Pandas è una libreria Python open source utilizzata principalmente per la manipolazione e l'analisi dei dati. È basato sulla libreria NumPy e fornisce strutture di dati e strumenti di analisi dei dati ad alte prestazioni e facili da usare per il linguaggio di programmazione Python.

In questo articolo imparerai come eseguire 6 operazioni di base utilizzando Pandas.

Utilizzo di esempi di panda

Puoi eseguire gli esempi in questo articolo utilizzando notebook computazionali come Taccuino Jupyter, Google Colab, eccetera. Puoi anche eseguire gli esempi inserendo il codice direttamente nell'interprete Python in modalità interattiva.

Se vuoi dare un'occhiata al codice sorgente completo utilizzato in questo articolo, puoi accedere al file Python Notebook da questo Archivio GitHub.

1. Come importare i panda come pd e stampare il numero di versione

Devi usare il importare parola chiave per importare qualsiasi libreria in Python. Pandas è in genere importato sotto il pd alias. Con questo approccio, puoi fare riferimento al pacchetto Pandas come pd invece di panda.

instagram viewer
importa panda come pd
stampa (pd.__versione__)

Produzione:

1.2.4

2. Come creare una serie in Pandas

Pandas Series è un array unidimensionale che contiene dati di qualsiasi tipo. È come una colonna in una tabella. Puoi creare una serie utilizzando array numpy, funzioni numpy, elenchi, dizionari, valori scalari, ecc.

I valori della serie sono etichettati con il loro numero di indice. Per impostazione predefinita, il primo valore ha indice 0, il secondo valore ha indice 1 e così via. Per assegnare un nome alle proprie etichette, è necessario utilizzare il indice discussione.

Come creare una serie vuota

s = pd. Serie (dtype='float64')
S

Produzione:

Serie([], dtype: float64)

Nell'esempio sopra, una serie vuota con il galleggiante viene creato il tipo di dati.

Come creare una serie utilizzando l'array NumPy

importa panda come pd
importa numpy come np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
S

Produzione:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Imparentato: Operazioni NumPy per principianti

Come creare una serie utilizzando l'elenco

d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
S

Produzione:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Come creare una serie con indice

Per creare una serie con un indice, è necessario utilizzare il indice discussione. Il numero di indici deve essere uguale al numero di elementi della serie.

d = [1, 2, 3, 4, 5]
s = pd. Serie (d, index=["uno", "due", "tre", "quattro", "cinque"])
S

Produzione:

uno 1
due 2
tre 3
quattro 4
cinque 5
dtype: int64

Come creare una serie usando il dizionario

Le chiavi del dizionario diventano le etichette della serie.

d = {"uno": 1,
"due": 2,
"tre": 3,
"quattro": 4,
"cinque": 5}
s = pd. Serie (d)
S

Produzione:

uno 1
due 2
tre 3
quattro 4
cinque 5
dtype: int64

Come creare una serie utilizzando il valore scalare

Se vuoi creare una serie utilizzando un valore scalare, devi fornire il indice discussione.

s = pd. Serie (1, indice = ["a", "b", "c", "d"])
S

Produzione:

un 1
b 1
c 1
d 1
dtype: int64

3. Come creare un dataframe in Pandas

Un DataFrame è una struttura di dati bidimensionale in cui i dati sono allineati sotto forma di righe e colonne. Un DataFrame può essere creato utilizzando dizionari, elenchi, un elenco di dizionari, array numpy, ecc. Nel mondo reale, i DataFrame vengono creati utilizzando l'archiviazione esistente come file CSV, file Excel, database SQL, ecc.

L'oggetto DataFrame supporta una serie di attributi e metodi. Se vuoi saperne di più su di loro, puoi consultare la documentazione ufficiale di dataframe panda.

Come creare un DataFrame vuoto

df = pd. DataFrame()
stampa (df)

Produzione:

DataFrame vuoto
Colonne: []
Indice: []

Come creare un dataframe utilizzando List

listObj = ["MUO", "tecnologia", "semplificato"]
df = pd. DataFrame (listObj)
stampa (df)

Produzione:

 0
0 MUO
1 tecnologia
2 semplificato

Come creare un dataframe utilizzando il dizionario di ndarray/liste

batmanData = {'Nome film': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Anno di uscita': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
stampa (df)

Produzione:

 Nome del film Anno di uscita
0 Batman inizia 2005
1 Il cavaliere oscuro 2008
2 Il cavaliere oscuro - Il ritorno 2012

Come creare un dataframe utilizzando un elenco di elenchi

dati = [['Alex', 601], ['Bob', 602], ['Catalina', 603]]
df = pd. DataFrame (dati, colonne = ['Nome', 'Numero rotolo'])
stampa (df)

Produzione:

 Nome Rotolo n.
0 Alex 601
1 Bob 602
2 Catalina 603

Come creare un dataframe utilizzando l'elenco dei dizionari

data = [{'Nome': 'Alex', 'Numero rotolo': 601},
{'Nome': 'Bob', 'Rotolo n.': 602},
{'Nome': 'Catalina', 'Numero rotolo': 603}]
df = pd. DataFrame (dati)
stampa (df)

Produzione:

 Nome Rotolo n.
0 Alex 601
1 Bob 602
2 Catalina 603

Imparentato: Come convertire un elenco in un dizionario in Python

Come creare un DataFrame utilizzando la funzione zip()

Utilizzare il cerniera lampo() funzione per unire elenchi in Python.

Nome = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = list (zip (Nome, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['Name', 'Roll No.'])
stampa (df)

Produzione:

 Nome Rotolo n.
0 Alex 601
1 Bob 602
2 Catalina 603

4. Come leggere i dati CSV in Pandas

Un file "valori separati da virgola" (CSV) è un file di testo delimitato che utilizza una virgola per separare i valori. Puoi leggere un file CSV usando il leggi_csv() metodo nei panda. Se vuoi stampare l'intero DataFrame, usa il tasto accordare() metodo.

In questo e nei prossimi esempi, questo File CSV serviranno per eseguire le operazioni.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.to_string())

Produzione:

5. Come analizzare i dataframe utilizzando i metodi head(), tail() e info()

Come visualizzare i dati utilizzando il metodo head()

Il testa() è uno dei modi migliori per ottenere una rapida panoramica del DataFrame. Questo metodo restituisce l'intestazione e il numero di righe specificato, a partire dall'alto.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.testa (10))

Produzione:

Se non specifichi il numero di righe, verranno restituite le prime 5 righe.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.head())

Produzione:

Come visualizzare i dati utilizzando il metodo tail()

Il coda() Il metodo restituisce l'intestazione e il numero di righe specificato, partendo dal basso.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.coda (10))

Produzione:

Se non specifichi il numero di righe, verranno restituite le ultime 5 righe.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.coda())

Produzione:

Come ottenere informazioni sui dati

Il Informazioni() I metodi restituiscono un breve riepilogo di un DataFrame che include il dtype dell'indice e i dtype della colonna, i valori non null e l'utilizzo della memoria.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.info())

Produzione:

6. Come leggere i dati JSON in Pandas

JSON (JavaScripto ohoggetto notation) è un formato di scambio dati leggero. Puoi leggere un file JSON usando il read_json() metodo nei panda. Se vuoi stampare l'intero DataFrame, usa il tasto accordare() metodo.

Nell'esempio seguente, questo File JSON serve per eseguire le operazioni.

Imparentato: Che cos'è JSON? Panoramica di un laico

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
stampa (df.to_string())

Produzione:

Aggiorna la tua conoscenza di Python con funzioni e metodi integrati

Le funzioni aiutano ad abbreviare il codice e a migliorarne l'efficienza. Funzioni e metodi come ridurre(), diviso(), enumerare(), eval(), il giro(), eccetera. può rendere il tuo codice robusto e facile da capire. È sempre utile conoscere le funzioni e i metodi incorporati in quanto possono semplificare notevolmente le attività di programmazione.

CondividereTweetE-mail
20 funzioni Python che dovresti conoscere

La libreria standard di Python contiene molte funzioni per aiutarti con le tue attività di programmazione. Scopri il più utile e crea codice più robusto.

Leggi Avanti

Argomenti correlati
  • Programmazione
  • Pitone
  • Sviluppo web
  • Programmazione
  • Analisi dei dati
Circa l'autore
Yuvraj Chandra (69 articoli pubblicati)

Yuvraj è uno studente universitario di Informatica presso l'Università di Delhi, in India. È appassionato di sviluppo Web Full Stack. Quando non scrive, esplora la profondità di diverse tecnologie.

Altro da Yuvraj Chandra

Iscriviti alla nostra Newsletter

Iscriviti alla nostra newsletter per suggerimenti tecnici, recensioni, ebook gratuiti e offerte esclusive!

Clicca qui per iscriverti