Pandas è una libreria Python open source utilizzata principalmente per la manipolazione e l'analisi dei dati. È basato sulla libreria NumPy e fornisce strutture di dati e strumenti di analisi dei dati ad alte prestazioni e facili da usare per il linguaggio di programmazione Python.
In questo articolo imparerai come eseguire 6 operazioni di base utilizzando Pandas.
Utilizzo di esempi di panda
Puoi eseguire gli esempi in questo articolo utilizzando notebook computazionali come Taccuino Jupyter, Google Colab, eccetera. Puoi anche eseguire gli esempi inserendo il codice direttamente nell'interprete Python in modalità interattiva.
Se vuoi dare un'occhiata al codice sorgente completo utilizzato in questo articolo, puoi accedere al file Python Notebook da questo Archivio GitHub.
1. Come importare i panda come pd e stampare il numero di versione
Devi usare il importare parola chiave per importare qualsiasi libreria in Python. Pandas è in genere importato sotto il pd alias. Con questo approccio, puoi fare riferimento al pacchetto Pandas come pd invece di panda.
importa panda come pd
stampa (pd.__versione__)
Produzione:
1.2.4
2. Come creare una serie in Pandas
Pandas Series è un array unidimensionale che contiene dati di qualsiasi tipo. È come una colonna in una tabella. Puoi creare una serie utilizzando array numpy, funzioni numpy, elenchi, dizionari, valori scalari, ecc.
I valori della serie sono etichettati con il loro numero di indice. Per impostazione predefinita, il primo valore ha indice 0, il secondo valore ha indice 1 e così via. Per assegnare un nome alle proprie etichette, è necessario utilizzare il indice discussione.
Come creare una serie vuota
s = pd. Serie (dtype='float64')
S
Produzione:
Serie([], dtype: float64)
Nell'esempio sopra, una serie vuota con il galleggiante viene creato il tipo di dati.
Come creare una serie utilizzando l'array NumPy
importa panda come pd
importa numpy come np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
S
Produzione:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Imparentato: Operazioni NumPy per principianti
Come creare una serie utilizzando l'elenco
d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
S
Produzione:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Come creare una serie con indice
Per creare una serie con un indice, è necessario utilizzare il indice discussione. Il numero di indici deve essere uguale al numero di elementi della serie.
d = [1, 2, 3, 4, 5]
s = pd. Serie (d, index=["uno", "due", "tre", "quattro", "cinque"])
S
Produzione:
uno 1
due 2
tre 3
quattro 4
cinque 5
dtype: int64
Come creare una serie usando il dizionario
Le chiavi del dizionario diventano le etichette della serie.
d = {"uno": 1,
"due": 2,
"tre": 3,
"quattro": 4,
"cinque": 5}
s = pd. Serie (d)
S
Produzione:
uno 1
due 2
tre 3
quattro 4
cinque 5
dtype: int64
Come creare una serie utilizzando il valore scalare
Se vuoi creare una serie utilizzando un valore scalare, devi fornire il indice discussione.
s = pd. Serie (1, indice = ["a", "b", "c", "d"])
S
Produzione:
un 1
b 1
c 1
d 1
dtype: int64
3. Come creare un dataframe in Pandas
Un DataFrame è una struttura di dati bidimensionale in cui i dati sono allineati sotto forma di righe e colonne. Un DataFrame può essere creato utilizzando dizionari, elenchi, un elenco di dizionari, array numpy, ecc. Nel mondo reale, i DataFrame vengono creati utilizzando l'archiviazione esistente come file CSV, file Excel, database SQL, ecc.
L'oggetto DataFrame supporta una serie di attributi e metodi. Se vuoi saperne di più su di loro, puoi consultare la documentazione ufficiale di dataframe panda.
Come creare un DataFrame vuoto
df = pd. DataFrame()
stampa (df)
Produzione:
DataFrame vuoto
Colonne: []
Indice: []
Come creare un dataframe utilizzando List
listObj = ["MUO", "tecnologia", "semplificato"]
df = pd. DataFrame (listObj)
stampa (df)
Produzione:
0
0 MUO
1 tecnologia
2 semplificato
Come creare un dataframe utilizzando il dizionario di ndarray/liste
batmanData = {'Nome film': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Anno di uscita': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
stampa (df)
Produzione:
Nome del film Anno di uscita
0 Batman inizia 2005
1 Il cavaliere oscuro 2008
2 Il cavaliere oscuro - Il ritorno 2012
Come creare un dataframe utilizzando un elenco di elenchi
dati = [['Alex', 601], ['Bob', 602], ['Catalina', 603]]
df = pd. DataFrame (dati, colonne = ['Nome', 'Numero rotolo'])
stampa (df)
Produzione:
Nome Rotolo n.
0 Alex 601
1 Bob 602
2 Catalina 603
Come creare un dataframe utilizzando l'elenco dei dizionari
data = [{'Nome': 'Alex', 'Numero rotolo': 601},
{'Nome': 'Bob', 'Rotolo n.': 602},
{'Nome': 'Catalina', 'Numero rotolo': 603}]
df = pd. DataFrame (dati)
stampa (df)
Produzione:
Nome Rotolo n.
0 Alex 601
1 Bob 602
2 Catalina 603
Imparentato: Come convertire un elenco in un dizionario in Python
Come creare un DataFrame utilizzando la funzione zip()
Utilizzare il cerniera lampo() funzione per unire elenchi in Python.
Nome = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = list (zip (Nome, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['Name', 'Roll No.'])
stampa (df)
Produzione:
Nome Rotolo n.
0 Alex 601
1 Bob 602
2 Catalina 603
4. Come leggere i dati CSV in Pandas
Un file "valori separati da virgola" (CSV) è un file di testo delimitato che utilizza una virgola per separare i valori. Puoi leggere un file CSV usando il leggi_csv() metodo nei panda. Se vuoi stampare l'intero DataFrame, usa il tasto accordare() metodo.
In questo e nei prossimi esempi, questo File CSV serviranno per eseguire le operazioni.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.to_string())
Produzione:
5. Come analizzare i dataframe utilizzando i metodi head(), tail() e info()
Come visualizzare i dati utilizzando il metodo head()
Il testa() è uno dei modi migliori per ottenere una rapida panoramica del DataFrame. Questo metodo restituisce l'intestazione e il numero di righe specificato, a partire dall'alto.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.testa (10))
Produzione:
Se non specifichi il numero di righe, verranno restituite le prime 5 righe.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.head())
Produzione:
Come visualizzare i dati utilizzando il metodo tail()
Il coda() Il metodo restituisce l'intestazione e il numero di righe specificato, partendo dal basso.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.coda (10))
Produzione:
Se non specifichi il numero di righe, verranno restituite le ultime 5 righe.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.coda())
Produzione:
Come ottenere informazioni sui dati
Il Informazioni() I metodi restituiscono un breve riepilogo di un DataFrame che include il dtype dell'indice e i dtype della colonna, i valori non null e l'utilizzo della memoria.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
stampa (df.info())
Produzione:
6. Come leggere i dati JSON in Pandas
JSON (JavaScripto ohoggetto notation) è un formato di scambio dati leggero. Puoi leggere un file JSON usando il read_json() metodo nei panda. Se vuoi stampare l'intero DataFrame, usa il tasto accordare() metodo.
Nell'esempio seguente, questo File JSON serve per eseguire le operazioni.
Imparentato: Che cos'è JSON? Panoramica di un laico
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
stampa (df.to_string())
Produzione:
Aggiorna la tua conoscenza di Python con funzioni e metodi integrati
Le funzioni aiutano ad abbreviare il codice e a migliorarne l'efficienza. Funzioni e metodi come ridurre(), diviso(), enumerare(), eval(), il giro(), eccetera. può rendere il tuo codice robusto e facile da capire. È sempre utile conoscere le funzioni e i metodi incorporati in quanto possono semplificare notevolmente le attività di programmazione.
La libreria standard di Python contiene molte funzioni per aiutarti con le tue attività di programmazione. Scopri il più utile e crea codice più robusto.
Leggi Avanti
- Programmazione
- Pitone
- Sviluppo web
- Programmazione
- Analisi dei dati
Yuvraj è uno studente universitario di Informatica presso l'Università di Delhi, in India. È appassionato di sviluppo Web Full Stack. Quando non scrive, esplora la profondità di diverse tecnologie.
Iscriviti alla nostra Newsletter
Iscriviti alla nostra newsletter per suggerimenti tecnici, recensioni, ebook gratuiti e offerte esclusive!
Clicca qui per iscriverti