Python, come linguaggio, è prezioso oltre ogni misura, specialmente quando vuoi lavorare con dati strutturati. Poiché le persone archiviano molti dati nei file Excel, è fondamentale consolidare più file per risparmiare tempo e fatica.
Python ti consente di fare esattamente questo; non importa quanti file Excel vuoi combinare, puoi farlo con relativa facilità. Data la sua gamma di librerie e risorse di terze parti, puoi importare e utilizzare gli strumenti multiformi di Python per eseguire le tue offerte.
In questa guida, dovrai installare e utilizzare le librerie Pandas per importare i dati in Python prima di consolidarli.
Installa le librerie Pandas in Python
Pandas è una libreria di terze parti che puoi installare in Python. Alcuni IDE hanno già installato Panda al loro interno.
Se stai usando un Versione IDE che non viene fornito con Panda preinstallati, stai tranquillo, puoi installarlo direttamente in Python.
Ecco come installare Panda:
pip installa i panda
Se stai usando Jupyter Notebook, puoi installare Pandas direttamente con il
comando PIP. Per lo più, quando hai installato Jupyter con Anaconda, ci sono alte probabilità di avere già Panda disponibili per l'uso diretto.Se non riesci a chiamare Pandas, puoi utilizzare il comando sopra per installarli direttamente.
Combinazione di file Excel con Python
Innanzitutto, devi creare una cartella nella tua posizione preferita con tutti i file Excel. Una volta che la cartella è pronta, puoi iniziare a scrivere il codice per importare le librerie.
Utilizzerai due variabili in questo codice:
- Panda: La libreria Pandas fornisce i frame di dati per archiviare i file Excel.
- Sistema operativo: La libreria è utile per leggere i dati dalla cartella della tua macchina
Per importare queste librerie, utilizzare questi comandi:
Importa Panda come pd
Importa sistema operativo
- Importare: Sintassi Python utilizzata per importare le librerie in Python
- Panda: Nome della libreria
- pd: Alias dato alla biblioteca
- Sistema operativo: Una libreria per accedere alla cartella di sistema
Dopo aver importato le librerie, creare due variabili per memorizzare il percorso del file di input e di output. Il percorso del file di input è necessario per accedere alla cartella dei file. Il percorso del file di output è necessario poiché il file combinato verrà esportato lì.
Se stai usando Python, assicurati di cambiare la barra rovesciata in barra in avanti (\ a /)
input_file_path = "C:/Utenti/gaurav/OneDrive/Desktop/File Excel/"
output_file_path = "C:/Utenti/gaurav/OneDrive/Desktop/"
Aggiungi il / anche alla fine per completare i percorsi.
I file della cartella sono disponibili in un elenco. Crea un elenco per memorizzare tutti i riferimenti ai file della cartella di input utilizzando il file listdir funzione dal Sistema operativo biblioteca.
Se non sei sicuro delle funzioni disponibili all'interno di una libreria, puoi utilizzare il dir funzione con il nome della libreria. Ad esempio, per verificare la versione esatta della funzione listdir, è possibile utilizzare il comando come segue:
dir (sistema operativo)
L'output sarà costituito da tutte le funzioni associate disponibili all'interno della libreria del sistema operativo. La funzione listdir è una delle tante funzioni disponibili all'interno di questa libreria.
Crea una nuova variabile per memorizzare i file di input dalla cartella.
excel_file_list = os.listdir (input_file_path)
Stampa questa variabile per vedere i nomi dei file archiviati nella cartella. Tutti i file archiviati nella cartella vengono visualizzati una volta utilizzata la funzione di stampa.
stampa (excel_file_list)
Successivamente, è necessario aggiungere un nuovo frame di dati per archiviare ogni file Excel. Immagina un frame di dati come un contenitore per la memorizzazione dei dati. Ecco il comando per creare un frame di dati.
df = pd. DataFrame()
- df: Variabile per memorizzare il valore di DataFrame
- pd: Alias per il Libreria dei panda
- DataFrame: Sintassi predefinita per l'aggiunta di un frame di dati
La cartella di input ne ha tre .xlsx file in questo esempio. I nomi dei file sono:
File1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx
Per aprire ogni file da questa cartella, è necessario eseguire un ciclo. Il ciclo verrà eseguito per ciascuno dei file nell'elenco creato sopra.
Ecco come puoi farlo:
per excel_files in excel_file_list:
Successivamente, è necessario controllare le estensioni dei file poiché il codice aprirà solo i file XLSX. Per controllare questi file, puoi usare un Se dichiarazione.
Usa il finisce con funzione a tale scopo, come segue:
per excel_files in excel_file_list:
se excel_files.endswith(".xlsx"):
- excel_files: Elenca con tutti i valori del file
- finisce con: Funzione per verificare l'estensione dei file
- (".xlsx"): Questo valore di stringa può cambiare, a seconda di ciò che vuoi cercare
Ora che hai identificato i file Excel, puoi creare un nuovo frame di dati per leggere e archiviare i file singolarmente.
per excel_files in excel_file_list:
se excel_files.endswith(".xlsx"):
df1 = pd.read_excel (percorso_file_input+file_excel)
- df1: Nuovo frame di dati
- pd: Libreria dei panda
- leggi_excel: Funzione per leggere i file Excel all'interno della libreria Pandas
- percorso_file_input: Percorso della cartella in cui sono archiviati i file
- excel_files: Qualsiasi variabile utilizzata nel ciclo for
Per iniziare ad aggiungere i file, è necessario utilizzare il file aggiungere funzione.
per excel_files in excel_file_list:
se excel_files.endswith(".xlsx"):
df1 = pd.read_excel (percorso_file_input+file_excel)
df = df.append (df1)
Infine, ora che il frame di dati consolidato è pronto, puoi esportarlo nella posizione di output. In questo caso, stai esportando il frame di dati in un file XLSX.
df.to_excel (output_file_path+"Consolidated_file.xlsx")
- df: Dataframe da esportare
- eccellere: Comando utilizzato per esportare i dati
- percorso_file_output: Percorso definito per la memorizzazione dell'output
- File_consolidato.xlsx: Nome del file consolidato
Ora, diamo un'occhiata al codice finale:
#Pandas viene utilizzato come dataframe per gestire i file Excel
importa panda come pd
importare os# cambia la barra da “\” a “/”, se utilizzi dispositivi Windows
input_file_path = "C:/Utenti/gaurav/OneDrive/Desktop/File Excel/"
output_file_path = "C:/Utenti/gaurav/OneDrive/Desktop/"#crea una lista per memorizzare tutti i riferimenti ai file della cartella di input usando la funzione listdir dalla libreria os.
#Per vedere il contenuto di una libreria (come la funzione listdir, puoi usare la funzione dir sul nome della libreria).
#Usa dir (nome_library) per elencare i contenutiexcel_file_list = os.listdir (input_file_path)
#stampa tutti i file archiviati nella cartella, dopo aver definito l'elenco
excel_file_list#Una volta aperto ogni file, utilizzare la funzione di aggiunta per iniziare a consolidare i dati archiviati in più file
#crea un nuovo dataframe vuoto, per gestire le importazioni di file excel
df = pd. DataFrame()#Esegui un ciclo for per scorrere ogni file nell'elenco
per excel_files in excel_file_list:
#controlla solo i file con suffisso .xlsx
se excel_files.endswith(".xlsx"):
#crea un nuovo dataframe per leggere/aprire ogni file Excel dall'elenco di file creato sopra
df1 = pd.read_excel (percorso_file_input+file_excel)
#append ogni file nel dataframe vuoto originale
df = df.append (df1)
#transfer l'output finale in un file Excel (xlsx) nel percorso di output
df.to_excel (output_file_path+"Consolidated_file.xlsx")
Utilizzo di Python per combinare più cartelle di lavoro di Excel
Python's Pandas è uno strumento eccellente sia per i principianti che per gli utenti avanzati. La libreria è ampiamente utilizzata dagli sviluppatori che vogliono padroneggiare Python.
Anche se sei un principiante, puoi trarre enormi benefici dall'apprendimento delle sfumature di Panda e di come viene utilizzata la libreria all'interno di Python.
Impara a usare i Panda con queste operazioni per principianti.
Leggi Avanti
- Programmazione
- Pitone
- Microsoft Excel
- Foglio di calcolo
Gaurav Siyal ha due anni di esperienza di scrittura, scrivendo per una serie di società di marketing digitale e documenti sul ciclo di vita del software.
Iscriviti alla nostra Newsletter
Iscriviti alla nostra newsletter per suggerimenti tecnici, recensioni, ebook gratuiti e offerte esclusive!
Clicca qui per iscriverti