Python, come linguaggio, è prezioso oltre ogni misura, specialmente quando vuoi lavorare con dati strutturati. Poiché le persone archiviano molti dati nei file Excel, è fondamentale consolidare più file per risparmiare tempo e fatica.

Python ti consente di fare esattamente questo; non importa quanti file Excel vuoi combinare, puoi farlo con relativa facilità. Data la sua gamma di librerie e risorse di terze parti, puoi importare e utilizzare gli strumenti multiformi di Python per eseguire le tue offerte.

In questa guida, dovrai installare e utilizzare le librerie Pandas per importare i dati in Python prima di consolidarli.

Installa le librerie Pandas in Python

Pandas è una libreria di terze parti che puoi installare in Python. Alcuni IDE hanno già installato Panda al loro interno.

Se stai usando un Versione IDE che non viene fornito con Panda preinstallati, stai tranquillo, puoi installarlo direttamente in Python.

Ecco come installare Panda:

pip installa i panda

Se stai usando Jupyter Notebook, puoi installare Pandas direttamente con il

instagram viewer
comando PIP. Per lo più, quando hai installato Jupyter con Anaconda, ci sono alte probabilità di avere già Panda disponibili per l'uso diretto.

Se non riesci a chiamare Pandas, puoi utilizzare il comando sopra per installarli direttamente.

Combinazione di file Excel con Python

Innanzitutto, devi creare una cartella nella tua posizione preferita con tutti i file Excel. Una volta che la cartella è pronta, puoi iniziare a scrivere il codice per importare le librerie.

Utilizzerai due variabili in questo codice:

  1. Panda: La libreria Pandas fornisce i frame di dati per archiviare i file Excel.
  2. Sistema operativo: La libreria è utile per leggere i dati dalla cartella della tua macchina

Per importare queste librerie, utilizzare questi comandi:

Importa Panda come pd
Importa sistema operativo
  • Importare: Sintassi Python utilizzata per importare le librerie in Python
  • Panda: Nome della libreria
  • pd: Alias ​​dato alla biblioteca
  • Sistema operativo: Una libreria per accedere alla cartella di sistema

Dopo aver importato le librerie, creare due variabili per memorizzare il percorso del file di input e di output. Il percorso del file di input è necessario per accedere alla cartella dei file. Il percorso del file di output è necessario poiché il file combinato verrà esportato lì.

Se stai usando Python, assicurati di cambiare la barra rovesciata in barra in avanti (\ a /)

input_file_path = "C:/Utenti/gaurav/OneDrive/Desktop/File Excel/"
output_file_path = "C:/Utenti/gaurav/OneDrive/Desktop/"

Aggiungi il / anche alla fine per completare i percorsi.

I file della cartella sono disponibili in un elenco. Crea un elenco per memorizzare tutti i riferimenti ai file della cartella di input utilizzando il file listdir funzione dal Sistema operativo biblioteca.

Se non sei sicuro delle funzioni disponibili all'interno di una libreria, puoi utilizzare il dir funzione con il nome della libreria. Ad esempio, per verificare la versione esatta della funzione listdir, è possibile utilizzare il comando come segue:

dir (sistema operativo)

L'output sarà costituito da tutte le funzioni associate disponibili all'interno della libreria del sistema operativo. La funzione listdir è una delle tante funzioni disponibili all'interno di questa libreria.

Crea una nuova variabile per memorizzare i file di input dalla cartella.

excel_file_list = os.listdir (input_file_path)

Stampa questa variabile per vedere i nomi dei file archiviati nella cartella. Tutti i file archiviati nella cartella vengono visualizzati una volta utilizzata la funzione di stampa.

stampa (excel_file_list)

Successivamente, è necessario aggiungere un nuovo frame di dati per archiviare ogni file Excel. Immagina un frame di dati come un contenitore per la memorizzazione dei dati. Ecco il comando per creare un frame di dati.

df = pd. DataFrame()
  • df: Variabile per memorizzare il valore di DataFrame
  • pd: Alias ​​per il Libreria dei panda
  • DataFrame: Sintassi predefinita per l'aggiunta di un frame di dati

La cartella di input ne ha tre .xlsx file in questo esempio. I nomi dei file sono:

File1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx

Per aprire ogni file da questa cartella, è necessario eseguire un ciclo. Il ciclo verrà eseguito per ciascuno dei file nell'elenco creato sopra.

Ecco come puoi farlo:

per excel_files in excel_file_list:

Successivamente, è necessario controllare le estensioni dei file poiché il codice aprirà solo i file XLSX. Per controllare questi file, puoi usare un Se dichiarazione.

Usa il finisce con funzione a tale scopo, come segue:

per excel_files in excel_file_list:

se excel_files.endswith(".xlsx"):

  • excel_files: Elenca con tutti i valori del file
  • finisce con: Funzione per verificare l'estensione dei file
  • (".xlsx"): Questo valore di stringa può cambiare, a seconda di ciò che vuoi cercare

Ora che hai identificato i file Excel, puoi creare un nuovo frame di dati per leggere e archiviare i file singolarmente.

per excel_files in excel_file_list:

se excel_files.endswith(".xlsx"):

df1 = pd.read_excel (percorso_file_input+file_excel)

  • df1: Nuovo frame di dati
  • pd: Libreria dei panda
  • leggi_excel: Funzione per leggere i file Excel all'interno della libreria Pandas
  • percorso_file_input: Percorso della cartella in cui sono archiviati i file
  • excel_files: Qualsiasi variabile utilizzata nel ciclo for

Per iniziare ad aggiungere i file, è necessario utilizzare il file aggiungere funzione.

per excel_files in excel_file_list:

se excel_files.endswith(".xlsx"):

df1 = pd.read_excel (percorso_file_input+file_excel)
df = df.append (df1)

Infine, ora che il frame di dati consolidato è pronto, puoi esportarlo nella posizione di output. In questo caso, stai esportando il frame di dati in un file XLSX.

df.to_excel (output_file_path+"Consolidated_file.xlsx")
  • df: Dataframe da esportare
  • eccellere: Comando utilizzato per esportare i dati
  • percorso_file_output: Percorso definito per la memorizzazione dell'output
  • File_consolidato.xlsx: Nome del file consolidato

Ora, diamo un'occhiata al codice finale:

#Pandas viene utilizzato come dataframe per gestire i file Excel
importa panda come pd
importare os

# cambia la barra da “\” a “/”, se utilizzi dispositivi Windows

input_file_path = "C:/Utenti/gaurav/OneDrive/Desktop/File Excel/"
output_file_path = "C:/Utenti/gaurav/OneDrive/Desktop/"

#crea una lista per memorizzare tutti i riferimenti ai file della cartella di input usando la funzione listdir dalla libreria os.
#Per vedere il contenuto di una libreria (come la funzione listdir, puoi usare la funzione dir sul nome della libreria).
#Usa dir (nome_library) per elencare i contenuti

excel_file_list = os.listdir (input_file_path)

#stampa tutti i file archiviati nella cartella, dopo aver definito l'elenco
excel_file_list

#Una volta aperto ogni file, utilizzare la funzione di aggiunta per iniziare a consolidare i dati archiviati in più file

#crea un nuovo dataframe vuoto, per gestire le importazioni di file excel
df = pd. DataFrame()

#Esegui un ciclo for per scorrere ogni file nell'elenco
per excel_files in excel_file_list:
#controlla solo i file con suffisso .xlsx
se excel_files.endswith(".xlsx"):
#crea un nuovo dataframe per leggere/aprire ogni file Excel dall'elenco di file creato sopra
df1 = pd.read_excel (percorso_file_input+file_excel)
#append ogni file nel dataframe vuoto originale
df = df.append (df1)

#transfer l'output finale in un file Excel (xlsx) nel percorso di output
df.to_excel (output_file_path+"Consolidated_file.xlsx")

Utilizzo di Python per combinare più cartelle di lavoro di Excel

Python's Pandas è uno strumento eccellente sia per i principianti che per gli utenti avanzati. La libreria è ampiamente utilizzata dagli sviluppatori che vogliono padroneggiare Python.

Anche se sei un principiante, puoi trarre enormi benefici dall'apprendimento delle sfumature di Panda e di come viene utilizzata la libreria all'interno di Python.

6 Operazioni Panda per principianti

Impara a usare i Panda con queste operazioni per principianti.

Leggi Avanti

CondividereTwittaE-mail
Argomenti correlati
  • Programmazione
  • Pitone
  • Microsoft Excel
  • Foglio di calcolo
Circa l'autore
Gaurav Siyal (59 articoli pubblicati)

Gaurav Siyal ha due anni di esperienza di scrittura, scrivendo per una serie di società di marketing digitale e documenti sul ciclo di vita del software.

Altro da Gaurav Siyal

Iscriviti alla nostra Newsletter

Iscriviti alla nostra newsletter per suggerimenti tecnici, recensioni, ebook gratuiti e offerte esclusive!

Clicca qui per iscriverti