Gli audiolibri stanno guadagnando sempre più popolarità rispetto agli eBook tradizionali. Sono più convenienti in quanto puoi ascoltarli sempre e ovunque.

Puoi convertire un eBook PDF in un audiolibro con un semplice script Python. Utilizzando alcune semplici librerie, puoi sviluppare un progetto che leggerà un PDF e memorizzerà l'audiolibro come nuovo file.

Installazione dei pacchetti richiesti

Devi installare il PyPDF3, pyttsx3, e pdf idraulico pacchetti per iniziare. Puoi installare questi pacchetti usando il gestore di pacchetti pip. Assicurati di averlo già fatto pip installato sul tuo sistema. Eseguire il comando seguente nel prompt dei comandi per installare i pacchetti:

pip installare PyPDF3 pyttsx3 pdfidraulico
  • Puoi usare il PyPDF3 libreria per leggere e modificare file PDF in Python.
  • Il pyttsx3 la libreria fornisce la conversione da testo a voce.
  • pdf idraulico è una libreria che ti permette di estrarre testo e tabelle da file PDF.

Il codice utilizzato in questo progetto è disponibile in a Archivio GitHub ed è gratuito per l'uso con la licenza MIT.

instagram viewer

Conversione di un PDF in un audiolibro usando Python

Dopo aver installato i pacchetti di cui sopra, sei pronto per importarli nel tuo file python:

importare PyPDF3
importare pyttsx3
importare pdf idraulico

È necessario fornire il nome e la posizione del file PDF che si desidera convertire. Per semplicità, puoi utilizzare qualsiasi file PDF di esempio. Copialo nella stessa directory del tuo script e memorizza il suo nome in una variabile; se si chiama Lorem.pdf, Per esempio:

file = 'Lorem.pdf'

Quindi, crea un oggetto file per il file PDF e un oggetto lettore PDF:

libro = apri (file, 'rb')
pdfReader = PyPDF3.PdfFileReader (libro)

Successivamente, scorrerai tutte le pagine del file PDF. Per trovare il numero totale di pagine, utilizzare il numPages proprietà:

pagine = pdfReader.numPages

Ora sei pronto per estrarre il testo dal file PDF:

testo finale = ""

insieme a pdfidraulico.open(file) come PDF:
per i nell'intervallo (0, pagine):
pagina = pdf.pages[i]
testo = page.extract_text()
testo finale += testo

Usa un ciclo for per scorrere tutte le pagine ed estrarre il testo dal PDF. È possibile utilizzare il pacchetto pdfplumber per aprire il file pdf e il file estrarre_testo metodo per recuperare il testo da una pagina.

Con il testo completo memorizzato in una variabile, puoi elaborarlo ulteriormente, a seconda delle tue esigenze. Se vuoi convertire il testo in audio e salvarlo in un nuovo file, usa il seguente codice:

motore = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
motore.esegui e aspetta()

Quando tu esegui questo codice Python, creerà un file di audiolibro nella sua directory.

Se non vuoi salvare l'audiolibro e, ad esempio, vuoi recitare il file PDF, puoi invece utilizzare il seguente codice:

motore = pyttsx3.init()
motore.dire(testo finale)
motore.esegui e aspetta()

Quando esegui questo script, reciterà il file PDF.

Sviluppa progetti usando Python

Python è noto per la sua versatilità. Puoi creare facilmente progetti con applicazioni pratiche usando Python.

Se stai cercando di sporcarti le mani con il codice Python, puoi iniziare sviluppando mini-progetti. Alcune buone idee di partenza sono un'app per quiz, un chatbot, un gioco di serpenti, un accorciatore di URL, un web scraper o un convertitore di unità.