Vuoi sapere come è possibile acquisire una pagina Web e salvarla come documento PDF o immagine utilizzando il terminale? Fortunatamente, Linux ha una miriade di utilità che puoi usare per automatizzare l'attività di conversione di documenti HTML in file PDF e immagini.
Questo articolo ti introdurrà a wkhtmltopdf e wkhtmltoimage, utilità di cui hai bisogno per semplificare il tuo lavoro.
Come convertire HTML in PDF
Se stai cercando di catturare pagine web e convertirle in un file PDF, l'utility wkhtmltopdf ti aiuterà. Wkhtmltopdf è uno strumento da riga di comando open source utilizzato per eseguire il rendering di pagine Web in documenti PDF.
Poiché lo strumento funziona senza testa all'interno del terminale Linux, non avrai bisogno di alcun driver web o framework di automazione del browser come Selenium.
Installa wkhtmltopdf su Linux
Wkhtmltopdf non è uno dei pacchetti standard preinstallati su Linux. Dovrai installarlo manualmente utilizzando il gestore di pacchetti del tuo sistema.
Per installare wkhtmltopdf su distribuzioni basate su Ubuntu e Debian:
sudo apt install wkhtmltopdf
Su distribuzioni basate su Arch come Manjaro Linux:
sudo pacman -S wkhtmltopdf
Anche l'installazione di wkhtmltopdf su distribuzioni basate su RHEL come Fedora e CentOS è facile.
sudo dnf install wkhtmltopdf
Sintassi di base
La sintassi di base del comando è:
wkhtmltopdf nome file della pagina web
...dove pagina web è l'URL della pagina web che si desidera convertire e nome del file è il nome del file PDF di output.
Per convertire la home page di Google in un documento PDF:
wkhtmltopdf https://google.com google.pdf
Produzione:
Aprendo il file PDF, noterai che wkhtmltopdf ha reso precisamente la pagina web in un documento.
Stampa più copie della pagina Web
Il --copie flag è un vero toccasana se vuoi che il tuo file di output abbia più copie della pagina web. Nota che quando si stampano più copie, wkhtmltopdf non genererà più file PDF, ma aggiungerà invece pagine aggiuntive a un singolo documento.
Per creare tre copie della home page di Google:
wkhtmltopdf --copie 3 https://google.com google.pdf
Il file PDF di output conterrà tre pagine come specificato nel comando di cui sopra.
Aggiungi un filtro in scala di grigi all'output
Per aggiungere un filtro in scala di grigi al file PDF, usa il -g o --scala di grigi bandiera con il comando:
wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --scala di grigi https://google.com google.pdf
File di uscita:
Modificare l'orientamento del PDF
Per impostazione predefinita, wkhtmltopdf genera il file PDF con layout verticale, ad esempio verticale. Per modificare questo comportamento predefinito e acquisire invece le pagine Web in orizzontale, utilizzare il pulsante --orientamento bandiera con il comando:
wkhtmltopdf --orientamento orizzontale https://google.com google.pdf
Produzione:
Nota che la versione orizzontale del documento ha un'area di spazi bianchi più ampia rispetto a quella verticale.
Non includere immagini durante la conversione
Durante la generazione dell'output, se non vuoi che wkhtmltopdf esegua il rendering delle immagini presenti in una pagina web, usa il pulsante --no-immagini bandiera:
wkhtmltopdf --no-images https://google.com google.pdf
Produzione:
Relazionato: I migliori strumenti per modificare un file PDF ovunque
Come convertire una pagina Web in immagini
L'utility wkhtmltoimage fa parte del pacchetto wkhtmltopdf. Se stai lavorando a un report e desideri includere immagini di un sito Web, questo strumento funzionerà a tuo favore. Il terminale Linux non solo ti semplifica l'acquisizione delle immagini, ma ti offre anche una gamma di opzioni che ti consentono di personalizzare il tuo output.
Sintassi di base
Wkhtmltoimage ha una sintassi simile a wkhtmltopdf:
wkhtmltoimage nome file della pagina web
...dove pagina web è l'URL di un sito web e nome del file è il nome dell'immagine di output.
Converti una pagina Web in un'immagine
Continuando con l'esempio di cui sopra, convertiamo la home page di Google in immagini.
wkhtmltoimage https://google.com google.png
Produzione:
Puoi anche specificare un formato di file personalizzato che vuoi che abbia l'immagine di output. Wkhtmltoimage supporta le seguenti estensioni di file:
- JPEG/JPG
- PNG
- SVG
Ad esempio, se vuoi generare un'immagine JPG, sostituisci semplicemente l'estensione del file con JPG nel comando:
wkhtmltoimage https://google.com google.jpg
Relazionato: JPG vs. JPEG: qual è la differenza tra questi formati di file immagine?
Acquisizione di pagine Web utilizzando il terminale Linux
Devi avere un visualizzatore PDF installato sul tuo sistema Linux se vuoi visualizzare i file PDF generati da wkhtmltopdf. Sebbene la maggior parte delle distribuzioni Linux sia dotata di un editor PDF preinstallato, puoi scegliere e installare manualmente un editor PDF adatto alle tue esigenze.
Hai bisogno di modificare un file PDF in Linux? Questi editor PDF Linux sono gratuiti da installare e facili da usare.
Leggi Avanti
- Linux
- Linux
Deepesh è l'editor junior per Linux di MUO. Scrive contenuti informativi su Internet da oltre 3 anni. Nel tempo libero ama scrivere, ascoltare musica e suonare la chitarra.
Iscriviti alla nostra Newsletter
Iscriviti alla nostra newsletter per consigli tecnici, recensioni, ebook gratuiti e offerte esclusive!
Ancora un passo…!
Conferma il tuo indirizzo e-mail nell'e-mail che ti abbiamo appena inviato.