Vuoi sapere come è possibile acquisire una pagina Web e salvarla come documento PDF o immagine utilizzando il terminale? Fortunatamente, Linux ha una miriade di utilità che puoi usare per automatizzare l'attività di conversione di documenti HTML in file PDF e immagini.

Questo articolo ti introdurrà a wkhtmltopdf e wkhtmltoimage, utilità di cui hai bisogno per semplificare il tuo lavoro.

Come convertire HTML in PDF

Se stai cercando di catturare pagine web e convertirle in un file PDF, l'utility wkhtmltopdf ti aiuterà. Wkhtmltopdf è uno strumento da riga di comando open source utilizzato per eseguire il rendering di pagine Web in documenti PDF.

Poiché lo strumento funziona senza testa all'interno del terminale Linux, non avrai bisogno di alcun driver web o framework di automazione del browser come Selenium.

Installa wkhtmltopdf su Linux

Wkhtmltopdf non è uno dei pacchetti standard preinstallati su Linux. Dovrai installarlo manualmente utilizzando il gestore di pacchetti del tuo sistema.

instagram viewer

Per installare wkhtmltopdf su distribuzioni basate su Ubuntu e Debian:

sudo apt install wkhtmltopdf

Su distribuzioni basate su Arch come Manjaro Linux:

sudo pacman -S wkhtmltopdf

Anche l'installazione di wkhtmltopdf su distribuzioni basate su RHEL come Fedora e CentOS è facile.

sudo dnf install wkhtmltopdf

Sintassi di base

La sintassi di base del comando è:

wkhtmltopdf nome file della pagina web

...dove pagina web è l'URL della pagina web che si desidera convertire e nome del file è il nome del file PDF di output.

Per convertire la home page di Google in un documento PDF:

wkhtmltopdf https://google.com google.pdf

Produzione:

Aprendo il file PDF, noterai che wkhtmltopdf ha reso precisamente la pagina web in un documento.

Stampa più copie della pagina Web

Il --copie flag è un vero toccasana se vuoi che il tuo file di output abbia più copie della pagina web. Nota che quando si stampano più copie, wkhtmltopdf non genererà più file PDF, ma aggiungerà invece pagine aggiuntive a un singolo documento.

Per creare tre copie della home page di Google:

wkhtmltopdf --copie 3 https://google.com google.pdf

Il file PDF di output conterrà tre pagine come specificato nel comando di cui sopra.

Aggiungi un filtro in scala di grigi all'output

Per aggiungere un filtro in scala di grigi al file PDF, usa il -g o --scala di grigi bandiera con il comando:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --scala di grigi https://google.com google.pdf

File di uscita:

Modificare l'orientamento del PDF

Per impostazione predefinita, wkhtmltopdf genera il file PDF con layout verticale, ad esempio verticale. Per modificare questo comportamento predefinito e acquisire invece le pagine Web in orizzontale, utilizzare il pulsante --orientamento bandiera con il comando:

wkhtmltopdf --orientamento orizzontale https://google.com google.pdf

Produzione:

Nota che la versione orizzontale del documento ha un'area di spazi bianchi più ampia rispetto a quella verticale.

Non includere immagini durante la conversione

Durante la generazione dell'output, se non vuoi che wkhtmltopdf esegua il rendering delle immagini presenti in una pagina web, usa il pulsante --no-immagini bandiera:

wkhtmltopdf --no-images https://google.com google.pdf

Produzione:

Relazionato: I migliori strumenti per modificare un file PDF ovunque

Come convertire una pagina Web in immagini

L'utility wkhtmltoimage fa parte del pacchetto wkhtmltopdf. Se stai lavorando a un report e desideri includere immagini di un sito Web, questo strumento funzionerà a tuo favore. Il terminale Linux non solo ti semplifica l'acquisizione delle immagini, ma ti offre anche una gamma di opzioni che ti consentono di personalizzare il tuo output.

Sintassi di base

Wkhtmltoimage ha una sintassi simile a wkhtmltopdf:

wkhtmltoimage nome file della pagina web

...dove pagina web è l'URL di un sito web e nome del file è il nome dell'immagine di output.

Converti una pagina Web in un'immagine

Continuando con l'esempio di cui sopra, convertiamo la home page di Google in immagini.

wkhtmltoimage https://google.com google.png

Produzione:

Puoi anche specificare un formato di file personalizzato che vuoi che abbia l'immagine di output. Wkhtmltoimage supporta le seguenti estensioni di file:

  • JPEG/JPG
  • PNG
  • SVG

Ad esempio, se vuoi generare un'immagine JPG, sostituisci semplicemente l'estensione del file con JPG nel comando:

wkhtmltoimage https://google.com google.jpg

Relazionato: JPG vs. JPEG: qual è la differenza tra questi formati di file immagine?

Acquisizione di pagine Web utilizzando il terminale Linux

Devi avere un visualizzatore PDF installato sul tuo sistema Linux se vuoi visualizzare i file PDF generati da wkhtmltopdf. Sebbene la maggior parte delle distribuzioni Linux sia dotata di un editor PDF preinstallato, puoi scegliere e installare manualmente un editor PDF adatto alle tue esigenze.

E-mail
I 5 migliori editor PDF Linux da provare

Hai bisogno di modificare un file PDF in Linux? Questi editor PDF Linux sono gratuiti da installare e facili da usare.

Leggi Avanti

Argomenti correlati
  • Linux
  • PDF
  • Linux
Circa l'autore
Deepesh Sharma (67 Articoli Pubblicati)

Deepesh è l'editor junior per Linux di MUO. Scrive contenuti informativi su Internet da oltre 3 anni. Nel tempo libero ama scrivere, ascoltare musica e suonare la chitarra.

Altro da Deepesh Sharma

Iscriviti alla nostra Newsletter

Iscriviti alla nostra newsletter per consigli tecnici, recensioni, ebook gratuiti e offerte esclusive!

Ancora un passo…!

Conferma il tuo indirizzo e-mail nell'e-mail che ti abbiamo appena inviato.

.