it-swarm-eu.dev

Come faccio a salvare un'immagine PDF file come immagine?

Ho un PDF che contiene un'immagine di scansione di un documento. Voglio salvare il contenuto di questo PDF come immagine in modo che possa quindi eseguirlo attraverso un programma OCR che accetta solo file .jpg, .png e .gif.

Come faccio a salvare/convertire questo PDF in uno di quei formati di immagine?

EDIT: Un modo che ho trovato per fare questo è cliccare su ogni pagina. Copia negli appunti. Incolla su Paint.net e quindi salva. Tuttavia, questo è ingombrante in quanto sembra che sia possibile selezionare solo una pagina alla volta in Acrobat Reader.

33
Guy

Si prega di prestare molta attenzione a risposta di pooryorick , in cui si evidenzia come risposta di sleske è in realtà una risposta molto migliore per questo particolare problema.


Usa GhostScript . Questo comando funziona per me:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

Esistono diversi pseudo-dispositivi png che differenziano la profondità del colore: pngmono, pnggray, png16, png256, png16m e pngalpha. Scegli quello che ti si addice meglio.

Puoi anche usare jpeg, ma a meno che tu non abbia un problema di spazio su disco, vuoi la massima qualità che puoi gestire per il tuo OCR, e questo non è jpeg.

GhostScript non ha più il supporto per gif, ma non riesco a immaginare perché ne avresti bisogno, con il supporto png256.

20
wfaulk

Installa Imagemagick . Apri una finestra o un terminale cmd:

convert myfile.pdf myfile.jpg

L'output sarà 1 file jpg per ogni pagina nel tuo pdf, test-0.jpg, test-1.jpg, ecc.

19
DaveParillo

C'è anche pdfimages dagli strumenti Xpdf (disponibile dal sito di XpdfReader ). Non convertirà un'intera PDF pagina su un'immagine, piuttosto estrarrà immagini incorporate da un PDF.

Ciò è utile se PDF contiene testo e immagini e vuoi solo le immagini. Inoltre, estrarrà le immagini nel loro formato originale, quindi nessuna perdita di qualità è coinvolta (a differenza dei programmi che rendono l'intera pagina e poi la convertono ad esempio in JPEG). A seconda delle esigenze questo potrebbe essere utile.


Uso semplice:

pdfimages -j -list mydocument.pdf mydocument-images

Questo leggerà il file di input mydocument.pdf, estrarrà tutte le immagini e le scriverà in singoli file chiamati mydocument-images-0000.jpg, mydocument-images-0001.jpg ecc.

L'opzione -j consente di scrivere immagini compresse JPEG incorporate come file JPEG, non come file PBM/PGM/PPM (che sono non compressi ed enormi). Si noti che le immagini possono ancora essere scritte come file PBM/PGM/PPM, se è così che sono stati memorizzati nel file di input PDF.

13
sleske

Puoi farlo usando Adobe Reader:

  1. Clicca l'immagine. Sarà evidenziato.
  2. Copia (Ctrl-C) e incollalo in Paint.
  3. Salva come qualsiasi tipo di file che ti piace.
11
Hemant

Fatta eccezione per la risposta che menziona pdfimages, tutte le altre risposte non riescono a menzionare che le loro soluzioni effettivamente transcodificano le immagini incorporate. Ad esempio, quelle soluzioni non estraggono semplicemente l'immagine originale, ma la modificano, probabilmente a scapito dell'immagine, durante il processo. Solo pdfimages estrae l'immagine originale. Questo è vero per Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview e molti altri PDF software.

9
pooryorick

PDFill PDF Tools è probabilmente il modo più semplice per convertire i tuoi PDF in immagini su Windows. Ti permetterà di esportare tutte le pagine in PDF per separare le immagini in un colpo solo. Ha anche molte altre funzioni disponibili gratuitamente, che sono disponibili solo in altri PDF spettatori se acquisti la versione commerciale o "Pro".

Usa il pulsante "Converti PDF in Immagini" (pulsante # 10) nello screenshot qui sotto.

PDFill PDF Tools screenshot

Se hai bisogno di concatenare le immagini in un'immagine molto alta, devi solo alimentare un file nel tuo programma OCR, puoi usare IrfanView

4
rob

Dato che non hai incluso un tag del sistema operativo includerò una risposta OSX:

I PDF di default si aprono in Preview.app che ti permette di usare File -> Save-As:

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • TIFF
2
Lake

Inoltre PDF Xchange Viewer (gratuito) eseguirà l'esportazione su file. File → Esporta → Esporta in immagine.

Non solo, ma penso che sia il miglior visualizzatore gratuito PDF viewer per Windows, e ha alcune funzionalità di markup Nice. Ho una licenza per Adobe Acrobat e preferisco ancora questo a meno che non stia facendo un editing completo, che è raro.

1
wfaulk

(Non libero) Acrobat professional fa questo:

Avanzate-> Elaborazione documenti-> Esporta tutte le immagini ...

1
ufotds

Se il file è inferiore a 5 MB e non sei preoccupato per la privacy/riservatezza, è un pratico servizio online all'indirizzo http://www.go2convert.com/ che può fare molte conversioni grafiche (incluso pdf in jpeg)

0
sgmoore