it-swarm-eu.dev

Impossibile copiare il testo da un file PDF

Sto usando foxit PDF reader per visualizzare il mio libro di testo. Vorrei copiare il testo dal file pdf in un documento Word ma non me lo consente. Posso selezionare bene il testo ma l'opzione per copiare il testo non è disponibile. Posso copiare il testo da altri documenti ma non da alcuni. C'è un modo per aggirare questa protezione in Windows?

37
Jonno_FTW

Il file pdf è stato probabilmente bloccato contro la copia del testo. Di seguito sono due modi per sbloccarlo:

  1. Se il pdf non è stato bloccato contro la stampa, è possibile stamparlo su una stampante pdf virtuale per creare un file sbloccato. Guarda questo:
    "Rimuovi password e sblocco protetto PDF Che è consentito stampare senza conoscere segreti" .
  2. Se la funzione di stampa è stata bloccata, vedere questo:
    "Rimuovi Restrizioni e Decrittografa Password Protetta PDF File con PDF Unlocker" .
28
harrymc
  1. Apri PDF in Google Chrome (trascina il file PDF su Chrome).
  2. Stampa la pagina specifica come PDF o apri semplicemente l'anteprima di stampa.
  3. Ora puoi copiare il testo dall'anteprima di stampa o dal PDF di output. Ma non penso che potresti copiare il tavolo direttamente.
24
Khaleel

Sono stato in grado di creare una versione senza DRM del file PDF utilizzando Ghostscript (che è disponibile per Windows).

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

Il file risultante stripped.pdf può essere caricato in Adobe Reader, e Reader ti consentirà felicemente di copiare qualsiasi parte di esso che desideri. Conserva anche la maggior parte della formattazione del tavolo.

11
Michael Hampton

Sono riuscito a copiare la tabella dal tuo PDF file usando Okular (per Linux, parte di KDE). Per fare questo, ho dovuto andare nelle impostazioni di Okular e deselezionare "Obey Restrizioni DRM".

Sono consapevole del fatto che questo non ti aiuta molto dal momento che stai usando Windows, ma è una possibilità se hai una macchina Linux a portata di mano o se vuoi installarla.

Sfortunatamente era un testo semplice senza formattazione, ma sembra che non dovrebbe essere troppo difficile ricreare la tabella. Puoi vedere i risultati della mia avventura di copia e incolla qui .

2
Michael Hampton

È possibile utilizzare GT Text è un programma che traduce le immagini (anche le istantanee pdf = immagine) in testo. È possibile selezionare l'area e copiarla negli appunti È gratuita

La home page ufficiale è http://gttext.googlecode.com

1
David

Un'altra possibilità è Evince .

In Windows , sembra supportare la copia per impostazione predefinita.

In Linux, la copia può essere abilitata controllando l'impostazione override_restrictions se non lo è già, seguendo queste direzioni (dconf-editor/org/gnome/evinceoverride_restrictions).

0
endolith

se la copia è in grigio, come ora è il dubbio per te, allora PDF è 'bloccato', può essere letto ma in effetti ti impedisce di copiare/incollare qualsiasi cosa da esso.

Questo sito Web sbloccherà un PDF

https://smallpdf.com/unlock-pdf

0
barlop

Questo è riuscito a convertire il testo di base. Tuttavia, è in difficoltà con i tavoli.

http://www.onlineocr.net/documents

0
Rob Sedgwick

Se stai cercando solo brevi frammenti, puoi spesso digitare alcune parole su google all'interno di virgolette e trovare la citazione esatta già scansionata in qualche altro formato o digitata da qualcun altro.

Un'altra opzione è "Documento dalla foto" nell'app Android di Google Documenti, che metterà il testo attraverso l'OCR. Questo è soggetto ad errori, ovviamente.

Vorrei che PDF la funzionalità di blocco non fosse mai esistita. :(

0
endolith

Risposta a endolith:

Il tuo PDF è protetto dalla copia, ma non è protetto dalla stampa.

Quindi ho stampato la pagina contenente la tabella 6.15 in un altro PDF che non è protetto dalla copia, selezionato e copiato nella tabella, quindi incollato in Word. Con mia grande sorpresa il risultato della pasta è stata una vera e propria spazzatura.

Ora ho dato un ulteriore sguardo a questo tavolo e ho trovato un risultato molto sorprendente: Questo non è un tavolo!

In realtà è un montaggio di piccoli pezzi di testo, posizionati sulla pagina in modo da sembrare un tavolo. Ma questo non è un vero tavolo.

Il meglio che puoi fare è riscrivere il tutto come un tavolo, o semplicemente usare nel tuo lavoro uno screenshot di questo testo assemblato simile a una tabella.

Ecco il mio screenshot del tavolo, come preso dal mio documento pdf a pagina unica generato :

image

0
harrymc