Postoje razni razlozi zašto biste htjeli pretvoriti PDF datoteku u tekst koji se može uređivati. Možda trebate izmijeniti stari dokument i sve što imate je PDF inačica. Pretvaranje PDF datoteka u sustavu Windows je jednostavno, ali što ako koristite Linux?
Bez brige. Pokazat ćemo vam kako jednostavno pretvoriti PDF datoteke u tekst koji se može uređivati pomoću alata naredbenog retka pod nazivom pdftotext, koji je dio paketa "poppler-utils". Ovaj alat možda je već instaliran. Da biste provjerili je li pdftotext instaliran na vašem sustavu, pritisnite "Ctrl + Alt + T" da biste otvorili prozor terminala. Upišite sljedeću naredbu i pritisnite "Enter".
dpkg -s poppler-utils
NAPOMENA: Kada kažemo da nešto napišemo u ovom članku i postoje citati oko teksta, NEMOJTE upisati citate, osim ako ne odredimo drukčije.
Ako pdftotext nije instaliran, upišite sljedeću naredbu i pritisnite "Enter".
sudo apt-get install poppler-utils
Upišite svoju lozinku kada se to zatraži i pritisnite "Enter".
Postoji nekoliko alata dostupnih u poppler-utils paketu za pretvaranje PDF-a u različite formate, manipuliranje PDF datotekama i vađenje podataka iz datoteka.
Slijedi osnovna naredba za pretvaranje PDF datoteke u tekstualnu datoteku koja se može uređivati. Pritisnite "Ctrl + Alt + T" za otvaranje prozora terminala, upišite naredbu u brz i pritisnite "Enter".
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Promijenite put do svake datoteke da biste odgovarali lokaciji i nazivu izvorne PDF datoteke i gdje želite spremiti rezultirajuću tekstualnu datoteku. Također, promijenite nazive datoteka kako bi odgovarale imenima vaših datoteka.
Tekstna datoteka je stvorena i može se otvoriti baš kao što biste otvorili bilo koju drugu tekstualnu datoteku u Linuxu.
Pretvoreni tekst može imati prekidne linije na mjestima koja ne želite. Odluke linije unose se nakon svakog retka teksta u PDF datotekama.
Možete zadržati izgled vašeg dokumenta (zaglavlja, podnožja, paging itd.) Iz izvorne PDF datoteke u konvertiranoj tekstualnoj datoteci pomoću oznake "-layout".
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Ako želite pretvoriti samo niz stranica u PDF datoteku, upotrijebite oznake "-f" i "-l" (mala slova "L") da biste odredili prve i zadnje stranice u rasponu koji želite pretvoriti.
pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Za pretvaranje PDF datoteke koja je zaštićena i šifrirana zaporkom vlasnika, upotrijebite zastavicu "-opw" (prvi znak u zastavici je mala slovo "O", a ne nula).
pdftotext -opw 'lozinka' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Promijenite "lozinku" na onu koja se koristi za zaštitu izvorne PDF datoteke koja se pretvara. Provjerite jesu li pojedinačni citati, a ne dvostruki, oko "lozinke".
Ako je PDF datoteka zaštićena i šifrirana korisničkom lozinkom, upotrijebite oznaku "-upw" umjesto oznake "-opw". Ostatak naredbe je isti.
Također možete odrediti vrstu kraja retka koji se primjenjuje na konvertirani tekst. To je osobito korisno ako namjeravate pristupiti datoteci na drugom operativnom sustavu kao što je Windows ili Mac. Da biste to učinili, upotrijebite zastavicu "-eol" (srednji znak u zastavici je mala slovo "O", a ne nula) nakon kojeg slijedi razmak i vrsta krajnjeg retka koji želite upotrijebiti (" unix "," dos "ili" mac ").
NAPOMENA: Ako ne odredite naziv datoteke za tekstnu datoteku, pdftotext automatski koristi bazu naziva datoteke u PDF-u i dodaje proširenje ".txt". Na primjer, "file.pdf" pretvorit će se u "file.txt". Ako je tekstualna datoteka navedena kao "-", konvertirani tekst šalje se u stdout, što znači da se tekst prikazuje u prozoru terminala i da se ne sprema u datoteku.
Da biste zatvorili prozor terminala, kliknite gumb "X" u gornjem lijevom kutu.
Za više informacija o naredbi pdftotext, upišite "man page pdftotext" na upit u prozoru terminala.