Domača » kako » Kako pretvoriti datoteko PDF v besedilo, ki ga je mogoče urejati z ukazno vrstico v Linuxu

    Kako pretvoriti datoteko PDF v besedilo, ki ga je mogoče urejati z ukazno vrstico v Linuxu

    Za pretvorbo datoteke PDF v besedilo, ki ga je mogoče urejati, obstaja več razlogov. Morda boste morali revidirati stari dokument in vse, kar imate, je njegova različica PDF. Pretvorba datotek PDF v operacijskem sistemu Windows je enostavna, toda kaj, če uporabljate Linux?

    Brez skrbi. Pokazali vam bomo, kako preprosto pretvorite datoteke PDF v besedilo, ki ga je mogoče urejati, z orodjem ukazne vrstice pdftotext, ki je del paketa »poppler-utils«. To orodje je morda že nameščeno. Če želite preveriti, ali je pdftotext nameščen v sistemu, pritisnite “Ctrl + Alt + T”, da odprete okno terminala. V poziv vnesite naslednji ukaz in pritisnite »Enter«.

    dpkg -s poppler-utils

    OPOMBA: Ko v tem članku rečemo, da vnesete nekaj in obstajajo narekovaji okoli besedila, NE vnesite narekovajev, če ne določimo drugače.

    Če pdftotext ni nameščen, vnesite naslednji ukaz v poziv in pritisnite “Enter”.

    sudo apt-get namesti poppler-utils

    Ko boste pozvani, vnesite svoje geslo in pritisnite »Enter«.

    V programu poppler-utils je na voljo več orodij za pretvorbo PDF v različne formate, manipuliranje datotek PDF in pridobivanje informacij iz datotek.

    Spodaj je osnovni ukaz za pretvorbo datoteke PDF v besedilno datoteko, ki jo je mogoče urejati. Pritisnite »Ctrl + Alt + T«, da odprete okno Terminal, vnesite ukaz ob pozivu in pritisnite »Enter«.

    pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Spremenite pot do vsake datoteke, da bo ustrezala lokaciji in imenu izvirne datoteke PDF in kje želite shraniti nastalo besedilno datoteko. Prav tako spremenite imena datotek, da bodo ustrezala imenam datotek.

    Besedilna datoteka je ustvarjena in jo je mogoče odpreti prav tako, kot bi odprli katerokoli drugo besedilno datoteko v Linuxu.

    Pretvorjeno besedilo ima lahko prelom vrstic na mestih, ki jih ne želite. Prelomi vrstic se vstavijo za vsako vrstico besedila v datoteki PDF.

    Postavitev dokumenta (glave, noge, ostranjevalne datoteke itd.) Lahko ohranite iz izvirne datoteke PDF v pretvorjeni besedilni datoteki z zastavico »-layout«.

    pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Če želite pretvoriti samo vrsto strani v datoteko PDF, uporabite zastavice »-f« in »-l« (male črke »L«), da določite prvo in zadnjo stran v obsegu, ki ga želite pretvoriti.

    pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Če želite pretvoriti PDF datoteko, ki je zaščitena in šifrirana z lastniškim geslom, uporabite oznako »-opw« (prvi znak v zastavici je majhna črka »O«, ne nič.).

    pdftotext -pw 'password' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Spremenite »geslo« v tisto, ki se uporablja za zaščito prvotne pretvorjene datoteke PDF. Preverite, ali obstajajo enojni narekovaji, ne dvojni, okoli »geslo«.

    Če je datoteka PDF zaščitena in šifrirana z uporabniškim geslom, namesto zastavice »-opw« uporabite oznako »-upw«. Preostali del ukaza je enak.

    Podate lahko tudi vrsto znaka ob koncu vrstice, ki se uporablja za pretvorjeno besedilo. To je še posebej uporabno, če načrtujete dostop do datoteke v drugem operacijskem sistemu, kot sta Windows ali Mac. Če želite to narediti, uporabite oznako »-eol« (srednji znak v zastavici je majhna črka »O«, ne ničla), ki ji sledi presledek in tip znaka za zaključek, ki ga želite uporabiti (» unix ”,“ dos ”ali“ mac ”).

    OPOMBA: Če ne določite imena datoteke za besedilno datoteko, pdftotext samodejno uporabi osnovo imena datoteke PDF in doda pripono ».txt«. Na primer, »file.pdf« bo pretvorjena v »file.txt«. Če je besedilna datoteka določena kot »-«, se pretvorjeno besedilo pošlje v stdout, kar pomeni, da je besedilo prikazano v oknu terminala in ni shranjeno v datoteko.

    Če želite zapreti okno terminala, kliknite gumb »X« v zgornjem levem kotu.

    Za več informacij o ukazu pdftotext vnesite »man page pdftotext« ob pozivu v oknu Terminal.