Kako izvleči besedilo iz slik z ukazno vrstico
Preprosto lahko preberete sliko in besedilo potegnete sami. Toda dinamično vlečenje besedila iz fotografije je nekoliko težje in na srečo, imgclip ponuja dokaj preprosto rešitev.
To orodje ukazne vrstice deluje v terminalih za Mac, Windows in Linux. Preprosto vzame argument za slikovno datoteko skupaj z jezikom vrne besedilo kopirali v odložišče.
Celotno knjižnico lahko namestite prek npm in je Preprosta namestitev. Stvar je samo nekaj KB veliko in prihaja z JS datoteko, ki jo lahko brskate na GitHubu.
Imgclip uporablja Tesseract.js knjižnica za avtomatizacijo obdelave slik in vlečenje besedila preko OCR. To je ena od najmočnejših OCR knjižnic do danes, in je popolnoma odprta koda, tako kot imgclip.
Mislim, da sem najbolj navdušen nad kakovostjo in hitrostjo tega orodja. Res deluje potegnite natančno besedilo in to je eno najpreprostejših orodij za uporabo.
Ukaz imgclip mora biti teči neposredno v terminalu, sledi relativna pot do slike. Dodate lahko tudi štiri možnosti na koncu prilagodite izhod.
-h
,--pomoč
: oddaja informacije o uporabi-V
,--različica
: izpiše številko različice-l
,--lang
: izpiąe jezik besedila na sliki-str
,--natisnite
: natisne besedilo na sliki (namesto kopiranja v odložišče)
Od tega pisanja, Tesseract podpira 65 jezikov z več na poti. Koda, ki jo dodate v --lang
oznaka mora biti katera koli koda v teh datotekah Tesseract.
Na primer, -l eng
bo iskal sliko za Besedilo v angleškem jeziku, medtem -l jpn
bo iskal Japonsko besedilo in lahko celo bežiš -l jpn_vert
za iskanje vertikalno usmerjeno japonsko besedilo.
Ker se imgclip močno opira na Tesseract, imate v bistvu na razpolago moč celotne knjižnice.
Za začeti, obiščite stran GitHub in lokalno prenesite kopijo ali pa jo z npm namestite v določen imenik. Nato lahko orodje v terminalu zaženete kot aplikacija na razčlenite katero koli želeno sliko.
Videti imgclip v akciji, Oglejte si ta kratek video, ustvarjen kot demo imgclip.