Tesseract.js prenaša slikovni OCR v brskalnike

Prevod OCR še vedno ni popoln, vendar se je v zadnjih nekaj letih dramatično izboljšal. Vodilna pot je Tesseract prevajanje trenutno odprtega vira C++.

Čeprav je to neverjetna knjižnica, je omejena na programsko opremo. K sreči je nekdo naredil pristanišče Tesseract v JavaScriptu, ki se imenuje Tesseract.js. To podpira do 60 jezikov in čeprav to zagotovo ni popolno, dobro opravi delo.

Namestitev in nastavitev sta povsem preprosta ciljati na kateri koli element slike na strani in zaženite Tesseract.recognize () funkcijo. To lahko sprejme kakršno koli sliko in samodejno stiskanje in prevajanje v brskalniku.

Lahko dobite veliko bolj zapleteno, a lepota je kako lahko zaženete OCR z eno vrstico kode.

Oglejte si ciljno stran Tesseract.js, če želite prikazati predstavitev v živo. To deluje v brskalniku, kjer lahko povlecite in spustite vsako optično prebrano sliko, da dobite samodejni prevod OCR.

Ta primer lahko prenesete tudi lokalno prek strani GitHub ali pa ustvarite lastno aplikacijo, tako da skripto Tesseract.js vključite neposredno iz CDN-ja..

Najenostavnejši primer kode je naslednji: myImage je neposredno sklicevanje na slikovni element HTML:

 Tesseract.recognize (myImage). Then (funkcija (rezultat) console.log (rezultat));

Knjižnica je tako uporabna, da se lahko premikate z OCR-jem v spletu. To je daleč od popolnosti, ampak je tudi najboljši vir za spletne razvijalce, ki želijo dinamično funkcionalnost OCR-ja na strani.

Če želite izvedeti več, obiščite stran Tesseract.js GitHub, kjer si lahko ogledate predstavitev v živo in brskate po spletni dokumentaciji..