Online usluge za prepoznavanje teksta

Pozdrav svim čitateljima bloga!

Mislim da oni koji često rade na računalu (ne igraju se, tj. Radi), morali su se nositi s prepoznavanjem teksta. Pa, primjerice, skenirali ste odlomak iz knjige i sada trebate umetnuti ovaj dio u svoj dokument. No, skenirani dokument je slika i trebamo tekst - za to, a posebni programi i online usluge potrebni su za prepoznavanje teksta sa slikama.

O programu za priznanje, već sam napisao u prethodnim postovima:

- skeniranje teksta i prepoznavanje u FineReaderu (plaćen program);

- raditi u analognom FineReader - CuneiForm (besplatni program).

U istom članku želim se usredotočiti na online usluge pri prepoznavanju teksta. Uostalom, ako trebate brzo dobiti tekst s 1-2 slike - nema smisla gnjaviti s instalacijom različitih programa ...

Važno! Kvaliteta prepoznavanja (broj pogrešaka, čitljivost itd.) Jako ovisi o izvornoj kvaliteti slike. Stoga, prilikom skeniranja (fotografiranja itd.) Odaberite kvalitetu što je više moguće. U većini slučajeva kvaliteta od 300-400 dpi bit će dovoljna (dpi je parametar koji karakterizira kvalitetu slike.) U postavkama skoro svih skenera ovaj parametar obično je označen.

Online usluge

Kako bih prikazao rad usluga, napravio sam screenshot jednog od mojih članaka. Ovaj snimak zaslona bit će preuzeta na sve usluge opisane u nastavku.

1) http://www.ocrconvert.com/

Svoju sam uslugu jako voljela zbog njegove jednostavnosti. Stranica je i engleski, ali dobro radi i sa ruskom. Ne morate se registrirati. Da biste započeli priznavanje, morate poduzeti tri radnje:

- prenesite sliku;

- odabir jezika teksta koji je na slici;

- Pritisnite tipku za početak prepoznavanja.

Podržani formati: PDF, GIF, BMP, JPEG.

Rezultat je prikazan ispod na slici. Moram reći, tekst je dobro prepoznat. Osim toga, vrlo brzo - čekao sam doslovce 5-10 sekundi.

2) http://www.i2ocr.com/

Ova usluga funkcionira slično kao i gore. Ovdje također trebate preuzeti datoteku, odabrati jezik prepoznavanja i kliknuti gumb ekstrakt teksta. Usluga je vrlo brza: 5-6 sek. za jednu stranicu.

Podržava formate: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Rezultat ove online usluge je mnogo praktičniji: odmah vidite dva prozora - prvi je rezultat prepoznavanja, u drugoj - izvornoj slici. Stoga je dovoljno jednostavno napraviti izmjene tijekom uređivanja. Usput, ne morate se registrirati za uslugu.

3) http://www.newocr.com/

Ova je usluga jedinstvena na nekoliko načina. Prvo, podržava "newfangled" DJVU format (usput, puni popis formata: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Drugo, podržava izbor tekstualnih područja na slici. Ovo je vrlo korisno kada na slici imate samo tekstualna područja, ali i grafičku koja ne morate prepoznati.

Kvaliteta priznanja je iznad prosjeka, ne morate se registrirati.

4) http://www.free-ocr.com/

Vrlo jednostavna usluga prepoznavanja: preuzmite sliku, odredite jezik, unesite captcha (usput, jedina usluga u ovom članku gdje treba izvršiti) i pritisnite gumb za prevođenje slike u tekst. Zapravo sve!

Podržani formati: PDF, JPG, GIF, TIFF, BMP.

Rezultat prepoznavanja je prosjek. Postoje pogreške, ali ih nema. Međutim, ako bi kvaliteta izvorne snimke zaslona bila veća - pogreške bi bile manje od veličine.

PS

Ovo je sve za danas. Ako znate više zanimljivih usluga za prepoznavanje teksta - dijelite komentare, bit ću vam zahvalni. Jedno stanje: poželjno je da nije bilo potrebno registrirati se i usluga je bila besplatna.

Sve najbolje!