Online nástroje k rozpoznávání textu z obrázků.
OCR nástroje jsem testoval na části českých skript, naskenovaných do PDF.
Na adrese http://www.onlineocr.net je první z nástrojů.
Po vložení adresy dokumentu je uživatel informován o průběhu nahrávání. Poté je třeba opsat kontrolní kód a potvrdit žádost o rozpoznání.
Bez registrace nejde vybrat jazyk, po registraci získáváte množství nástrojů a exportů. Omezení na velikost pdf je pak 30MB. Nicméně počet převodu je omezen, na začátku máte k dispozici zdarma 5 stran, kredity pro další převody si musíte koupit, takže převod vlastně není zdarma.
Výstup:
le I:TVOD Li SENZOR Senzor je funkeni prvek tvofici vstupni blok meficiho fetezce, ktery je v pfirnem styku s mefenYm prostfedim. Misto pojmu senzor se pouZivaji te2 terminy snimae, pfevodnik (angi. transducer) nebo detektor. Citliva east senzoru se nekdy oznaeuje jako id1o. Senzor snima sle-dovanou fyzikalni, chemickou nebo biologickou velieinu a transformuje ji na vystupni (mero-nosnou) velieinu — nejeasteji analogovY nebo eislicovY elektrick.Y signal. Typy senzora Die met' ene senzory teploty, tlaku, prfitoku, optickYch veliein, mechanickYch veliin (posunuti, polohy, rych-losti, zrychleni, shy, mechanickeho napeti aj.), chemicke a biologicke senzory, senzory elektric-k3"Tch a magnetickYch velioin aj. Die )5zikeilniho principu: senzory odporove, indukenostni, indukeni, kapacitni, magneticke, piezoelektricke, pyroelektric-ke, opticke, chemicke, biologicke aj. Die styku senzoru s inefen)im prostredim: bezdotykove, dotykove.
Na adrese http://free-ocr.com je další nástroj. Velikost pdf je omezeno na 2MB.
Převádět lze z formátů: PDF, JPG, GIF, TIFF or BMP. Při převodu je možné vybrat jazyk včetně češtiny.
Pro odeslání je nutné vybrat soubor, jazyk a opsat kontrolní kód.
Výstup:
r. rlrvon 1.1 ŠENZOR Senzor je funkční prvek tvořící vstupní blok měřicího řetězce, který je V přímém styku S měřeným prostředím. Místo pojmu Senzor se používají též termíny Snímač, převodník (angl. trćınsducer) nebo detektor. Citlivá část senzoru se někdy označuje jako čidlo. Senzor snímá sle- dovanou fyzikální, chemickou nebo biologickou veličinu a transformuje ji na výstupní (měro- nosnou) veličinu ~ nejčastěji analogový nebo číslicový elektrický signál. Typy senzorů j Dle měřené veličiny.“ Senzory teploty, tlaku, průtoku, optických veličin, mechanických veličin (posunutí, polohy, rych- losti, zrychlení, Síly, mechanického napětí aj.), chemické a biologické senzory, senzory elektric- kých a magnetických veličin aj _ Dle jfižzikálniho principu.“ senzory odporové, indukčnostní, indukční, kapacitní, magnetické, piezoelektrícké, pyroelektric- ké, optické, chemické, biologické aj. Dle styku senzoru S měřeným prostředím.“ bezdotykové, dotykové.
Na adrese http://www.newocr.com/ je další nástroj, který má omezení na velikost pdf 20MB.
Pro odeslání je nutné vybrat soubor a jazyk. Dále je možné výstup otáčet. Kontrolní kód není třeba, ale vícestránková pdf je nutno v dalším kroku převádět po stránkách.
Výstup:
i. ÚVOD 1.1 SENZOR Senzor je funkční prvek tvořící vstupní blok měřicího řetězce, který je V pñmém styku S měřeným prostředím. Místo pojmu Senzor se používají též termíny snímač, převodník (angl. transducer) nebo detektor. Citlivá část senzoru se někdy označuje jako čidlo. Senzor snímá sle- dovanou fyzikální, chemickou nebo biologickou veličinu a transfonnuje ji na výstupní (měro- nosnou) veličinu - nejčastěji analogový nebo Číslicový elektrický signál. Typy senzorů Dle měřené veličiny: Senzory teploty, tlaku, průtoku, optických veličin, mechanických veličin (posunutí, polohy, rych- losti, zrychlení, Síly, mechanického napětí aj.), chemické a biologické senzory, Senzory elektric- kých a magnetických veličin aj. Dle jjžzikální/10 principu.“ Senzory odporové, indukčnostní, indukční, kapacitní, magnetické, piezoelektrické, pyroelektric- ké, optické, chemické, biologické aj. Dle styku senzoru S měřeným prostředím.“ bezdotykové, dotykové.
Vidíme, že nejlepšího (i kdyz ne úplně dokonalého) výsledku dosahuje nástroj na http://www.newocr.com/.
Tento web jsem zakládal na střední, v roce 2008. Je zde hlavně archiv mé tvorby.
Aktuální věci publikuji kvůli úspoře času na Twitter.
Honza
"Čas je materiál, ze kterého se vyrábí život."