.
FineReader dostane papier do počítača

FineReader dostane papier do počítača

Napísal: admin V kategórií: Dátum vytvorenia: 2017-12-08 Počet zobrazení: 66 Komentárov: 0

Programov na optické rozpoznávanie znakov z naskenovanej grafiky je viac, ale väčšinu ľudí napadne iba jeden – FineReader od firmy ABBYY.

Buďte si istí, že tento softvér je najlepší vo svojej triede, ostatne, kúpilo si ho už okolo 20 miliónov ľudí (v takmer 200 jazykoch) a licencovanú technológiu používajú firmy ako Samsung, Panasonic alebo Xerox. Vybavuje sa nám päť silných skupín, ktoré FineReader najčastejšie používajú:

 

1.      Študenti. Veľmi dobre známa situácia pre všetkých tých, ktorí sa stretli s nedostatočnou vybavenosťou univerzitných knižníc. So softvérom ABBYY FineReader prichádzame prvýkrát do styku často, keď nejaký ročník študentov potrebuje určité skriptum alebo aspoň jeho časť a knihovníčky majú pre celú triedu len jeden kus. Vtedy zistíte, že digitalizácia je oveľa elegantnejšia ako nekonečné fyzické kopírovanie. To isté platí pre výskumníkov, ktorí zdieľajú výsledky prác, ktoré nemajú uložené elektronicky.

2.      Právnici. Advokátske kancelárie, súdy a prokuratúry bývajú najlepšími zákazníkmi firmy ABBYY. Právne dokumenty mávajú často iba papierovú formu a aj pracovníci v tejto oblasti rýchlejšie pracujú s počítačovými súbormi.

3.      Úradníci. Vláda a úrady, druhý typický užívateľ softvéru, ktorý potrebuje prevádzať optické obrázky na digitálny text. Obrovské množstvo tlačív a formulárov sa spracováva v papierovej forme, avšak digitalizácia umožňuje ľahkú hromadnú prácu s nimi a tiež výborné možnosti archivácie nie sú zanedbateľné (jeden disk nahradí celú budovu archívu).

4.      Účtovníci. Firemné materiály – dodacie listy, faktúry, doklady o platbe, skladové príjemky a výdajky – to všetko predstavuje kvôli svojej náročnosti a rôznorodému formátovaniu veľkú výzvu pre každý OCR softvér. Preto vo firmách potrebujú zamestnanci len tie najlepšie programy – napríklad FineReader.

5.      Majitelia starých kníh. Autorské práva platia do 70 rokov po autorovej smrti – nové knihy sa teda bez súhlasu autora nemôžu digitalizovať. Avšak staré kusy z antikvariátu alebo zapadnuté kúsky z knižníc by sa bez prevedenia do dát často asi nezachovali. Predstavte si, že máte storočnú knihu, ktorá vyšla v malom náklade, a viete určite, že iný kus už asi nikde nezoženiete. Elektronickým uložením ju zachováte pre ďalšiu generáciu.

 

FineReader patrí do rodiny starých programov (20+ rokov) a vyvinul sa pôvodne zo slovníka. Jeho autori sa chvália, že ho používali aj polárnici na severnom póle alebo na Antarktíde. Jedno je isté – iba s obyčajným prečítaním skenovaného papiera by si už veľmi dlho nevystačil.

 

Texty bývajú na papieroch rôznej kvality, s rôznymi poškodeniami a artefaktami – technológia rozpoznávania sa teda musí zlepšovať s takmer každým veľkým upgradom. Dokumenty obsahujú až príliš často rôzne tabuľky, zvláštne typografické prvky a usporiadanie – a s tým všetkým si dobrý OCR softvér musí poradiť. V extrémnych prípadoch musí ponúknuť editor na ručnú opravu. Čím menej chýb vo výslednom PDF súbore – tým lepší program.

 

Ale pozor – FineReader musí dnes už často riešiť nielen pekné a ostré skeny, ale veľmi často aj nekvalitné a šikmé fotky z mobilov a podobne. Program musí vedieť rozpoznať použitý jazyk, oddeliť nadpisy a celkovo prečítať štruktúru textu. Mal by aj vedieť s akým formátom vlastne pracuje – či ide o starú knihu alebo napríklad o vizitku. Užívatelia sa totiž nechcú s programom dlho hrať, chcú si vizitku rýchlo uložiť do svojej súkromnej databázy a venovať sa inej práci. Jednoducho, FineReader je forma umelej inteligencie, ktorá nám zjednodušuje prácu.