OCR software je software určený pro strojové čtení a vytěžování dokladů a jiných dokumentů. Mezi na českém trhu nejznámější aplikace tohoto typu patří český software Rossum.

Kvalita takového software se určuje podle toho, s jakou přesností dokáže vytěžit jednotlivé druhy dokumentů (včetně těch digitalizovaných ve formě fotografie) a jak moc složité je učení takové aplikace. Učení probíhá zpravidla tak, že aplikaci „ukážeme“ několik desítek prvních dokladů či jiných dokumentů a definujeme, co znamenají jeho jednotlivé prvky. Do této činnosti se zapojuje takzvané strojové učení, kdy se aplikace z našich vstupních dat učí jim rozumět a správně určovat typy dokumentů a dokladů nahraných později a také z nich správně extrahovat potřebná data.

Čím přesnější dokáže OCR software být, tím méně práce zbývá na toho, kdo aplikaci obsluhuje nebo následně zpracovává získané výstupy. Nejlepší aplikace pro vytěžování dat dokáží nabídnout přesnost kolem 95 %. Vždy to však záleží na tom, zda se doklad či dokument drží nějaké standardizované formy nebo má jednotlivé prvky rozmístěny či pojmenovány jinak.

Strojové vytěžování dokumentů je rozhodně trend a budoucnost práce s daty přicházejícími z „offline“ do digitálního světa.

 

Řešení Docspoint slouží jako elektronický archiv daňových dokladů.

Archivujte a spravujte své účetní doklady online, bez papírů a v souladu s českou legislativou.