V poslednom čase sa v odborných médiách a medzi účtovníkmi pomerne často spomína téma automatizácie a digitalizácie niektorých účtovných úloh. Aj účtovníci ako profesionáli chcú svojim klientom priniesť čo najväčšiu hodnotu. Táto hodnota spočíva v poradenstve, správnom účtovaní dokladov a vedení účtovníctva v stave, ktorý zodpovedá štandardom západných krajín (a samozrejme požiadavkám orgánov verejnej správy a zákonov). Základom zefektívnenia práce (nielen) účtovníkov, ale v podstate všetkých, ktorí pracujú s dokumentmi, je digitalizácia dokumentov.

Aj tento problém má niekoľko úrovní. Od jednoduchého naskenovania dokumentu a jeho uloženia do formátu PDF alebo obrázka až po jeho vyťaženie pomocou špecializovaného softvéru (tzv. OCR - optické rozpoznávanie znakov). O čom hovoríme v prípade " vyťažovania dokumentov"? Vďaka moderným technológiám sú dnes počítače schopné "čítať" naskenované dokumenty a účtovné doklady a pracovať s takto získanými údajmi. Môžu ich napríklad ukladať do rôznych programov (CRM, ERP, účtovné programy atď.) a umožniť ďalšie spracovanie získaných údajov (účtovníctvo, štatistiky, rôzne výpočty atď.) bez toho, aby ich bolo potrebné ručne prepisovať.

Je pravda, že presnosť strojového čítania údajov je stále obmedzená. V bežnom komerčnom využívaní týchto technológií sme však stále v relatívne skorej fáze. Samotná technológia strojového čítania je na trhu už pomerne dlho. Vzhľadom na náklady na vývoj bola však veľmi drahá, a preto bola dostupná skôr pre veľké spoločnosti alebo vládne inštitúcie, ktoré spracovávali dokumenty veľkého významu alebo (historickej) hodnoty.

Ako to však už býva, každá technológia sa časom stane lacnejšou, pretože sa neustále vyvíja, a časom sa stane dostupnou aj pre menšie a stredné podniky. K tomuto stavu sa pomaly, ale isto približuje aj OCR. Hoci stále nejde o zanedbateľné náklady, určite nie sú pre malé a stredné podniky úplne nedostupné. To umožňuje aj kancelárskym pracovníkom automatizovať niektoré monotónne práce s nízkou pridanou hodnotou, prenechať ich strojom a venovať sa činnostiam s vyššou hodnotou.

Čo je potrebné? Zvyčajne potrebujete špecializovaný softvér určený na strojové čítanie (softvér OCR). V českom kontexte je pravdepodobne najznámejším a najlepším riešením Rossum od rovnomennej spoločnosti. Toto riešenie používame aj v našej aplikácii Docspoint. Podľa našich skúseností ide pravdepodobne o systém s najvyššou presnosťou, ktorý dokáže správne prečítať 70-90 % údajov v dokumente.

Ani takýto pokročilý softvér však nie je všemocný. Na správne fungovanie potrebuje, aby naskenované dokumenty spĺňali určitú štruktúru, ktorú sa softvér "naučí" na začiatku používania a potom postupuje podľa uložených šablón. V okamihu, keď sa zmení šablóna určitého typu dokumentu, je potrebné "znovu naučiť" extrakčný softvér. To znamená, že mu ukážete, ktoré šablóny v dokumente sa zmenili alebo presunuli a kde alebo v akej forme ich má teraz softvér OCR hľadať.

Nemôžeme teda predpokladať, že môžeme naskenovať akýkoľvek dokument, ktorý sa nám dostane do rúk, a extrakčný softvér ho bezchybne extrahuje hneď na prvýkrát. Tieto aplikácie pracujú s "mapami dokumentov", t. j. pokynmi, kde hľadať konkrétne typy údajov a v akej forme. Napríklad variabilné symboly, názov a adresa dodávateľa, dátumy splatnosti faktúr, predmet transakcie atď. Správne zadanie týchto "máp" je na zamestnancovi alebo dodávateľovi, ktorý vykonáva prvotné nastavenie aplikácie OCR.

Na druhej strane, počiatočná trpezlivosť pri učeniu extrakčného softvéru sa určite oplatí. Najmä ak spracovávate veľké objemy desiatok až stoviek dokumentov mesačne. V takýchto prípadoch sa dajú ušetriť desiatky hodín času. Takéto úspory, napríklad v prípade účtovníkov, dnes predstavujú aj vyššie jednotky či nižšie desiatky tisíc korún na zamestnanca (ak si uvedomíme platové podmienky účtovníkov v Českej republike, ktoré sa často šplhajú k 40 000 Kč (cca. 1 600 eur) hrubého mesačne).

Zistite, ako vám Docspoint môže ušetriť desiatky hodín času a účtovných nákladov.

Kontaktujte nás pre nezáväznú konzultáciu a bezplatnú ukážku.