Detekcja faktur


System PROGMATE DOCs jest wyposażony w opcjonalną wtyczkę, która odpowiada za wykrywanie danych zapisanych w dokumencie bez konieczności uczenia jego układu. Do konfiguracji wykorzystany jest słownik kontrahentów, który powinien występować w PROGMATE DOCs (może on być zintegrowany np. z systemem finansowo-księgowym).

Algorytm wymaga dokumentu, który jest już po procesie rozpoznawania tekstu (OCR), dlatego przeważnie przed detekcją ustawiony zostaje moduł serwerowy OCR np. ABBYY FineReader Engine. Końcowy wynik przekazywany jest np. do formularza, który decyduje, jakie dane wstawić do odpowiednich pól. Podpowiedzi pojawiające się przy wypełnianiu pól w formularzu faktury generowane są na podstawie informacji uzyskanych przez wbudowany mechanizm OCR.

Aktualnie algorytm detekcji polskich faktur poszukuje następujących pól: NIP (kontrahenta), Data sprzedaży, Data wystawienia, Data płatności, Suma netto, Suma VAT, Do zapłaty (suma brutto), Sposób zapłaty, Rodzaj faktury (Oryginał).
Badana skuteczności na potrzeby wdrożeń u klientów wykazały skuteczność algorytmu na poziomie: 80%.

Możliwy jest jeszcze drugi typ podejścia: poprzez selektywny OCR. Rozpoznawanie danych ze skanowanych faktur odbywa się dzięki zaangażowaniu dodatkowych narzędzi. Istnieje wśród nich klasa oprogramowania wymagającego uczenia (konfiguracji) wyglądu poszczególnych dokumentów. Rozwiązanie takie ze względu na spore koszty, ma sens tylko wtedy gdy jest jasno określony powtarzalny format dokumentu oraz trzeba rozpoznać specyficzne dane.

Dodatkowo warto wspomnieć o formularzu, który najpierw wywołuje detekcję, a następnie odbiera i prezentuje rozpoznane dane. To formularz podejmuje decyzję jak z danych skorzystać (np. gdzie je zapisać w pliku XML). Jest to spowodowane tym, że detekcja jest uniwersalna dla wszystkich dokumentów, a formularz specyficzny dla konkretnego klienta. Dodatkowo przy tej okazji formularz potrafi sam uzupełnić dane w formularzu na bazie atrybutów (ATRYBUT -> FORMULARZ) oraz uzupełnić atrybuty przy zapisie formularza (FORMULARZ -> ATRYBUT). Dodatkowo formularz potrafi analogicznie jak z atrybutami uzupełnić pola na bazie rekordu zewnętrznego (REKORD -> FORMULARZ) oraz potrafi podłączyć rekord do dokumentu na bazie wybranych rekordów w formularzu (FORMULARZ -> REKORD).


Zobacz także
Galeria
Funkcjonalności PROGMATE DOCs