Naturalnym miejscem wykorzystania technologii OCR wydają się być departamenty księgowości, biura księgowe oraz centra outsourcingowe odpowiedzialne za przepisanie danych z kluczowych dokumentów dla każdej firmy czyli FAKTURY.
Faktura jako dokument o nie określonej strukturze i występowaniu danych które trudno jednoznacznie zinterpretować, jest bardzo ciężkim przypadkiem do zastosowania automatycznego pozyskiwania danych za pomocą narzędzi OCR.
Z pomocą przychodzi innowacyjny system dedykowany do automatycznego odczytywania danych z faktur o nazwie AUTODEKRET
Idea działania
System Autodekret jest rozwiązaniem wspomagający pracę księgowych, sekretariatów oraz centr outsourcingowych po przez automatyzację procesu pozyskiwania danych z dokumentów jakimi są faktury.
Dzięki wykorzystaniu technologii AutoLearningu możliwe jest uzyskanie efektu uczenia się systemu na podstawie przetwarzanych dokumentów które weryfikowane są przez weryfikatorów za pomocą prostego i intuicyjnego interfejsu graficznego.
Prostota obsługi stacji weryfikacji jest kluczową zaletą systemu ze względu na minimalne obciążenie weryfikatora, sprowadzające się jedynie do zaznaczania myszką poszukiwanych obszarów na dokumencie, co zapamiętywane jest przez system i wykorzystywane podczas ponownego przetwarzania podobnego dokumentu od danego wystawcy.
Każdorazowe wykonanie korekty w rozpoznaniu dokumentu, powoduje zwiększenie bazy wiedzy systemu która na bieżąco wykorzystywana jest przez system.
Dzięki bezpośredniej integracji z systemami Finansowo Księgowymi, ERP, ECM,CRM użytkownik nie musi dbać o importowanie danych do systemów zewnętrznych oraz o integralność formatu danych - o wszystkie te elementy dba system AutoDekret.
Po wdrożeniu Systemu czas przepisywania danych z faktur i wprowadzania ich do systemów zewnętrznych skraca się kilku krotnie.
Poszczególne etapy procesu przetwarzania
Import dokumentów
- wprowadzanie danych poprzez skaner wykorzystujące protokół TWAIN lub ISIS - z wbudowanymi funkcjami wstępnego przetwarzania obrazu
- import dokumentów lub formularzy w różnorodnych formatach grafiki - TIFF, JPG, PCX, BMP
- import za pośrednictwem plików PDF
- import za pośrednictwem aktywnego folderu „Hot Folder” - pozwalającego na aktywny import obrazów
- uproszczony import - z wykorzystaniem domyślnego profilu
- import załączników wiadomości e-mail bezpośrednio ze skrzynki pocztowej
Rozpoznawanie dokumentów z automatyczną kontrolą poprawności
AutoDekret bazuje na wielokrotnie nagradzanych rozwiązaniach do rozpoznawania tekstu firmy ABBYY oferujących niespotykaną dotąd dokładność i stabilność pracy.
Oferowane przez AutoDekret rodzaje rozpoznawania to m.in.:
- OCR - druk maszynowy, obsługa 190 języków, w tym rozpoznawanie pełno tekstowe dokumentów niestrukturalnych
- ICR - pismo odręczne, obsługa 92 języków
- OMR - znaczniki, w tym zakreślenia wokół wybranego tekstu lub wartości liczbowych, pola wyboru, krzyżyki, dymki itp.
- OBR (kody kreskowe) - wiele rodzajów kodów 1D oraz 2D
Etapami rozpoznawania, które uruchamiane są automatycznie i mogą być uruchamiane jako procesy w tle, są m.in.:
- wstępne przetwarzanie obrazu - działania mające na celu poprawienie jakości rozpoznawania, takie jak korekta orientacji strony, odwrócenie lub wyprostowanie strony, a także usunięcie „szumów”
- automatyczna klasyfikacja dokumentów - Moduł określa czy procesowany dokument jest fakturą czy innym dokumentem - dopasowuje istniejące szablony dokumentów do zaimportowanych obrazów i klasyfikuje poszczególne trony wg rodzajów
- wyodrębnianie danych i tekstu - zależnie od rodzaju dokumentu, rozwiązanie do rozpoznawania precyzyjnie wyodrębnia odpowiednie dane i tekst
- automatyczna kontrola poprawności danych - w celu zwiększenia dokładności rozpoznawania, w trakcie procesu automatycznie stosowane są wbudowane reguły kontroli poprawności
Weryfikacja
- intuicyjny interfejs do weryfikacji, z możliwością dostosowywania - operatorzy mogą z łatwością sprawdzać dane, ponieważ każdemu rozpoznanemu znakowi przypisywany jest status, który informuje, czy system jest pewny wyniku swojego rozpoznawania. Interfejs daje operatorowi możliwość zadecydowania, czy dane mają być zaakceptowany, czy poprawione.
- łatwa korekta błędów za pomocą funkcji „przeciągnij i upuść” i widoku miniatury dokumentu połączona z automatycznym douczaniem systemu (ponowne przetworzenie podobnego dokumentu zwróci prawidłowe wyniki bazując na ówczesnym douczeniu)
- ręczne indeksowanie - za pomocą AutoDekret, w przypadku pól, których nie można wyodrębnić automatycznie istnieje możliwość dopisania informacji ręcznie
- korekta wyników rozpoznawania „w locie”- automatyczna weryfikacja pól - wykonania weryfikacji poprawności odczytanych danych kwotowych ( Np. Netto + VAT = Brutto lub automatyczne wyliczanie stawki VAT na podstawie odczytanych danych Netto i Brutto)
Eksport, zapis plików do archiwizacji dokumentów
- uproszczony eksport - zgodnie z predefiniowanymi ustawieniami
- eksport obrazów wraz z danymi lub poprzez plik, możliwość zmiany rozdzielczości obrazu
- eksport do pliku - formaty DBF, XLS, CSV, DCX i TXT, w tym obrazy dokumentów, wraz z wyodrębnionymi danymi
- eksport do formatu XML * + eksport plików obrazu
- eksport do bazy danych za pośrednictwem ODBC
- eksport do formatu PDF * lub PDF/A * - pliki przeszukiwalne dla celów archiwizacji
Architektura systemu