Systemy masowego OCR dokumentów dla potrzeb projektów RODO

Systemy Masowego OCR (Optical Character Recognition) dokumentów dla potrzeb projektów RODO w sposób automatyczny konwertują, zamieniają duże zbiory zgromadzonych niezdygitalizowanych dokumentów na przeszukiwalne pliki (np. PDF z przeszukiwalną warstwą tekstową, PDF-A), które mogą
zostać przekazane do kolejnego etapu np. obiegu dokumentów lub do wskazanego miejsca przechowywania (archiwum).

Etapy działania przykładowego systemu:

  1. ROZDZIELENIE DOKUMENTÓW (opcjonalnie) ZA POMOCĄ: arkuszy separujących, kodów kreskowych lub ustalonej liczby stron na dokument
  2. IMPORTOWANIE OBRAZÓW DOKUMENTÓW PAPIEROWYCH (tiff, jpeg, pdf, djvu, bmp, pcx, doc, docx, xls, xlsx, ods, txt, html), ze: skanerów (zalecane 300 dpi), folderów, serwerów e-mail, bibliotek programu microsoft sharepoint
  3. ROZPOZNAWANIE – automatyczny proces ocr, zamieniający obrazy oryginałów dokumentów w elektroniczne pliki pozwalające na wyszukiwanie pełnotekstowe i długoterminową archiwizację cyfrową
  4. WERYFIKACJA (opcjonalnie – stacja weryfikacji w celu akceptacji poprawności rozpoznania).
  5. KLASYFIKACJA I INDEKSOWANIE (opcjonalnie) pozyskanie kluczowych danych z dokumentów
  6. EKSPORTOWANIE W FORMIE EDYTOWALNYCH DOKUMENTÓW (skompresowane pliki z przeszukiwalną warstwą tekstową: pdf, pdf-a dane xml, xls, doc, docx, txt, html, jpeg)

Systemy  mają zastosowanie:

  • W każdej firmie, organizacji przetwarzącej dane osobowe, posiadającej duże zbiory dokumentów, które zgodnie z RODO powinny mieć formę pozwalającą w dowolnym czasie na: wgląd do danych, ich uaktualnienie, przeniesienie lub usunięcie z bazy.
  • W projektach związanych z przetwarzaniem danych osobowych, które wymagają konwersji dokumentów w średniej lub dużej skali.

Idea zastosowania systemów:

  • Rozwiązania serwerowe, które wykorzystując zaawansowaną funkcjonalność OCR automatyzują proces przechwytywania dużych ilości dokumentów.
  • Umożliwiają ustalenie efektywnych procesów konwersji dokumentów papierowych w formie plików TIFF, JPEG i PDF w elektroniczne pliki nadające się do wyszukiwania pełnotekstowego i długoterminowej archiwizacji cyfrowej.
  • Mogą być samodzielną kompletną usługą lub integralną częścią systemów zewnętrznych, tj. systemów zarządzania treścią (content management), zarządzania dokumentami (document management), planowania zasobów przedsiębiorstwa (ERP), skanowania dokumentów (document capture) oraz ich sortowania.

Cechy Systemów:

  • rozwiązania serwerowe do automatycznego digitalizowania dokumentów
  • wykorzystując technologię OCR, precyzyjnie rozpoznają dane z dokumentów (tekst maszynowy, kody jedno i dwuwymiarowe)
  • rozpoznają ponad 190 rodzajów języków
  • zamieniają pozyskane obrazy w pliki z przeszukiwalną warstwą tekstową, pozwalające na pełnotekstowe wyszukiwanie
  • przesyłają skonwertowane pliki we właściwych formatach do wskazanego systemu przechowywania (archiwum), systemu zarządzania, celem dalszego procesowania.
  • umożliwiają manualne kategoryzowanie plików, ich oznaczenie dzięki zastosowaniu metadanych i inteligentnego nazewnictwa plików
  • dają możliwość rozszerzenia mocy obliczeniowej dzięki łatwej skalowalności rozwiązania
  • posiadają prosty i intuicyjny interfejs użytkownika

Oferowane systemy automatyzujące przechwytywanie dokumentów i danych: ABBYY Recognition Server i ABBYY Flexicapture.

Działanie Systemów Zgodnie z Zasadami RODO:

  • Zgodności z prawem:
    technologia OCR gwarantuje rzetelne, precyzyjne i przejrzyste przetwarzanie dokumentów, ich zamianę w przeszukiwalne pliki PDF.
  • Zasada ograniczenia celu:
    funkcja eksportu dokumentów w postaci przeszukiwalnych plików pozwala w konkretnych, wyraźnych i prawnie uzasadnionych celach, za pomocą funkcji pełnotekstowego przeszukiwania, odnaleźć właściwe dokumenty niezbędne do dalszego procesowania.
  • Zasada prawidłowości:
    dokumenty są precyzyjnie sczytane, w razie konieczności mogą być zastąpione aktualną wersją.
  • Zasada ograniczonego przechwowywania:
    automatyczna konwersja skanów na formę przeszukiwalną dokumentów, pozwala na archiwizowanie elektronicznie oraz na usunięcie danych w dowolnym momencie.
  • Zasada minimalizacji danych:
    przesłanie edytowalnych plików do elektronicznej archiwizacji pozwala w dowolnym momencie pozyskać konkretne dane dla celów, dla których są przetwarzane.
  • Zasada bezpieczeństwa:
    automatyczna konwersja, przetworzenie dokumentów w przeszukiwalne pliki i ich cyfrowa archiwizacja zapobiega przypadkowej utracie danych, zniszczeniu lub uszkodzeniu

Korzyści:

  • digitalizacja dużych volumenów różnego typu dokumentów
  • dokumenty trafiające do systemów są zapisywane i automatycznie konwertowane w formie przeszukiwalnych plików np. PDF, PDF-A
  • skonwertowane dokumenty mogą być archiwizowane elektronicznie, udostępniane, edytowane w dowolnym momencie celem dalszego procesowania
  • automatyczny proces importu dokumentów do przetwarzania
  • szybkie przeszukiwanie przetworzonych zbiorów i precyzyjne odnajdywanie właściwych dokumentów
  • optymalny stosunek rozmiaru do jakości plików dzięki zastosowaniu technologii kompresji MRC
  • rozwiązania są proste we wdrożeniu i zarządzaniu, konfiguracja systemów nie wymaga szkolenia

Chcesz wiedzieć więcej? - wypełnij formularz, a my skontaktujemy się tak szybko jak to możliwe!

Imię i nazwisko*:   
E-mail*:   
(i/lub) Telefon*:   
Pytanie:   
2 + 1 (słownie)*: