software lettura ottica, Lettura ottica, riconoscimento caratteri ICR OCR OMR BCR CHR, elaborazione immagini, lettura ottica moduli, indicizzazione documenti, estrazione automatica dati Recogniform Technologies - Lettura ottica, riconoscimento caratteri ICR OCR OMR BCR CHR, elaborazione immagini, lettura ottica moduli, indicizzazione documenti, estrazione automatica dati
Come identificare dati in documenti con layout variabile

Come identificare dati in documenti con layout variabile

La tecnologia FREE-FORM è indispensabile per l'identificazione e l'estrazione di dati ed informazioni contenute in documenti con layout non noto, variabile. .

Liberi dal modulo
Il termine "Free-Form", nella sua traduzione letterale, significa "modulo libero": più che "a modulo libero", potremmo dire che la tecnologia Free-Form ci consente di operare in "liberi dal modulo"; liberi cioè dal fornire necessariamente informazioni spaziali (zone, coordinate, aree, etc.) relative all'informazione o al dato da estrarre.

Il vantaggio è immediato: qualsiasi sia il layout del documento da elaborare, siamo in grado di estrarre le informazioni di cui abbiamo bisogno senza preoccuparci di predisporre un "template" specifico.

Dalla mappatura "zonale" alla mappatura "logica"
La tecnologia FREE-FORM nasce dalla sinergia tra sofisticati algoritmi di analisi del layout della pagina e riconoscimento OCR dell'intero documento. Utilizzando le informazioni acquisite attraverso questi, è possibile definire una serie di regole di ricerca, estrazione e verifica dei dati.

Anzichè fornire al sistema solo delle informazioni spaziali da usare per recuperare i dati (zone mapping), si forniscono delle informazioni sulla tipologia di dato da estrarre (logical mapping). Le informazioni fornite al software saranno quindi inerenti il formato atteso, la dimensione, la prossimità ad etichette più o meno specifiche, etc.

Approfondimenti: