Architecture fonctionnelle

1. Capture :

Les documents sont capturĂ©s au travers des diffĂ©rentes chaines entrantes (« Hot » folder, API, download, IMAP, etc
). Le traitement de classification et d’extraction se dĂ©clenche.

2. Extraction :

Le formulaire d’extraction est identifiĂ©, les mĂ©tadonnĂ©es sont extraites des documents via les REGEX et/ou l’apprentissage opĂ©rateur en s’appuyant si besoin sur des rĂ©fĂ©rentiels mĂ©tier et un moteur de rĂšgle.

3. ContrĂŽle :

En fonction du taux d’extraction attendu, les documents sont prĂ©sentĂ©s en vidĂ©o-codage dans le module « VĂ©rifier » Ă  l’opĂ©rateur. Ce dernier vĂ©rifie, complĂšte et valide le formulaire d'extraction. Les Ă©ventuelles modifications opĂ©rĂ©es sont intĂ©grĂ©es dans un mĂ©canisme d’apprentissage pour optimiser avec le temps le taux d’extraction initial (courbe d’apprentissage).

4. Export :

Les métadonnées et les images alimentent les différentes chaines sortantes et les connecteurs préexistants (API, XML, SFTP, etc
).

Last updated