Méthode complète pour développer des systèmes de reconnaissance automatique de documents
La problématique de cette innovation réside dans la complexité de la reconnaissance d’images de documents, qui nécessite une description précise du contenu graphique, logique et sémantique d’un type de document. De plus, les besoins peuvent varier, allant de la reconnaissance de la structure complète de la page à l’extraction de champs précis ou à l’appel de reconnaisseurs d’écriture sur des blocs de texte identifiés.
La méthode proposée repose sur l’utilisation du langage de programmation EPF pour décrire le contenu des documents. Cette description est basée sur différents indices visuels tels que les perceptions de l’image à plusieurs résolutions, les lignes de texte, les résultats de l’OCR et les filets. À partir de cette description, l’analyseur de document est automatiquement généré par une phase de compilation. Elle permet de développer des systèmes de reconnaissance d’images de documents efficaces et adaptables aux besoins spécifiques de chaque contexte. Les développeurs peuvent créer des solutions de reconnaissance d’images de documents puissantes et précises.
TRL7 - Prototype industriel
UMR 6074 - IRISA
INSTITUT DE RECHERCHE EN INFORMATIQUE ET SYSTEMES ALEATOIRES
FR : IDDN.FR.001.030028.002.S.A.2010.000.10400 - déposé le 07/05/2012
Recevez les prochaines offres qui correspondent à vos besoins.
Conformément à la loi Informatique et Libertés du 06 janvier 1978 modifiée (voir Règlement Général sur la Protection des Données du 25 mai 2018), vous disposez d’un droit de rectification, d’opposition, d’effacement et portabilité de vos données. Vous pouvez exercer ce droit par email à l'adresse dpo@ouestvalorisation.fr. Pour en savoir plus sur notre politique de Gestion des données personnelles, vous pouvez consulter notre politique de confidentialité.