Ce site utilise des cookies afin d’améliorer votre expérience utilisateur et de réaliser des statistiques d’audience.
J'accepteJe refuseEn savoir plus
en es
en es
Menu
Toutes nos actualités
31/08/2021

ICDAR 2021 : ARIADNEXT présentera 3 contributions

Icdar2021 Ariadnext Programming

La 16ème conférence internationale sur l’analyse et la reconnaissance de documents (ICDAR 2021) se tiendra à Lausanne du 5 au 10 septembre.

ARIADNEXT présentera à cette occasion ses dernières avancées techniques dans le domaine de l’analyse de documents.

 

Détection, classification et recadrage de documents d’identité1

L’une des principales étapes de l’analyse de documents d’identité est la localisation du document d’identité dans l’image envoyée par l’utilisateur et l’identification de son type (carte d’identité française, passeport allemand, etc…).

Cette tâche est rendue très difficile du fait de la grande variation des conditions de capture. Comme l’utilisateur prend simplement une photo de son document sans aucune contrainte, les images produites peuvent souffrir de flou, de variations d’éclairage, de résolution, etc. D’autre part, un large panel de documents doit pouvoir être traité pour couvrir une majorité des documents d’identité en usage.

Un approche modulaire basée sur des techniques d’apprentissage profond est proposée dans ce travail. Cette approche permet d’offrir plus de flexibilité dans le processus de classification tout en permettant d’envisager un apprentissage incrémental pour prendre en charge de potentiels nouveaux documents.

Les expériences montrent la supériorité de l’approche proposée par rapport aux solutions non basées sur l’apprentissage automatique, le tout sur des ensembles de données académiques et industriels.

 

Une solution plus robuste pour la reconnaissance de texte2

Les systèmes de reconnaissance optique de caractères permettent d’extraire des informations textuelles d’une image de document. Les systèmes modernes de reconnaissance de caractères, principalement basés sur des réseaux de neurones récurrents, sont très efficaces, mais aussi très sensibles aux variations de localisation du texte dues aux diverses conditions de capture.

Dans ce travail, nous montrons d’abord la sensibilité des réseaux récurrents à de telles variations. La technique d’augmentation de données est proposée pour surmonter ce problème. Malgré l’amélioration apportée par l’utilisation de ces données augmentées lors des étapes d’apprentissage, cette approche est moins efficace en termes de stockage et temps d’apprentissage requis.

Un nouveau réseau de neurones entièrement convolutif est ensuite proposé. En plus d’être plus résiliente que les systèmes de pointe, cette architecture est plus compacte et offre une alternative plus légère et plus efficace que les réseaux récurrents.

 

Mesure de similarité d’images pour la détection de documents falsifiés3

Certaines vérifications de documents visant à détecter les documents falsifiés nécessitent l’utilisation de méthodes de comparaison d’images (ex. parties invariantes de l’arrière-plan).

Des architectures neuronales ont été explorées dans ce travail pour mesurer la similarité entre deux images. L’utilisation d’une fonction de perte adaptée permet de calculer une distance qui serait faible pour des images similaires (= document authentique) et élevée pour des images  » différentes  » (= document falsifié).

Une comparaison expérimentale entre deux architectures profondes et des approches traditionnelles basées sur l’utilisation de descripteurs locaux a été menée sur un ensemble de données réelles de patchs extraits de documents d’identité. Les résultats obtenus montrent que notre approche surpasse les méthodes traditionnelles non basées sur l’apprentissage automatique.

 

1: Guillaume Chiron, Florian Arrestier and Ahmad Montaser Awal, Fast End-to-end Deep Learning Identity Document Detection, Classification and Cropping, International conference on document analysis and recognition (ICDAR 2021), 2021 

2: Ahmad Montaser Awal, Timothée Neitthoffer and Nabil Ghanmi. Data augmentation vs. PyraD-DCNN: a Fast, Light, and Shift Invariant FCNN for Text Recognition.  3rd Workshop on Machine Learning in ICDAR 2021.

3: Nabil Ghanmi, Cyrine Nabli and Ahmad Montaser Awal. CheckSim: a reference-based identity document verification by image similarity measure.  3rd International Workshop on Computational Document Forensics in ICDAR 2021.

 

Suivez-nous !
contact