Responsive image

Un héritage à préserver

Plus de 31 000 manuscrits arméniens nous sont parvenus depuis le Ve siècle, conservés à la BNF, au Matenadaran à Erevan et dans le monde entier.

Ces manuscrits représentent des sources inestimables et parfois inédites pour l’histoire des civilisations, la géographie, le droit canonique, la théologie ou encore l’arithmétique. Un héritage unique, à préserver et à transmettre.

Profondément engagée pour la sauvegarde de l’Arménien Classique, l’équipe du Calfa.fr travaille aujourd’hui sur un nouveau projet technologique pour accompagner la numérisation du patrimoine manuscrit.

Notre projet : un OCR pour comprendre les manuscrits numérisés

À l’aide de réseaux de neurones de notre conception, nous développons actuellement une intelligence artificielle capable d’apprendre à lire les manuscrits d’arménien classique : un OCR (Outil de Reconnaissance de Caractères) qui retranscrit automatiquement les textes photographiés.

Nous voulons proposer une solution technique innovante aux institutions ou aux particuliers souhaitant valoriser leur patrimoine. Intégrée à la numérisation, elle rend les textes lisibles et accessibles. Associée à nos outils linguistiques, elle permet de les comprendre : recherche de mots-clefs, édition critique, analyse et traduction.

Nous pensons que ces technologies de pointe pourront à terme dépasser le cadre de l’arménien classique et être exploitées pour d’autres langues.

Responsive image
Responsive image

Innover par la recherche en réseaux neuronaux

Le développement d’un tel moteur est possible aujourd’hui grâce aux technologies émergentes de deep learning.

Notre équipe rassemble des spécialistes de plusieurs disciplines pour mettre au point un outil aux performances très compétitives : doctorants en intelligence artificielle, linguistes, paléographes, ingénieurs en traitement automatique des langues, en machine learning et en traitement de l’image.

Pour la première fois, ces compétences variées sont regroupées dans un même projet pour mettre l’intelligence artificielle au service du patrimoine arménien.

Ils nous soutiennent

Rejoignez un projet participatif

Un système intelligent nécessite une importante quantité de données pour être efficace. Dans le cadre d’un OCR, il s’agit d’images de caractères manuscrits.

Pour les lire, nous faisons appel à tous les internautes qui souhaitent nous aider dans notre projet ! L’interface Vision Calfa vous permet de nous aider à traiter des manuscrits authentiques, que vous disposiez d’une minute ou d’une heure. Cette lecture vous permet d’entraîner notre système et de nous soutenir dans notre recherche.

Actuellement, 89 personnes participent au projet et ont identifié 150122 caractères. Cliquez ici pour vous inscrire et participer !


Contribuer


Illustrations : Ms W547, Collection du Walters Museum de Baltimore, CC BY-NC-SA 3.0 et MAF55, Cliché CNRS-IRHT. Copyright Musée Arménien de France, Paris.

Responsive image