Le projet

C’est après avoir constaté la disparition progressive du dictionnaire d’arménien classique-français d’Ambroise Calfa que l’idée de fournir aux internautes un dictionnaire simple, novateur et complet est née.

Initié en 2014, le projet aurait pu s’arrêter à la simple mise en ligne de pages numérisées, comme cela est le cas pour le Gaffiot (latin) ou le Bailly (grec ancien). Mais au fil des discussions, nous avons conclu qu’il serait fascinant de rassembler nos connaissances en mathématiques, en informatique, en linguistique, en paléographie et en langues afin de mettre au point un support de travail unique, esthétique et prodigieusement efficace.

La conservation et la pratique de l’arménien classique sont des enjeux essentiels dans la compréhension et la survie de l’arménien moderne, ainsi que dans l’étude de textes anciens et de civilisations disparues. Pourtant il n’existe pas de véritable outil de travail, pratique et accessible, capable de répondre à tous les types de demandes, et sans erreur.

C’est précisément ce manque que nous voulons combler, en réalisant une plate-forme numérique en ligne d’arménien classique, évolutive, interactive et intuitive, comportant de riches lexiques et des textes lemmatisés, soutenus par de puissants et innovants algorithmes informatiques de gestion et de recherche. Les nouvelles technologies y sont mises au service de la préservation de la langue classique, et par là même, de l’ensemble du patrimoine littéraire arménien. Le support numérique garantit une diffusion à l’échelle mondiale, gratuite et sans contraintes éditoriales.

Il s’agit donc d’un projet grand public, qui s’inscrit dans l’optique de préserver la langue et de renouveler sa pratique. La plate-forme est destinée à devenir le support indispensable des étudiants, des chercheurs, et des néophytes, mais plus encore, elle se veut un agent décisif dans la transmission de cet héritage. Elle sera adaptée à l’apprentissage de la langue, et nécessaire à la compréhension de la nation arménienne.

L’objectif du projet étant de rendre accessible au plus grand nombre le patrimoine en arménien classique, l’équipe du Calfa.fr est également mobilisée autour du développement d’un moteur de reconnaissance de caractères pour les manuscrits arméniens (OCR). En novembre 2016, l’équipe a bénéficié du soutien de la Fondation Calouste Gulbenkian, dans le cadre de l’appel à projets « Armenian Language in The Digital Age ». L’équipe s’est ainsi agrandie de doctorants et ingénieurs en intelligence artificielle, spécialisés dans l’apprentissage profond (Deep Learning). Il est possible de suivre l’avancement de ces recherches à la page vision.calfa.fr et de nous y aider en utilisant le module de crowdsourcing dédié à la labellisation de caractères manuscrits arméniens.

La base de données contient actuellement 48251 entrées lexicales, plus de 2 000 000 de formes déclinées et conjuguées, et 112010 caractères manuscrits arméniens.


L’équipe

Chahan Vidal-Gorène - Titulaire d'un Master de linguistique (spécialité arménien, INALCO), doctorant en paléographie arménienne à l'École Nationale des Chartes et en mathématiques.

Agnès Ouzounian - Docteur en linguistique. Chargée de l’enseignement de l’arménien classique à l’INALCO et à l’Institut Catholique de Paris.

Thomas Riccioli - Ingénieur en génie informatique diplômé de l’Université de Technologie de Compiègne

Rémi Cadène - Doctorant au laboratoire LIP6 de l'Université Pierre et Marie Curie

Ahmed Mazari - Doctorant au laboratoire LIP6 de l'Université Pierre et Marie Curie

Aliénor Decours-Perez - Titulaire du Master d'Édition de l'Université Paris Ouest.

Boris Dupin - Ingénieur R&D en traitement automatique des langues et de l’image, titulaire du Master Ingénierie Robotique et Systèmes Intelligents pour l’Image et le Son de l’Université Pierre et Marie Curie.

Baptiste Queuche - Titulaire du Master marketing numérique et communication de l'École supérieure de commerce de Rennes

Et avec la participation de Laure et Charlotte Belekian, Maurice Karamanoukian, Parik Simsar, Lorraine Saujot, Juliette Martin et surtout de Marie-Suzanne Gorène-Chehade.


Ouvrages de référence

Principaux supports lexicaux (translittération ISO 9985)

Supports lexicaux complémentaires

Banque de textes (translittération ISO 9985)


Soutiens

La Fondation Calouste Gulbenkian est une institution portugaise privée, créée en 1956 par son fondateur Calouste Sarkis Gulbenkian. La Fondation mène des activités diversifiées dans les domaines des arts, de l'éducation, de la science et de la philanthropie.

Le service des communautés arméniennes a pour vocation d'apporter son appui technique et financier à la diaspora arménienne. Son objectif principal est la diffusion de l'éducation et de la culture arméniennes, et plus particulièrement l'arménien classique représenté ici par le Calfa.fr.


La Fondation des Frères Ghoukassiantz est une fondation suisse de bienfaisance, qui intervient dans le cadre de projets culturels et humanitaires arméniens. Elle finance notamment la chaire d'arménologie de l'Université de Genève.



Partenaires