Le projet

C’est après avoir constaté la disparition progressive du dictionnaire d’arménien classique-français d’Ambroise Calfa que l’idée de fournir aux internautes un dictionnaire simple, novateur et complet est née.

Initié en 2014, le projet aurait pu s’arrêter à la simple mise en ligne de pages numérisées, comme cela est le cas pour le Gaffiot (latin) ou le Bailly (grec ancien). Mais au fil des discussions, nous avons conclu qu’il serait fascinant de rassembler nos connaissances en mathématiques, en informatique, en linguistique, en paléographie et en langues afin de mettre au point un support de travail unique, esthétique et prodigieusement efficace.

La conservation et la pratique de l’arménien classique sont des enjeux essentiels dans la compréhension et la survie de l’arménien moderne, ainsi que dans l’étude de textes anciens et de civilisations disparues. Pourtant il n’existe pas de véritable outil de travail, pratique et accessible, capable de répondre à tous les types de demandes, et sans erreur.

C’est précisément ce manque que nous voulons combler, en réalisant une plate-forme numérique en ligne d’arménien classique, évolutive, interactive et intuitive, comportant de riches lexiques et des textes lemmatisés, soutenus par de puissants et innovants algorithmes informatiques de gestion et de recherche. Les nouvelles technologies y sont mises au service de la préservation de la langue classique, et par là même, de l’ensemble du patrimoine littéraire arménien. Le support numérique garantit une diffusion à l’échelle mondiale, gratuite et sans contraintes éditoriales.

Il s’agit donc d’un projet grand public, qui s’inscrit dans l’optique de préserver la langue et de renouveler sa pratique. La plate-forme est destinée à devenir le support indispensable des étudiants, des chercheurs, et des néophytes, mais plus encore, elle se veut un agent décisif dans la transmission de cet héritage. Elle sera adaptée à l’apprentissage de la langue, et nécessaire à la compréhension de la nation arménienne.

L’objectif du projet étant de rendre accessible au plus grand nombre le patrimoine en arménien classique, l’équipe du Calfa.fr est également mobilisée autour du développement d’un moteur de reconnaissance de caractères pour les manuscrits arméniens (OCR). En novembre 2016, l’équipe a bénéficié du soutien de la Fondation Calouste Gulbenkian, dans le cadre de l’appel à projets « Armenian Language in The Digital Age ». L’équipe s’est ainsi agrandie de doctorants et ingénieurs en intelligence artificielle, spécialisés dans l’apprentissage profond (Deep Learning). Il est possible de suivre l’avancement de ces recherches à la page vision.calfa.fr et de nous y aider en utilisant le module de crowdsourcing dédié à la labellisation de caractères manuscrits arméniens.

La base de données contient actuellement 44030 entrées lexicales, plus de 2 000 000 de formes déclinées et conjuguées, et 66497 caractères manuscrits arméniens.


L’équipe

Chahan Vidal-Gorène - Titulaire d'un Master de linguistique (spécialité arménien, INALCO), doctorant en paléographie arménienne à l'École Nationale des Chartes et en mathématiques.

Agnès Ouzounian - Docteur en linguistique. Chargée de l’enseignement de l’arménien classique à l’INALCO et à l’Institut Catholique de Paris.

Thomas Riccioli - Ingénieur en génie informatique diplômé de l’Université de Technologie de Compiègne

Rémi Cadène - Doctorant au laboratoire LIP6 de l'Université Pierre et Marie Curie

Aliénor Decours - Titulaire du Master d'Édition de l'Université Paris Ouest.

Boris Dupin - Ingénieur R&D en traitement automatique des langues et de l’image, titulaire du Master Ingénierie Robotique et Systèmes Intelligents pour l’Image et le Son de l’Université Pierre et Marie Curie.

Laure Belekian - Étudiante en troisième année de licence d’arménien à l’INALCO

Charlotte Belekian - Étudiante en troisième année de licence d’arménien à l’INALCO

Maurice Karamanoukian - Étudiant en troisième année de licence d’arménien à l’INALCO

Et avec la participation de Parik Simsar, Lorraine Saujot et Juliette Martin


Ouvrages de référence

Principaux supports lexicaux (translittération ISO 9985)

Supports lexicaux complémentaires

Banque de textes (translittération ISO 9985)


Partenaires

La Fondation Calouste Gulbenkian est une institution portugaise privée, créée en 1956 par son fondateur Calouste Sarkis Gulbenkian. La Fondation mène des activités diversifiées dans les domaines des arts, de l'éducation, de la science et de la philanthropie.

Le service des communautés arméniennes a pour vocation d'apporter son appui technique et financier à la diaspora arménienne. Son objectif principal est la diffusion de l'éducation et de la culture arméniennes, et plus particulièrement l'arménien classique représenté ici par le Calfa.fr.


La Fondation des Frères Ghoukassiantz est une fondation suisse de bienfaisance, qui intervient dans le cadre de projets culturels et humanitaires arméniens. Elle finance notamment la chaire d'arménologie de l'Université de Genève.


Portail numérique regroupant de nombreux dictionnaires et ressources pour l’étude et la compréhension des langues du monde, notamment en arménien classique et moderne.