Au printemps 2022, nous avons achevé la création de nouveaux modèles d'analyse automatique de textes en grec ancien, en collaboration avec le projet GREgORI (UCLouvain, Louvain-la-Neuve, Belgique). Les développements réalisés ont abouti à un innovant pipeline, combinant intelligence artificielle et approche classique par règles-dictionnaires. Nous évaluons nos nouveaux modèles sur le corpus De Thessalonica Capta, qui réunit des textes historiographiques grecs d'époque byzantine.
Notre étude compare et évalue les résultats produits par les deux méthodes en lemmatisation et POS-tagging, et décrit une approche hybride qui pourra être généralisée au traitement automatique des langues traitées par Calfa à l'avenir. Les résultats sont publiés dans la revue en open access du Bulletin De l'Académie Belge Pour l'Étude Des Langues Anciennes Et Orientales no 1011 (février 2022).
Kindt, Bastien, Chahan Vidal-Gorène, et Saulo Delle Donne. 2022. «Analyse Automatique Du Grec Ancien Par réseau De Neurones. Évaluation Sur Le Corpus De Thessalonica Capta». Bulletin De l'Académie Belge Pour l'Étude Des Langues Anciennes et Orientales 1011 (février), 537-62. https://doi.org/10.14428/babelao.vol1011.2022.65073.