|
|
|
|
|
|
Calfa au TUMO d'Erevan pour un nouveau workshop autour du patrimoine arménien
|
|
|
Chahan et Baptiste ont mené en février un atelier de deux semaines au TUMO d’Erevan. Les
étudiants du TUMO (14 à 18 ans) ont pu développer leurs propres modèles
d’intelligence artificielle, et les appliquer sur des collections journaux anciens de la
Fundamental Scientific Library (FSL) d'Erevan, notre partenaire de longue date.
Exemples d’applications : des modèles pour classifier les photos contenues dans les
pages des journaux, ou pour
identifier les silhouettes humaines dans les documents, fonctionnalités qui peuvent
améliorer les moteurs de recherche de bibliothèques.
Les étudiants ont aussi découvert, grâce à une visite de la FSL organisée par son directeur
Tigran Zargaryan, les fonds d’archives de la bibliothèque, ainsi que le laboratoire de
numérisation interne.
Découvrez la vidéo réalisée par les équipes du TUMO ! ⬇️
|
|
|
|
|
|
|
|
|
BULAC : Premiers résultats robustes après un hackathon pour les manuscrits en Arabe maghrébin
|
|
|
Pendant trois mois, une vingtaine d’étudiants de master et de doctorants ont été formés aux humanités numériques par nos équipes
en travaillant sur les manuscrits arabes de la BULAC.
Mené avec le GIS Moyen-Orient et mondes musulmans (GIS MOMM) et la BULAC, ce hackathon permettra à terme de créer
un modèle polyvalent de reconnaissance de caractères de ces documents. Au total, 300 images
ont été préparées par les étudiants, et les premiers résultats montrent une bonne reconnaissance des manuscrits jusqu'à
moins de 3% d’erreur.
Grâce à cette avancée, ce sont plus de 6 000 pages en arabe manuscrit de la BULAC qui
seront prochainement OCRisées par Calfa et dont le contenu sera désormais interrogeable.
|
|
|
|
Découvrez deux documents que nous avons traités en OCR ou HTR ce mois-ci
|
|
|
|
|
|
|
|
|
Lettres manuscrites d'Aivasowsky, congrégation des Pères Mekhitaristes de Venise - H. Ohanian, 1838
|
|
|
Une écriture manuscrite cursive difficile en Arménien classique et occidental, avec ratures et notes en marges.
|
|
|
|
|
|
|
|
|
|
|
مجموع - MS.ARA.65, Collections patrimoniales numérisées de la BULAC, XVe siècle
|
|
|
Un recueil de textes rhétoriques, prophétiques et de droit du XVe siècle, en écriture manuscrite arabe maghrébine,
traité lors d'un hackathon organisé par le GIS MOMM, la BULAC et Calfa.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Présentation à l’Ecole de printemps du GIS-MOMM
|
|
|
Du 2 au 4 mai se tiendra à la BULAC « l’École de printemps : les manuscrits maghrébins et les humanités numériques », organisé
par le GIS Moyen-Orient Mondes Musulmans. Présentation de nos dernières avancées en HTR de l'arabe et formation à Calfa Vision.
Lien vers le programme
|
|
|
|
|
|
|
|
|
|
|
Calfa au salon "Innovatives SHS" du CNRS les 18 et 19 mai
|
|
|
Venez nous rencontrer sur cet événement à Aubervilliers (Seine-Saint-Denis) où entreprises, associations, et acteurs publics
viennent découvrir les recherches et les start-ups liées au CNRS sur des projets en sciences humaines et sociales. Le thème du
salon cette année : l’intelligence artificielle.
En savoir plus
|
|
|
|
|
|
|
|
|
|