La librairie orientale Samuelian, fondée à Paris en 1930, est un célèbre haut-lieu intellectuel de la diaspora arménienne ayant accueilli journalistes, chercheurs, historiens, ainsi que leur matériel de travail : livres ou de titres de presse.
Depuis sa fermeture il y a une dizaine d’années, les collections de journaux qui y sont stockées se dégradent inexorablement. Avec les années, l’état des documents est devenu critique et certains ne sont parfois plus manipulables.
Avec le soutien de la famille Samuelian sensible à la valeur de ces archives, et grâce au soutien financier apporté par la fondation Calouste Gulbenkian, Calfa va pouvoir mener sur place une opération de sauvetage. Son enjeu est non seulement d’immortaliser ces journaux par la numérisation, mais aussi de les rendre de nouveau accessibles au public grâce à leur OCRisation et leur publication en ligne par la Fundamental Scientific Library (FSL) de l'Académie des Sciences d'Arménie, également partenaire du projet.
Les archives concernées sont principalement des journaux de la diaspora arménienne, publiés entre 1920 et 1975, pour un total estimé entre 10 000 et 15 000 pages. Les titres édités en France dans les années 1930 sont très bien représentés. Il n’existe pas encore de liste exhaustive des titres disponibles, mais un premier inventaire a permis d’en identifier plus de 70 différents, publiés dans plus de 30 pays de la Diaspora arménienne. On peut citer par exemple :
De grands plans de numérisation de la presse arménienne sont actuellement en cours dans le monde, notamment soutenus par la fondation Calouste Gulbenkian dans ses efforts pour la numérisation et la préservation des textes en arménien occidental. Dans ce cadre, la numérisation du journal Haratch par l’association ARAM et la BULAC (France) à partir de 2011, puis de la presse arménienne de la Congrégation des Pères Mekhitaristes de Vienne (Autriche) par la Fundamental Scientific Library de NASRA à partir de 2019, a permis la création d’immenses bases de données interrogeables et accessibles au grand public : cliquer pour accéder à la base de données.
Dans la lignée de cette dynamique, les équipes de Calfa ont commencé le travail d’inventaire des journaux stockés à la librairie Samuelian. Par la suite, l’ensemble de ces pages sera numérisé. Calfa OCR sera ensuite utilisé sur ces pages pour extraire le texte.
Développé spécialement par Calfa pour les journaux en arménien, l’OCR permet de restituer les textes imprimés dans les journaux sous une forme numérique, éditable et interrogeable. Enfin, les fichiers numérisés et leur texte retranscrit iront rejoindre la bibliothèque numérique de la FSL.
Nous vous tiendrons régulièrement informés sur le blog et nos différents réseaux de l’avancement du projet et de nos découvertes, alors restez connectés !