EMAN, édition de manuscrits et archives numériques

Par
Richard WALTER (Recherche/ CNRS)
, modifié le
17 juillet 2021
Image
logo2
Partager

EMAN est un outil de publication numérique pour la diffusion et l’exploitation de manuscrits et de fonds d’archives modernes.

Le choix a été fait de ne pas partir d’une création ex-nihilo et ad-hoc, ce qui aurait signifié des développements lourds et une maintenance hasardeuse. Nous avons choisi de nous baser sur le logiciel ouvert Omeka, un outil très apprécié dans la communauté des humanités pour la valorisation de corpus ou de fonds scientifiques. Il répond aux impératifs de pérennisation et d’interopérabilité des données, nécessaires à l’exploitation et à la valorisation des corpus et des fonds d’archives.

Image
logo

Sur notre plateforme EMAN, basée sur Omeka, le dispositif éditorial et l’interface de navigation ont fait l’objet d’un certain nombre de développements spécifiques pour s’adapter à des pratiques documentaires et scientifiques portant sur les manuscrits et les fonds d’archives modernes : nous construisons à travers ce type de projet un modèle d’édition numérique.

Ce modèle est diffusé sur tous les projets de la plateforme. Ceux-ci l’adaptent en fonction des spécificités de leurs corpus et/ou des finalités de leurs études. Le modèle est composé d’un thème et d’un plugin EMAN spécifiques, qui rassemblent toutes les modifications et les ajouts que nous avons faits à partir du coeur du logiciel Omeka – qui lui n’a pas été modifié. À partir de là, d’autres développements sous forme de plugins sont diffusés au sein de la communauté Omeka à travers une page GitHub.

Image
Émile Zola, L'Assommoir. Manuscrit autographe (BnF)
Émile Zola, L'Assommoir. Manuscrit autographe (BnF)

Le modèle éditorial est composé d’une structuration des données en collections et sous-collections, avec des descriptions en Dublin Core et en types de métadonnées personnalisées, d’outils pour des expositions virtuelles et pour la transcription au format TEI, des outils d’import et d’export en CSV et XML de tout ou partie du corpus. Ce modèle peut évoluer en fonction des décisions du comité de pilotage de la plateforme, il est travaillé lors d’ateliers et de journées d’études. Toutes les adaptations et manipulations sont mémorisées dans un espace collaboratif et un carnet de recherche diffuse l’activité éditoriale et scientifique produite à partir de la plateforme.

À ce jour, elle regroupe près d’une cinquantaine de projets qui vont de la « microédition » génétique ou non sur un corpus très réduit jusqu’à la publication en masse de documents très variés, avec transcription ou non. Les périodes couvertes vont de la Renaissance jusqu’au XXIe siècle, de nombreuses langues sont présentes dans les documents numérisés et édités, la typologie des supports est elle aussi très large, du manuscrit jusqu’au document vidéo.

La plateforme est régie par un comité de pilotage avec un représentant par projet qui de facto participe à la construction de la plateforme. Les projets en cours concernent a/ le développement d’une nouvelle version de notre outil de transcription pour diffusion au sein de la communauté et fabrication de fichier TEI compatible ; b/ la visualisation sous forme de graphe des relations entre les documents : c/ l’édition multilingue avec des corpus en plusieurs langues.

L'équipe

  • Richard Walter, lagoratoire Thalim (direction)
  • Comité de pilotage de la plate-forme avec 30 représentants des différents projets accueillis par la plate-forme & un bureau de 7 participants (Céline Bohnert, Emmanuelle Bousquet, Charlotte Dessaint, Marie Dupond, Camille Koskas, Jean-Sebastien Macke, Anne Reach-Ngö)

Voir le carnet de recherche.