Cyclades, des outils d'annotation pour les corpus littéraires

Par
Thierry POIBEAU (Chercheur/ CNRS)
, modifié le
17 juillet 2021
Image
© Patrick Tomasso, Unsplash
Partager

Cyclades est un projet de collaboration internationale visant à développer des outils d'annotation pour les humanités numériques, en particulier pour les corpus littéraires (Cyclades signifie ''Corpora and Computational Linguistics for Digital Humanities'').

Le consortium Cyclades rassemble des praticiens et des chercheurs en humanités numériques, qui ont un intérêt particulier pour l'analyse de textes et le développement d'outils d’analyse spécifiques. Il comprend des spécialistes de l'analyse littéraire et des sciences sociales qui peuvent aider à identifier les corpus pertinents, les sujets à traiter et à évaluer les différentes solutions développées au sein du consortium. Il comprend également des spécialistes du traitement du langage naturel, qui développent des logiciels robustes et précis. La collaboration entre les participants au projet permettra de développer de nouveaux domaines de recherche, de mettre au point de nouvelles techniques d'analyse de texte, d'adapter les outils à de nouveaux problèmes et d'évaluer les solutions proposées de manière originale, tant qualitative que quantitative.

Voir le Github et le site.

Image
© Patrick Tomasso, Unsplash

Consortium

  • Thierry Poibeau, Lattice (CNRS, ENS/PSL et Université Sorbonne nouvelle)
  • Médialab, Sciences Po Paris
  • Bibliothèque nationale de France, Paris
  • Turing Insitute, UK
  • University of Cambridge, UK
  • British library, UK
  • Université de Göttingen, Allemagne
  • Stanford Literary Lab, USA

Formation

Initiation au TAL, Master Humanités numériques de PSL