Comment allier science des données et études théâtrales ? Mylène Maignant et Gaëtan Brison nous expliquent les coulisses de leur projet, qui passe la critique littéraire britannique au crible de l'informatique.
Mylène Maignant, doctorante à Paris Sciences & Lettres (Ecole normale supérieure), et Gaëtan Brison, désormais ingénieur à l’Institut Polytechnique de Paris et ancien stagiaire sous la direction de Mylène Maignant au laboratoire LATTICE (Langues, Textes, Traitements Informatiques et Cognition), collaborent sur un projet mêlant littérature théâtrale anglaise et informatique. De formation académique radicalement différente, ils nous expliquent comment s’est articulée leur recherche.
Gaëtan : J'ai fait une classe préparatoire économique et commerciale pour rejoindre l’EDHEC (l’Ecole des Hautes Etudes Commerciales) en 2016. Après quelques stages, je me suis rendu compte que je voulais poursuivre dans le domaine de la science des données. C’est pourquoi je me suis spécialisé dans ce champ-là lors de ma dernière année de Master. Je suis actuellement en train d’approfondir mes compétences en effectuant un second Master en Computer Science, à la Georgia Institute of Technology, et en occupant un poste d’ingérieur à l’Institut Polytechnique de Paris.
Mylène : Après une classe préparatoire littéraire (Hypokhâgne et Khâgne), j’ai fait un Master en Langues, Littératures et Cultures Etrangères en anglais à Sorbonne Universités. C’est en Erasmus à King’s College, à Londres, que j’ai découvert le numérique. J’ai ensuite décidé d’effecter un second Master à PSL, à l’Ecole nationale des Chartes, où j’ai pu développer mes connaissances et mes compétences informatiques. Aujourd’hui je suis doctorante en troisième année à l’Ecole normale supérieure en humanités numériques sous la direction de Thierry Poibeau.
Gaëtan : Notre projet consiste à implémenter des modèles informatiques capables de nous aider à comprendre la littérature théâtrale sous un angle différent. Il s’agit, à l’aide de la machine, d’analyser des phénomènes culturels à grande échelle. Tandis que l’humain ne pourrait passer en revue qu’un nombre limité de ressources, l’ordinateur nous permet de démultiplier ce champ de possibles.
Je m'occupe principalement de l'aspect technique de ce projet. Un de mes rôles-clef est d’implétenter des solutions techniques à un problème littéraire posé. Cependant, à mon sens, il n'existe pas de division claire des tâches. Mylène et moi se complétons sur de nombreux points.
Mylène : Ce projet a pour finalité d’étudier deux communautés littéraires distinctes qui proposent deux discours différents sur le théâtre contemporain londonien des années 2010 à 2020. Nous avons créé deux corpora qui recensent plus de 40 000 critiques théâtrales au total ! Nous étudions plus particulièrement les points de convergence et de divergence entre les critiques publiées dans les grands journaux de la presse anglaise (The Times, The Independent, The Guardian, etc.) et celles, moins connues du grand public, publiées par les bloggeurs.euses sur Internet.
Si c’est moi qui suis plutôt à l’origine des pistes de recherche en littérature (« Quels textes théoriques choisir ? », « Comment interpréter ces graphiques ? », « Quelles questions poser ? » etc.), nos connaissances se complètent lorsqu’il s’agit d’aborder ces problématiques d’un point de vue informatique. Gaëtan est bien plus compétent que moi dans ce domaine ! Son expérience et son expertise nous permettent d’avancer plus vite, et plus sereinement, ce qui est important dans un travail de longue durée comme celui-ci. Si ce projet est à mon nom, il n’en reste pas moins que sans son aide si précieuse, je ne serais pas aussi avancée dans mes recherches.
Gaëtan : J'ai toujours été attiré par les opposés. J’aime beaucoup les mathématiques et la philosophie par exemple. Un tel projet était très intéressant pour moi car il me permettait, d'une certaine façon, d'approfondir mes connaissances en science des données et de découvrir un autre monde, celui de la littérature. Le mélange parfait.
Mylène : A la fin de mes études, je me suis demandée si je n’avais pas manqué quelque chose en n’ayant jamais, ou presque, étudié de matières scientifiques. J’étais aussi curieuse de comprendre comment fonctionnait un algorithme. C’est un mot qui est souvent employé aujourd’hui, mais il reste très abscons. Ce tournant vers le numérique représentait autant un challenge envers moi-même (« Vais-je saisir le sens d’une équation ? ») qu’un désir de trouver des réponses à mes questions (« Pourquoi parle-t-on d’une ‘société algorithmique ?’ », « Qu’est-ce qu’un algorithme exactement, comment s’en servir ? »).
Gaëtan : Le premier obstacle auquel nous pouvons penser est la communication. Premièrement, je devais comprendre les idées littéraires qui sous-tendent ce projet. Deuxièmement, je devais rendre certains procédés mathématiques parfois très complexes aussi clairs que possible pour qu’ils soient assimilables par Mylène. C’est là où l’hybridité de nos profils se complétait et nous permettait de trouver un terrain d’entente : Mylène ayant de solides connaissances théoriques et techniques en programmation, le dialogue s’en trouvait facilité.
Mylène : La communication est effectivement un point névralgique dans ce genre de projet. Je passe beaucoup de temps à préparer des fiches explicatives très détaillées afin de donner le plus d’informations possible sur les démarches techniques à suivre. Sur un plan très pratique, le fait de travailler à deux implique que nous sommes partiellement dépendants l’un de l’autre. Gaëtan doit attendre que mes idées littéraires et mes plans informatiques soient aboutis pour commencer à travailler, et je dois attendre que les algorithmes tournent pour passer aux analyses théâtrales afin de poursuivre mes recherches.
Gaëtan : Pour ma part, j'ai renoué avec les sciences humaines dont j’avais partiellement abandonnées l’étude après la classe préparatoire. J'ai surtout appris l'importance de l'écoute de l'autre. Dans une telle configuration, on ne maîtrise qu'une partie du problème. Sans Mylène, il m’est impossible de saisir pleinement les enjeux d’une problématique donnée. Travailler sur un projet à si grande échelle m’a aussi appris à prendre davantage mon temps. Pour obtenir des résultats pertinents, il faut d’abord s’attarder sur la compréhension des données, de leur nettoyage et des algorithmes qui seront les plus adaptés à elles. C’est également un processus itératif : certains résultats demandent à être améliorés, tandis que d’autres ne répondent finalement pas à la question posée au départ. Il faut alors modifier les paramètres, changer d’algorithmes, trouver d’autres solutions techniques…
Mylène : Collaborer avec quelqu’un qui a travaillé en tant que data scientist dans une entreprise auparavant m’a appris à être plus terre-à-terre dans mes recherches. J’avais tendance à me perdre dans mes innombrables lectures. J’ai ainsi dû recentrer mes propos de sorte qu’ils soient les plus compréhensibles possible pour quelqu’un qui n’avait pas, ou peu, étudié de littérature avant. Cela m’a encouragée à être plus pédagogue aussi et à clarifier mes hypothèses. C’est également intéressant et formateur de se confronter à une personne qui a un système de pensée radicalement différent du vôtre. Je conçois ces échanges comme une gymnastique linguistique. Il faut sans cesse traduire ses idées dans une autre langue, de sorte que les deux discutants puissent trouver un langage hybride commun. C’est très ludique comme expérience !
Pour laisser un avis sur ce contenu, connectez-vous ou rejoignez-nous.
Se connecter S'inscrire