Cours proposé dans le cadre du Master Humanités numériques de PSL.
Le cours donne un panorama des techniques de traitement automatique des langues appliquées (et applicables) à des questions d’humanités numériques. Les méthodes symboliques sont rapidement abordées, mais le cours se focalise avant tout sur les méthodes numériques récentes (classifieurs, réseaux de neurones, apprentissage profond). Les éléments clés pour comprendre ces méthodes sont fournis, ainsi que leur application à des questions diverses (annotation de corpus, reconnaissance des entités nommées, analyse d’opinion). Le langage de programmation utilisé est python, et les étudiants sont fréquemment amenés à se plonger dans des implémentations existantes (jupyter notebooks, essentiellement) pour les adapter à leurs problèmes.