Fil d'Ariane
- Accueil /
- Évènements /
- Gallicagram, un nouvel outil de lexicographie : le big data sans ses gros sabots ?
Conférence par Benjamin Azoulay et Benoît de Courson
Avec son outil Ngram Viewer, l'entreprise Google pensait en 2010 fonder une nouvelle science : les culturomics. Onze ans plus tard, force est de constater que malgré les ambitieuses promesses du logiciel, son utilisation par les chercheurs reste rare. Les griefs contre Ngram Viewer sont nombreux : corpus opaque, inaccessible et difficile à maîtriser, qualité médiocre des métadonnées, etc. Gallicagram est un outil open-source, conçu pour répondre à ces enjeux essentiels d’interprétation en tirant le meilleur profit du libre accès aux données de Gallica. Il permet une maîtrise efficace des corpus étudiés grâce à leur délimitation, en amont des traitements effectués comme à leur description, en aval, et propose différents modes d'analyse complémentaires permettant de tester rapidement une hypothèse. L'analyse du corpus de presse introduit aussi de nouvelles possibilités en histoire politique et en histoire culturelle : il permet ainsi aux chercheurs de s'approcher au plus près des évènements tout en conservant une vision macroscopique. Cette discussion visera à présenter cet outil, à décrire son fonctionnement et à en illustrer les nombreux usages possibles par plusieurs exemples concrets.