Partager
Séminaire

Gallicagram, un nouvel outil de lexicographie : le big data sans ses gros sabots ?

Séminaire DHAI 2020-2021
Mardi 11 mai 2021 Mardi 11 mai 2021
De 12h à 13h
Image
gallicagram
en ligne

Avec son outil Ngram Viewer, l'entreprise Google pensait en 2010 fonder une nouvelle science : les culturomics. Onze ans plus tard, force est de constater que malgré les ambitieuses promesses du logiciel, son utilisation par les chercheurs reste rare. Les griefs contre Ngram Viewer sont nombreux : corpus opaque, inaccessible et difficile à maîtriser, qualité médiocre des métadonnées, etc. Gallicagram est un outil open-source, conçu pour répondre à ces enjeux essentiels d’interprétation en tirant le meilleur profit du libre accès aux données de Gallica. Il permet une maîtrise efficace des corpus étudiés grâce à leur délimitation, en amont des traitements effectués comme à leur description, en aval, et propose différents modes d'analyse complémentaires permettant de tester rapidement une hypothèse. L'analyse du corpus de presse introduit aussi de nouvelles possibilités en histoire politique et en histoire culturelle : il permet ainsi aux chercheurs de s'approcher au plus près des évènements tout en conservant une vision macroscopique. Cette discussion visera à présenter cet outil, à décrire son fonctionnement et à en illustrer les nombreux usages possibles par plusieurs exemples concrets.

Mardi 11 mai 2021
Organisateurs

Comité d'organisation du séminaire DHAI

Image
Fractal - Pixabay

Séminaire DHAI 2020-2021

Du 9 octobre 2020 au 8 juin 2021

Interroger la rencontre entre les humanités numériques et l'intelligence artificielle. 

Organisation : Ségolène Albouy, Mathieu Aubry, Jean-Baptiste Camps, Matthieu Husson, Béatrice Joyeux-Prunel, Gabriel Peyré, Thierry Poibeau et Léa Saint-Raymond