Partager
Séminaire

Séquences

Enquêtes quantitatives. Boîte à outils pour sciences sociales
Lundi 4 novembre 2024 Lundi 4 novembre 2024
De 15h à 18h
Image
data analysis
ENS-PSL, salle de conférences du Centre Sciences des Données

ENS-PSL
45 rue d'Ulm
75005 Paris
France

48.8418371, 2.3440403

Cinquième séance du cours "Enquêtes quantitatives. Boîte à outils pour sciences sociales", assurée par Théo Boulakia.

R. est né en 1946. De ses 14 à ses 35 ans, il a travaillé gratuitement sur la ferme familiale. Puis il a été exploitant en titre, jusqu’à sa retraite, à 56 ans. Combien de trajectoires ressemblent à celle de R. ? Cette question est du ressort d’une famille de méthodes, l’analyse de séquences, dont le représentant le plus connu est l’appariement optimal (Optimal Matching). L’unité de base de cette méthode est une séquence, c’est à dire une suite d’éléments ordonnés : une carrière professionnelle, l’emploi du temps d’un jour, une phrase, une danse. Pour calculer la distance entre deux séquences, les algorithmes comptent le nombre minimum d’opérations élémentaires (insertion, suppression, substitution) nécessaires pour passer d’une séquence à l’autre. À partir de la matrice de distances obtenue, il est possible de faire des typologies de séquences. La mise en oeuvre et l’interprétation des résultats avec R est particulièrement simple. L’essentiel des tâtonnements se situe en amont : comment recoder mes données pour que les composantes élémentaires de chaque séquence traduisent le plus précisément possible la question que je me pose ? Quel “coût” assigner à la substitution d’une portion de séquence à une autre ? On explorera ces questions avec deux enquêtes : l’une sur les carrières professionnelles, l’autre sur les emplois du temps.

Lundi 4 novembre 2024
Image
data analysis

Enquêtes quantitatives. Boîte à outils pour sciences sociales

S1 2024-2025.

Cours d'analyse de données en sciences sociales, délivré par Théo Boulakia. Les séances ont lieu le lundi, de 15h à 18h, dans la salle de conférences du Centre de Sciences des données (ENS-PSL, 45 rue d'Ulm, tout en haut de l'escalier B ou C). 

Objectifs du cours: Ce cours propose une initiation à diverses méthodes quantitatives à partir d’enquêtes de sciences sociales. Chaque séance s’organise autour de la rencontre entre une question (sociologique, anthropologique, historiographique), des données et une méthode : cartographie, réduction de la dimensionnalité, partitionnement, analyse de séquences, analyse textuelle, statistiques bayésiennes. L’objectif du cours est d’acquérir une compréhension schématique de la mise en oeuvre de ces méthodes, de leurs mérites et de leurs limites. Comment représenter des données spatiales, des séquences temporelles ? Qu’apportent les statistiques bayésiennes qui manque à l’approche fréquentiste ? Comment analyser les propriétés morpho-synthaxiques d’un texte ? Comment passer d’un grand nombre de variables à un petit nombre de classes ? Ces questions se poseront en contexte, dans une dynamique d’ajustement entre données, méthode et question de recherche (une dynamique d’enquête). Les questions de programmation seront abordées seulement dans les grandes lignes, aucune expérience dans ce domaine n’est requise.

Modalités pratiques: Validation dans le cadre de la mineure "humanités numériques" du Programme gradué Humanités ou du DENS (6 ECTS). Possibilité d'assister en auditeur libre. Rendre un document de quatre pages appliquant une des méthodes découvertes en cours à ses propres données : présentation des données, intérêt de la méthode, mise en œuvre et interprétation. Les personnes n'ayant pas d'expérience en programmation seront assistées pour la mise en œuvre.  

Inscription : theo.boulakia [a] ens.psl.eu