2025
La dynamique temporelle de la découverte individuelle de musique
Célestin Zimmerlin, Thomas Louail, Manuel Moussallam et Marc Barthelemy. The dynamics of discovery and the Heaps-Zipf relationship. Manuscrit soumis à la revue Phys. Rev. E et en cours d’évaluation (peer-review). Preprint sur arxiv.
Quand on examine une séquence ordonnée d’éléments piochés dans un dictionnaire ou catalogue — comme la séquence des mots d’un texte, ou celle des morceaux écoutés par une personne sur une plateforme de streaming — on peut mesurer comment le nombre d’éléments distincts augmente au fur et à mesure que la longueur de la séquence augmente. Cette croissance suit généralement une loi de puissance appelée loi de Heaps, fréquemment utilisée pour caractériser les processus d’innovation et de découverte chez l’humain. Jusqu’à présent, on pensait que des modèles de tirage aléatoire, basés sur une distribution statistique de type Zipf, pouvaient reproduire et suffisaient à expliquer cette régularité empirique. Mais cette explication repose sur une hypothèse critique : l’indépendance de l’ordre des éléments dans la séquence. Or, cette hypothèse ne tient souvent pas en réalité.
Cette étude montre comment l’ordre temporel des éléments — la manière dont les mots ou les morceaux de musique s’enchaînent réellement — affecte la mesure de la croissance de la diversité. En analysant des données réelles — des historiques individuels d’écoute de musique et de navigation sur le web, mais aussi des classiques de la littérature mondiale — nous montrons que dans certains cas les corrélations temporelles entre éléments créent des écarts systématiques par rapport au cas aléatoire. Autrement dit, changer l’ordre des éléments modifie la caractérisation statistique de la dynamique de croissance de la diversité. Grâce à un modèle mathématique simple jouant sur les corrélations, nous reproduisons toute l’amplitude des comportements possibles.
Le résultat principal est que la dynamique de croissance de la diversité dépend non seulement de la fréquence des éléments dans la séquence, mais aussi de l’organisation temporelle de ces éléments — un facteur crucial souvent ignoré quand on utilise les deux lois de Heaps et Zipf pour étudier le comportement humain.
Questionner les résultats d’enquêtes déclaratives au regard de données de consommation : le cas de l’écoute de musique en ligne
Thomas Louail et Yann Renisio (2025) Questionner les résultats d’enquêtes déclaratives au regard de données de consommation : le cas de l’écoute de musique en ligne. Preprint d’un chapitre d’ouvrage « Culture en régime numérique. Questionner les pratiques, catégories et méthodes » coordonné par Anne Jonchery, Amandine Louguet et Vincent Berry, collection Questions de culture des Presses de Sciences Po, à paraître.
Dans cette étude exploratoire nous montrons comment associer des données d’enquête par questionnaire sur les préférences musicales des personnes à leurs historiques individuels d’écoute sur Deezer. Cette combinaison permet de mettre en lumière des « dissonances » entre les préférences déclarées par les individus et leurs écoutes de musique au quotidien. Ces dissonances entre déclarations et observations touchent inégalement différents genres musicaux et artistes au sujet desquels les personnes étaient interrogées dans l’enquête. La distribution de l’intensité de ces dissonances semble partiellement recouvrir une autre distribution, celle de l’inégale consécration de ces artistes et genres par les institutions culturelles.
Disruptions in Music Listening Behaviors During Lockdowns
Pierre Gallinari Safar, Laetitia Gauvin and Thomas Louail (2025) Disruptions in Music Listening Behaviors During Lockdowns. Proceedings of the International AAAI Conference on Web and Social Media, 19(1).
Dans cet article présenté à la conférence internationale de référence ICWSM en juin 2025, nous montrons combien les confinements en France — le premier en particulier — ont impacté la durée et la fréquence d’écoute de musique des personnes, avec des changements d’une nature et d’une intensité variables selon les groupes sociaux.
2024
Integrating digital traces into mixed methods designs
Yann Renisio, Amélie Beaumont, Jean-Samuel Beuscart, Samuel Coavoux, Philippe Coulangeon, Robin Cura, Brenda Le Bigot, Manuel Moussallam, Camille Roth, Thomas Louail (2024) Integrating digital traces into mixed methods designs. Revue française de sociologie, 2024, 65 (1-2), pp.129–160.
Dans cet article, nous présentons et discutons notre dispositif d’enquête mixte qui associe les données issues de questionnaires, d’entretiens et des historiques d’écoute sur Deezer des mêmes individus. Nous exposons la diversité des cas d’utilisation de la combinaison de ces sources d’information, prises deux à deux. Grâce à l’articulation de ces trois sources de données, nous démontrons que, malgré l’accès illimité à l’ensemble du catalogue musical sur les plateformes, les frontières sociales entre les répertoires musicaux des personnes perdurent ; et que les artistes ont des publics distincts, dont les différences tiennent à la génération, au sexe et au niveau de diplôme.
Depict or Discern? Fingerprinting Musical Taste from Explicit Preferences
Kristina Matrosova, Manuel Moussallam, Thomas Louail, Olivier Bodini (2024) Depict or Discern? Fingerprinting Musical Taste from Explicit Preferences. Transactions of the International Society for Music Information Retrieval (TISMIR), 7 (1), 15-29.
Cet article est centré sur la formalisation informatique de la notion de goût musical. Nous proposons deux approches pour calculer une empreinte (ou « signature ») du goût d’une personne. Dans la première approche on cherche une combinaison de chansons et d’artistes qui permettent d’identifier une personne de manière unique au sein d’une population d’auditeur-trice-s. Dans la seconde on se concentre sur une tâche de représentativité, fondamentale dans les systèmes de recommandation : construire une représentation synthétique des préférences de l’utilisateur·rice, afin de pouvoir lui proposer d’autres musiques susceptibles de lui plaire. Nous démontrons que les deux méthodes aboutissent à des solutions contradictoires, ce qui souligne la nécessité de préciser le point de vue appliqué lorsqu’on formalise la notion de goût musical individuel. Nous discutons enfin de la question de l’identifiabilité des personnes à partir de leur activité en ligne sur les plateformes de streaming.
Concevoir des dispositifs qui associent des traces numériques individuelles à des données d’enquête
Thomas Louail (2024) Concevoir des dispositifs qui associent des traces numériques individuelles à des données d’enquête. La Lettre de l’InSHS, 89, pp.37-38.
Dans cet article, nous présentons le dispositif d’enquête mixte de Mixtapes en discutant pour chacune de trois sources de données (questionnaire, entretien, historique d’écoute) leurs apports et avantages, mais aussi leurs limites, relatives notamment aux difficultés de les combiner. Nous insistons également sur les enjeux d’anonymisation des données des personnes et la conformité au RGPD, afin de pouvoir à terme ouvrir ces données d’écoute, individuelles mais anonymisées, à l’ensemble de la communauté scientifique.




