Taylor Arnold : Un pipeline pour l'exploration et la visualisation de corpus textuels

Le 30 septembre 2019

10h00 à 12h00
26, Place Bellecour - 69002 Lyon
Salle de réunion - Allée A - 1er étage

La recherche exploratoire dans le domaine des sciences et des sciences sociales s’est de plus en plus tournée vers l’analyse de grandes sources de données textuelles. Les dossiers médicaux électroniques, les publications sur les réseaux sociaux, les revues en ligne et les collections numérisées de livres et de périodiques en sont des exemples courants.

Travailler avec des données textuelles, en particulier d'un point de vue exploratoire, pose de nombreux défis uniques sous étudiés dans les domaines de l'informatique statistique et de la visualisation de données. Dans cet exposé, je passe en revue trois études de cas de mon travail où des techniques de visualisation des différences sont utilisées pour étudier et explorer des corpus textuels. Les questions de confidentialité des données et de corpus multilingues seront abordées. Je conclurai en présentant les recherches spécifiques sur lesquelles je me concentre à Lyon - la visualisation de la formation de communautés linguistiques dans des espaces numériques - et leur lien avec mon programme de recherche.

Taylor Arnold est professeur assistant à l’université de Richmond (Virginie, États-Unis), au sein du programme de linguistique du département de mathématiques et d'informatique - Fellow du Collegium 2019- 2020