Vous êtes ici : Version française > Activités
-
Partager cette page
Taylor Arnold : Un pipeline pour l'exploration et la visualisation de corpus textuels
Le 30 septembre 2019
Salle de réunion - Allée A - 1er étage
La recherche exploratoire dans le domaine des sciences et des sciences sociales s’est de plus en plus tournée vers l’analyse de grandes sources de données textuelles. Les dossiers médicaux électroniques, les publications sur les réseaux sociaux, les revues en ligne et les collections numérisées de livres et de périodiques en sont des exemples courants.
Travailler avec des données textuelles, en particulier d'un point de vue exploratoire, pose de nombreux défis uniques sous étudiés dans les domaines de l'informatique statistique et de la visualisation de données. Dans cet exposé, je passe en revue trois études de cas de mon travail où des techniques de visualisation des différences sont utilisées pour étudier et explorer des corpus textuels. Les questions de confidentialité des données et de corpus multilingues seront abordées. Je conclurai en présentant les recherches spécifiques sur lesquelles je me concentre à Lyon - la visualisation de la formation de communautés linguistiques dans des espaces numériques - et leur lien avec mon programme de recherche.