Vous êtes ici : Version française > Promotions accueillies > Promotions antérieures > Séjour 2021-2022

Séjour long

Brendan
Murphy

Statistiques - Irlande

Coordonnées

Thèmes de recherche

PROJET

Analyse de clusters en sciences humaines et sociales

Le but de l'analyse de clusters est de trouver des groupes ou clusters pertinents dans des données. Les membres d'un groupe ont quelque chose en commun qu'ils ne partagent pas avec les membres d'autres groupes. Le regroupement des objets selon ce qu'ils ont en commun remonte au moins au début du langage. Aristote est un des premiers à faire des regroupements basés sur les données empiriques de l’histoire des animaux. Le regroupement empirique est devenu de plus en plus courant au fil du temps, depuis les taxonomies de plantes et d’animaux de Linné, jusqu’à l'avènement de l'analyse par cluster.
Le « clustering » basé sur des modèles implique de développer des méthodes d’analyse de clusters du point de vue de la modélisation statistique. Cette approche permet le développement de méthodes qui rendent compte précisément de la structure du problème étudié.
Ce projet développera des méthodes de regroupement basées sur des modèles développés pour des types de données complexes utilisées dans les sciences humaines et sociales. Le projet examinera les applications du regroupement dans les enquêtes sociales, les recensements historiques, les transports, la durabilité et le vote.

Activités / CV

BIOGRAPHIE

Brendan est professeur de statistiques à la School of Mathematics and Statistics de l'University College de Dublin.
Ses thèmes de recherche comprennent le « clustering », la classification et la modélisation des variables latentes, il s'intéresse en particulier aux applications dans les sciences sociales, la science de l’alimentation, la médecine et la biologie. Il est rédacteur en chef pour les sciences sociales et politiques pour la revue Annals of Applied Statistics et il a récemment co-écrit une monographie de recherche sur le regroupement et la classification basés sur des modèles.

BIBLIOGRAPHIE

Livre:

Charles Bouveyron, Gilles Celeux, T. Brendan Murphy, Adrian E. Raftery (2019) Model-Based Clustering and Classification for Data Science, Cambridge University Press.

Articles:

Ng, T.L.J., Murphy, T.B., McCormick, T., Fosdick, B. and Westling, T. (2021) Modeling the social media relationships of Irish politicians using a generalized latent space stochastic blockmodel. Annals of Applied Statistics, To appear.

Murphy, K., Murphy, T.B., Piccaretta, R. and Gormley, I.C. (2021) Clustering longitudinal life-course sequences using mixtures of exponential-distance models. Journal of the Royal Statistical Society, Series A., To appear.

Cappozzo, A., Greselin, F. and Murphy, T.B. (2020) Anomaly and novelty detection for robust semi-supervised learning. Statistics & Computing, 30, 1545—1571.

Murphy, K. and Murphy, T.B. (2020) Gaussian parsimonious clustering models with covariates and a noise component. Advances in Data Analysis & Classification, 14(2), 293—325.

Fop, M., Murphy, T.B. and Scrucca, L. (2019) Model-based clustering with sparse covariance matrices. Statistics & Computing, 29(4), 791—819.

Cappozzo, A., Greselin, F. and Murphy, T.B. (2020) A robust approach to model-based classification based on trimming and constraints. Advances in Data Analysis & Classification, 14(2), 327—354.

Hu, S., O'Hagan, A. and Murphy, T.B. (2018) Motor insurance claim modeling with factor collapsing and Bayesian model averaging. Stat, 7(1), e180.

Fop, M. and Murphy, T.B. (2018) Variable selection methods for model-based clustering. Statistics Surveys, 12, 18—65.

Fop, M., Smart, K. and Murphy, T.B. (2017) Variable selection for latent class analysis with application to low back pain diagnosis. Annals of Applied Statistics, 11(4), 2085—2115.

Scrucca, L., Fop, M., Murphy, T.B. and Raftery, A.E. (2016) mclust 5: Clustering, Classification and Density Estimation Using Gaussian Finite Mixture Models. The R Journal, 8(1), 205—233.