Recherche
|
Centres d'intérêt
|
|
|
La classification est l'art de diviser en classes homogènes une collection d'objets supposée hétérogène. Les applications liées à cette (pré)occupation sont nombreuses : la biologie classifie les organismes vivants (taxinomie et systématique), la linguistique classifie les langues (typologie), l'économie, les marchés (segmentation), la médecine, les maladies (nosologie) etc.
L'usage de mélanges paramétriques est courant en classification ; ces modèles expliquent l'hétérogénéité des données par leur génèse et permettent (i) de définir rigoureusement la notion de classe, (ii) d'interpréter de façon probabiliste des méthodes de partitionnement traditionnelles et (iii) de privilégier un objectif dans la procédure de classification : modélisation des données, interprétation des classes, comparaison des classes inférées avec une partition externe etc.
Ma thèse [LourmePhD.pdf] aborde deux aspects de la classification basée sur des mélanges.
D'une part elle présente de nouveaux mélanges gaussiens dont la parcimonie porte sur des paramètres d'interprétation statistique. Ces nouveaux modèles possèdent des propriétés de stabilité dont sont dépourvus beaucoup de mélanges plus classiques [PosTRV.pdf].
D'autre part elle présente une méthode nouvelle dite de classification simultanée dont voici le principe : classifier un échantillon revient souvent à partitionner plusieurs échantillons ; cette transformation du contexte de classification permet généralement, en établissant un lien entre populations, d'améliorer l'adéquation du modèle estimé et la qualité de la partition inférée.
L'instabilité de modèles traditionnels, présentée d'abord comme un défaut, peut être vue comme un atout : elle permet de démultiplier facilement les modèles d'une famille en les combinant avec quelques transformations simples et d'élargir rapidement l'éventail des modéles utiles à la (co-)classification [PostUnits.pdf].
|
|
Logiciels
|
|
Articles
|
Biernacki C. and Lourme A., Unifying Data Units and Models in (Co-)Clustering. 2017. [pdf]
Lourme A. and Maurer F., Testing the Gaussian and Student's t copulas in a risk management framework. Economic Modelling 2017. [pdf]
Biernacki C. and Lourme A., Stable and visualizable Gaussian parsimonious clustering models. Statistics and Computing, 23(5), 2013. [pdf]
Biernacki C. and Lourme A., Simultaneous Gaussian Model-Based Clustering for Samples of Multiple Origins. Computational Statistics, 28(1), 2013. [pdf]
Biernacki C. and Lourme A., Classification Simultanée de Plusieurs Echantillons sous Contrainte d'Egalité des Entropies de Partition. Journal de la SFdS, 152(3), 2011. [pdf]
Biernacki C. and Lourme A., Simultaneous t-Model-Based Clustering for Time Dependent Data: Application to a Study of the Financial Health of Corporations. Case Studies in Business, Industry and Government Statistics, 4(2), 2011. [pdf]
Biernacki C. and Lourme A., Simultaneous Gaussian Model-Based Clustering for Samples of Multiple Origins. preprint 70, VII, IRMA, Lille, 2010. [pdf]
|
Livres
|
Lourme A., Statistique pour la Licence, Ed. Lavoisier, Col. Hermes Science, 2018.
Beninel F., Biernacki C., Bouveyron C., Jacques J. & Lourme A., Knowledge Transfer: Practices, Types and Challenges (Chapter: Parametric Link Models for Transfer in Statistical Learning). Nova Publishers, 2012. [pdf]
|
|