::: :  Accueil  |  Recherche (Research)  |  Enseignement  |  Colles Maple  |  Colles Maths  |  Contact  : :::

 


Adresse
Faculté d'Economie, Gestion & AES (collège DSPEG)
Université de Bordeaux
16, Avenue Léon Duguit
33600 Pessac
France

E-mail
alexandre.lourme@u-bordeaux.fr

Tel
+33 (0)5 56 84 62 67

Recherche Drapeau anglais Drapeau français
Centres d'intérêt

  • classification automatique

  • analyse discriminante

  • modèles de mélanges

    • mélanges gaussiens

    • mélanges de Student
      (données bruitées)

    • mélanges de Factor Analyzers (données en grande dimension)

    • modèle des classes latentes (données binaires)

  • lien entre populations

  • modèles parcimonieux

  • algorithme EM

  • applications :

    • biologiques

    • financières

La classification est l'art de diviser en classes homogènes une col­lec­tion d'objets sup­posée hé­té­rogène. Les ap­pli­ca­tions liées à cette (pré)oc­cu­pa­tion sont nombreuses : la bio­lo­gie clas­sifie les or­ga­nismes vi­vants (ta­xi­no­mie et sys­té­ma­ti­que), la lin­guis­tique clas­si­fie les langues (ty­po­lo­gie), l'éco­no­mie, les mar­chés (seg­men­ta­tion), la mé­de­cine, les ma­la­dies (no­so­lo­gie) etc.

L'usage de mélanges paramétriques est courant en classification ; ces modèles ex­pli­quent l'hé­té­ro­gé­né­ité des don­nées par leur gé­nèse et per­met­tent (i) de dé­fi­nir ri­gou­reu­sement la no­tion de classe, (ii) d'in­ter­pré­ter de fa­çon pro­ba­bi­liste des méthodes de parti­tion­nement tra­di­tio­n­nel­les et (iii) de pri­vi­lé­gier un ob­jec­tif dans la pro­cé­dure de clas­si­fi­cation : mo­dé­li­sa­tion des don­nées, in­ter­pré­ta­tion des clas­ses, com­pa­rai­son des class­es in­fé­rées avec une par­ti­tion ex­terne etc.

Ma thèse [LourmePhD.pdf] aborde deux as­pects de la clas­si­fi­ca­tion basée sur des mé­lan­ges.

D'une part elle pré­sente de nou­veaux mé­langes gaus­siens dont la par­ci­mo­nie porte sur des pa­ra­mè­tres d'in­ter­pré­ta­tion sta­tis­tique. Ces nouveaux mo­dè­les pos­sèdent de nom­breuses pro­pri­étés de sta­bi­li­té dont sont dé­pour­vus beau­coup de mé­langes plus classiques [PosTRV.pdf].

D'autre part elle pré­sente une mé­thode nou­vel­le dite de clas­si­fi­ca­tion si­mul­ta­née dont voi­ci le prin­cipe : clas­si­fier un échan­til­lon re­vient sou­vent à par­ti­tion­ner plusieurs échan­til­lons ; cet­te trans­for­ma­tion du con­texte de clas­si­fi­ca­tion permet gé­né­ra­lement, en éta­blis­sant un lien en­tre po­pu­la­tions, d'amé­lio­rer l'adé­qua­tion du mo­dè­le es­timé et la qua­li­té de la par­ti­tion in­fé­rée.

Logiciels

  • MixTRV : un paquet Matlab destiné à l'inférence de mélanges gaussiens dans les contextes suivants : tests d'hypothèse - analyse discriminante - classification semi-supervisée - classification non supervisée.

    Pour installer MixTRV il suffit de décompresser MixTRV.tar.gz dans le dossier work de Matlab. Le fichier whyTRV.pdf explique ce qui motive le développement de MixTRV et le manuel userguide.pdf montre comment l'utiliser.

Publications

  • Biernacki C. and Lourme A., Unifying Data Units and Models in (Co-)Clustering. (under revision) 2017. [pdf]

  • Lourme A. and Maurer F., Testing the Gaussian and Student's t copulas in a risk management framework. Economic Modelling 2017. [pdf]

  • Biernacki C. and Lourme A., Stable and visualizable Gaussian parsimonious clustering models. Statistics and Computing, 23(5), 2013. [pdf]

  • Biernacki C. and Lourme A., Simultaneous Gaussian Model-Based Clustering for Samples of Multiple Origins. Computational Statistics, 28(1), 2013. [pdf]

  • Beninel F., Biernacki C., Bouveyron C., Jacques J. & Lourme A., Knowledge Transfer: Practices, Types and Challenges (Chapter: Parametric Link Models for Transfer in Statistical Learning). Nova Publishers, 2012. [pdf]

  • Biernacki C. and Lourme A., Classification Simultanée de Plusieurs Echantillons sous Contrainte d'Egalité des Entropies de Partition. Journal de la SFdS, 152(3), 2011. [pdf]

  • Biernacki C. and Lourme A., Simultaneous t-Model-Based Clustering for Time Dependent Data: Application to a Study of the Financial Health of Corporations. Case Studies in Business, Industry and Government Statistics, 4(2), 2011. [pdf]

  • Biernacki C. and Lourme A., Simultaneous Gaussian Model-Based Clustering for Samples of Multiple Origins. preprint 70, VII, IRMA, Lille, 2010. [pdf]

Enseignement

IUT Dpt. Génie Biologique (2008--2012)
Mathématiques générales et probabilités (S1M1)

Ce cours reprend dans un contexte expérimental les notions d'analyse abordées au lycée. Le TD 1 [pdf] est consacré à l'étude de fonctions, le TD 2 [pdf] au calcul intégral, le TD 3 [pdf] aux équations différentielles et le TD 4 [pdf] au calcul des probabilités. Le formulaire de dérivation [pdf], les rappels sur l'intégration [pdf] et le formulaire de probabilités [pdf] vous aideront à traiter les exercices proposés.



bibliographie

Demarquilly C. et al., Biostatistique Biomathématiques (2011), Ellipses

Kohler F., Eléments de biostatistiques (2010), Ellipses

Legay J.M. et al., Mathématiques pour biologistes (1981), Masson

Informatique et bureautique (S1M4)

Ce module est une initiation aux logiciels de présentation, de traitement de texte et de tableur. Des exposés [pdf] sont structurés et présentés sous Open Office Impress/Power Point/Beamer. Un texte scientifique, un curriculum vitae [pdf] [pdf], une lettre etc. sont rédigés sous Open Office Writer/Word/Latex, après quelques TDs dédiés à Latex : TD1 [pdf], TD2 [pdf], TD3 [pdf], TD4 [pdf]. Sous des logiciels de tableur (Open Office Calc, Excel, R-Commander) sont abordés la mise en forme d'un document [pdf], les fonctions de calcul et les diagrammes [pdf], les tris, les fonctions de recherche, les solveurs et les tableaux dynamiques [pdf].



bibliographie

Chevalier C. et al., Latex pour l'impatient (2007), H et K Editions

Ortolo T., Legrand J., Latex à 200% (2006), O'Reilly Editions

Statistique descriptive (S2M1 & S2M11)

Ce module est consacré aux bases de la statistique descriptive. On apprendra à distinguer plusieurs types de séries univariées (qualitatives, quantitatives, etc.) lors du TD 1 [pdf], à utiliser des diagrammes appropriés lors du TD 2 [pdf], et à estimer des paramètres statistiques usuels lors du TD 3 [pdf]. La seconde partie de ce module est consacrée aux séries multivariées. Le TD 4 [pdf] aborde le croisement de deux variables qualitatives, le TD 5 [pdf] le croisement d'une variable qualitative et d'une variable quantitative et le TD 6 [pdf] le croisement de deux variables quantitatives. Ces notions font l'objet de travaux pratiques sous R : TP 1 [pdf], TP 2 [pdf], TP 3 [pdf], TP 4 [pdf], TP 5 [pdf] et TP 6 [pdf].



bibliographie

Cornillon P.A. et al., Statistiques avec R (2008), Presses Universitaires de Rennes

Georgin J.P., Gouet M., Statistiques avec Excel (2005), Presses Universitaires de Rennes

Hamon A., Jégou N., Statistique descriptive (2008), Presses Universitaires de Rennes

Lafaye de Micheaux P. et al., Le logiciel R (2011), Springer

Millot G., Comprendre et réaliser les tests statistiques à l'aide de R (2009), De Boeck

Vidal A., Statistique descriptive et inférentielle avec Excel (2004), Presses Universitaires de Rennes

Statistique (S3M7)

Ce cours porte sur des notions usuelles de probabilités et de statistique, utiles en biologie. Le TD 1 [pdf] est consacré à la loi normale, le TD 2 [pdf] à l'échantillonnage (et à la distribution de quelques estimateurs classiques), le TD 3 [pdf] à l'estimation ponctuelle, le TD 4 [pdf] à l'estimation par intervalle de confiance et le TD 5 [pdf] aux tests d'hypothèse. Ce module comporte également un TP [pdf] dédié aux cartes de contrôle.



bibliographie

Daudin J.J. et al., Statistique inférentielle (2001), Presses Universitaires de Rennes

Egon H., Porée P., Statistique et probabilités en production industrielle Volume 2 (2004), Hermann

Golmard J.L., Biostatistique (2011), Ellipses

Valleron A.J., Probabilités et statistique (2008), Omniscience

Verlant B., Statistique et probabilités Tome 2 (2009), Foucher

Complément de bibliographie

Appel W., Probabilités pour les non probabilistes (2013), H&K Editions

Biau G. et al., Mathématiques et statistique pour les sciences de la nature (2010), EDP Sciences

Bouyer J., Méthodes statistiques (2010), De Boeck

P. Dagnelie, Statistique théorique et appliquée Tome 2 (2006), De Boeck

D'Athis P., Techniques de raisonnement statistique et applications aux sciences de la vie (2011), Ellipses

Dress F., Probabilités et Statistique de A à Z (2007), Dunod

Husson F., Pagès J., Statistiques générales pour utilisateurs Volume 2 Exercices et corrigés (2005), Presses Universitaires de Rennes

Pagès J., Statistiques générales pour utilisateurs : Tome 1, Méthodologie (2010), Presses Universitaires de Rennes

Scherrer B., Biostatistique (2009), Gaëtan Morin

Triola M.M., Triola M.F., Biostatistique pour les sciences de la vie et de la santé (2009), Pearson Education


Faculté d'Economie Gestion & AES
Statistique descriptive / décisionnelle

Mathématiques pour l'économie

Informatique

Colles Maths

Voici des sujets de colles de mathématiques (au format pdf) données en section ATS.

colle 01   colle 02   colle 03   colle 04   colle 05   colle 06

colle 07   colle 08   colle 09   colle 10   colle 11   colle 12

colle 13   colle 14   colle 15   colle 16   colle 17   colle 18

colle 19   colle 20   colle 21   colle 22   colle 23   colle 24


Voici d'autres sujets de colles de mathématiques (au format pdf) données en section MPSI.

colle 01   colle 02   colle 03   colle 04   colle 05   colle 06

colle 07   colle 08   colle 09   colle 10   colle 11   colle 12

colle 13   colle 14   colle 15   colle 16   colle 17   colle 18

colle 19   colle 20   colle 21   colle 22   colle 23   colle 24

Mise a jour en cours