Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones

Code UE : RCP208

  • Cours
  • 6 crédits

Responsable(s)

Michel CRUCIANU

Public, conditions d’accès et prérequis

Cet enseignement s'adresse aux auditeurs souhaitant acquérir des connaissances de base sur l'analyse des données, la reconnaissance des formes et la fouille de données (data mining).
Prérequis obligatoires : avoir suivi le cycle préparatoire de l'EICNAM ou avoir un niveau équivalent (licence).

L'avis des auditeurs

Les dernières réponses à l'enquête d'appréciation pour cet enseignement :

Objectifs pédagogiques

Ce cours donne des éléments de base de l'analyse des données et de la modélisation descriptive, ainsi que des principes à mettre en œuvre pour traiter des applications réelles. Une introduction à la modélisation décisionnelle avec des réseaux de neurones est également présentée. L'analyse des données et la modélisation descriptive aident à comprendre les données empiriques issues de phénomènes naturels, économiques ou socio-culturels. Cette compréhension facilite la mise en œuvre de méthodes performantes de construction de modèles décisionnels.
Les méthodes abordées ont de très nombreuses applications dans des domaines aussi divers que l'assurance qualité, les enquêtes d'opinion, le marketing, la gestion de la relation client, la climatologie, la sécurité, etc.
L'enseignement adopte une approche pragmatique, les séances de travaux pratiques permettant la mise en œuvre systématique des méthodes présentées.
Les unités d'enseignement RCP209 « Apprentissage statistique : modélisation décisionnelle et apprentissage profond », RCP211 « Intelligence artificielle avancée » et RCP217 « Intelligence artificielle pour des données multimédia » sont des suites recommandées de RCP208.

Compétences visées

Analyse des données, modélisation descriptive à partir de données, introduction à la modélisation décisionnelle avec application à la reconnaissance des formes et à la fouille de données.

Contenu

Les thèmes abordés dans les séances de cours et de travaux pratiques (TP) sont :
  • Applications, nature des problèmes de modélisation et spécificités des données.
  • Analyse des données, réduction de dimension : méthodes factorielles.
  • Réduction non-linéaire de dimension : UMAP, t-SNE.
  • Sélection de variables.
  • Classification automatique : k-moyennes, DBSCAN.
  • Estimation de densités : noyaux, modèles de mélange.
  • Imputation des données manquantes.
  • Réseaux de neurones multi-couches : architectures, capacités d'approximation, apprentissage et régularisation, explicabilité.
Chaque séance de cours est suivie d'une séance de TP permettant de mettre en œuvre les méthodes présentées.
Les TP sont réalisés en utilisant principalement la plateforme Scikit-learn. Une introduction rapide au langage Python, à NumPy, à matplotlib et à Scikit-learn est prévue lors des premières séances de TP.

Modalité d'évaluation

Examen ; certaines questions peuvent porter sur les travaux pratiques.

Bibliographie

  • A. Belaid, Y. Belaid : Reconnaissance des formes : méthodes et applications. Ed. Inter Editions.
  • G. Dreyfus, et al : Réseaux de neurones : méthodologies et applications. Ed. Eyrolles.
  • M. Crucianu, J.-P. Asselin de Beauville, R. Boné : Méthodes factorielles pour l'analyse des données : méthodes linéaires et extensions non-linéaires. Ed. Hermès.
  • G. Saporta : Probabilités, analyse des données et statistique. Ed. TECHNIP.
  • D.J. Hand, H. Mannila, P. Smyth : Principles of Data Mining (Adaptive Computation and Machine Learning). Ed. Bradford Book.

Cette UE apparaît dans les diplômes et certificats suivants

Chargement du résultat...
Patientez
Intitulé de la formation
Type
Modalité(s)
Lieu(x)
Lieu(x) À la carte
Lieu(x) Paris
Lieu(x) À la carte
Lieu(x) Alternance
Lieu(x) Occitanie
Lieu(x) À la carte
Lieu(x) Package
Lieu(x) Grand-Est
Lieu(x) Alternance
Lieu(x) Occitanie
Lieu(x) À la carte
Lieu(x) Package
Lieu(x) Grand-Est
Intitulé de la formation Type Modalité(s) Lieu(x)

Contact

EPN05 - Informatique
2 rue Conté
75003 Paris
Tel :01 40 27 22 58
Swathi Rajaselvam

Voir les dates et horaires, les lieux d'enseignement et les modes d'inscription sur les sites internet des centres régionaux qui proposent cette formation

UE

    • Paris
      • Centre Cnam Paris
        • 2021-2022 1er semestre : Présentiel soir ou samedi
        • 2021-2022 2nd semestre : FOAD 100%
        Comment est organisée cette formation ?

        Organisation de la modalité FOAD 100%

        Planning

        2ème semestre

        • Date de démarrage : 07/02/2022
        • Date limite d'inscription : 21/03/2022
        • Regroupements facultatifs : aucun
        • Date de 1ère session d'examen : 13/06/2022
        • Date de 2ème session d'examen : 29/08/2022

        Accompagnement

        • Plateforme Moodle
        • Forum
        • Classe virtuelle
        • Séance de démarrage

        Ressources mises à disposition de l'auditeur

        • Documents de cours
        • Enregistrement de cours
        • Documents d'exercices, études de cas activités
        • Bibliographie et webographie

        Modalités de validation

        • Contrôle continu
        • Examen sur table
        :