Analyse des données : méthodes explicatives

Code UE : STA102

  • Cours
  • 6 crédits

Responsable national

Giorgio RUSSOLILLO

Responsable opérationnel

Public et conditions d'accès

Bases d'inférence statistique : variables aléatoire, statistiques et distributions d'échantillonnage, estimation ponctuelle et par intervalle, tests d'hypothèses. Notions de calcul matriciel.
Les UE STA104 et STA101 donnent toutes les connaissances nécessaires pour intégrer le cours.

Objectifs pédagogiques

Le cours présente des méthodes pour décrire, expliquer ou prédire une variables à l'aide d'un ou plusieurs caractères quantitatifs et/ou qualitatifs. Ces méthodes, fondées sur le modèle linéaire, sont illustrées par des sorties SAS.

Compétences visées

Connaitre les bases théoriques des modèles présentés en cours, et en particulier :
- Les hypothèses des modèles
- Les méthodes de construction des estimateurs des paramètres
- Les propriétés des estimateurs
Etre capable d'interpréter les sorties d'un logiciel à fin de :
- Evaluer l'ajustement aux données et la signification statistique du modèle
- Détecter des données aberrantes et influentes
- Vérifier les hypothèses du modèle.
- Détecter des problèmes de multi colinéarité
- Choisir le meilleur modèle par la sélection des variables

Contenu

Régression linéaire simple :
  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés et de maximum de vraisemblance
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes
Régression linéaire multiple :
  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés 
  • la géométrie du modèle de régression multiple
  • théorème de Gauss - Markov
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, théorème de Cochran, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes
  • multicolinearité : diagnostic et remèdes
  • sélection de variables
  • détection d'observations aberrantes et d'observation influentes
Analyse de la variance - modèle à un facteur :
  • l'analyse de la variance a un facteur comme modèle linéaire
  • estimation des paramètres (dispositif équilibré et déséquilibré) 
  • décomposition de la somme des carrées totale et qualité de l'ajustement du modèle
  • test de l'effet du facteur
  • validation des hypothèses de normalité et de homoscédasticité
  • tests post hoc pour les comparaisons multiples de moyennes
  • analyse de la variance non paramétrique
Analyse de la variance - modèle à deux facteurs :
  • l'analyse de la variance à deux facteurs comme modèle linéaire
  • estimation des paramètres et qualité du modèle
  • test d'hypothèses et intervalles de confiance sur les coefficients
  • étude de l'interaction
  • décomposition de la somme des carrés totale
  • décomposition de la somme des carrées du modèle
  • test de la significativité globale du modèle
  • tests des effets
  • test de comparaison des moyennes pour chaque facteur
  • test de comparaison des moyennes par traitements
Analyse de la covariance :
  • le modèle d'analyse de la covariance
  • estimation des paramètres
  • décomposition de la somme des carrés totale, ajustement du modèle
  • test de significativité globale du modèle
  • test des effets
  • test de comparaison des moyennes par traitements
  • sélection du modèle

Bibliographie

  • P. DAGNELIE : Statistique théorique et appliquée - tome 2 (De Boeck, Bruxelles 2011)
  • Y. DODGE : Analyse de régression appliquée (Dunod 2004)
  • N. DRAPER et H. SMITH : Applied regression analysis (Wiley 1998)
  • M. LEJEUNE : Statistique: la théorie et ses applications (Springer 2010)
  • R.C. LITTELL : SAS for Linear Models, Fourth Edition (SAS Institute Inc. 2002)
  • G.SAPORTA : Probabilités, analyse des données, statistique (Technip 2011)
  • N.H. TIMM : Univariate and Multivariate General Linear Models: Theory and Applications using SAS Software (SAS Institute Inc. 1997)
  • M.TENENHAUS : Statistique. Méthodes pour décrire, expliquer et prévoir. (Dunod, 2007)

Cette UE apparaît dans les diplômes et certificats suivants

Chargement du résultat...
Patientez
Type
Intitulé
Equipe pédagogique
Modalité(s) / Lieu(x)
Code
Equipe pédagogique Mathématique et statistique
Modalité(s) / Lieu(x)
  • Enseignée en formation présentielle et/ou partiellement à distance : Paris
  • Equipe pédagogique Informatique
    Modalité(s) / Lieu(x)
  • Enseignée en formation présentielle et/ou partiellement à distance : Paris
  • Equipe pédagogique Mathématique et statistique
    Modalité(s) / Lieu(x)
  • Enseignée en formation présentielle et/ou partiellement à distance : Paris, Liban
  • Type Intitulé Equipe pédagogique Modalité(s) / Lieu(x) Code

    Contact

    EPN06 Mathématiques et statistiques
    2 rue conté Accès 35 3 ème étage porte 19
    75003 Paris
    Sabine Glodkowski
    Voir les sites

    Voir les dates et horaires, les lieux d'enseignement et les modes d'inscription sur les sites internet des centres régionaux qui proposent cette formation

    UE

      • Paris
        • Paris
          • 2018-2019 2nd semestre : Présentiel
          • 2019-2020 2nd semestre : Présentiel
          • 2020-2021 2nd semestre : Présentiel
      • Liban
        • Liban
          • 2018-2019 2nd semestre : Présentiel
          • 2019-2020 2nd semestre : Présentiel
          • 2020-2021 2nd semestre : Présentiel