Analyse des données : méthodes explicatives

Code UE : STA102

  • Cours
  • 6 crédits

Responsable national

Giorgio RUSSOLILLO

Responsable opérationnel

Public et conditions d'accès

Bases d'inférence statistique : variables aléatoire, statistiques et distributions d'échantillonnage, estimation ponctuelle et par intervalle, tests d'hypothèses. Notions de calcul matriciel.
Les UE STA104 et STA101 donnent toutes les connaissances nécessaires pour intégrer le cours.

Objectifs pédagogiques

Le cours présente des méthodes pour décrire, expliquer ou prédire une variables à l'aide d'un ou plusieurs caractères quantitatifs et/ou qualitatifs. Ces méthodes, fondées sur le modèle linéaire, sont illustrées par des sorties SAS.

Compétences visées

Connaitre les bases théoriques des modèles présentés en cours, et en particulier :
- Les hypothèses des modèles
- Les méthodes de construction des estimateurs des paramètres
- Les propriétés des estimateurs
Etre capable d'interpréter les sorties d'un logiciel à fin de :
- Evaluer l'ajustement aux données et la signification statistique du modèle
- Détecter des données aberrantes et influentes
- Vérifier les hypothèses du modèle.
- Détecter des problèmes de multi colinéarité
- Choisir le meilleur modèle par la sélection des variables

Contenu

Régression linéaire simple :
  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés et de maximum de vraisemblance
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes
Régression linéaire multiple :
  • analyses des données, ajustement linéaire par le critère des moindres carrés, décomposition de la somme des carrés totale, qualité de l'ajustement, points leviers
  • hypothèses du modèle, estimation des paramètres par la méthode des moindres carrés 
  • la géométrie du modèle de régression multiple
  • théorème de Gauss - Markov
  • ajustement du modèle
  • validation du modèle : test d'hypothèses et intervalles de confiance sur les coefficients, théorème de Cochran, test de la signification globale du modèle, intervalle de confiance pour la droite, intervalle de prédiction
  • diagnostic du modèle
  • détection d'observations aberrantes et d'observation influentes
  • multicolinearité : diagnostic et remèdes
  • sélection de variables
  • détection d'observations aberrantes et d'observation influentes
Analyse de la variance - modèle à un facteur :
  • l'analyse de la variance a un facteur comme modèle linéaire
  • estimation des paramètres (dispositif équilibré et déséquilibré) 
  • décomposition de la somme des carrées totale et qualité de l'ajustement du modèle
  • test de l'effet du facteur
  • validation des hypothèses de normalité et de homoscédasticité
  • tests post hoc pour les comparaisons multiples de moyennes
  • analyse de la variance non paramétrique
Analyse de la variance - modèle à deux facteurs :
  • l'analyse de la variance à deux facteurs comme modèle linéaire
  • estimation des paramètres et qualité du modèle
  • test d'hypothèses et intervalles de confiance sur les coefficients
  • étude de l'interaction
  • décomposition de la somme des carrés totale
  • décomposition de la somme des carrées du modèle
  • test de la significativité globale du modèle
  • tests des effets
  • test de comparaison des moyennes pour chaque facteur
  • test de comparaison des moyennes par traitements
Analyse de la covariance :
  • le modèle d'analyse de la covariance
  • estimation des paramètres
  • décomposition de la somme des carrés totale, ajustement du modèle
  • test de significativité globale du modèle
  • test des effets
  • test de comparaison des moyennes par traitements
  • sélection du modèle

Bibliographie

  • P. DAGNELIE : Statistique théorique et appliquée - tome 2 (De Boeck, Bruxelles 2011)
  • Y. DODGE : Analyse de régression appliquée (Dunod 2004)
  • N. DRAPER et H. SMITH : Applied regression analysis (Wiley 1998)
  • M. LEJEUNE : Statistique: la théorie et ses applications (Springer 2010)
  • R.C. LITTELL : SAS for Linear Models, Fourth Edition (SAS Institute Inc. 2002)
  • G.SAPORTA : Probabilités, analyse des données, statistique (Technip 2011)
  • N.H. TIMM : Univariate and Multivariate General Linear Models: Theory and Applications using SAS Software (SAS Institute Inc. 1997)
  • M.TENENHAUS : Statistique. Méthodes pour décrire, expliquer et prévoir. (Dunod, 2007)

Cette UE apparaît dans les diplômes et certificats suivants

Contact

EPN06 Mathématiques et statistiques
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Sabine Glodkowski
Voir les sites

Voir les dates et horaires, les lieux d'enseignement et les modes d'inscription sur les sites internet des centres régionaux qui proposent cette formation