Modélisation Statistique
Transcription
Modélisation Statistique
Modélisation Statistique Modélisation statistique Statistiques descriptives Plan Schéma de la modélisation statistique Modélisation Linéaire Statistiques descriptives Non Linéaire Découpage des cours Statistiques unidimensionnelles Régression linéaire Analyse en composantes principales Perceptron multi-couches Cartes topologiques (suite) Statistiques bidimensionnelles Classification (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Supervisé Régression Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre 24 mars 2015 1/19 Modélisation statistique Sommaire du document Plan Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles Plan Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles Statistiques bidimensionnelles Statistiques multidimensionnelles Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Dans ce document tous les liens actifs sont en vert Page précédente Plan Nous joindre Page suivante Schéma de la modélisation statistique 2/19 Modélisation statistique Statistiques descriptives Plan Schéma de la modélisation statistique Modélisation Statistiques descriptives Découpage des cours Linéaire Statistiques unidimensionnelles Non Linéaire (suite) Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles Régression linéaire Analyse en composantes principales Perceptron multi-couches Cartes topologiques (suite) Modélisation linéaire Classification Régression linéaire Analyse en composantes principales Supervisé Modélisation non linéaire Perceptron multicouches Cartes topologiques Régression Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante 3/19 Modélisation statistique Plan Schéma de la modélisation statistique es Statistiques tatistiqu es S v descriptives descripti Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Analyse en composantes principales ne uune variable riable va eux ddeux variables variables XX XX,,YY lusieurs pplusieurs variables riables va n] [1,n] XXkk kk ∈∈[1, Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante 4/19 Modélisation statistique Plan Schéma de la modélisation statistique Statistiques descriptives Cours de statistiques descriptives Le cours de statistiques descriptives comporte 3 cours: I I I Statistiques unidimensionnelles Statistiques bidimensionnelles Statistiques multidimensionnelles Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles Statistiques unidimensionnelles Description du cours Statistiques bidimensionnelles Description du cours Statistiques multidimensionnelles Description du cours (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante Statistiques unidimensionelles 5/19 Modélisation statistique Caractéristiques: I Plan Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles 1/2 Accès à la description du cours une seule variable X qui peut prendre n valeurs xi Paramètres: I I I I moyenne Étude de cas médiane quartiles variance et écart type Représentations graphiques: I I I camemberts histogrammes boîtes à moustaches (suite) Statistiques unidimensionnelles Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Modélisation non linéaire Perceptron multicouches Représentations graphiques Paramètres Analyse en composantes principales Moyenne Quartiles: médiane et autres quartiles Variance Ecart type Camemberts Histogrammes Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante Boîtes à moustaches 6/19 Modélisation statistique Statistiques unidimensionelles Plan Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques unidimensionnelles Paramètres: Moyenne n 1 X x = xi n i=1 Variance n 1 X 2 V (X ) = (xi − x) n i=1 2/2 Représentations graphiques: Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante Statistiques bidimensionelles 7/19 Modélisation statistique Plan Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Accès à la description du cours Caractéristiques: I Deux variables X et Y Indicateurs: I I 1/2 Étude de cas: Données environnementales et effet de serre Covariance Coefficient de corrélation Représentations graphiques: I I Diagrammes de dispersion Histogramme 2D Statistiques bidimensionnelles Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Représentations graphiques Détermination des indicateurs Régression linéaire Covariance Diagrammes de dispersion Coefficient de corrélation Histogrammes 2D Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante 8/19 Modélisation statistique Statistiques bidimensionelles Plan Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles σX = Paramètres: p p V (X ) σY = V (Y ) Covariance Statistiques bidimensionnelles Cov(X , Y ) = 2/2 Représentations graphiques: n X (xi − x)(yi − y) i=1 Coefficient de corrélation Cov(X , Y ) rxy = Cor (X , Y ) = σX σY (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante Statistiques multidimensionelles 9/19 Modélisation statistique Plan Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) 1/2 Caractéristiques: I Un grand nombre de variables Xn Indicateurs: I I I Accès à la description du cours Vecteur moyen Matrice de covariance Coefficient de corrélation Représentations graphiques: I I Représentation géométrique Ellipsoïde de Mahalanobis Statistiques multidimensionnelles Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) Représentations graphiques Détermination des indicateurs Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Vecteur moyen Matrice de covariance Matrice de corrélation Réprésentation géométrique Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante Ellipsoïde de Mahalanobis 10/19 Modélisation statistique Statistiques multidimensionelles Plan Schéma de la modélisation statistique Paramètres: Sij = Cov(Xi , Xj ) et Sii = V (Xi ) rij = Cor (Xi , Xj ) Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire 2/2 Statistiques multidimensionnelles Matrice de covariance S11 ... S1p . . . . . . . . . Sp1 ... Spp Matrice de corrélation r11 ... r1p . . . . . . . . . rp1 ... rpp Représentation graphique: Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante 11/19 Modélisation statistique Plan Schéma de la modélisation statistique Statistiques descriptives linéaire Modélisation tion linéaire Modélisa Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) nalyse AAnalyse n een ntes composantes composaales principales princip n Régression Régressioe ir a linéaire é n li Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante 12/19 Modélisation statistique Modélisation linéaire Plan Modélisation Linéaire Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles Deux variables X , Y Xk n variables k ∈ [1, n] Analyse en composantes principales ACP Régression linéaire (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante Régression linéaire 13/19 Modélisation statistique Accès à la description du cours Plan Régression Modélisation y = f (x) Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Régression linéaire : Méthode des moindres carrés Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles Modèle déterministe Modèle probabiliste Régression Linéaire Régression y = ax + b y = ax + b + variable aléatoire (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Détermination de a et b par la méthode des moindres carrés Détermination de la variable aléatoire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante Analyse en composantes principales 14/19 Modélisation statistique Accès à la description du cours Plan Première étude de cas: Variables climatiques liées à l’effet de serre Schéma de la modélisation statistique Deuxième étude de cas : Températures locales et effet de serre Statistiques descriptives Découpage des cours Analyse en composantes principales Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles Méthodes (suite) Statistiques multidimensionnelles Diagonalisation But Méthode des moindres carrés Diminuer le nombre de variables (suite) Obtenir des représentations graphiques Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante 15/19 Modélisation statistique Plan Schéma de la modélisation statistique Statistiques descriptives tion Modélisation odélisa M non linéaire non linéaire Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) on Perceptron Perceptrches u multicouches o ic mult Cartes artes ues C topologiques topologiq Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante 16/19 Modélisation statistique Perceptron multicouches Accès au cours sur IPSL formations Plan Schéma de la modélisation statistique Etude de cas 1 : Régression par Perceptron Multicouche Les vidéos ci-dessous extraites d’une conférence de Sylvie Thiria vous permettront d’avoir un aperçu sur le perceptron multicouche Etude de cas 2 : Classification par Perceptron Multicouche Application aux iris de Fisher Statistiques descriptives Etude de cas 3 : Reconnaissance des chiffres manuscrits Codage des données Masques et poids partagés Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron :introduction Vidéo Etude de cas 4 : Modélisation de la fonction de transfert du diffusiomètre NSCAT et des incertitudes Modèle direct Modélisation de la fonction de transfert Vidéo Etude de cas 5 : Inversion des observations du radiomètre SeaWiFS pour la quantification des aérosols- comparaison avec l’algorithme standard de la NASA Modèle direct Modélisation de l’incertitude Vidéo Etude de cas 6 : Modélisation de séries chronologiques - Application à la prévision du trafic SNCF Modèle inverse Perceptron Modèle inverse Vidéo Etude de cas 7 : Etude de la prévisibilité de séries chronologiques de températures issues de la base de données ERA-Interim du centre Européen au moyen de modèles neuronaux (perceptron multicouches et cartes de Kohonen) Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante Cartes topologiques 17/19 Modélisation statistique Accès au cours sur IPSL formations Plan Schéma de la modélisation statistique Statistiques descriptives Etude de cas 1 : Classification par cartes topologiques - Utilisation de la SOM Toolbox Les vidéos ci-dessous extraites d’une conférence de Sylvie Thiria vous permettront d’avoir un aperçu sur les cartes topologiques (cartes de Kohonen) Etude de cas 2 : Caractérisation de phénomène d’upwelling au large du Sénégal à partir températures de surface de l’océan et des concentration en Chlorophylle-a observées par satellite Découpage des cours Statistiques unidimensionnelles (suite) Etude de cas 3 : Etude et prévision du phénomène El Nino à partir des anomalies mensuelles de températures de surface de la mer observées par satellite près des côtes d’Amérique du Sud. Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Couleur de l’océan Vidéo Polution atmosphérique Vidéo Etude de cas 4 : Etude de la prévisibilité de séries chronologiques de températures issues de la base de données ERA-Interim du centre Européen au moyen de modèles neuronaux (perceptron multicouches et cartes topologiques) Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante 18/19 Modélisation statistique Plan Ouvrages sur la modélisation statistique Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Régression linéaire 1. Saporta ,Probabilités, analyse des données et statistique, Springer 2011 2. G. Dreyfus, J.M. Martinez, M. Samuelides, M.B. Gordon, F. Badran, S. Thiria [2008], Apprentissage statistique (Réseaux de neurones, Cartes topologiques, Machines à vecteurs supports), Eyrolles 3ème édition, 2008. 3. Christopher M. Bishop [2006], Pattern recognition and machine learning, Springer 2006 4. Vladimir N. Vapnik , Statistical Learning Theory , Wiley 1998 5. Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, 2nd Edition Wiley 2000 6. Kohonen, Teuvo, Self-Organizing Maps Springer 2001 Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan Nous joindre Page suivante 19/19 Modélisation statistique Plan Nous joindre Schéma de la modélisation statistique Statistiques descriptives Découpage des cours Statistiques unidimensionnelles (suite) Statistiques bidimensionnelles I I Les responsables du MASTER TRIED Les enseignants Cécile Mallet Cécile Mallet est maître de conférences à l’UVSQ et enseigne dans le master TRIED (suite) Statistiques multidimensionnelles (suite) Modélisation linéaire Sylvie Thiria Sylvie Thiria est Professeur d’université et enseigne dans le master TRIED Régression linéaire Analyse en composantes principales Modélisation non linéaire Perceptron multicouches Cartes topologiques Bibliographie Nous joindre Page précédente Plan