Modélisation Statistique

Transcription

Modélisation Statistique
Modélisation Statistique
Modélisation
statistique
Statistiques
descriptives
Plan
Schéma de la
modélisation
statistique
Modélisation
Linéaire
Statistiques
descriptives
Non Linéaire
Découpage des cours
Statistiques
unidimensionnelles
Régression
linéaire
Analyse en composantes
principales
Perceptron
multi-couches
Cartes topologiques
(suite)
Statistiques
bidimensionnelles
Classification
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Supervisé
Régression
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
24 mars 2015
1/19
Modélisation
statistique
Sommaire du document
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
Plan
Schéma de la modélisation statistique
Statistiques descriptives
Découpage des cours
Statistiques unidimensionnelles
Statistiques bidimensionnelles
Statistiques multidimensionnelles
Modélisation linéaire
Régression linéaire
Analyse en composantes principales
Modélisation non linéaire
Perceptron multicouches
Cartes topologiques
Bibliographie
Nous joindre
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Dans ce document tous les liens actifs sont en vert
Page précédente
Plan
Nous joindre
Page suivante
Schéma de la modélisation statistique
2/19
Modélisation
statistique
Statistiques
descriptives
Plan
Schéma de la
modélisation
statistique
Modélisation
Statistiques
descriptives
Découpage des cours
Linéaire
Statistiques
unidimensionnelles
Non Linéaire
(suite)
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
Régression
linéaire
Analyse en composantes
principales
Perceptron
multi-couches
Cartes topologiques
(suite)
Modélisation
linéaire
Classification
Régression linéaire
Analyse en
composantes
principales
Supervisé
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Régression
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
3/19
Modélisation
statistique
Plan
Schéma de la
modélisation
statistique
es
Statistiques
tatistiqu es
S
v
descriptives
descripti
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
ne
uune
variable
riable
va
eux
ddeux
variables
variables
XX
XX,,YY
lusieurs
pplusieurs
variables
riables
va
n]
[1,n]
XXkk kk ∈∈[1,
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
4/19
Modélisation
statistique
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
Cours de statistiques descriptives
Le cours de statistiques descriptives comporte 3 cours:
I
I
I
Statistiques unidimensionnelles
Statistiques bidimensionnelles
Statistiques multidimensionnelles
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
Statistiques
unidimensionnelles
Description du cours
Statistiques
bidimensionnelles
Description du cours
Statistiques
multidimensionnelles
Description du cours
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
Statistiques unidimensionelles
5/19
Modélisation
statistique
Caractéristiques:
I
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
1/2
Accès à la description du cours
une seule variable X qui peut prendre n valeurs xi
Paramètres:
I
I
I
I
moyenne
Étude de cas
médiane
quartiles
variance et écart type
Représentations graphiques:
I
I
I
camemberts
histogrammes
boîtes à moustaches
(suite)
Statistiques
unidimensionnelles
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Modélisation non
linéaire
Perceptron
multicouches
Représentations
graphiques
Paramètres
Analyse en
composantes
principales
Moyenne
Quartiles:
médiane et
autres quartiles
Variance
Ecart type
Camemberts
Histogrammes
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
Boîtes à
moustaches
6/19
Modélisation
statistique
Statistiques unidimensionelles
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
unidimensionnelles
Paramètres:
Moyenne
n
1 X
x =
xi
n i=1
Variance
n
1 X
2
V (X ) =
(xi − x)
n i=1
2/2
Représentations graphiques:
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
Statistiques bidimensionelles
7/19
Modélisation
statistique
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Accès à la description du cours
Caractéristiques:
I
Deux variables X et Y
Indicateurs:
I
I
1/2
Étude de cas:
Données environnementales
et effet de serre
Covariance
Coefficient de corrélation
Représentations graphiques:
I
I
Diagrammes de dispersion
Histogramme 2D
Statistiques
bidimensionnelles
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Représentations
graphiques
Détermination
des indicateurs
Régression linéaire
Covariance
Diagrammes
de dispersion
Coefficient
de corrélation
Histogrammes
2D
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
8/19
Modélisation
statistique
Statistiques bidimensionelles
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
σX =
Paramètres: p
p
V (X ) σY =
V (Y )
Covariance
Statistiques
bidimensionnelles
Cov(X , Y ) =
2/2
Représentations graphiques:
n
X
(xi − x)(yi − y)
i=1
Coefficient de corrélation
Cov(X , Y )
rxy = Cor (X , Y ) =
σX σY
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
Statistiques multidimensionelles
9/19
Modélisation
statistique
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
1/2
Caractéristiques:
I
Un grand nombre de variables Xn
Indicateurs:
I
I
I
Accès à la description du cours
Vecteur moyen
Matrice de covariance
Coefficient de corrélation
Représentations graphiques:
I
I
Représentation géométrique
Ellipsoïde de Mahalanobis
Statistiques
multidimensionnelles
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
Représentations
graphiques
Détermination
des indicateurs
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Vecteur moyen
Matrice de
covariance
Matrice de
corrélation
Réprésentation
géométrique
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
Ellipsoïde de
Mahalanobis
10/19
Modélisation
statistique
Statistiques multidimensionelles
Plan
Schéma de la
modélisation
statistique
Paramètres:
Sij = Cov(Xi , Xj ) et Sii = V (Xi )
rij = Cor (Xi , Xj )
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
2/2
Statistiques
multidimensionnelles
Matrice de covariance

S11
...
S1p

.
.
.


.
.
.

.
.
.
Sp1
...
Spp
Matrice de corrélation

r11
...
r1p

.
.
.


.
.
.

.
.
.
rp1
...
rpp
Représentation graphique:










Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
11/19
Modélisation
statistique
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
linéaire
Modélisation
tion linéaire
Modélisa
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
nalyse
AAnalyse
n
een
ntes
composantes
composaales
principales
princip
n
Régression
Régressioe
ir
a
linéaire
é
n
li
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
12/19
Modélisation
statistique
Modélisation linéaire
Plan
Modélisation Linéaire
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
Deux variables X , Y
Xk
n variables
k ∈ [1, n]
Analyse en composantes
principales ACP
Régression
linéaire
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
Régression linéaire
13/19
Modélisation
statistique
Accès à la description du cours
Plan
Régression
Modélisation
y = f (x)
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Régression linéaire :
Méthode des
moindres carrés
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
Modèle déterministe
Modèle probabiliste
Régression Linéaire
Régression
y = ax + b
y = ax + b + variable aléatoire
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Détermination
de a et b
par la méthode des
moindres carrés
Détermination de la
variable aléatoire Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
Analyse en composantes principales
14/19
Modélisation
statistique
Accès à la description du cours
Plan
Première étude de cas:
Variables climatiques liées à l’effet
de serre
Schéma de la
modélisation
statistique
Deuxième étude de cas :
Températures locales et effet de serre
Statistiques
descriptives
Découpage des cours
Analyse en
composantes principales
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
Méthodes
(suite)
Statistiques
multidimensionnelles
Diagonalisation
But
Méthode des
moindres carrés
Diminuer
le nombre de variables
(suite)
Obtenir des
représentations
graphiques
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
15/19
Modélisation
statistique
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
tion
Modélisation
odélisa
M
non
linéaire
non linéaire
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
on
Perceptron
Perceptrches
u
multicouches
o
ic
mult
Cartes
artes ues
C
topologiques
topologiq
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
16/19
Modélisation
statistique
Perceptron multicouches
Accès au cours sur IPSL formations
Plan
Schéma de la
modélisation
statistique
Etude de cas 1 : Régression
par Perceptron Multicouche
Les vidéos ci-dessous extraites d’une conférence de Sylvie Thiria
vous permettront d’avoir un aperçu sur le perceptron
multicouche
Etude de cas 2 : Classification
par Perceptron Multicouche
Application aux iris de Fisher
Statistiques
descriptives
Etude de cas 3 : Reconnaissance
des chiffres manuscrits Codage des
données Masques et poids partagés
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron :introduction
Vidéo
Etude de cas 4 : Modélisation de
la fonction de transfert du diffusiomètre NSCAT et des incertitudes
Modèle direct
Modélisation de la
fonction de transfert
Vidéo
Etude de cas 5 : Inversion des
observations du radiomètre SeaWiFS pour la quantification des
aérosols- comparaison avec l’algorithme standard de la NASA
Modèle direct
Modélisation de l’incertitude
Vidéo
Etude de cas 6 : Modélisation de
séries chronologiques - Application à la prévision du trafic SNCF
Modèle inverse
Perceptron Modèle inverse
Vidéo
Etude de cas 7 : Etude de la prévisibilité de séries chronologiques de
températures issues de la base de
données ERA-Interim du centre
Européen au moyen de modèles
neuronaux (perceptron multicouches et cartes de Kohonen)
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
Cartes topologiques
17/19
Modélisation
statistique
Accès au cours sur IPSL formations
Plan
Schéma de la
modélisation
statistique
Statistiques
descriptives
Etude de cas 1 : Classification
par cartes topologiques - Utilisation de la SOM Toolbox
Les vidéos ci-dessous extraites d’une conférence de Sylvie Thiria
vous permettront d’avoir un aperçu sur les cartes topologiques
(cartes de Kohonen)
Etude de cas 2 : Caractérisation
de phénomène d’upwelling
au large du Sénégal à partir
températures de surface de
l’océan et des concentration en
Chlorophylle-a observées par satellite
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Etude de cas 3 : Etude et prévision du phénomène El Nino à
partir des anomalies mensuelles
de températures de surface de la
mer observées par satellite près
des côtes d’Amérique du Sud.
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Couleur de l’océan
Vidéo
Polution atmosphérique
Vidéo
Etude de cas 4 : Etude de la prévisibilité de séries chronologiques de
températures issues de la base de
données ERA-Interim du centre
Européen au moyen de modèles
neuronaux (perceptron multicouches et cartes topologiques)
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
18/19
Modélisation
statistique
Plan
Ouvrages sur la modélisation statistique
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Régression linéaire
1.
Saporta ,Probabilités, analyse des données et statistique, Springer 2011
2.
G. Dreyfus, J.M. Martinez, M. Samuelides, M.B. Gordon, F. Badran, S. Thiria [2008], Apprentissage statistique
(Réseaux de neurones, Cartes topologiques, Machines à vecteurs supports), Eyrolles 3ème édition, 2008.
3.
Christopher M. Bishop [2006], Pattern recognition and machine learning, Springer 2006
4.
Vladimir N. Vapnik , Statistical Learning Theory , Wiley 1998
5.
Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, 2nd Edition Wiley 2000
6.
Kohonen, Teuvo, Self-Organizing Maps Springer 2001
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan
Nous joindre
Page suivante
19/19
Modélisation
statistique
Plan
Nous joindre
Schéma de la
modélisation
statistique
Statistiques
descriptives
Découpage des cours
Statistiques
unidimensionnelles
(suite)
Statistiques
bidimensionnelles
I
I
Les responsables du MASTER TRIED
Les enseignants
Cécile Mallet
Cécile Mallet est maître de conférences à l’UVSQ
et enseigne dans le master TRIED
(suite)
Statistiques
multidimensionnelles
(suite)
Modélisation
linéaire
Sylvie Thiria
Sylvie Thiria est Professeur d’université
et enseigne dans le master TRIED
Régression linéaire
Analyse en
composantes
principales
Modélisation non
linéaire
Perceptron
multicouches
Cartes topologiques
Bibliographie
Nous joindre
Page précédente
Plan