Correction
Transcription
Correction
UNIVERSITE de NICE - SOPHIA ANTIPOLIS Institut Sup´ erieur d’Economie et de Management ´ UNIVERSITAIRE : 2014-2015 ANNEE REF. ´ ´ ANNEE D’ETUDE : L2 ` ´ STATISTIQUES MATIERE : PROBABILITES, ENSEIGNANT : DIETER MITSCHE ` ´ THEME DE LA SEANCE : Tests d’hypoth`eses : comparaison a` une norme. ´ Fiche TD 2 - L2 Economie-Gestion Exercice 1 : (Choix des hypoth`eses; Anderson) Un responsable d’une concession automobile cherche `a mettre en place un nouveau syst`eme de bonus, et souhaite ´etudier son effet sur le volume moyen des ventes. Avant la mise en place du bonus, chaque membre du personnel charg´e de la vente vendait en moyenne 12 v´ehicules par mois. Un ´echantillon du personnel charg´e de la vente applique le nouveau syst`eme de bonus pendant un mois. a. D´eterminer les hypoth`eses nulle et alternative les plus appropri´ees pour cette recherche. On veut prouver que le nouveau syst`eme fait augmenter les ventes. On note µ le nombre moyen de v´ehicules vendus par membre du personnel. On choisit donc H0 = “le volume moyen des ventes n’augmente pas avec les nouveau syst`eme” : µ ≤ 12. Ha = “le volume moyen des ventes augmente avec les nouveau syst`eme” : µ > 12. b. A quoi correspondent les erreurs de premi`ere et seconde esp`ece dans ce cas ? Erreur de premi`ere esp`ece : on conclut que µ > 12 alors que µ ≤ 12 = on conclut `a tort que le nouveau syst`eme fait augmenter le niveau moyen des ventes. Erreur de seconde esp`ece : on conclut que µ ≤ 12 alors que µ > 12 = on conclut a` tort que le nouveau syst`eme est inefficace. c. Quelles sont les cons´equences d’une erreur de premi`ere esp`ece ? De seconde esp`ece ? Si on fait une erreur de premi`ere esp`ece, on mettra en place le nouveau syst`eme de bonus, alors qu’il est inefficace, et peut-ˆetre coˆ uteux. Si on fait une erreur de seconde esp`ece, on renoncera a` le mettre en place, alors qu’il aurait peut-ˆetre ´et´e int´eressant. Exercice 2 : (Choix des hypoth`eses; Anderson) Une chaˆıne de production est con¸cue pour remplir un barril de lessive avec 3kg de produit. Un ´echantillon de barrils est p´eriodiquement s´electionn´e, pour d´eterminer s’il y a sur- ou sous-remplissage. Dans ce cas, la chaˆıne de production est ferm´ee et ajust´ee. a. D´eterminer les hypoth`eses nulle et alternative a` utiliser. Hypoth`ese nulle : la quantit´e moyenne µ de lessive dans les barrils est 3kg (c’est-`a-dire : la chaˆıne est bien r´egl´ee). Hypoth`ese alternative : µ 6= 3kg, la chaˆıne est mal r´egl´ee. b. A quoi correspondent les erreurs de premi`ere et seconde esp`ece dans ce cas ? Erreur de premi`ere esp`ece : on conclut que la chaˆıne est mal r´egl´ee alors qu’elle est bien r´egl´ee. 1 Erreur de seconde esp`ece : on conclut `a tort que la chaˆıne est bien r´egl´ee. c. Quelles sont les cons´equences d’une erreur de premi`ere esp`ece ? De seconde esp`ece ? Si on fait une erreur de premi`ere esp`ece, on va arrˆeter la chaˆıne pour rien, ce qui coˆ ute probablement de l’argent. Si on fait une erreur de seconde esp`ece, on va produire un certain nombre de barrils avec une chaˆıne mal r´egl´ee. Exercice 3 : (Moyenne d’une population, σ connu) On consid`ere le test d’hypoth`eses suivant, o` u µ d´esigne la moyenne d’une population : H0 : µ = 6 ; Ha : µ 6= 6 Un ´echantillon de taille n = 80 fournit une moyenne d’´echantillon de 5, 8. L’´ecart-type de la population est connu, ´egal `a 1. Effectuer le test, avec un seuil de signification α = 0.05, en expliquant les diff´erentes ´etapes. Pour vous entraˆıner, utiliser la m´ethode de la valeur p et la m´ethode de la valeur critique. L’´ecart-type de la population est connu, on utilisera donc la loi normale pour calculer valeur p et valeur critique; la taille de l’´echantillon est suffisante pour qu’on puisse effectuer un test. On calcule la statistique de test : √ z = 80(5.8 − 6)/1 ' −1.79 M´ ethode de la valeur p : C’est un test bilat´eral, donc la probabilit´e d’obtenir une statistique de test au moins aussi improbable que −1.79, en supposant que H0 est vraie, est ´egale a` P (|Z| > 1.79), pour Z une va de loi N (0, 1). On obtient comme valeur p : 0.0734. Conclusion : on conserve H0 au seuil de signification 0.05. M´ ethode de la valeur critique : On souhaite un seuil de signification 0.05, pour un test bilat´eral. La valeur critique zc est donc d´efinie par P (|Z| > zc ) = 0.05 , o` u Z est une va de loi N (0, 1). On en d´eduit que zc = 1.96.On rejette l’hypoth`ese H0 si la statistique de test z est inf´erieure a` −zc ou sup´erieure a` zc (zone de rejet :]−∞, −zc [∪]zc , +∞[). Dans ce cas, −1.79 n’est pas dans la zone de rejet, on conserve donc H0 . Exercice 4 : (Moyenne d’une population, σ connu) On consid`ere le test d’hypoth`eses suivant, o` u µ d´esigne la moyenne d’une population : H0 : µ ≥ 14 ; Ha : µ < 14 Un ´echantillon de taille n = 120 fournit une moyenne d’´echantillon de 13.6. L’´ecart-type de la population est connu, ´egal `a 2. Effectuer le test, avec un seuil de signification α = 0.02, en expliquant les diff´erentes ´etapes. Pour vous entraˆıner, utiliser la m´ethode de la valeur p et la m´ethode de la valeur critique. L’´ecart-type de la population est connu, on utilisera donc la loi normale pour calculer valeur p et valeur critique; la taille de l’´echantillon est suffisante pour qu’on puisse effectuer un test. On calcule la statistique de test : √ z = 120(13.6 − 14)/2 ' −2.19 2 M´ ethode de la valeur p : C’est un test unilat´eral inf´erieur, donc la probabilit´e d’obtenir une statistique de test au moins aussi improbable que −2.19, en supposant que H0 est vraie, est ´egale a` P (Z < −2.19), pour Z une va de loi N (0, 1). On obtient comme valeur p : 0.0143. Conclusion : on accepte Ha au seuil de signification 0.02. M´ ethode de la valeur critique : On souhaite un seuil de signification 0.02, pour un test unilat´eral inf´erieur. La valeur critique zc est donc d´efinie par P (Z < zc ) = 0.02 , o` u Z est une va de loi N (0, 1). On en d´eduit que zc = −2.06.On rejette l’hypoth`ese H0 si la statistique de test z est inf´erieure a` zc (zone de rejet :] − ∞, zc [). Dans ce cas, on rejette donc H0 , et on accepte Ha . Exercice 5 : (Moyenne d’une population, σ inconnu) On consid`ere le test d’hypoth`eses suivant, o` u µ d´esigne la moyenne d’une population : H0 : µ ≥ 34 ; Ha : µ < 34 On sait que la population a une distribution normale. Un ´echantillon de taille n = 16 fournit une moyenne d’´echantillon de 31, et un ´ecart-type d’´echantillon de 5. Effectuer le test, avec un seuil de signification α = 0.05, en expliquant les diff´erentes ´etapes. Pour vous entraˆıner, utiliser la m´ethode de la valeur p et la m´ethode de la valeur critique. L’´ecart-type de la population est inconnu, on utilisera donc une loi de Student pour calculer valeur p et valeur critique; l’´echantillon est petit, mais on sait que la population suit une loi normale; on peut donc tout de mˆeme effectuer un test. On calcule la statistique de test : √ t = 16(31 − 34)/5 ' −2.4 M´ ethode de la valeur p : C’est un test unilat´eral inf´erieur, donc la probabilit´e d’obtenir une statistique de test au moins aussi improbable que −2.4, en supposant que H0 est vraie, est ´egale a` P (T < −2.4), pour T une va de loi de Student `a 15 degr´e de libert´e. On obtient comme valeur p une probabilit´e comprise entre 0.025 et 0.01. Conclusion : on accepte Ha au seuil de signification 0.05. M´ ethode de la valeur critique : On souhaite un seuil de signification 0.05, pour un test unilat´eral inf´erieur. La valeur critique tc est donc d´efinie par P (T < tc ) = 0.05 , o` u T est une va de loi de Student `a 15 degr´es de libert´e. On en d´eduit que tc = −1.753.On rejette l’hypoth`ese H0 si la statistique de test t est inf´erieure a` −tc (zone de rejet :] − ∞, tc [). Dans ce cas, on rejette donc H0 , et on accepte Ha . Exercice 6 : (Moyenne d’une population, σ inconnu) On consid`ere le test d’hypoth`eses suivant, o` u µ d´esigne la moyenne d’une population : H0 : µ = 12 ; Ha : µ 6= 12 Un ´echantillon de taille n = 100 fournit une moyenne d’´echantillon de 12.25, et un ´ecart-type d’´echantillon de 1. 3 Effectuer le test, avec un seuil de signification α = 0.01, en expliquant les diff´erentes ´etapes. Pour vous entraˆıner, utiliser la m´ethode de la valeur p et la m´ethode de la valeur critique. L’´ecart-type de la population est inconnu, on utilisera donc a priori une loi de Student pour calculer valeur p et valeur critique. La taille de l’´echantillon est suffisante pour qu’on puisse effectuer un test, mˆeme si la population ne suit pas une loi normale (n = 100). Pour n = 100, la diff´erence entre loi de Student et loi normale est faible; on pourra donc aussi utiliser une loi normale pour calculer valeur p et valeur critique. On calcule la statistique de test : √ t = 100(12.25 − 12)/1 = 2.5 M´ ethode de la valeur p : C’est un test bilat´eral donc la probabilit´e d’obtenir une statistique de test au moins aussi improbable que 2.5, en supposant que H0 est vraie, est ´egale a` P (|T | > 2.5), pour T une va de loi de Student a` 99 degr´e de libert´e. On obtient comme valeur p une probabilit´e comprise entre 0.01 et 0.02 (en utilisant la table d’une loi de Student `a 100 degr´es de libert´e, proche de celle d’une loi de Student `a 99 degr´es de libert´e; en utilisant la loi normale, assez proche aussi d’une loi de Student a` 99 degr´es de libert´e, on obtient une valeur p de 0.0124) Conclusion : on conserve H0 au seuil de signification 0.01. M´ ethode de la valeur critique : On souhaite un seuil de signification 0.01, pour un test bilat´eral. La valeur critique tc est donc d´efinie par P (|T | > tc ) = 0.01 , o` u T est une va de loi de Student `a 99 degr´es de libert´e. On en d´eduit que tc ' 2.63 (table de la loi de Student `a 100 ddl).On rejette l’hypoth`ese H0 si la statistique de test t est inf´erieure a` −tc ou sup´erieure `a tc (zone de rejet :] − ∞, −tc [∪]tc , +∞[). Dans ce cas t = 2.5, on conserve donc H0 . Remarque : pour n = 100, on peut aussi dire que la loi de Student a` 99 degr´es de libert´e est proche d’une loi normale centr´ee r´eduite, et utiliser la table de la loi normale; on fera seulement une petite erreur; on obtiendrait tc = 2.58. Exercice 7 : (Proportion d’une population) On consid`ere le test d’hypoth`eses suivant, o` u µ d´esigne la proportion d’une population : H0 : µ ≤ 0.6 ; Ha : µ > 0.6 a. Un ´echantillon de taille n = 200 a fournit une proportion d’´echantillon de .67. Calculer la valeur p et conclure, pour un seuil de signification α = 0.05. L’´echantillon est assez grand pour qu’on puisse effectuer le test (n × 0.6 > 10 , n × 0.4 > 10). La statistique d’´echantillon est p √ z = 200(0.67 − 0.6)/ 0.6 ∗ (1 − 0.6) ' 2.02 La valeur p est P (Z > 2.02), avec Z une va de loi normale centr´ee r´eduite. Donc la valeur p est environ 0.0217. On accepte donc l’hypoth`ese Ha . b. Mˆeme question pour une proportion d’´echantillon de 0.62. La statistique d’´echantillon est p √ z = 200(0.62 − 0.6)/ 0.6 ∗ (1 − 0.6) ' 0.577 4 La valeur p est P (Z > 0.577), avec Z une va de loi normale centr´ee r´eduite. Donc la valeur p est environ 0.28. On ne rejette donc pas l’hypoth`ese H0 . c. Mˆeme question pour une proportion d’´echantillon de 0.57. La statistique de test est n´egative, et on effectue un test unilat´eral sup´erieur... Clairement, les donn´ees ne fournissent aucun support pour Ha , et on ne rejette donc pas H0 : on obtient cette conclusion sans calcul. Exercice 8 Une machine d´ecoupe des tiges en acier, d’une longueur moyenne suppos´ee d’1m. On souhaite v´erifier si la machine est correctement r´egl´ee. 988 997 995 989 997 985 1000 995 1002 990 Qu’en pensez-vous au vu des observations ci-dessus (en mm) ? On supposera que la longueur d’une tige suit une loi normale N (µ, σ 2 ). On note µ la longueur moyenne des tiges. On va effectuer un test bilat´eral, avec un seuil de signification α = 0.05. H0 : µ = 1000 Ha : µ 6= 1000 La moyenne d’´echantillon x¯ = 993.8. L’´ecart-type d’´echantillon est s¯ ' 5.55. La statistique de test est donc √ t = 10(993.8 − 1000)/5.55 ' −3.53 La valeur p (calcul´ee a` l’aide d’une distribution de Student a` 9 degr´es de libert´e, puisque la variance de la population est inconnue) est donc P (T > 3.53) + P (T < −3.53) < 0.01. Au seuil de signification 0.05, on peut accepter Ha , ie la machine est d´er´egl´ee. Exercice 9 (Comparaison de moyennes) : On consid`ere deux populations, d’´ecarts-types connus σ1 = 2.2 et σ2 = 3.0. On donne les r´esultats issus de deux ´echantillons al´eatoires ind´ependants, issus de deux populations : 1- taille n1 = 50 ; moyenne d’´echantillon x¯1 = 9.0. 2- taille n2 = 70 ; moyenne d’´echantillon x¯2 = 9.5. a. Quelle est l’estimation ponctuelle de l’´ecart entre les moyennes µ1 et µ2 des deux populations ? L’estimation ponctuelle de µ1 − µ2 est x¯1 − x¯2 = −0.5. b. On consid`ere le test d’hypoth`eses suivant : H0 : µ1 − µ2 ≥ 0 ; Ha : µ1 − µ2 < 0. Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil α = 0.05 ? ¯1 − X ¯ 2 suit une loi approximativeLes ´ecarts-types des population sont connus. L’estimateur X 2 ment normale, d’esp´erance µ1 − µ2 et de variance connue σ = σ12 /n1 + σ22 /n2 = .2254. On ¯1 − X ¯ 2 )/σ, de loi normale centr´ee r´eduite. La utilise donc comme statistique de test Z¯ = (X statistique de test calcul´ee a` partir de l’´echantillon est z¯ ' −1.05. La valeur p est la probabilit´e qu’une va de loi normale centr´ee r´eduite soit inf´erieure a` z¯. On trouve 0.1469. Au seuil α = 0.05, on ne rejette donc pas H0 . Exercice 10 (Comparaison de moyennes) : On consid`ere deux populations, d’´ecarts-types inconnus. On donne les r´esultats issus de deux ´echantillons al´eatoires ind´ependants, issus de deux populations : 1- taille n1 = 120 ; moyenne d’´echantillon x¯1 = 21.5; ´ecart-type d’´echantillon s1 = 3.1. 2- taille n2 = 100 ; moyenne d’´echantillon x¯2 = 20.5; ´ecart-type d’´echantillon s2 = 2.5. 5 a. Quelle est l’estimation ponctuelle de l’´ecart entre les moyennes µ1 et µ2 des deux populations ? Estimation ponctuelle de µ1 − µ2 : x¯1 − x¯2 = 1. b. On consid`ere le test d’hypoth`eses suivant : H0 : µ1 − µ2 ≥ 0 ; Ha : µ1 − µ2 < 0. Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil α = 0.05 ? Les ´echantillons sont suffisamment grands (n1 , n2 ≥ 100) pour que l’on puisse consid´erer √ √ ¯ 1 − µ1 )/¯ ¯ 2 − µ2 )/¯ s1 et n2 (X s2 suivent approximativement des lois normales centr´ees que n1 (X ¯ ¯ r´eduites. Alors X1 − X2 suit approximativement une loi normale d’esp´erance µ1 − µ2 et de varix1 − x¯2 )/¯ s' ance s21 /n1 + s22 /n2 ' 0.1426; ´ecart-type s¯ ' 0.378. La statistique de test est z¯ = (¯ 2.65. La valeur p est la probabilit´e qu’une va de loi normale centr´ee r´eduite prenne une valeur plus petite que z¯. On obtient 0.996... Bien sˆ ur, on conserve H0 . On pouvait obtenir ce r´esultat d`es le d´ebut, puisque les donn´ees de l’´echantillon favorisent H0 . c. On consid`ere maintenant le test d’hypoth`eses suivant : H0 : µ2 −µ1 ≥ 0 ; Ha : µ2 −µ1 < 0. Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil α = 0.05 ? La statistique de test est la mˆeme, z¯ ' 2.65; cette-fois, la valeur p est la probabilit´e qu’une va de loi normale centr´ee r´eduite prenne une valeur plus grande que z¯. On obtient 0.004. On accepte donc Ha . Exercice 11 (Comparaison de proportions; Anderson) : Dans un test sur la qualit´e de deux publicit´es, chacune a ´et´e diffus´ee dans une zone test sp´ecifique 6 fois en une semaine. La semaine suivante, une enquˆete t´el´ephonique a identifi´e les personnes qui ont vu les publicit´es. On a ensuite demand´e a` ces personnes d’´enoncer le slogan de la publicit´e qu’ils avaient vue. L’enquˆete a fourni les r´esultats suivants : - Nombre de personnes ayant vu la publicit´e A : 150; nombre de personnes se souvenant du slogan 63. - Nombre de personnes ayant vu la publicit´e B : 200; nombre de personnes se souvenant du slogan 60. Tester l’hypoth`ese selon laquelle il n’y a pas d’´ecart entre les proportions de personnes se souvenant du slogan des publicit´es, au seuil de signification 0.05. La proportion dans l’´echantillon A est p¯A = 0.42; dans l’´echantillon B : p¯B = 0.3 On d´efinit le test : H0 : pA = pB ; Ha : pA 6= pB Si H0 est vraie, pA = pB = p; on estime p par p¯ = (nA p¯A + nB p¯B )/(nA + nB ). l’estimateur P¯A − P¯B a une distribution proche de N (0, σ 2 ) (application du TCL), avec 2 σ = p(1 − p)(nA + nB )/(nA nB ). On estime σ en rempla¸cant p par p¯. La statistique de test (qui est distribu´ee suivant une loi normale centr´ee r´eduite) est donc r nA nB P¯A − P¯B ¯ p Z= nA + nB p¯(1 − p¯) Pour les donn´ees de l’´enonc´e, on obtient z¯ ' 2.326. Au seuil α = 0.05, pour un test bilat´eral, la zone de rejet est ] − ∞, −zα/2 [ ∪ ]zα/2 , +∞[=] − ∞, −1.96[ ∪ ]1.96, +∞[ 6 z¯ est dans la zone de rejet, donc on rejette H0 . 7