סטטיסטיקה ב - הסקה סטטיסטית - ד"ר אופיר ברנע
Transcription
סטטיסטיקה ב - הסקה סטטיסטית - ד"ר אופיר ברנע
שיטות סטטיסטיות הסקה סטטיסטית ד"ר אופיר ברנע Statistical Methods Statistical Inference Dr. Ophir Barnea הפצה ישירה www.ophirbarnea.co.il © כל הזכויות שמורות למחבר אין לשכפל ,להעתיק ,לצלם ,להקליט ,לתרגם, לאחסן במאגרי מידע ,לשדר או להקליט בכל דרך או בכל אמצעי אלקטרוני ,אופטי ,מכני או אחר כל חלק שהוא מהחומר שבספר זה. שימוש מסחרי מכל סוג שהוא בחומר הכלול בספר זה אסור בהחלט אלא ברשות מפורשת בכתב מהמחבר. מהדורה רביעית תשע"ה הודפס בישראל Fourth Edition 2015 Third Edition 2014 Second Edition 2013 First Edition 2011 Copyright © 2010 by Dr. Ophir Barnea All rights reserved No parts of this book may be reproduced in any form or by any means Without permission in writing from the author © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 פתח דבר ספר זה נכתב ומיועד לסטודנטים הלומדים בקורס "הסקה סטטיסטית" (סטטיסטיקה ב) ולמרצים בתחום. מטרתו של הספר לשמש כספר מנחה ( , )Text bookלכל המקורב להליך המחקרי ולתהליכי קבלת החלטות המושתתים ונבחנים בכלים סטטיסטיים. הספר כולל את כל החומר הנלמד בקורס זה באוניברסיטאות ובמכללות בארץ ובעולם ,כתיבתו הדידקטית – "הידידותית למשתמש" מאפשרת למידה עצמית של החומר. הספר נכתב לאור ניסיון רב בהוראת התחום ,תוך כדי שיתוף פעולה והקשבה לבעיות ולקשיים בתחום העולים מהסטודנטים הלומדים תחום זה. בכתיבת הספר ניסיתי לחסוך מהסטודנט את הבסיס המתמטי של הסטטיסטיקה ואת פירוט הטכניקות המתמטיות השונות "המעייפות" מיגעות ו"מלחיצות" באופן מיותר את הסטודנט שאינו מתחום המדעים המדויקים ולהתמקד במימד היישומי שימושי . כל הבעיות המועלות בספר ,הן במהלך ההסברים והן בעיות לתרגול אותן תמצאו בסוף כל פרק ,פתורות באופן מלא ומקיף ,ובשלוש דרכים שונות -הדרכים הנפוצות לפתרון בעיות בהסקה סטטיסטית ובכך עונה הספר על שיטות ההוראה השונות. בסוף הספר תמצאו מבחני סיכום (מבחני סמסטר) פתורים פתרון מלא. בספר פרק המוקדש לשימוש בתוכנת Microsoft Excelלעיבודים סטטיסטיים ולהסקה סטטיסטית. באתר האינטרנט שלי שכתובתו ,www.ophirbarnea.co.il -תוכלו למצוא פורומים לסטודנטים ,דרכם ניתן לפתח דיונים ולהעלות שאלות בתחומי דעת רבים. אשמח לקבל הערות והארות בדואר אלקטרוני .ophirba@clb.ac.il שלמי תודה להורי היקרים ,על שהשכילו לטעת בי את יצר הסקרנות ,הרצון ללמוד ,היכולת לשאול ,ובראש ובראשונה את הדרך להצבת מטרות והשגתן. לאבי היקר והאהוב רפי ברנע ז"ל. ד"ר אופיר ברנע © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 3 תוכן עניינים .1 מבוא להסקה סטטיסטית9 ............................................................................. מדגם ,טעויות דגימה ,שיטות דגימה – מקרי ,שכבות ,אשכולות ,שיטתי 9-11 ............. .2 הסקה סטטיסטית 12 ...................................................................................... סטטיסטי ,פרמטר ,אמידה ,בדיקת השערות 12 ................................................ , התפלגות הדגימה של הממוצע 13 ....................................................................... משפט הגבול המרכזי 14-17 .................................................................................. תרגילים 18 .................................................................................................. פתרונות מלאים לתרגילים 19-22 .......................................................................... .3 אמידה 23 .................................................................................................... אומד נקודתי ,אומד חסר הטיה ,יעילות 23 .......................................................... עקביות ,אמינות ,אומד ע"י תחום 24 ................................................................ רווח בר סמך ,רמת ביטחון ,רמת מובהקות 25 ..................................................... חישוב גודל מדגם 26 ...................................................................................... תרגילים 27 .................................................................................................. פתרונות מלאים לתרגילים 28-29 .......................................................................... .4 בדיקת השערות ,הסקה על תוחלת – שונות באכלוסיה ידועה 30 ........................... המבחן הסטטיסטי ,השערה חד כיוונית ,השערה דו כיוונית ,השערת האפס 31 .......... השערה אלטרנטיבית ,רמת מובהקות 33 ............................................................. מבחן חד כיווני ,תחומי קבלה ודחייה להשערת האפס ,שיטת הגבול הקריטי 33 ........... מבחן המובהקות (הסתברויות) 34 ...................................................................... השוואת ערכי , Zהחלטת החוקר 35 .................................................................. טעויות אפשריות ,טעות מסוג ראשון ,טעות מסוג שני ,הסבר גרפי 37 ...................... חישוב טעות מסוג ראשון 37 ............................................................................. חישוב טעות מסוג שני 38 ................................................................................. התאמת גודל המדגם לטעויות רצויות 39 .............................................................. מבחן דו כיווני 39 ........................................................................................... גבולות קריטיים – דו כיווני 40 .......................................................................... רמות מובהקות – דו כיווני ,ערכי – Zדו כיווני 41 ................................................ טעויות אפשריות – דו כיווני 42 ......................................................................... תרגילים 43 .................................................................................................. פתרונות מלאים לתרגילים 44-49 .......................................................................... © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 4 .5 הסקה סטטיסטית – שונות באוכלוסיה אינה ידועה 50 .......................................... אמידת השונות באוכלוסיה 50 ....................................................................... S התפלגות סטודנט 51-52 ..................................................................................... t רווח בר סמך – שונות באוכלוסיה לא ידועה 53 ..................................................... בדיקת השערות – שונות לא ידועה 54-57 ................................................................. תרגילים 57 .................................................................................................. פתרונות מלאים לתרגילים 58-68 .......................................................................... .6 הסקה על הפרש תוחלות – שני מדגמים ,שתי אוכלוסיות בלתי תלויות 69 .............. קבוצות טיפול וקבוצות ביקורת ,מדגמים בלתי תלויים ,מדגמים מזווגים 69 ................. השוואת ממוצעים – שני מדגמים בלתי תלויים 70 ................................................... רווח בר סמך להפרש ממוצעים 73 ...................................................................... בדיקת השערות – סטיות תקן ידועות (שונות באוכלוסיה ידועה) 73 ............................ המבחן הסטטיסטי 73 ........................................................................................ תרגילים 74-75 ................................................................................................... פתרונות מלאים לתרגילים 73-87 ........................................................................... .7 הפרש תוחלות – סטיות תקן באוכלוסיה לא ידועות 88 .......................................... סטיות תקן לא ידועות אך שוות ,משפט הגבול המרכזי 88 ....................................... השונות המשוקללת89 ...................................................................................... רווח בר סמך 90 ............................................................................................. בדיקת השערות 91-92 .......................................................................................... תרגילים 93-94 ................................................................................................... פתרונות מלאים לתרגילים 95-106 ........................................................................... .8 מדגמים מזווגים 107 ......................................................................................... רווח בר סמך ,בדיקת השערות 107-110 ...................................................................... תרגילים 111-112 ................................................................................................... פתרונות מלאים לתרגילים 113-127 ........................................................................... .9 הסקה סטטיסטית על פרופורציה באוכלוסיה 128 ................................................... סטיית תקן לפרופורציה 129 ................................................................................ משפט הגבול המרכזי לפרופורציה 130-132 ................................................................... בדיקת השערות 133-134........................................................................................... תרגילים 135 ................................................................................................... פתרונות מלאים לתרגילים 137-145 ........................................................................... שני מדגמים בלתי תלויים – השוואת פרופורציות 146 ............................................... טעות תקן משוקללת להפרש פרופורציות ,רווח בר סמך להפרש פרופורציות 146-147 ........... © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 5 בדיקת השערות על הפרש פרופורציות 148-150 ............................................................... תרגילים 151 ..................................................................................................... פתרונות מלאים לתרגילים 152-161 ............................................................................. הקירוב הנורמאלי לבינום 162-164 ................................................................................ תרגילים 165 ...................................................................................................... פתרונות מלאים לתרגילים 166-168 .............................................................................. .10הסקה סטטיסטית על שונות באוכלוסיה 169 ............................................................ התפלגות 2 , הסטטיסטי 169 .............................................................................. רווח בר סמך לשונות 170 ..................................................................................... בדיקת השערות לשונות 171-172 ................................................................................. תרגילים 173 ..................................................................................................... פתרונות מלאים לתרגילים 174-183 ............................................................................. ניתוח שונות – 184 ................................................................................. ANOVA שונות בתוך קבוצה , ,שונות מוסברת ,שונות בין קבוצות 184-185 ....................................... התפלגות F 186 ........................................................................... SSW , SSB טבלת ניתוח שונות 187 ........................................................................................ כלל החלטה 188-190 ................................................................................................. תרגילים 191-192 ...................................................................................................... פתרונות מלאים לתרגילים 192-197 ............................................................................ .11קשר סטטיסטי בין שני משתנים 198 ..................................................................... קשר ליניארי בין שני משתנים 199 ......................................................................... מקדם המתאם בין שני משתנים 200-201 ....................................................................... שונות משותפת , Covariance -חישוב מקדם המתאם 201 ....................................... רגרסיה ליניארית 202 ........................................................................................ שיטת הריבועים הפחותים ,קו הרגרסיה 203 ......................................................... , בניית קו החיזוי 203 .......................................................................................... שונות מוסברת 203............................................................................................ תרגילים 204-205 ................................................................................................... פתרונות מלאים לתרגילים 207-209 ........................................................................... .12מבחן 2 לאי תלות 210-211 ................................................................................ המבחן הסטטיסטי 212 ........................................................................................ תרגילים 213 ................................................................................................... פתרונות מלאים לתרגילים 214-221 ........................................................................... © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 6 .13שימוש בתוכנת אקסל להסקה סטטיסטית 222 ....................................................... התקנה ותחילת עבודה באקסל 222 ........................................................................ שני מדגמים בלתי תלויים 223-226 ............................................................................. שני מדגמים מזווגים – (תלויים) 227-230 ..................................................................... מבחן 2 לאי תלות 231-233 ................................................................................. רגרסיה ליניארית 237-237 ........................................................................................ .14מבחנים לדוגמא 237 ......................................................................................... מבחן מס' 237 ............................................................................................... 1 מבחן מס' 242 ............................................................................................... 2 מבחן מס' 248 ............................................................................................... 3 מבחן מס' 252 ............................................................................................... 4 מבחן מס' 256 ............................................................................................... 5 מבחן מס' 260 ............................................................................................... 6 מבחן מס' 264 ............................................................................................... 7 מבחן מס' 268 ............................................................................................... 8 מבחן מס' 272 ............................................................................................... 9 מבחן מס' 276 ............................................................................................. 10 מבחן מס' 281 ............................................................................................. 11 פתרון מבחן 275 ............................................................................................ 1 פתרון מבחן 283 ............................................................................................ 2 פתרון מבחן 291 ............................................................................................ 3 פתרון מבחן 296 ............................................................................................ 4 פתרון מבחן 305 ............................................................................................ 5 פתרון מבחן 312 ............................................................................................ 6 פתרון מבחן 329 ............................................................................................ 7 פתרון מבחן 336 ............................................................................................ 8 פתרון מבחן 343 ............................................................................................ 9 .15נספחים ..... .................................................................................................... שימוש במחשבון Casioלחישובים סטטיסטיים351 .................................................. לוח התפלגות נורמאלית 353 ................................................................................ לוח התפלגות 354 ........................................................................................... t לוח 2 355 .................................................................................................. לוח 356 ....................................................................................................... F © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 7 מבוא להסקה סטטיסטית Introduction to Statistical Inference מהי הסקה סטטיסטית? תחום ההסקה הסטטיסטית עוסק בשיטות הסקה על פרמטרים שונים של תכונה נבדקת (ממוצע ,פיזור ,שונות ,פרופורציה וכו' ) באוכלוסייה שלמה מתוך בדיקת התכונה על מדגם מייצג. מחקרים סטטיסטיים מבוססים בד"כ על מדגם מתוך אוכלוסיה ולא על האוכלוסייה כולה ,במטרה ליצור הכללה נכונה ומדויקת מתוך תוצאות המדגם על האוכלוסייה כולה. אוכלוסייה – אוכלוסיה היא אוסף כל הפרטים ,אובייקטים ,תצפיות העונים על קטגוריה מסוימת: אוכלוסיית המועסקים במדינה – אוסף כל הפרטים המועסקים במדינה – ניתן להוציא רשימה שמית מוגדרת של כל הפרטים .אוכלוסיית תלמידי בית ספר – אוסף כל הפרטים הלומדים בבית ספר מסוים. מדגם -קבוצה קטנה של פרטים ,אובייקטים ,תצפיות ,העונים על קטגוריה מסוימת הלקוחה מתוך אוכלוסיה נתונה( .מדגם של 24איש מתוך אוכלוסיית המועסקים במדינה). מדוע נשתמש במדגם? לשימוש במדגם מספר יתרונות ביחס לעבודה מול אוכלוסייה: א. עלות – עבודה מול קבוצה קטנה יותר ,צמצום ניכר בעלויות. ב. נח לניהול וניתוח – פחות נתונים ,פחות פרטים. ג. חסכון בזמן. ד. מאפשר ניתוח גם במצבים שהאוכלוסייה אינה נגישה /זמינה או ידועה. ההסקה הסטטיסטית היא הסקה אינדוקטיבית – הסקה מהפרט אל הכלל – (ממדגם לאוכלוסיה). על מנת שהכללה – ההסקה ממדגם על התכונה הנבדקת באוכלוסיה תהיה מדויקת ככל הניתן ותשקף נכון יותר ,את האוכלוסייה הנבדקת ,במטרה שהמסקנות המתקבלות מתוך המדגם אכן ייצגו את האוכלוסייה יש לבחור מדגם מייצג. מדגם מייצג -מדגם המייצג את האוכלוסייה ממנה נדגם ,מהווה למעשה דגם מוקטן של האוכלוסייה על מרכיביה השונים והתפלגותם . טעויות דגימה א. טעויות אקראיות – – Random Errorsטעויות הנובעות מהעיסוק במדגם בהבדל מהעיסוק באוכלוסיה כולה ,טעויות הנובעות מהסיכוי האקראי לקבלת מדגם מסוים ,טעות מסוג זה ניתן להפחית ע"י הגדלת גודל המדגם ,הסיכוי לטעות זו ישאף לאפס ככל שגודל המדגם יגדל ויהיה אפס כאשר נעבוד עם אוכלוסייה. ב. טעויות שיטתיות – – Systematic Errorsטעויות הנובעות מתהליכי המדידה עצמם ,טעויות מדידה , טעיות בשיטה/טכניקת המדידה ,טעויות מחשב ,טעויות מסוג זה אינן בגדר טעויות דגימה -אינן מושפעות מגודל מדגם ואינן שייכות למדגמים בלבד – באותה מידה יכולים להתרחש בעבודה מול אוכלוסיה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 8 במטרה לדגום מדגם המייצג את האוכלוסייה ,יש לבחור מדגם : א .בגודל מתאים ב .בשיטות הסתברותיות המאפשרות לכל פרט באוכלוסייה להיות מיוצג במדגם את המדגם נדגום בשיטה מתאימה אשר תהפוך את המדגם למדגם מייצג ,משמע לא מספיק שאני דוגם אוכלוסייה לשיטת המדגם יש משמעות גדולה בהנחה שרוצים שהפרטים באוכלוסייה יהיו מיוצגים במדגם ,במילים אחרות השאיפה היא שהרכב קבוצת המדגם יהיה דומה ככל שניתן להרכב האוכלוסייה. גודל המדגם – לגודל המדגם תפקיד משמעותי והוא מהווה פקטור משמעותי ביכולתו של המדגם להיות מייצג. קיימות מספר שיטות דגימה החשובות שבהן : א .מדגם מקרי פשוט. ב .מדגם שכבות. ג .מדגם אשכולות. ד .מדגם שיטתי. מדגם מקרי פשוט הרציונאל בבניית מדגם מקרי פשוט -לכל פרט באוכלוסייה יש אותה הסתברות להיכלל במדגם ,לכל מדגם יש אותה הסתברות להיבחר וקיימת אי תלות בין תצפיות המדגם. הדימוי הקרוב ביותר לבחירת מדגם זה הוא הגרלה ,נניח שכל פרט באוכלוסייה היה מקבל פתק עם מספר – ההסתברות לבחור כל nפרטים שווה .ההסתברות לכל פתק -כל פרט להיבחר שווה. חסרונות -השיטה מחייבת מסגרת מוגדרת וממוספרת של כל האוכלוסייה ,החוקר חייב שתהיה בידו את רשימת כל אוכלוסיית המחקר ממנה הוא דוגם ,אחרת אנו סותרים את התנאי הבסיסי של השיטה – לכל פרט הסתברות שווה להיבחר .נבהיר שוב נקודה זו ,אם חוקר מעוניין לבדוק את לחץ הדם אצל אנשים שמשקלם מעל 100ק"ג והוא מעוניין במדגם של 40איש מאוכלוסייה זו ,עליו לדעת מיהי אוכלוסיית האנשים שמשקלם מעל 100ק"ג – רשימה שמית ממנה הוא ידגום (בהנחת דגימה של מדגם מקרי פשוט) ,והיה ורשימת כזו לא נמצאת כלומר אין לנו פירוט של האוכלוסייה הנדגמת ,עלינו להתאים שיטת דגימה אחרת. בדגימה מקרית נקבל בד"כ פיזור גיאוגרפי רחב של המדגם וזו יכולה להיות בעיה טכנית , לוגיסטית ותקציבית .כאשר דוגמים מכלל האוכלוסייה (נניח מכלל האנשים שמשקלם מעל 100ק"ג) האוכלוסייה מפוזרת גיאוגרפית ולכן יכול להיווצר מצב של פיזור רחב אשר יקשה בביצוע המחקר. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 9 מדגם שכבות כאשר ידועה החלוקה באוכלוסייה לשכבות/קבוצות הקשורות עם התכונה הנבדקת ,ניתן לשפר את הדגימה המקרית ע"י דגימה בשכבות. הרעיון הוא חלוקת האוכלוסייה לשכבות ומכל שכבה לדגום מדגם מקרי פשוט ,בגודל הפרופורציוני לגודל השכבה. שכבות – קיבוץ ,כפר ,עיר ,דתיים ,חילוניים וכו' .נחלק את האוכלוסייה לשכבות כנ"ל ,אם נמצא כי בני הקיבוצים מהווים 5%מהאוכלוסייה ,המשמעות היא שבני הקיבוצים יהוו 5%מהמדגם. יתרונות – למדגם שכבות יש יתרון כאשר קיימת הומוגניות בתוך השכבה והטרוגניות בין השכבות. אם נרצה לבנות מדגם לצורך חיזוי תוצאות בחירות ,ניקח לדוגמא שתי שכבות – מתנחלים ובני קיבוצים ,מצב ברור הוא כי כל שכבה היא הומוגנית ובין השכבות יש הטרוגניות זהו מצב בו יש יתרון לחלוקה לשכבות. מאחר והדגימה בפועל היא דגימה מקרית פשוטה אזי מגבלות שיטת המדגם המקרי הפשוט חלות גם בחלוקה לשכבות. מדגם אשכולות במדגם אשכולות ,יחידת הדגימה היא אשכול של פרטים ולא פרט בודד – כיתה ,מחלקה בגדוד ,רחוב ,שכונה וכו'. רוצים לדגום 100חיילים ואין רשימה מוגדרת של החיילים (העונים על הפרמטר הנבדק) ניתן לדגום מדגם מקרי פשוט של גדודים ומתוך כל גדוד לדגום מחלקה ,המחלקה תהווה אשכול ,בשיטה זו מקבל החוקר/המראיין רשימה של מחלקות לחקור – בתוך כל מחלקה הוא מראיין פרטים. יתרונות- טכני – ריכוז גיאוגרפי נח. אין צורך ברשימה מוגדרת של אוכלוסיית המחקר. חסרונות- מדגם גדול ביחס לדגימה מקרית פשוטה – במטרה להגיע לאותן תוצאות. בד"כ יש הומוגניות בין הפרטים באשכול כך שלמעשה חוקרים פרטים דומים ובכך פוגעים בנושא החשוב של שונות בין הפרטים. מדגם שיטתי במדגם שיטתי דוגמים באופן שיטתי (צעד קבוע) מתוך רשימה של אוכלוסייה – לדוגמא ספר טלפונים. נדגום מתוך ספר הטלפונים כל שם עשירי ,כל בית חמישי ברחוב וכו'. בצורה זו דוגמים אחוז ידוע מהאוכלוסייה שהוא גודל המדגם. בדגימה מסוג זה יש לבדוק כי אין חוקיות נסתרת ברשימה ממנה דוגמים ,חוקיות העלולה לעוות את הדגימה וכמובן את תוצאות המחקר. ניתן לערוך שילוב של מספר שיטות דגימה ,בשטח (במציאות) בנית מדגם בד"כ משלבת יותר משיטה אחת. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 10 הסקה סטטיסטית Statistical Inference נכיר מספר משתנים פרמטר – ערך המשתנה הנחקר המתאר את כל האוכלוסייה (ממוצע האוכלוסייה -תוחלת המשתנה הנחקר). - תוחלת האוכלוסייה (הפרמטר) - ,סטית התקן באוכלוסייה 2 , -שונות האוכלוסייה סטטיסטי – ערך המשתנה הנחקר המתאר את המדגם (ממוצע המדגם של המשתנה הנחקר). - Xממוצע המדגם (הסטטיסטי) – S ,סטית התקן במדגם – S2 ,שונות המדגם. הסקה סטטיסטית -הסקה מסטטיסטי לפרמטר מ X -נסיק לגבי . מנתוני המדגם אנו מעוניינים להסיק על האוכלוסייה כולה ,לכן ככל שהמדגם יהיה מדגם מייצג יותר – ישקף וייצג נכון יותר את האוכלוסייה ההכללה תהיה מדויקת יותר. הסקה ממדגם מייצג לאוכלוסייה איננה וודאית או מוחלטת אלא הסקה הסתברותית ,ניתן להסיק ממדגם בהסתברות גבוהה לגבי האוכלוסייה אך תמיד קיים סיכוי לטעות ,לכן תמיד נציין בנוסף למסקנה המחקרית את ההסתברות לטעות אפשרית במסקנה. תהליך ההסקה הסטטיסטית מטרתו -הסקה על ממוצע האוכלוסייה ע"פ תוצאות מדגם מקרי בגודל . n הסקה סטטיסטית – הסקה מסטטיסטי לפרמטר מתמקדת בשני תחומים עיקריים: א. אמידה – אמידת פרמטר לא ידוע ,ביצוע הערכה/אומדן של פרמטר באוכלוסייה מתוך נתוני המדגם. בנינו מדגם ,ערכנו מחקר וקיבלנו נתונים ,נשאלת השאלה איך מתוך ממוצע המדגם ניתן לאמוד את ממוצע האוכלוסייה ,מאחר ומדובר באומדן /הערכה ,הרי שממוצע האוכלוסייה – הפרמטר יוערך בטווח מסוים ולא יהיה מספר מדויק. ב. בדיקת השערות – בדיקת השערות סטטיסטיות על פרמטר לא ידוע. כיצד על סמך תוצאות מדגם נוכל לאשש או להפריך השערות שיש לנו לגבי האוכלוסייה. כיצד נוכל להעריך פרופורציה של תכונה מסוימת באוכלוסייה מתוך הפרופורציה של אותה תכונה במדגם. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 11 התפלגות הדגימה של הממוצע Sampling distribution of the sample mean התפלגות הדגימה של הממוצע היא התפלגות ממוצעי כל המדגמים האפשריים בגודל nמסוים מתוך האוכלוסייה. דוגמא :נתונה אוכלוסיית מחקר בת , n=5להלן משקלי האוכלוסייה. משקל 73 75 78 83 86 מס' נחקר 1 2 3 4 5 נחשב את המשקל הממוצע באוכלוסיה זו (עיין בנספח – שימוש במחשבון לחישובים סטטיסטיים). ממוצע המשקל באוכלוסייה -תוחלת האוכלוסייה 79וסטית התקן 4.86 (שימו לב כי מדובר באוכלוסייה כולה המונה 5אנשים ולא במדגם). שאלה :כמה מדגמים שונים בגודל n=3ניתן להוציא מאוכלוסייה זו ? כדי לחשב את מספר המדגמים יש להשתמש בחישוב הבא : - Nגודל האוכלוסייה ממנה בוחרים מדגם – nגודל המדגם המבוקש !N N !) n n! ( N n !5 !5 5 10 ! 3 3!(5 3)! 2!3 ניתן להוציא מאוכלוסייה זו 10מדגמים שונים בני 3אנשים כל אחד. נבנה את כל 10המדגמים הנ"ל: ממוצע המדגם משקלי כל פרט במדגם מדגמים (ע"פ מספר הנחקר) מס' 75.33 77 78 78 79 80.66 78.66 79.66 81.33 82.33 73,75,78 73,75,83 73,75,86 73,78,83 73,78,86 73,83,86 75,78,83 75,78,86 75,83,86 78,83,86 1, 2 ,3 1, 2 ,4 1, 2 ,5 1, 3 ,4 1, 3 ,5 1, 4 ,5 2, 3 ,4 2, 3 ,5 2, 4 ,5 3, 4 ,5 1 2 3 4 5 6 7 8 9 10 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 12 מתוך טבלת עשרת המדגמים האפשריים בגודל n=3ניתן לראות כי ההסתברות לבחירת מדגם מסוים היא , 1/ 10 לכל מדגם הסתברות שווה להיבחר ,אולם רק למדגם אחד (מס ) 5יש ממוצע השווה לממוצע האוכלוסייה. ניתן לראות כי קיימת תמונה ברורה של פיזור ממוצעי המדגמים סביב 79 כמו כן ניתן לראות כי התפלגות ממוצעי המדגמים היא התפלגות נורמאלית. אם נחשב את ממוצע ממוצעי המדגמים נקבל - 79ממוצע ממוצעי המדגמים שווה לממוצע האוכלוסייה. לעומת זאת סטית התקן של ממוצעי המדגמים קטנה מסטיית התקן באוכלוסייה -פיזור ממוצעי המדגמים קטן יותר מפיזור הפרטים באוכלוסייה ,ניתן לומר כי הממוצע משקף נכון יותר את ממוצע המדגמים מאשר את הפרטים הבודדים באוכלוסייה .התופעה שאנחנו רואים משקפת חוקיות כללית תיאורטית הטוענת כי – התפלגות ממוצעי כל המדגמים האפשריים בגודל nשואפת להתפלגות נורמאלית סביב הפרמטר . חוקיות זו נקראת משפט הגבול המרכזי The Central Limit Theorem משפט הגבול המרכזי -אם מתוך אוכלוסייה בעלת ממוצע וסטית תקן , נוציא את כל המדגמים האפשריים בגודל , nסדרת ממוצעי כל המדגמים תתפלג נורמאלית , עם ממוצע וסטית תקן הנקראת טעות התקן Standard Errorושווה ל- . SE n בניסוח סטטיסטי 2 x~N , n נורמלית שונות התקן השווה לריבוע טעות התקן ממוצע ממוצעי המדגמים מתפלג ממוצע השווה לממוצע האוכלוסייה טעות התקן –Standard Error -סטית התקן של ממוצע ממוצעי המדגמים נקראת טעות התקן במטרה לציין את הטעות האפשרית באמידת ע"פ . X טעות התקן מתקבלת כאשר מחלקים את סטית התקן באוכלוסייה בn - ( - nגודל המדגם) ,ניתן לראות ולהבין ברמה המתמטית את המובן ברמה הלוגית -ככל שהמדגם גדול יותר כך טעות התקן קטנה יותר ,הטעות האפשרית באמידת © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע קטנה. 13 שאלה: ע"פ נתוני הלשכה המרכזית לסטטיסטיקה השכר הממוצע במדינת ישראל עומד על 5250 עם סטית תקן 600 ,אם נוציא את כל המדגמים האפשריים בגודל , n=400התפלגות הממוצעים תשאף 600 להתפלגות נורמאלית 30 . 400 n = טעות התקן ברישום סטטיסטי: x ~ N 5250 , 900 מהו התחום הסימטרי בו מרוכזים 95%ממוצעי כל המדגמים בגודל ? n=400 מאחר וממוצעי כל המדגמים מתפלגים נורמאלית ,נעזר בטבלת ההתפלגות הנורמאלית. 2.5% הסתברות של 0.025 2.5% הסתברות של 0.025 התחום בו מרוכזים 95% ממוצעי המדגמים של 0.95 כלומר הסתברות 0.975 הגבול העליון -הערך אשר ההסתברות לקבל ערך נמוך ממנו היא , 0.975הגבול אשר עד אליו מרוכזים 97.5% ממוצעי כל המדגמים. כאשר השטח נתון ומחפשים את ( Zציון התקן) ,מחפשים את הערך בתוך הטבלה כלומר את 0.975בתוך הטבלה ומוצאים את ה Z-המתאים. Ф(1.96)=0.975 -- Z ( 0.975) 1.96 n Z הגבול העליון n 600 5308.8 400 5250 1.96 גבול עליון 600 5191.2 400 5250 1.96 גבול תחתון Z הגבול התחתון התחום הסימטרי בו מרוכזים 95%ממוצעי כל המדגמים הוא בין ₪ 5191.2לבין .₪ 5308.8 התחום בו מרוכזים 95% ממוצעי כל המדגמים בגודל n=400 5308.8 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 5250 5191.2 14 שאלה: מהו אחוז המדגמים בהם ממוצע המדגם גדול מ?5320 - נעזר בתכונה של ממוצעי כל המדגמים – מתפלגים נורמאלית ,ובטבלת ההתפלגות הנורמאלית. נמצא את ציון התקן – Zעבור . ₪ 5320 התחום המבוקש 5320 5250 Xi X X i S n Z X מאחר וממוצע ממוצעי המדגמים שווה לממוצע האוכלוסייה. X iערך נבדק = S ,סטית התקן של ממוצע ממוצעי המדגמים שהיא למעשה טעות התקן ולכן n S על פי נתוני השאלה: 600 30 400 n 5250 X i 5320 5320 5250 2.33 30 Z 2.33 0.9901 Z 1 0.9901 0.0099 0.99% מצאנו כי ערכו של Zהוא , 2.33בדיקה בטבלה הראתה כי השטח הנמצא משמאל לערך זה הוא 0.9901 (כל השטח מתחת לעקומת ההתפלגות הנורמאלית שווה ל , )1-ערך זה הוא ההסתברות לקבל ערך נמוך מ.₪ 5320- מאחר והשאלה הנשאלת היא איזה אחוז מהמדגמים נמצא מעל , ₪ 5320מעוניינים בשטח מימין לערך זה ולכן נחסיר מ.1- © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 15 שאלה: מהו אחוז המדגמים בהם הממוצע נמוך מ? ₪ 5200 - התחום המבוקש 5250 600 30 400 n 5250 5200 X i 5200 5200 5250 1.66 30 Z 1.67 0.9525 Z 1 0.9525 0.0475 4.75% בעבודה עם טבלה הכוללת ערכי Zשליליים (טבלה ע"מ , )262מקבלים ישירות את הערך . 0.0475 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 16 תרגילים .1 הציון הממוצע בבחינה פסיכומטרית הוא 580עם סטית תקן .86 א. אם נוציא את כל המדגמים האפשריים בגודל , n=20מהו התחום הסימטרי בו ירוכזו 95%ממוצעי המדגמים. ב. מהי ההסתברות שציונם הכולל של 53נבחנים שנבחרו באקראי יהיה מעל . 32520 2. הציון הממוצע בבחינת בגרות במתמטיקה הוא 81עם סטית תקן , 7דוגמים 7בתי ספר . א. מהו אחוז בתי הספר בהם הציון הממוצע גבוה מ. 87 - ב. מהו התחום הסימטרי בו מרוכזים 98%ממוצעי המדגמים. .3 באוכלוסיה המונה 6נשים נמדדה מנת המשכל ,להלן הממצאים: .125 , 117 , 122 , 112 , 115 , 120 א. חשבו את מנת המשכל הממוצעת באוכלוסיה זו ואת סטית התקן. ב. בנו טבלה המכילה את כל המדגמים האפשריים של 4נשים. ג. חשבו את הממוצע לכל מדגם ואת ממוצע ממוצעי המדגמים והשוו את הממצאים לנתוני האוכלוסייה. ד. בוחרים מדגם של 3נשים מה ההסתברות שממוצע המדגם יהיה גבוה מ. 116 - .4 נבחני נהיגה עוברים בממוצע בטסט שלישי עם סטית תקן . 0.8 מהו התחום הסימטרי בו אינם נמצאים 4%מהנבחנים מתוך מדגם של 16נבחנים. .5 ילד מחייג במהלך יום ל 8-חברים בממוצע בעוד שסטיית התקן של מספר החיוגים היומי היא .2 מה הסיכוי שב 60-יום שנבחרו באקראי יחייג הילד בסה"כ לפחות 512פעם לחבריו? ב. 0.0032 ג. 0.0394 ד. 0.451 א. 0.0197 .6 ע"פ נתוני המועצה להשכלה גבוהה הציון הממוצע בקורס מבוא לכלכלה הוא 74 עם סטית תקן , 16 א. מהו התחום הסימטרי בו מרוכזים 95%ממוצעי כל המדגמים בגודל ?n=250 ב. מהו אחוז המדגמים בהם הממוצע גבוה מ? 76- .7 ידוע כי מניה מסוימת עולה בממוצע ב ₪ 2-ליום עם סטיית תקן של . ₪ 0.8מה ההסתברות שבמשך 40 יום תהיה תשואת המניה בין ₪ 1.8ל ₪ 2.4 -ליום בממוצע? © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 17 פתרונות .1 n Z הגבול העליון Z 0.975 1.96 0.05 2 1 n 0.05 Z 86 580 1.96 גבול עליון 86 542.3 20 580 1.96 גבול תחתון 617.69 20 n 20 Z הגבול התחתון 86 580 התחום בו מרוכזים 95%ממוצעי כל המדגמים הוא בין 542.3לבין . 617.69 התחום בו מרוכזים 95% כל המדגמים ממוצעי בגודל n=20 617.69 ב. 542.3 580 32520 נחשב את הציון הממוצע של 53הנבחנים 613.58 : 53 X נחשב את ההסתברות באמצעות טבלת ההתפלגות הנורמאלית. 613.58 580 2.84 86 53 1 0.9977 Z1 0.0023 Z 2.84 .2 613.58 1 580 א. 87 81 2.27 7 ) ( 7 1 0.9884 0.0116 Z1 1.16%מבתי הספר הציון הממוצע בהם גבוה מ.87- © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 18 ב. Z הגבול העליון n Z 0.99 2.33 87.16 74.83 .3 0.02 2 1 0.02 Z 7 81 2.33 גבול עליון 7 81 2.33 גבול תחתון 7 7 א. 7 n7 81 לחישובים באמצעות מחשבון עיינו בנספח שימוש במחשבון לחישובים סטטיסטיים. 4.34 ב. n Z הגבול התחתון X 118.5 !N N !) n n!( N n !6 נחשב את מספר המדגמים האפשריים בגודל 15 . n=4 !4!2 ניתן להוציא מאוכלוסייה זו 15מדגמים שונים בני 4נשים כל אחד. נמספר כל נבדק ,ונבנה את כל 15המדגמים הנ"ל: מס' נבדק 1 2 3 4 5 6 מנת משכל 120 115 112 122 117 125 ממוצע המדגם מנת משכל כל פרט במדגם מדגמים (ע"פ מספר הנחקר) מס' מדגם 117.25 120,115,112,122 ,1,2,3,4 1 116 120,115,112,117 ,1,2,3,5 2 118 120,115,112,125 ,1,2,3,6 3 118.5 120,115,122,117 ,1,2,4,5 4 120.5 120,115,122,125 ,1,2,4,6 5 119.5 120,115,117,125 ,1,2,5,6 6 117.75 120,112,122,117 ,1,3,4,5 7 119.75 120,112,122,125 ,1,3,4,6 8 118.5 120,112,117,125 ,1,3,5,6 9 121 120,122,117,125 ,1,4,5,6 10 116.5 115,112,122,117 ,2,3,4,5 11 118.5 115,112,122,125 ,2,3,4,6 12 117.5 115,112,117,125 ,2,3,5,6 13 119.75 115,122,117,125 ,2,4,5,6 14 119 112,122,117,125 ,3,4,5,6 15 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 19 X 118.5ממוצע ממוצעי המדגמים. 0.8413 ד. 1 0.1587 116 118.5 0.997 ~ 1 4.34 ( ) 3 Z1 החישוב נעשה באמצעות טבלה בעלת ערכים שליליים ,בטבלה רגילה יש לבדוק את ההסתברות המתאימה ל- Z=1ולא להחסיר מ.1- ההסתברות שממוצע המדגם יהיה גבוה מ 116-היא .0.8413 .4 n נחשב את התחום בו אינם נמצאים 4%הוא התחום בו נמצאים 96%נחשב תחום זה: Z הגבול העליון Z 0.98 2.06 0.04 2 1 n Z 0.04 0.8 3.41 16 3 2.06 גבול עליון 0.8 2.58 16 3 2.06 גבול תחתון Z הגבול התחתון n 16 0.8 3 התחום הסימטרי בו אינם מרוכזים 4%ממוצעי המדגמים בגדול 16הוא בין 2.58לבין . 3.41 .5 תשובה א' נכונה .6 512 8.53 n 60 2 8 60 8.53 8 Z1 2.065 1 0.9803 0.0197 2 ( ) 60 X התחום בו מרוכזים 95%ממוצעי כל המדגמים 2.5% הסתברות של 0.025 התחום בו מרוכזים 95% ממוצעי המדגמים של 0.95 כלומר הסתברות 2.5% הסתברות של 0.025 0.975 n Z הגבול העליון © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע n Z הגבול התחתון 20 Z0.975 1.96 0.05 2 0.05 Z 1 16 75.98 250 74 1.96 גבול עליון 16 72.01 250 74 1.96 גבול תחתון n 250 16 התחום בו מרוכזים 95% ממוצעי המדגמים של 0.95 כלומר הסתברות 75.98 .7 74 72.01 מעוניינים לחשב את ההסתברות שתשואת המניה תהיה בין ₪ 1.8ל ₪ 2.5-בממוצע ליום. הדרך לחישוב היא חישוב ההסתברות שהתשואה תהיה נמוכה מ ₪ 1.8-ליום ,חישוב ההסתברות שהתשואה תהיה נמוכה מ ₪ 2.5-ליום ,חיסור ההסתברויות ישאיר לנו את ההסתברות בין שני הערכים: ההסתברות בין ₪ 1.8ל₪ 2.4 - ₪ 2.4 Xi ) n Z ₪ 1.8 n 40 0.8 2 ( 1.8 2 1.58 0.8 ( ) 40 Z 1.58 0.0571 Z 2.4 2 3.16 0.8 ( ) 40 Z 3.16 0.9992 Z 0.9992 0.0571 0.9421 ההסתברות שהתשואה הממוצעת במשך 40יום תהיה בין ₪ 1.8ל ₪ 2.4 -ליום היא . 0.9421 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 21 אמידה Estimation מחקרים מבוססים בד"כ על מדגמים מתוך האוכלוסייה ,נשאלת השאלה כיצד ניתן לאמוד את הפרמטרים המתאימים באוכלוסייה? שתי שיטות אמידה .1 אומד/אומדן נקודתי - Point Estimate - אמידת הפרמטר – ממוצע האוכלוסייה ע"י ערך נקודתי יחיד. אומדים את הפרמטר (תוחלת האוכלוסייה) ע"י הסטטיסטי X - . אומד נקודתי בד"כ נוח לחישוב ופירוש והוא בד"כ התוצאה המוצגת במחקרים המופנים לקהל הרחב. ניתן למצוא ע"י קריטריונים מסוימים את האומד הנקודתי הטוב ביותר לאמידת הפרמטר ,אך לא ניתן להעריך את ההסתברות לטעות. מהו האומד הנקודתי הטוב ביותר עבור ? עקרונית ניתן להתאים לכל פרמטר את הסטטיסטי המקביל לו במדגם : ממוצע האוכלוסייה = ממוצע המדגם החציון באוכלוסייה = חציון המדגם סטית התקן באוכלוסייה = סטית התקן במדגם ישנם מקרים בהם האומד הנקודתי הטוב ביותר אינו בהכרח הסטטיסטי המקביל לו במדגם. קיימים מספר קריטריונים לבחירת האומד הנקודתי הטוב ביותר: א. אומד חוסר הטיה , X -Unbiasednessמתוך נקודת המוצא כי ממוצע כל המדגמים האפשריים בגודל nשווה לממוצע האוכלוסייה ,נכון הוא כי ממוצע של מדגם אחד אינו בהכרח שווה לממוצע האוכלוסייה , אולם מאחר וממוצע ממוצעי המדגמים שווה לממוצע האוכלוסייה נוכל לטעון כי Xהוא אומד חסר הטיה ל .- המושג חוסר הטיה משמעותו היא שאין הטיה שיטתית בין תוצאות המדגם לאוכלוסייה ,ההסתברות שממוצע המדגם יהיה גבוה מממוצע האוכלוסייה שווה להסתברות שהוא יהיה נמוך ממנו . ב. יעילות – Efficiencyקריטריון נוסף הוא מידת היעילות באמידה, יעילות האמידה נמדדת ע"י שונות התקן ,שונות התקן = ריבוע טעות התקן. ככל ששונות התקן קטנה יותר המשמעות היא שהפיזור סביב ממוצע המדגם קטן יותר – נתוני המדגם הומוגניים יותר ולכן האמידה יעילה יותר. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 22 בהשוואה בין שני אומדים חסרי הטיה נעדיף את האומד ששונות התקן שלו קטנה יותר. 2T1 את היעילות היחסית בין שני אומדים נקודתיים ( )T1 ,T2חסרי הטיה ניתן לחשב ע"י 2T2 דוגמא :נניח ששני חוקרים מבקשים לאמוד את 1 5 2 200 2 40 T2 2 ,חוקר א' דגם 40איש וחוקר ב' . 200 2 200 T1 2 2 40 מידת היעילות של ב' גדולה פי 5מידת היעילות של א' ,כלומר מידת הסבירות להתאמה בין ממוצע המדגם לממוצע האוכלוסייה גדולה פי 5אצל חוקר ב'. ג. עקביות – Consistencyהסטטיסטי יחשב כאומד עקבי /קונסיסטנטי לפרמטר באוכלוסיה אם ככל שגודל המדגם יגדל ,ערך הסטטיסטי ישאף לערך הפרמטר -ממוצע המדגם ישאף לממוצע האוכלוסייה. ד. אמינות /אומד מספק - Sufficiencyהסטטיסטי Xיחשב כאומד אמין /מספק אם הוא נותן את האינפורמציה הטובה ביותר לגבי הפרמטר ואף אומד אחר (חציון ,שכיח ) לא יוכל להוסיף על האומדן המתקבל על הפרמטר מתוך ממוצע המדגם . X .2 אומד ע"י תחום – Interval Estimationאמידת ע"י תחום ערכים כלומר . נבנה תחום עבור הפרמטר בהסתברות גבוהה כרצוננו – ההסתברות משמעותה שהתחום אכן מכיל את הפרמטר , וכמובן שמהסתברות זו נגזרת ההסתברות לשגיאה – ההסתברות להימצא מחוץ לתחום זה. לתחום קוראים רווח בר סמך Confidence Interval -ולהסתברות המתאימה לתחום – רמת הסמך. נסמן את ההסתברות לטעות באמידה באות ולכן רמת הסמך – ההסתברות המתאימה לתחום או במילים אחרות ההסתברות שהפרמטר אכן בתחום תסומן .1 L1 L2 = L L2 L1אורך רווח הסמך (ההפרש בין הגבול העליון לגבול התחתון). © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 23 רווח בר סמך לממוצע האוכלוסייה Confidence Interval for the population mean טרם בניית התחום יש לקבוע את ההסתברות לשגיאה ההסתברות שהתחום אכן יכלול את . ממנה נגזרת ההסתברות לנכונות ,1 כלומר - 1 נקראת גם רמת הביטחון ,הביטחון שהתחום אכן יכלול את . אם נקבע כי 5%המשמעות היא כי ישנו סיכוי של 5%לשגיאה ,ההסתברות לטעות היא . 0.05 רמת הביטחון היא 95%כלומר ההסתברות ש -בתחום היא – 0.95ביטחון של 95%ש - n 2 X Z 1 n 2 נמצא בתחום. X Z 1 חישוב רווח הסמך כנ"ל הוא חישוב כאשר סטית התקן באוכלוסייה ידועה. ניתן לראות מדרך החישוב כי אורך רווח הסמך תלוי בגודל המדגם ,כלומר ככל שהמדגם גדל טעות התקן קטנה ולכן הסטייה מהממוצע לכל צד תקטן כלומר רווח הסמך יקטן. הגדלת המדגם פי Kתקטין את אורך רווח הסמך פי K הגדלת רמת הביטחון ) - , (1 הקטנת , תגדיל את התחום - ,בטחון גדול יותר משמעותו הקטנת ההסתברות לשגיאה – רווח סמך גדול יותר. שאלה: במדגם של 16עורכי דין נמצא כי השכר הממוצע הוא ₪ 12500לחודש ,ידוע כי סטית התקן לשכר עו"ד באוכלוסיה היא . ₪ 3800 בנו רווח בר סמך לשכר הממוצע של עו"ד באוכלוסייה ,ברמת סמך (רמת ביטחון) של -95%סיכוי שגיאה . 5% n Z 0.975 1.96 0.05 2 Z 1 ) (1 2 X Z 0.05 n n 16 3800 3800 12500 1.96 16 16 10638 14362 ) (1 2 X Z 3800 X 12500 12500 1.96 משמעות – 95%ממוצעי כל המדגמים בגודל n=16נמצאים בתחום הנ"ל ,על סמך משפט הגבול המרכזי : אנו מסיקים על סמך מדגם של 16עו"ד ברמת בטחון של 95%כי שכרם הממוצע של עו"ד הינו בין ₪ 10638לבין .₪ 14362 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 24 חישוב גודל המדגם ניתן לחשב את גודל המדגם הדרוש לבניית רווח סמך מסוים תחילה יש להגדיר את רמת המובהקות ואת מחצית אורך רווח הסמך -הסטייה הדרושה בין L Z 1 2 n 2 X n L X 2 2 גודל המדגם L X 2 1 2 Z Z ) (1 2 n L 2 שאלה: חוקר רוצה למדוד את לחץ הדם הממוצע אצל רצי מרתון. מהו גודל המדגם שעליו לבחור כדי לקבל רמת סמך של 0.95וסטייה מרבית של , 3אם ידוע כי סטית התקן של האוכלוסייה הנחקרת היא ? 7 2 1 . 96 7 20.91 6 2 על החוקר לבחור מדגם של 21איש. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 25 תרגילים .1 לבדיקת התשואות השנתיות של מנהלי תיקים בחברה מסוימת ,נבחרה קבוצה של שישה יועצי השקעות , נבדקה תשואת תיקי ההשקעות שלהם במשך שנה .ידוע כי סטית התקן לתשואות בחברה היא .2.36%התוצאות: ד היועץ ו ה ג ב א 11 7 4 4 14 16 תשואה שנתית % בנו רווח בר סמך לאחוז התשואה השנתית הממוצעת אצל היועצים בחברה ברמת סמך של .98% .2 סטטיסטיקאי חישב רווח בר סמך לתוחלת זמן השירות של עובדי שירות לקוחות 5.72 8.28 גודל המדגם 65 -עובדים ונמצא כי X 7וסטית התקן של כלל העובדים היא 3.4ד'. א. מהי רמת הביטחון (רמת הסמך) בה חושב הרווח ? ב. מהו גודל המדגם המינימאלי על מנת שאורך הרווח לא יעלה על 0.5דקה ברמת בטחון של ? 95% .3 בונים שני רווחי סמך לתוחלת של אוכלוסייה נורמאלית כאשר סטיית התקן ידועה .רמת הסמך של שני הרווחים זהה .הרווח הראשון נבנה על מדגם בגודל ,100הרווח השני נבנה על מדגם בגודל .500הרווח הראשון : א. ארוך פי 5מהרווח השני. ב. ארוך פי 25מהרווח השני. ג. ארוך פי 2.236מהרווח השני. ד. קצר פי 5מהרווח השני. .4 נבנה רווח סמך לתוחלת אוכלוסייה נורמאלית 100 200ברמת ביטחון של , 99%המשמעות היא: א הסיכוי שתוחלת האוכלוסייה שווה ל 150 -הוא .99% ב. בסיכוי של 99%נמצאת תוחלת האוכלוסייה בין 100ל .200 - ג. הסיכוי שתוחלת האוכלוסייה היא בין 100ל 200 -הוא .1% ד. הסיכוי שתוחלת האוכלוסייה לא נמצאת בתוך הרווח שבין 100ל 200 -הוא .1% .5 מנהל השיווק בחברה מסוימת רצה לבדוק את פעילות מחלקת הטלמרקטינג ,המנהל בדק 8עובדים ,ידוע כי סטית התקן למס' השיחות הממוצע בשעה היא , 1.92להלן היקף פעילותם: 8 7 6 5 4 3 2 1 מס' טלפן 4 5 8 4 3 7 4 מס' שיחות בשעה 6 חשבו רווח בר סמך למספר השיחות הממוצע שעורך טלפן בשעה ברמת בטחון של .95% א. ב. איזה אחוז מהטלפנים מבצעים יותר מ 6-שיחות בשעה. .6 בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת .לפניך 2טענות: א .ככל שהמדגם גדול יותר ,רווח הסמך ארוך יותר .ב .ככל שרמת הביטחון קטנה יותר ,הרווח ארוך יותר. א .שתי הטענות נכונות. ב .שתי הטענות לא נכונות. ג .רק הטענה הראשונה נכונה. ד .רק הטענה השנייה נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 26 פתרונות .1 עיינו בנספח לשימוש במחשבון לחישובים סטטיסטיים לצורך חישוב הממוצע: Z 0.99 2.33 2 n 2.36 6 1 2 2.36 Z 1 X Z 9.33 2.33 n 2.36 6 n6 2 1 X 9.33 X Z 9.33 2.33 7.088 11.57 התשואה השנתית הממוצעת היא בין 7.08%ל.11.57% - .2 L נחשב את מחצית הרווח 1.28 - 2 ,הרווח אינו תלוי בממוצע המדגם לכן : 4 1.28 65 ) 2.579 ) 2 2 (1 (1 Z Z 0.0049 ב. 2 2 S Z 1.28 ) (1 n 2 1.28 65 4 0.9951 ) 2 (1 2 Z 1 Z ) (1 2 n L 2 1.96 3.4 n 0.5 2 n 710.54 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 27 .3 ,לכן הגדלת המדגם פי ( 5מ 100-ל )500-תקצר את הגדל המדגם פי Kתקטין את אורך הרווח פי K הרווח פי , 2.236כלומר במדגם של 100הרווח ארוך פי .2.236 .4 רווח בר סמך לתוחלת ברמת ביטחון של , 99%ע"פ משפט הגבול המרכזי 99%ממוצעי כל המדגמים בגודל nנמצאים בתחום המתקבל –ו 1%-מחוץ לתחום . .5 א. תשובה ג' נכונה תשובה ד' נכונה . נחשב את מספר השיחות הממוצע בשעה X 5.125 Z 0.975 1.96 2 Z 1 0.05 1.92 n 2 n8 X Z 1 X 5.125 n 1.92 1.92 5.125 1.96 8 8 2 X Z 1 5.125 1.96 3.794 6.455 רווח הסמך למספר השיחות הממוצע ב. מעל 6שיחות 6שיחות 9.85% 1 0.9015 0.0985 5.125שיחות Z1.29 0.9015 6 5.125 1.288 1.92 ( ) 8 Z 9.85%מהטלפנים מבצעים יותר מ 6-שיחות בשעה. .6 טענה א' אינה נכונה – ככל שהמדגם גדול יותר ,אורך הרווח קצר יותר – ברמה תיאורטית ככל שהמדגם גדול יותר הדיוק טוב יותר ולכן אורך הרווח מתקצר .ברמה מתמטית ככל ש n-גדל ,בנוסחה מחלקים במכנה גדול יותר ולכן התוצאה קטנה יותר – רווח קטן יותר טענה ב' אינה נכונה – ככל שרמת הביטחון גדלה הרווח גדל – שיפור הביטחון משמעותו רווח גדול יותר , מתמטית ככל קטנה ,ערך ה Z -גדל ולכן הרווח גדול יותר © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 28 בדיקת השערות Hypothesis Testing כאשר עורכים מחקר ,מגדירים תחילה את השערות המחקר ,כלומר מהי המטרה ,מה רוצים לחקור /להוכיח במחקר ,בסיום המחקר ,עם קבלת התוצאות על החוקר להחליט אם לאשש או להפריך את השערתו. השערות סטטיסטיות באות תמיד בזוגות – השערת האפס אותה בודקים וההשערה האלטרנטיבית. מאחר והמחקר נערך על מדגם מתוך האוכלוסייה יש להחליט האם הפער בין ממוצע התכונה הנבדקת במדגם לבין ממוצע אותה תכונה באוכלוסייה חריג מספיק – מובהק ,בכדי להחליט כי מקבלים את השערת המחקר או שלמרות שקיים פער הוא אינו מובהק ברמה כזו שנוכל לקבל את השערת המחקר. דוגמא: ידוע כי בשיטת הלימוד הקיימת במתמטיקה ממוצע ציוני הבגרות הוא 76עם סטית תקן .12 פותחה שיטת לימוד חדשה אשר מטרתה לשפר את הישגי התלמידים בבגרות במתמטיקה. חוקר רוצה לבדוק אם אכן שיטת הלימוד החדשה גורמת לשיפור ממוצע הבגרות . החוקר דגם 64תלמידים אשר למדו ע"פ שיטת הלימוד החדשה ,ממוצע ציוני הבגרות של קבוצה זו היה . 79.3 נשאלת השאלה האם לאור התוצאה שהתקבלה המראה כי ממוצע הבגרות של קבוצת המדגם גבוה ב 3.3-נק' מממוצע הבגרות באוכלוסייה ,נוכל לקבוע כי שיטת הלימוד החדשה אכן משפרת את ההישגים ולאור תוצאה זו לשנות את שיטת הלימוד במתמטיקה בכל בתי הספר בארץ. אילו היינו מנסים את שיטת הלימוד החדשה על כל אוכלוסיית התלמידים ואלו היו התוצאות ,היינו יכולים לקבל את השערת המחקר ולומר כי התוצאות מעידות על שיפור בהישגים ,אולם השיטה נבדקה על מדגם של 64איש לכן יש צורך בתהליך בו נבחן את התוצאות טרם אנו מסיקים מסקנות – בחינה אשר בסופה נקבל החלטה האם יש כאן פער חריג מספיק או במונחים סטטיסטים פער מובהק )significant( -כך שנוכל לקבל את השערת המחקר ולהסיק כי השיטה החדשה אכן משפרת את ההישגים או שפער זה הוא בגבול הסטייה האפשרית סביב הממוצע. אנחנו יודעים כי אם ניקח את כל המדגמים בני 64איש מאוכלוסייה זו ונבדוק עליהם את השיטה החדשה נקבל תוצאות שונות בכל מדגם ונקבל התפלגות נורמאלית של תוצאות המדגמים ,אם הממוצע סביבו התפלגו מדגמים אלו הוא ממוצע האוכלוסייה – כי אז אין השפעה לשיטה החדשה. אם הממוצע סביבו התפלגו ממוצעי המדגמים הנ"ל גבוה ממוצע האוכלוסייה כיום ,במצב כזה אם הפער מובהק , יש משמעות לשיטה החדשה. כדי לחדד את הנקודה: אם היינו לוקחים מדגם אקראי מייצג בגודל n=64מאוכלוסיית הניגשים לבגרות במתמטיקה אשר למדו בשיטה הרגילה היינו יכולים לקבל ממוצע הגבוה (או נמוך) מממוצע האוכלוסייה (משפט הגבול המרכזי) , לכן השאלה אותה יש לבחון היא משמעותו של הפער בין ממוצע המדגם לממוצע האוכלוסייה. בסיס הרעיון של בחינת התוצאה הוא קביעת גבולות "סבירים" ביניהם יכול להימצא ממוצע האוכלוסייה ,אם ממוצע המדגם יהיה מחוץ לגבול "סביר" זה נוכל לקבל את השערת המחקר ולומר כי קיים הבדל משמעותי/מובהק. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 29 המבחן הסטטיסטי תהליך בדיקת ההשערות הוא מבחן סטטיסטי המחולק ל 5-שלבים: ניסוח השערת המחקר - א. השערת המחקר יכולה להיות השערה חד כיוונית -חד זנבית – ( One Tailed Hypothesisכלפי מעלה/מטה ) או השערה דו כיוונית – דו זנבית Two Tailed Hypothesis - השערה חד כיוונית משמעותה – בודקים שינוי מול המצב הקיים עם כוון ברור : השיטה החדשה משפרת את הישגי התלמידים – בודקים אם הממוצע החדש גבוה מהממוצע הקיים (השערה חד כיוונית כלפי מעלה). התרופה החדשה מורידה את לחץ הדם – בודקים האם לחץ הדם בעקבות התרופה נמוך מלחץ הדם הקיים (השערה חד כיוונית כלפי מטה). השערה דו כיוונית – בודקים האם קיים שינוי/הבדל – כיוון לא ברור התרופה החדשה משפיעה על המשקל – בודקים האם קיים הבדל במשקל בעקבות לקיחת התרופה הכוון (השערה דו כיוונית). בסטטיסטיקה השערות תמיד באות בזוגות – השערת האפס וההשערה האלטרנטיבית – השערת המחקר. החוקר מנסח שתי השערות ביחס ל( -הממוצע החדש שהתקבל X -השווה למעשה לממוצע המדגם) 0 ,הוא הממוצע הקיים היום באוכלוסייה – הממוצע בנקודת האפס : השערת האפס - H 0 - Null Hypothesis -השערת האפס מתייחסת למצב הקיים וטוענת כי אין כל שינוי בין המצב הקיים למצב הנבדק. 0 H0 : אם הממוצע החדש קטן או שווה לממוצע הקיים אזי התוצאות לא מובהקות . חשוב לציין כי לא מדובר בבחינה של הממוצע החדש מול 0 בערכו הידוע אלא מול ערך חדש המחושב באמצעות , 0הנקרא הגבול הקריטי .Critical Value – Cהגבול הקריטי תוחם את הגבולות סביב 0 אם הפער הוא בגדר חריגה סבירה כלומר נובע מההתפלגות הסבירה 0 ומאפשר לנו לקבוע סביב או פער מובהק. לכן הרישום הנכון יותר להשערת האפס אמור היה להיות : C H0 : בדוגמא שלנו - 76 H0 : שיטת הלימוד החדשה אינה משפרת את הישגי התלמידים בבגרות במתמטיקה © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 30 השערה אלטרנטיבית - H 1 - Alternative Hypothesis -השערת המחקר -הטענה אותה רוצים לבדוק/להוכיח במחקר – יש שינוי /הבדל בין במצב הקיים למצב הנבדק. 0 H1 : אם הממוצע החדש גבוה מהממוצע הקיים אזי התוצאות מובהקות. נבהיר שוב את הנקודה כי בפועל הבדיקה אינה מול 0 אלא מול גבול קריטי Cהמחושב באמצעות . 0לכן הרישום הנכון יותר להשערת האפס אמור היה להיות C H1 : בדוגמא שלנו 76 - H1 : שיטת הלימוד החדשה משפרת את הישגי התלמידים בבגרות במתמטיקה. המבחן הסטטיסטי בנוי על בדיקת השערת האפס --דחית השערת האפס היא הוכחת טענת החוקר דחית השערת האפס היא קבלת , H 1קבלת השערת המחקר. קבלת השערת האפס משמעותה שלילת השערת המחקר – אין הבדל בתוצאות ביחס למצב הקיים. ב. קביעת רמת המובהקות - - רמת המובהקות של המבחן ,החוקר קובע מראש את רמת המובהקות של המבחן הסטטיסטי רמת המובהקות היא ההסתברות לטעות בהחלטת החוקר ,מקובל כי 0.05 כלומר ההסתברות לטעות החלטת החוקר לא תעלה על - 0.05הסיכוי לטעות לא יעלה על .5% התחום של 1 הוא למעשה תחום קבלת , H 0כלומר אם 0.05 אזי 1 הוא התחום בו מרוכזים 95%ממוצעי כל המדגמים לכן תוצאה שתתקבל בתוך תחום זה היא בגדר הסטייה המקובלת סביב הממוצע. בדוגמא שלנו 0.05 0.05 1 1 0.95 הגבול הקריטי C Critical Value © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 31 ג. קביעת תחומי קבלה ודחייה Acceptance/Rejection regionלH 0 - חישוב הגבול הקריטי – Critical Value Cהערך המהווה גבול בין תחום קבלת H 0לתחום דחית . H 0 השערה חד כיוונית כלפי מעלה תחום דחית H 0 תחום קבלת H0 השערה דו כיוונית 0 C תחום דחית H 0 תחום דחית H 0 תחום קבלת H0 C2 0 C1 שלב זה נלמד בשלוש הדרכים הנפוצות .1 השיטה הקלאסית -חישוב הגבול הקריטי C- Critical Value השערת חד כיוונית - n C 0 Z 1 בהשערה חד כיוונית קיים רק גבול אחד עליון /תחתון ולכן משתמשים בZ 1 - הסימון מתייחס לשתי האפשרויות – חד כווני כלפי מעלה , +כלפי מטה . - השערה דו כיוונית - n C 0 Z 1 2 בהשערה דו כיוונית ישנם שני גבולות – עליון ותחתון -רמת המובהקות -הסיכוי לטעות מתחלק לשניים. בדוגמא שלנו – השערה חד כיוונית Z 1 Z 10.05 Z 0.95 1.65 C 76 1.65 1.5 78.475 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 1.5 n 12 64 n 79.3 0 76 C 0 Z1 32 תחומי קבלה /דחייה לH 0 - תחום דחית H 0 תחום קבלת H0 76 78.475 79.3 הערך הנבדק – ממוצע המדגם ,נמצא בתחום דחית השערת האפס ,נדחה את השערת האפס .2 שיטה ב' -השוואת הסתברויות – רמות מובהקות רמת המובהקות אשר נקבעה למחקר היא , 0.05המשמעות היא -הסיכוי שהגדרנו לשגיאה במחקר הוא , 5%אם על סמך הנתונים שקיבלנו הסיכוי לשגיאה יהיה קטן מ 5%-אזי נדחה את השערת האפס כלומר נקבל את השערת המחקר ואם הסיכוי לשגיאה על סמך הנתונים יהיה גדול מרמת המובהקות המוגדרת נקבל את השערת האפס. את ההסתברות ה"אמיתית" לשגיאה – על סמך הנתונים ניתן להגדיר כרמת המובהקות המינימאלית ,רמת המובהקות הקטנה ביותר בה נדחה את השערת האפס ,זוהי למעשה ההסתברות לקבל ערך נמוך מ - -הערך הנבדק - ,אם נחשב את הגבול הקריטי ע"י רמת מובהקות זו נקבל את , הערך הקיצוני ביותר בו יכול להימצא הגבול הקריטי. נסמן את רמת המובהקות המינימאלית כ. ' - תחום דחית H 0 תחום קבלת ' H0 0 C 0 Z1 ' n ' דוחים את השערת האפס ' מקבלים את השערת האפס ' 0.0139 1 ' 0.9861 79.3 76 2.2 1.5 Z1 ' ) ' (0.0139) (0.05 הסיכוי לשגיאה בהתאם לתוצאות הוא , 1.39%הסיכוי לשגיאה המוגדר במחקר . 5% נדחה את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 33 .3 שיטה ג' -השוואת ערכי Z נתבונן בטבלת ההתפלגות הנורמאלית ,ניתן לראות כי ככל שערכו של Zגדל כך הערך המתקבל בטבלה גדל. הערך המתקבל בטבלה שווה לשטח/הסתברות משמאל לערך הנבדק ולכן ככל שהשטח משמאל גדל כך השטח מימין קטן .במונחים שלנו השטח מימין הוא רמת המובהקות , -לכן ככל ש Z -גדל קטנה. תחום דחית H 0 תחום קבלת ' H0 C Z STAT 0 Z1 נגדיר משתנה חדש Z( Z STATמחושב) Z ,סטטיסטי הוא למעשה ה Z-המחושב בהתאם לתוצאות המדגם. 0 Z STAT Z1 ' n Z1 Z Criticalבהתאם לרמת המובהקות המוגדרת במחקר Z STAT Zדוחים את השערת האפס Z STAT Zמקבלים את השערת האפס בדוגמא שלנו: Z0.95 1.65 79.3 76 2.2 1.5 )Z STAT (2.2) Z (1.65 ד. Z STAT Z1 ' דוחים את השערת האפס החלטת החוקר - השלב הרביעי במבחן הסטטיסטי הוא החלטת החוקר בהתאם לנתוני המחקר ולתחומים שבנינו בסעיף ג. בדוגמא שלנו :ממוצע המדגם היה , 79.3הגבול הקריטי הוא 78.475כלומר ממוצע המדגם גבוה מהגבול הקריטי , כלומר נמצא בתחום דחית , H 0התחום בו החריגה מהמוצע הקיים אינה חריגה זניחה אלא מובהקת. החלטת החוקר :נדחה את H 0ונקבל את השערת המחקר – שיטת הלימוד החדשה משפרת את הישגי התלמידים( .ברמת מובהקות של , 0.05או ברמת בטחון של .)95% – 0.95 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 34 ה. טעויות אפשריות - ישנן שתי טעויות אפשריות בתהליך בדיקת ההשערות : .1 טעות מסוג ראשון – כאשר דוחים את - H 0האפשרות לשגיאה היא H 0נכונה ,מקבלים את השערת המחקר אולם זו טעות והשערת המחקר אינה נכונה – תוצאות המחקר לא הוכיחו שינוי כלשהו. ההסתברות לטעות זו היא ( . באופן מדויק יותר ניתן לומר כי ההסתברות לטעות זו היא ' .) .2 טעות מסוג שני – כאשר מקבלים את H 0האפשרות לשגיאה היא H 1נכונה ,דוחים את השערת המחקר וטוענים כי המחקר לא הראה כל שינוי למרות שבפועל השערת המחקר נכונה. ההסתברות לטעות מסוג שני היא . Xממוצע המדגם הוא הממוצע הנבדק בבחינת ההשערה והוא נבחן כ - החדש. טעויות מסוג ראשון ושני כאשר ההשערה היא חד כיוונית כלפי מעלה C 0 טעויות מסוג ראשון ושני כאשר ההשערה היא חד כיוונית כלפי מטה 0 C - כאשר דוחים את השערת האפס המשמעות היא ש -הוא ערך חדש אשר אינו שייך להתפלגות סביב - 0 הסיכוי לשגיאה הוא ההסתברות שערך השווה ל -נמצא בהתפלגות סביב . 0 n C 0 Z 1 C 0 Z 1 n © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 35 - כאשר מקבלים את השערת האפס המשמעות היא ש -אינו ערך חדש אלא שייך להתפלגות סביב - 0 הסיכוי לשגיאה הוא -ערך חדש היוצר התפלגות חדשה ו C-שייך להתפלגות זו ,לכן שגיאה מסוג שני היא ההסתברות שערך Cשייך להתפלגות סביב . n C Z 1 C Z 1 n - מחושבת ע"י המרחק בין ל. 0 - - מחושבת ע"י המרחק בין ל. C - חישוב טעויות : .1 טעות מסוג ראשון ניתן לחשב את באופן מדויק יותר בהתאם לנתוני המחקר הספציפי ,ההסתברות לקבל ערך גבוה מממוצע ,היא רמת המובהקות של המחקר. המדגם (בהתאם לנתוני האוכלוסייה הקיימים -ההסתברות לקבל באוכלוסייה מדגם עם ממוצע גבוה (בלי לערוך כל מחקר) מממוצע המדגם שקיבלנו (כתוצאה ממחקר) היא בעצם ההסתברות לטעות מסוג ראשון – דחית השערת האפס בשעה שהשערת האפס נכונה ,במילים אחרות קבלת השערת המחקר בזמן שהשערת האפס נכונה – בזמן שבפועל אין כל שינוי. ניתן לחשב את ה -הקטנה ביותר האפשרית ,נעזר בטבלת ההתפלגות הנורמאלית נשתמש בדרך בה אנו מוצאים את הגבול הקריטי ע"י n - C 0 Z 1 הגבול הקריטי נקבע למעשה אשר הוגדרה מראש בתהליך המבחן הסטטיסטי ,בפועל אם קיבלנו הגדול/קטן מ( C-תלוי בסוג המבחן ,הרי שיכולנו להשתמש ב -קטנה יותר. ה -הקטנה ביותר בה נוכל להשתמש היא ה - n n בה ערכו של Cיהיה שווה ל , -לכן נציב C C 0 Z 1 0 Z 1 0 n © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע Z 1 36 בדוגמא שלנו : 1 0.9861 0.0139 79.3 76 2.2 1.5 Z 1 בדוגמא שלנו ע"פ הגדרת המחקר 0.05אולם באופן מדויק יותר קטנה יותר 0.0139 ההסתברות זו היא ההסתברות לטעות מסוג ראשון וזו גם ה -הקטנה ביותר איתה עדיין נשאר עם אותם מסקנות למחקר כלומר נדחה את . H 0 כלומר זו מתקיימת כאשר C עבור C 0.0139לכן נקבל את H 0 עבור 0.0139 C לכן נדחה את H 0 המשמעות היא -ניתן לערוך בדיקת השערות גם ללא חישוב גבול קריטי אלא על פי ערכי אם רמת המובהקות במחקר היא 0.05נשווה אותה לתחום י דחייה/קבלה H 0ע"פ שחישבנו. 0.05 0.0139לכן נידחה את . H 0 .2 טעות מסוג שני -קבלת השערת האפס למרות שהשערת המחקר נכונה. מאחר וטעות זו היא הטענה כי השערת המחקר H 1נכונה וקיבלנו בטעות את H 0 נגדיר את הגבול הקריטי Cלפי H 1 הגבול יוגדר ע"פ בניגוד ל C-ע"פ H 0המוגדר ע"פ 0 הגדרת Cלפי H1 n C Z 1 לכן כדי לחשב את C n Z 1 בפועל אנחנו מודדים את המרחק בין C מאחר ועקומת ההתפלגות סימטרית אפשר להתייחס לתשובה בערכה המוחלט. נחשב את ההסתברות לטעות זו בדוגמא שלנו (למרות שבדוגמא זו השגיאה האפשרית שהרי דחינו את .) H 0 0.2913 1 0.7088 79.3 78.475 0.55 1.5 Z 1 ההסתברות לטעות מסוג שני בדוגמא שלנו היא 0.29שהיא הסתברות גבוהה מאוד. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 37 התאמת גודל המדגם כדי להבטיח רצויות. ניתן להגדיר מראש את הטעויות המבוקשות – ( , רמת המובהקות תמיד מוגדרת מראש) ,אך ניתן להגדיר גם את ולחשב את גודל המדגם הדרוש במטרה לעמוד בטעויות אלו. הגדרת Cלפי H1 הגדרת Cלפי n H0 n C Z1 C 0 Z1 מאחר ו C-שווה ניתן להשוות (שימו לב שה -תמיד הפוך בין שתי ההגדרות) n Z 1 n 0 Z 1 אם נבודד את nממשוואה זו נקבל: ( Z 1 Z 1 )2 n ( 0 ) 2 נבדוק מהו גודל המדגם הדרוש בדוגמא שלנו על מנת להבטיח 0.05 0.05 2 12(1.65 1.65) n 144 (79.3 76) 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 38 מבחן דו כווני דו זנבי Two Tailed Test - תרופה חדשה להורדת לחץ הדם חשודה כמשפיעה על תאבון החולה (הצורך את התרופה) ,לבדיקת השפעת התרופה על משקל החולים נבדק מדגם מקרי של 36חולים אשר לקחו את התרופה במשך חודש ימים ונמצא כי משקלם הממוצע לאחר תקופה זו היה 79.5ק"ג. ידוע כי משקלה הממוצע של אוכלוסיית חולים זו הוא 82ק"ג עם סטית תקן של 5ק"ג. בנו מבחן סטטיסטי ברמת מובהקות של 0.05לבדיקת הטענה . א. השערות: 0 -- H 0 :השערת האפס למבחן דו כווני 82 -- H 0 :לתרופה אין השפעה על משקלם של החולים 0 -- H1 :השערת המחקר למבחן דו כווני 82 -- H1 :התרופה החדשה משפיעה על משקל החולים. ב. 0.05 ג. תחומי קבלה /דחייה לH 0 - .1 השיטה הקלאסית אנו עוסקים בבדיקת השערות דו כיוונית -ישנם שני גבולות ,עליון ותחתון ולכן רמת המובהקות מעל הגבול העליון ו- מתחלקת לשניים 2 2 מתחת לגבול התחתון. תחום דחית H 0 תחום קבלת H0 83.63 בהשערה דו כיוונית: Z 0.975 1.96 n Z 0.05 1 2 82 Z 1 2 80.36 C 0 Z 1 2 5 5 36 6 5 5 C 2 82 1.96 83.63גבול עליון 80.36 6 6 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 79.5 n 0 82 C1 82 1.96 גבול תחתון 39 .2 רמות מובהקות 82 79.5 3 5 6 0.0026 ' 2 Z 1 0.0013 0 Z1 ' n ' 2 0.9987 ' 2 ' דוחים את השערת האפס ' מקבלים את השערת האפס 1 3 ' 2 Z 1 ) ' (0.0026) (0.05 הסיכוי לשגיאה בהתאם לתוצאות הוא , 0.26%לעומת הסיכוי לשגיאה המוגדר במחקר . 5% נדחה את השערת האפס .3 ערכי Z Z 0.975 1.96 82 79.5 3 5 6 ' 2 Z STAT Z 1 Z STAT Zדוחים את השערת האפס Z STAT Zמקבלים את השערת האפס )Z STAT (3) Z (1.96 דוחים את השערת האפס החלטה : המשקל הממוצע שהתקבל במדגם הוא 79.5ק"ג ממוצע זה נמוך מהגבול התחתון – נמצא בתחום דחית השערת האפס. נדחה את H 0ונקבל את השערת המחקר התרופה משפיעה על משקלם של החולים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 40 הטעות האפשרית הטעות האפשרית היא טעות מסוג ראשון טעות ההסתברות לטעות זו היא .0.05 נחשב את הספציפית למדגם זה – רמת המובהקות הקטנה ביותר לדחיית . H 0 0.0026 0.9987 2 1 82 79.5 3 5 ) ( 6 Z 1 2 רמת המובהקות הקטנה ביותר לדחיית H 0היא 0.0026 ההסתברות האמיתית (המדויקת) – רמת המובהקות המינימאלית ,לטעות מסוג ראשון היא 0.0026 הערך שקיבלנו קטן מ C-המשמעות היא שיכולנו להשתמש ב C-קטן יותר ועדיין להגיע לאותן מסקנות ולהחליט את אותן החלטות. באופן מדויק יותר יכולנו להקטין/להגדיל את Cעד הנקודה בה C ולכן הסיכוי לשגיאה בהחלטה קטן מהסיכוי המתוכנן לשגיאה ,זוהי נקודה חשובה אשר ראוי להדגיש אותה בתוצאות ובמסקנות - ככל שהסיכוי לשגיאה קטן יותר כך המסקנה וההחלטה שלנו מוצקה יותר ומבוססת יותר. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 41 תרגילים .1 מנהל השיווק בחברה מסוימת רצה לבדוק את יעילותו של בונוס ,כתמריץ לשיפור המכירות .ידוע כי בממוצע מתוך 50שיחות טלפון במשמרת מאתר טלפן 6לקוחות חדשים עם סטית תקן .3הבונוס הוצע ל16 - טלפנים באופן אקראי ונמצא כי באותה משמרת איתר טלפן בממוצע מתוך 50שיחות 8לקוחות חדשים. א. בדקו את יעילות הבונוס ברמת מובהקות של . 0.05 ב. מהי ההסתברות "האמיתית" לשגיאה (רמת המובהקות המינימאלית) בהחלטה שהתקבלה ? .2 מכונית אמריקאית מדגם AAAצורכת בממוצע 10ליטר דלק לכל 100ק"מ עם סטית תקן של ליטר וחצי .בודקים סוג דלק חדש ומעוניינים לבדוק את השפעתו על צריכת הדלק ,הבדיקה נעשית על 20מכוניות מדגם AAAונמצא כי בממוצע צרכה כל מכונית 8.9ליטר דלק לכל 100ק"מ. ערוך מבחן סטטיסטי ובדוק את הטענה ברמת מובהקות של . 0.04 .3 הכנסתה הממוצעת נטו בחודש של משפחה במדינה מסוימת היא , ₪ 1000מתוך הכנסה זו חוסכת המשפחה בממוצע 10%עם סטית תקן של ( 31.26%מהסכום הנחסך). במשרד האוצר של אותה מדינה שוקלים להקטין את נטל המס כך שהמשכורת נטו הממוצעת תעלה ב, 8%- ההחלטה אם לבצע את השינוי מותנית בכך שכתוצאה מהמהלך יגדל סכום החיסכון אצל התושבים . נבדק מדגם מקרי של 64משפחות אשר ניסו את שיטת המס החדשה. בדוק האם יש להקטין את נטל המס ,ברמת מובהקות של . 0.05 .4 במאמר פורסם שרמת המובהקות המינימאלית לדחיית השערת האפס היא .5%משמעות הדבר הוא: א. שהשערת האפס תידחה ברמת מובהקות של 5%בלבד. ב. שהשערת האפס תידחה בכל רמת מובהקות של 5%לפחות ותתקבל בכל רמת מובהקות הנמוכה מ.5% - ג. שהשערת האפס תתקבל בכל רמת מובהקות של 5%לפחות ותידחה בכל רמת מובהקות הנמוכה מ.5% - ד. שהשערת האפס תידחה רק ברמת מובהקות בין 5%ל.10% - .5 סטטיסטיקאי החליט כי הוא משתמש תמיד ברמת מובהקות של .2.5%לטווח הארוך ,הוא החליט נכונה: א .בערך ב 2.5%מהשערות האפס הנכונות שבדק. ב .בערך ב 97.5%מהשערות האפס הנכונות שבדק. ג .בערך ב 2.5%מבדיקות ההשערות שביצע. ד .בערך ב 97.5%מבדיקות ההשערות שביצע. .6 במבחן שנערך נמצא כי רמת המובהקות המינימאלית לדחיית H0היא .5%המשמעות היא : א. ניתן לדחות את H0ברמת מובהקות של .3% ג. לא ניתן לדחות את H0ברמת מובהקות של .3% ד. לא ניתן לדחות את H0ברמת מובהקות של ,10%אך ניתן לדחות את H0ברמת מובהקות של .5% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ב. לא ניתן לדחות את H0ברמת מובהקות של .10% 42 פתרונות לתרגילים .1 מנהל השיווק רוצה לבדוק את יעילותו של הבונוס לשיפור המכירות – השערה חד כיוונית כלפי מעלה. מבחן סטטיסטי 6 H0 : הבונוס אינו משפר את רמת המכירות 6 H1 : הבונוס גרום לשיפור ברמת המכירות א. השערות : ב. רמת מובהקות ג. תחומי קבלה ודחית H 0 0.05 השערה חד כיוונית - n Z1 Z10.05 Z0.95 1.65 3 0.75 16 C 0 Z 1 n 0 6 C 6 1.65 0.75 7.24 השיטה הקלאסית – גבולות קריטיים תחום דחית H 0 תחומי קבלה /דחייה לH 0 - תחום קבלת H0 נדחה את השערת האפס. 8 ד. 7.24 6 החלטת החוקר - נדחה את H 0ונקבל את השערת המחקר – הבונוס משפר את רמת המכירות וגורם להעלאת ממוצע המכירות. ה. השגיאה האפשרית : דחינו את השערת האפס ,השגיאה האפשרית -טעינו בהחלטה -דחינו את השערת האפס בזמן שהיא נכונה. שגיאה מסוג , 0.05ברמת הגדרת המחקר יש סיכוי של 5%שטעינו. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 43 השוואת הסתברויות – רמות מובהקות 0 Z1 ' n ' דוחים את השערת האפס ' מקבלים את השערת האפס ' 0.0039 1 ' 0.9961 86 2.67 0.75 Z1 ' ) ' (0.0038) (0.05 הסיכוי לשגיאה בהתאם לתוצאות המחקר הוא , 0.38%הסיכוי לשגיאה המוגדר במחקר . 5% נדחה את השערת האפס. השוואת ערכי Z Z 0.95 1.65 86 2.67 0.75 Z STAT 0 Z STAT Z1 ' n Z STAT Zדוחים את השערת האפס Z STAT Zמקבלים את השערת האפס )Z STAT (2.67) Z (1.65 דוחים את השערת האפס .1ב ההסתברות האמיתית לשגיאה היא רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן מסקנות .בניסוח יותר סטטיסטי -ההסתברות לקבל ערך גבוה מהערך שקיבלנו במדגם ,ערך גבוה מ– .8 נשווה את Cלממוצע המדגם ,ונחשב את ההסתברות באמצעות טבלת ההתפלגות הנורמאלית . כלומר ניתן להזיז את Cעד ולא להסתפק ב. 7.24- 0 Z 1 n 86 0.75 2.67 0.0039 Z 1 Z 1 1 0.9961 ההסתברות "האמיתית" לשגיאה היא .0.0039 סיכוי של 0.39%לשגיאה במסקנות. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 44 .2 מעוניינים לבדוק את השפעת הדלק החדש – כוון לא ברור – מבחן דו כווני א. השערות: 10 H0 : הדלק החדש אינו משפיע על צריכת הדלק 10 H1 : לדלק החדש יש השפעה על צריכת הדלק ב. רמת מובהקות 0.04 ג. תחומי קבלה /דחייה לH 0 - השערה דו כיוונית - n Z10.02 Z0.98 2.05 1.5 10.687 20 C1 0 Z 1 2 1.5 20 Z 1 2 C2 10 2.05 n 1 2 0 10 n 1.5 9.31 20 C2 0 Z C1 10 2.05 תחום דחית H 0 תחום דחית H 0 תחום קבלת H0 10.69 הערך הנבדק נמצא בתחום דחיית השערת האפס ד. 10 9.31 8.9 החלטת החוקר - נדחה את השערת האפס ונקבל את השערת המחקר – לדלק החדש יש השפעה על צריכת הדלק , הדלק החדש גורם לירידה בצריכת הדלק. ה. השגיאה האפשרית : דחינו את השערת האפס ,השגיאה האפשרית -דחינו את השערת האפס בזמן שהיא נכונה -שגיאה מסוג ראשון - , 0.04 , ברמת הגדרת המחקר יש סיכוי של 4%לטעות. ההסתברות האמיתית לשגיאה היא רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן מסקנות (סעיף ג – רמות מובהקות) במילים אחרות ההסתברות הקטנה ביותר בה ניתן לקבוע את Cועדיין להישאר עם אותן מסקנות לכן C . C 8.9 ' 0.001 הסיכוי האמיתי לשגיאה הוא 1% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 8.9 10 3.27 1 1.5 2 20 ' ' 1 0.9995 0.0005 2 2 Z 0 n 3.27 2 ' 2 1 1 Z Z 45 בדיקה ע"י השוואת הסתברויות – רמות מובהקות 8.9 10 3.27 1.5 20 ' 2 1 Z ' 0 n ' 0.001 0.0005 ' דוחים את השערת האפס 2 0.9995 2 ' 1 ' 2 Z 3.27 1 ' 2 ' 1 Z מקבלים את השערת האפס ) ' (0.001) (0.04הסיכוי לשגיאה בהתאם לתוצאות הוא , 0.1%לעומת הסיכוי לשגיאה המוגדר במחקר . 5% נדחה את השערת האפס בדיקה ע"י השוואת ערכי Z 8.9 10 3.27 1.5 20 Z 0.98 2.05 ' 2 Z STAT Z 1 Z STAT Zמקבלים את השערת האפס Z STAT Zדוחים את השערת האפס )Z STAT (3.27) Z (2.05 דוחים את השערת האפס נעבד את הנתונים 31.26 - .3 0 100 השכר הממוצע כתוצאה מהשינוי ₪ 1080 . 108 מבחן חד כווני כלפי מעלה: א. השערות 100 : H0 : סכום החיסכון לא ישתנה 100 H1 : סכום החיסכון יגדל ב. רמת מובהקות 0.05 ג. תחומי קבלה /דחייה לH 0 - השערה חד כיוונית - Z1 Z10.05 Z0.95 1.65 n C 0 Z 1 31.26 3.9 64 n 0 100 C 100 1.65 3.9 106.43 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 46 תחום דחית H 0 תחום קבלת H0 100 106.43 108 הערך הנבדק – 108נמצא בתחום דחיית השערת האפס – נדחה את השערת האפס ד. החלטת החוקר : הערך הנבדק גבוה מהגבול הקריטי -נדחה את השערת האפס ונקבל את השערת המחקר – סכום החיסכון יעלה כתוצאה מהשינוי במס ולכן ניתן לערוך את השינוי ה. השגיאה האפשרית : דחינו את השערת האפס ,השגיאה האפשרית -דחינו את השערת האפס בזמן שהיא נכונה , שגיאה מסוג ראשון - , 0.05בהתאם להגדרת המחקר הסיכוי לשגיאה . 5% ההסתברות האמיתית לשגיאה -רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן מסקנות כלומר ההסתברות לקבל ערך גבוה מהערך שקיבלנו במדגם – ( .108סעיף ג' – רמות מובהקות) 108 100 2.05 3.9 1 0.9798 0.0202 Z 1 נשווה את Cלממוצע המדגם ,ונחשב את ההסתברות באמצעות טבלת ההתפלגות הנורמאלית ,ההסתברות לטעות בהחלטה היא 0.0202כלומר סיכוי של 2.02%לשגיאה. בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 Z1 ' n ' דוחים את השערת האפס ' מקבלים את השערת האפס ' 0.0202 1 ' 0.9798 108 100 2.05 3.9 Z1 ' ) ' (0.0202) (0.05 הסיכוי לשגיאה בהתאם לתוצאות הוא , 0.38%הסיכוי לשגיאה המוגדר במחקר . 5% נדחה את השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 47 בדיקה ע"י השוואת ערכי Z Z STAT Zדוחים את השערת האפס Z STAT Zמקבלים את השערת האפס )Z STAT (2.05) Z (1.65 .4 דוחים את השערת האפס רמת המובהקות המינימאלית היא רמת המובהקות הקטנה ביותר בה עדיין נדחה את השערת האפס , הגבול הנמוך ביותר לדחיית השערת האפס -ברמת מובהקות קטנה ממנה נקבל את השערת האפס - התשובה הנכונה היא ב . .5 כאשר סטטיסטיקאי משתמש ברמת מובהקות מסוימת המשמעות היא שבתהליך בדיקת ההשערות , הסיכוי לשגיאה הוא אותה רמת מובהקות לכן אם החליט על רמת מובהקות של 2.5%המשמעות היא שבתהליך בדיקת ההשערות זהו הסיכוי לשגיאה לכן הסיכוי שהחליט נכון הוא - 97.5%תשובה נכונה ד'. .6 ' דוחים את השערת האפס ' ,מקבלים את השערת האפס .תשובה נכונה ג'. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 48 הסקה סטטיסטית על תוחלת של אוכלוסייה כאשר השונות לא ידועה עסקנו בהסקה סטטיסטית על הפרמטר (ממוצע האוכלוסייה ) כאשר השונות/סטיית התקן באוכלוסייה ידועה. במציאות מחקים נערכים על מדגמים כאשר בד"כ נתוני האוכלוסיות שלהם אינם ידועים – לא בכל תחום ישנם נתונים על האוכלוסייה – ממוצע של תכונה מסוימת וסטית התקן של אותה תכונה. ברב המקרים תהליך הסקת המסקנות ממדגם לאוכלוסייה נעשה כאשר נתוני האוכלוסייה אינם ידועים. אמידת השונות כאשר נבדוק באוכלוסייה בה הנתונים ידועים את הקשר בין סטית התקן במדגם – Sלבין סטית התקן באוכלוסייה ,נוכל לראות כי סטית התקן במדגם איננה אומדן טוב לסטיית התקן באוכלוסייה ,זאת מאחר וקיימת הטיה/סטייה שיטתית בין Sל . -ההטיה היא כלפי מטה S -קטן מ - )(n 1 באוכלוסיה פי גודל קבוע ,השווה ל- n שונות המדגם קטנה מהשונות : (n 1) 2 n S 2 כאשר nהוא גודל המדגם. n 1 ככל שהמדגם גדול יותר n שואף לאחד ולכן Sשואף ל. - נבצע מספר פעולות מתמטיות כמתואר להלן ונגיע לכך שסטית התקן של המדגם מחולקת ב n-1 -במקום nתבצע את התיקון הדרוש בהטיה בין סטית התקן במדגם לאוכלוסייה וכך נוכל באמצעות המדגם לקבל אומדן לסטייה התקן באוכלוסייה . את אומדן סטית התקן באוכלוסייה נגדיר באות S n 2 n 1 S2 (X i X )2 2 S 2 n (X i X )2 n 1 2 S n n 1 (X i X )2 n חישוב סטית התקן וחלוקה ב n-1 -במקום nמבצע למעשה את תיקון הסטייה ולכן מקבלים אומדן ל - © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 49 התפלגות t Student t distribution כאשר עסקנו בהסקה סטטיסטית וסטית התקן באוכלוסייה הייתה ידועה ,הנחנו בהתאם למשפט הגבול המרכזי כי התפלגות הדגימה של הממוצעים שואפת להתפלגות נורמאלית. מנקודת מוצא זו עם טבלת ההתפלגות הנורמאלית והשתמשנו בציון התקן . Z 0 ) Z ( n מאחר ואנו עובדים עם אומדן לסטיית התקן באוכלוסייה – סטית התקן באוכלוסייה אינה ידועה הרי שערך הביטוי משתנה ,מאחר והמכנה שלו משתנה ( Sמשתנה ביחס ל )n -ולכן נגדיר סטטיסטי חדש . t 0 t S ( ) n התפלגות tפותחה ע"י William Gossetהתפלגות tהיא התפלגות סימטרית ,בצורת פעמון ,דומה להתפלגות נורמאלית סטנדרטית ,אך שטוחה יותר ,להתפלגות tפרמטר נוסף הנקרא דרגת החופש , Degrees of freedomדרגות החופש משנות את צורת ההתפלגות -ככל שדרגת החופש עולה ההתפלגות מתקרבת לצורת התפלגות נורמאלית . תיאורטית בדרגת חופש אין סופית שתי ההתפלגויות זהות. מעשית עבור דרגת חופש גדולה מ 120 -ההתפלגויות למעשה זהות. מדובר במשפחה של התפלגויות ,עבור כל דרגת חופש יש התפלגות שונה ועם עליה בדרגת החופש ההתפלגות שואפת להתפלגות נורמאלית. דרגת החופש מתייחסת לגודל המדגם פחות אחד df=n-1 df=8 df=6 הוא גודל קבוע כאשר הוא נתון ,לעומתו Sמשתנה ממדגם למדגם ,מאחר והוא תלוי בגודל המדגם . בחישוב Zהמכנה הוא קבוע ואילו בחישוב tהמכנה משתנה ,שינוי זה הולך וקטן ככל שהמדגם גדול יותר (מדגם שגודלו n=10מושפע יותר כאשר מחסירים ממנו , 1מאשר מדגם שגודלו )100 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 50 הוא גודל קבוע כאשר הוא נתון ,לעומתו Sמשתנה ממדגם למדגם ,מאחר והוא תלוי בגודל המדגם כלומר שבחישוב Zהמכנה הוא קבוע ואילו בחישוב tהמכנה משתנה ,שינוי זה הולך וקטן ככל שהמדגם גדול יותר (מדגם שגודלו n=10מושפע יותר כאשר מחסירים ממנו , 1מאשר מדגם שגודלו )100 כתוצאה מכך ,התפלגות tאינה התפלגות נורמאלית סטנדרטית ,התפלגות tהיא התפלגות ידועה ,התפלגות סימטרית ,שטוחה יותר מהתפלגות נורמאלית – ככל שהמדגם גדל כך n-1שהוא בעצם התיקון בהטיה בין סטית התקן במדגם לסטייה באוכלוסייה נעשה זניח ולכן Sשואף ל -והתפלגות tשואפת להתפלגות נורמאלית. התפלגות tתלויה ב"-דרגות חופש" , df - Degrees of freedomדרגות החופש הם n-1ככל שמספר דרגות החופש גדל ערכי tמתקרבים לערכי – Zככל שהמדגם גדול יותר – (יש יותר דרגות חופש) tמתקרב ל. Z- כאשר מספר דרגות החופש df 120משתמשים בלוח התפלגות . t כאשר df >120נשתמש בהתפלגות – Zהתפלגות נורמאלית. דוגמא לחישוב בטבלת t מצאו את ) 0.05 tn 1,(1 n 20 העמודה השמאלית בטבלה מציינת dfדרגות חופש ,העמודות 1 - 1 =0.95 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע df=19 t19,0.95 1.729 51 כאשר סטית התקן באוכלוסייה לא ידועה רווח בר סמך ל - S S X t X t ) ( n 1)(1 ) ( n 1)(1 n n 2 2 דוגמא: במטרה לאמוד את ממוצע האיחורים של תלמידי בית ספר מסוים נלקח מדגם מקרי של 10תלמידים להלן נתוני האיחורים בימים 1,4,3,1,5,10,11,10,9,3 : . 0.95 חשבו רווח בר סמך לממוצע האיחורים בבית הספר ברמת סמך של נכניס את הנתונים לטבלה ,נחשב את ממוצע האיחורים ונאמוד את סטית התקן לאיחורים בביה"ס: ניתן לבצע את החישובים באמצעות המחשבון – עיין נספח לשימוש במחשבון. 2 ) (Xi X 22.09 22.09 7.29 7.29 2.89 0.49 10.89 18.49 18.49 28.09 138.1 ) (Xi X Xi מס נבדק i 4.74.72.72.71.70.73.3 4.3 4.3 5.3 1 1 3 3 4 5 9 10 10 11 57 1 2 3 4 5 6 7 8 9 10 סה"כ 138.1 15.3444 9 S 15.344 3.9171 0.975 2 1 S t9,0.975 2.262 df 9 t 0.05 (101)(1 ) 2 S X t ) ( n 1)(1 n 2 3.9171 2 57 X 5.7 10 S X t ) ( n 1)(1 n 2 5.7 2.262 10 8.501 3.9171 5.7 2.262 10 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2.898 52 בדיקת השערות – שונות לא ידועה בדיקת השערות כאשר סטית התקן באוכלוסיה אינה ידועה ,זהה לתהליך שהכרנו בפרק על בדיקת השערות , ע"פ נתוני המדגם יש לחשב אומדן ל - -את הסטטיסטי Sולהשתמש בהתפלגות tבמקום התפלגות נורמאלית. שאלה: חוקר בדק את הטענה כי אכילת 100גר' שוקולד לפני בחינה משפרת את הריכוז ומכאן את הישגי הנבחן. לצורך בדיקת הטענה נלקח מדגם מקרי של 16סטודנטים בקורס בסטטיסטיקה ,ידוע כי ממוצע הציונים בקורס זה הוא 70.6בדוק את טענת החוקר ברמת מובהקות 0.01 ציוני הסטודנטים במדגם 70,74,78,78,80,80,45,90,75,75,65,68,70,74,76,80 : 2 ( X i X ) Fi 819.39 74.39 31.64 26.28 0.2812 3.7812 5.6406 38.28 121.92 268.14 1389.743 2 ) (Xi X ) (Xi X X i Fi Fi Xi 819.39 74.39 31.64 13.14 0.1406 1.8906 5.6406 19.14 40.64 268.14 1274.15 28.6258.6255.6253.6250.375 1.375 2.375 4.375 6.375 16.375 45 65 68 140 148 150 76 156 240 70 1178 1 1 1 2 2 2 1 2 3 1 16 45 65 68 70 74 75 76 78 80 90 סה"כ נחשב את הממוצע ,את tונאמוד את סטית התקן. t(161)(10.01) t15,0.99 2.602 א. ב. 1389.743 9.625 15 S 1178 73.625 16 X השערות : 70.6 H 0 :לאכילת שוקולד לפני מבחן אין השפעה על ציוני הסטודנטים 70.6 H1 :אכילת שוקולד לפני מבחן משפרת את ציוני הסטודנטים רמת מובהקות 0.01 : © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 53 ג. תחומי דחייה וקבלה להשערת האפס S n C 0 t ( n 1), (1 ) 9.625 76.86 16 C 70.6 2.602 תחום דחית H 0 תחום קבלת H0 מקבלים את השערת האפס ד. 73.62 76.86 70.6 החלטה ממוצע הציונים החדש הוא 73.625והוא קטן מהגבול הקריטי שהוא - 76.86נמצא בתחום קבלת השערת האפס , נקבל את השערת האפס – לאכילת שוקולד לפני מבחן אין השפעה על ציוני הסטודנטים. ה. טעות אפשרית קיבלנו את H 0הטעות האפשרית -קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. טעות מסוג שני . 76.86 73.625 1.344 2.406 C ) S t15,(1 ) ( n ברמה של 15דרגות חופש הערך 1.344נמצא מתאים ל1 0.9 - , 0.1כלומר הסיכוי לשגיאה במסקנה הוא 10% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 54 בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.1 ' 0.25 df 15 0.75 1 ' 0.9 ' (01מקבלים את השערת האפס. ) 0.25) (0.01 73.62 70.6 1.255 9.625 ( ) 16 t15,1 ' בדיקה ע"י השוואת ערכי t t15,0.99 2.602 73.62 70.6 1.255 9.625 ( ) 16 tSTAT 0 S n tSTAT t( n 1)(1 ') ערך tהנבדק נקרא גם - t Criticalערך המוביל אותנו לגבול הקריטי tSTAT tCRITICALדוחים את השערת האפס )tSTAT (1.255) t (2.602 tSTAT tCRITICAL מקבלים את השערת האפס מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 55 תרגילים חוקר מבקש למדוד את ממוצע משך הנישואים אצל זוגות גרושים (עד הגירושין) ,החוקר דגם מדגם 1. מקרי של 10זוגות ,להלן התוצאות (בשנים),7 , 2 , 1 , 15 , 25 , 3 , 7 , 20 , 8 , 2 : א. בנו רווח בר סמך ברמת סמך של 0.98לפרמטר - ממוצע אורך חיי הנשואים אצל גרושים. ב. בדקו את הטענה (ברמת מובהקות של ) 0.05כי במדינה שכנה משך הנישואים ארוך יותר ,אם נתון כי משך הנישואים הממוצע במדינה זו הוא 11.25שנים. בדקו את הטענה -יש הבדל בין משך חיי הנישואים במדינות העולם השלישי לבין משך חיי הנישואים ג. במדינה זו אם נתון כי ממוצע משך הנישואים במדינות העולם השלישי הוא שנתיים וחצי 0.01 . במטרה לבדוק את העלות הממוצעת של "סל קניות לחג" ,נבדק דגם מקרי של 10קונים ,להלן עלויות .2 הקניה של כל קונה . 485 , 540 , 420 , 630 , 480 , 550 , 530 , 520 , 475 , 450 : א. בנו רווח בר סמך לעלות הממוצעת של "סל קניות לחג" ברמת סמך של .0.95 ב. ע"פ נתוני השנה הקודמת ,עלות ממוצעת של "סל קניות לחג" הייתה , ₪ 420בדוק את הטענה כי השנה ההוצאה הממוצעת למשפחה לחג גבוהה מההוצאה בשנה שעברה ברמת סמך של .0.95 בדוק את הטענה כי השנה ההוצאה הממוצעת לחג למשפחה גבוהה מההוצאה בשנה שעברה ברמת סמך ג. של 0.99אם על פי נתוני השנה הקודמת סל הקניות הממוצע היה .₪ 485 בישוב א נבדק מדגם של 20ילדים בגילאי 8-10ונמצא כי רמת המשכל שלהם – IQהיא בממוצע 112עם .3 שונות ( 100שימו לב – שורש של שונות המדגם -סטית התקן של המדגם S אינו אומדן ל. - א. בנה רווח בר סמך למנת המשכל הממוצע של הילדים בגיל זה באותה ישוב ברמת סמך של . 0.95 ב. בדוק את הטענה כי מנת המשכל של הילדים בישוב א גבוהה ממנת המשכל של הילדים בגיל זה בכל המדינה העומדת על , 105ברמת מובהקות של .0.05 בישוב ב ידוע כי מנת המשכל של הילדים גבוהה ב 10%-ממנת המשכל הארצית הממוצעת ,בדקו את ג. הטענה כי מנת המשכל בישוב ב גבוהה ממנת המשכל בישוב א ,ברמת מובהקות של . 0.05 אם נתון כי מנת המשכל הממוצעת של ילדי ישוב ב היא , 120מה תהיה תשובתך ומהו הסיכוי לטעות ? ד. חוקר ביצע ניסוי .הוא ניסח את ההשערות הבאות . H 0 : 0 H1 : 0 :לצורך בדיקה הוא לקח .4 מדגם מקרי בגודל 5מתוך אוכלוסיה המתפלגת נורמאלית עם שונות לא ידועה .על סמך תוצאות המדגם הוא חישב וקיבל : . t stat 2.611לכן המסקנה היא : א. ידחה H 0ברמת מובהקות 0.1אך לא כן ברמת מובהקות .0.05 ב. ידחה H 0ברמת מובהקות 0.05אך לא ברמת .0.025 ג. ידחה H 0ברמת מובהקות 0.025אך לא ברמת 0.01 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ד .הוא לא ידחה H 0ברמת מובהקות .0.1 56 פתרונות .1 א. נחשב את הממוצע ,את tונאמוד את סטית התקן. t9,0.99 2.821 0.02 ) 2 t 9,(1 ) ( n 1),(1 2 t S 8.3 S X t ) ( n 1)(1 n 2 8.3 S X t ) ( n 1)(1 n 2 8.3 9 2.821 10 1.595 בדיקת השערות – חד כווני כלפי מעלה 11.25 ב.1. 9 2.821 10 16.4 ב. X 9 t(101)(10.05) t9,0.95 1.833 0 9 S 8.3 השערות : 9 H 0 :אין הבדל בין משך חיי הנישואים במדינה למדינה השכנה 9 H1 :במדינה השכנה משך חיי הנישואים ארוך יותר ב.2. 0.05 ב.3. תחומי דחייה וקבלה להשערת האפס S C 0 t( n1),(1 ) n 8.3 13.81 10 תחום דחית H 0 C 9 1.833 תחום קבלת H0 11.25 13.81 9 מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 57 ב.4. החלטה משך חיי הנישואים במדינה השכנה – 11.25נמצא בתחום קבלת השערת האפס ,לכן נקבל את H 0ונדחה את השערת המחקר – אין הבדל בין משך חיי הנישואים בין שתי המדינות ב.5. טעות אפשרית קיבלנו את H 0הטעות האפשרית -השערת המחקר H 1נכונה -טעות מסוג שני . ברמה של 9דרגות חופש הערך נמצא מתאים ל- 0.75 1 0.9 13.81 11.25 0.975 2.625 0.1 0.25 הסיכוי לשגיאה במסקנה הוא בין 10%-25% C t9,(1 ) S ) ( n בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.1 ' 0.25 df 9 0.75 1 ' 0.9 11.25 9 0.8572 8.3 ( ) 10 t9,1 ' ' (0.1מקבלים את השערת האפס. ) 0.25) (0.05 בדיקה ע"י השוואת ערכי t 11.25 9 0.8572 8 ( ) 10 t9,0.95 1.833 S n ערך tהנבדק נקרא גם - t Criticalערך המוביל אותנו לגבול הקריטי tSTAT tCRITICALדוחים את השערת האפס )tSTAT (0.8572) t (1.833 tSTAT 0 tSTAT tCRITICAL tSTAT t( n 1)(1 ') מקבלים את השערת האפס מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 58 השערה דו כיוונית ג1. 2.5 ג.2. t9,0.995 3.25 0.01 ) 2 (101)(1 t 0 9 S 8.3 השערות : 9 H 0 :אין הבדל בין משך חיי הנישואים במדינה למדינות העולם השלישי 9 H1 :יש הבדל בין משך חיי הנישואים במדינה למדינות העולם השלישי ג.3. 0.01 ג.3. תחומי דחייה וקבלה להשערת האפס S C 0 t( n 1),(1 ) תחום דחית n 2 H0 תחום קבלת 8.3 17.53 10 8.3 C1 9 3.25 0.46 10 C2 9 3.25 מקבלים את השערת האפס. ג.4. H0 17.53 0.46 2.5 9 החלטה משך חיי הנישואים במדינות העולם השלישי 2.5נמצא בתחום קבלת השערת האפס ,לכן נקבל את H 0ונדחה את השערת המחקר – אין הבדל בין משך חיי הנישואים בין מדינות העולם השלישי למדינה זו. ג.5. טעות אפשרית קיבלנו את H 0הטעות האפשרית -קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. כלומר טעות מסוג שני . 2.5 0.46 0.77 2.625 ברמה של 9דרגות חופש: הסיכוי לשגיאה במסקנה הוא בין 20%-50% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 0.2 0.5 C S ) n ( ) 9,(1 2 t 0.9 2 0.75 1 59 בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n ' ) ( n 1),(1 2 t ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.02 ' 0.05 0.99 ' 2 2.5 9 2.476 8.3 ( ) 10 df 9 0.975 1 ' (0.02 מקבלים את השערת האפס. ) 0.05) (0.01 ' 2 t 9,1 בדיקה ע"י השוואת ערכי t t9,0.995 3.25 2.5 9 2.47 8.3 ( ) 10 0 tSTAT S n ) ' 2 ( n 1)(1 tSTAT t ערך tהנבדק נקרא גם - t Criticalערך המוביל אותנו לגבול הקריטי tSTAT tCRITICAL tSTAT tCRITICALדוחים את השערת האפס מקבלים את השערת האפס ) tSTAT (2.47) t (3.25מקבלים את השערת האפס .2א. t9,0.975 2.262 0.05 ) 2 t 9,(1 ) ( n 1),(1 2 t S X t ) ( n 1)(1 n 2 59.45 S 59.45 X 508 508 2.262 10 S X t ) ( n 1)(1 n 2 59.45 508 2.262 10 465.47 550.52 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 60 .2ב. מבחן חד כווני כלפי מעלה 508 t(101)(10.05) t9,0.95 1.833 0 420 S 59.45 .1השערות : .2 .3 420 H0 : עלות סל קניות השנה לא שונה מעלותו לפני שנה 420 H1 : עלות סל קניות השנה גבוהה מעלותו בשנה שעברה 0.05 תחומי דחייה וקבלה להשערת האפס תחום דחית H 0 S C 0 t( n1),(1 ) n 59.45 454.45 10 תחום קבלת H0 C 420 1.833 454.4 508 420 דוחים את השערת האפס. .4 החלטה ממוצע עלות סל קניות השנה – ₪ 508נמצא בתחום דחית השערת האפס ,נדחה את השערת האפס ונקבל את השערת המחקר – עלות סל קניות לחג השנה גבוהה מעלותו בשנה שעברה. .5 טעות אפשרית דחינו את H 0הטעות האפשרית -דחינו את השערת האפס בזמן שהשערת האפס נכונה . טעות מסוג ראשון . ההסתברות ה"אמיתית" לטעות מסוג זה במחקר זה – רמת המובהקות המינימאלית היא: ברמה של 9דרגות חופש הערך נמצא מתאים ל- 0.995 1 0.9995 , 0.0005 0.005 508 420 4.68 18.799 0 t9,(1 ) S ) ( n הסיכוי לשגיאה במסקנה הוא בין 0.5% - 0.05% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 61 בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.0005 ' 0.005 508 420 4.68 59.45 ( ) 10 df 9 0.995 1 ' 0.9995 t9,1 ' ' (0.0005 דוחים את השערת האפס. ) 0.005) (0.05 בדיקה ע"י השוואת ערכי t 508 420 4.68 59.45 ( ) 10 t9,0.95 1.833 tSTAT tSTAT tCRITICALדוחים את השערת האפס )tSTAT (4.68) t (1.833 0 S n tSTAT t( n 1)(1 ') tSTAT tCRITICAL מקבלים את השערת האפס דוחים את השערת האפס 2ג .אם בשנה הקודמת סל קניות ממוצע לחג עלה ₪ 485המשמעות היא שינוי בגבול הקריטי C 528.8 59.45 10 C 485 2.33 ממוצע הסל השנה ₪ 508 ,נמצא בתחום קבלת השערת האפס ,לכן נקבל את השערת האפס. טעות במקרה זה היא טעות מסוג שני 528.8 508 1.106 18.799 C ) S n t 9,(1 ) ( ברמה של 9דרגות חופש הערך נמצא מתאים ל0.75 1 0.9 - - 0.1 0.25הסיכוי לשגיאה במסקנה הוא בין .10% - 25% הסיכוי לטעות מאוד גבוה מאחר והערכים קרובים אחד לשני – ככל שהערכים קרובים כך הסיכוי לשגיאה גדל. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 62 .3 כאשר נתון כי שונות המדגם היא , 100המשמעות היא , S 2 100כיצד נתרגם מנתון זה את ? S אנחנו יודעים כי כלומר ( X i X )2 n ו- ( X i X )2 100 20 נציב את הנתון הנ"ל בנוסחה 2000 לכן 10.259 19 t19,0.975 2.093 S2 0.05 ) 2 t 19,(1 ( X i X )2 n 1 2 לכן ( X i X )2 2 S n 1 ( X i X )2 n 1 ) ( n 1),(1 2 2 2000 כלומר S 19 S S 10.259 X 112 S X t ) ( n 1)(1 n 2 10.259 ) 2000 ( X i X t 2 S 112 2.093 20 116.8 S X t ) ( n 1)(1 n 2 10.259 112 2.093 20 107.198 ב .מבחן חד כווני כלפי מעלה .1השערות : 105 H0 : מנת המשכל של הילדים בישוב אינה גבוהה ממנת המשכל של הילדים בגיל זה במדינה . 105 H1 : מנת המשכל של הילדים בישוב גבוהה ממנת המשכל של הילדים בגיל זה במדינה . .2 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 63 .3 תחומי דחייה וקבלה להשערת האפס תחום דחית H 0 תחום קבלת S C 0 t( n1),(1 ) n 10.259 108.96 20 H0 C 105 1.729 108.96 112 105 דוחים את השערת האפס. .4 החלטה מנת המשכל של ילדי הישוב נמצאת מעבר לגבול הקריטי כלומר בתחום דחיית השערת האפס. נדחה את השערת האפס – מנת המשכל הממוצעת אצל ילדי הישוב גבוהה ממנת המשכל של הילדים במדינה. .5 טעות אפשרית דחינו את H 0הטעות האפשרית -דחינו את השערת האפס בזמן שהשערת האפס נכונה . כלומר טעות מסוג ראשון . 112 105 ההסתברות ה"אמיתית" לטעות מסוג זה במחקר זה היא 3.052 : 2.293 ברמה של 19דרגות חופש הערך נמצא מתאים ל0.995 1 0.9995 - 0 S ) n t19,(1 ) ( 0.0005 0.005 כלומר הסיכוי לשגיאה במסקנה הוא בין 0.5% - 0.05% בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.0005 ' 0.005 df 19 0.995 1 ' 0.9995 112 105 3.052 10.259 ( ) 20 t19,1 ' ) 0.005) (0.05 ' (0.0005 דוחים את השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 64 בדיקה ע"י השוואת ערכי t t19,0.95 1.729 112 105 3.052 2.293 tSTAT tSTAT tCRITICALדוחים את השערת האפס )tSTAT (3.052) t (1.729 ג. 0 S n tSTAT t( n 1)(1 ') tSTAT tCRITICAL מקבלים את השערת האפס דוחים את השערת האפס הטענה -בישוב ב רמת המשכל הממוצעת היא 10%( 115.5יותר מהממוצע הארצי ) הרעיון הוא לבדוק זאת מול ישוב א בו הממוצע הוא . 112 מבחן חד כווני כלפי מעלה ג1. השערות : H 0 : 112מנת המשכל של הילדים בישוב ב אינה גבוהה ממנת המשכל של הילדים בגיל זה בישוב א. H1 : 112מנת המשכל של הילדים בישוב ב גבוהה ממנת המשכל של הילדים בגיל זה בישוב א. ג.2. ג3. 0.05 תחומי דחייה וקבלה להשערת האפס תחום דחית H 0 תחום קבלת S C 0 t( n1),(1 ) n 10.259 115.96 20 C 112 1.729 מקבלים את השערת האפס. ג4. H0 115.5 115.96 112 החלטה מנת המשכל של ילדי ישוב ב נמצאת בתחום קבלת השערת האפס .נקבל את השערת האפס – מנת המשכל הממוצעת אצל ילדי ישוב ב אינה גבוהה ממנת המשכל של הילדים בישוב א. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 65 ג5. טעות אפשרית קבלנו את H 0הטעות האפשרית -קבלנו את השערת האפס בזמן שהשערת המחקר נכונה . כלומר טעות מסוג שני . 115.96 115.5 0.2 2.293 C S ) n t19,(1 ) ( ברמה של 19דרגות חופש הערך נמצא מתאים ל1 0.6 - , 0.4 כלומר הסיכוי לשגיאה במסקנה הוא גדול מ - 40%-סיכוי גבוה מאוד וזאת מאחר ו C-ו -מאוד קרובים. בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.05 ' 0.1 df 19 0.9 1 ' 0.95 115.5 112 1.526 10.259 ( ) 20 t19,1 ' ' (0.05 מקבלים את השערת האפס. ) 0.1) (0.05 בדיקה ע"י השוואת ערכי t t19,0.95 1.729 115.5 112 1.256 10.259 ( ) 20 tSTAT tCRITICALדוחים את השערת האפס )tSTAT (1.256) t (1.729 tSTAT 0 S n tSTAT tCRITICAL tSTAT t( n 1)(1 ') מקבלים את השערת האפס מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 66 ד. אם מנת המשכל הממוצעת בישוב ב היא 120אזי נדחה את השערת האפס כלומר טעות מסוג ראשון . ההסתברות לטעות מסוג זה במחקר זה היא: 120 112 3.48 2.293 0 S ) n t19,(1 ) ( ברמה של 19דרגות חופש הערך נמצא מתאים ל0.995 1 0.9995 - 0.0005 0.005 כלומר הסיכוי לשגיאה במסקנה הוא בין 0.5% - 0.05% .4 החוקר בדק מדגם של 5אנשים בהשערה דו כיוונית ,נחשב את ' עבור t 2.611 0.05 ' 0.1 0.975 ' 2 0.95 1 2.611 2 4,1 t 2 n1,1 t ' דוחים את השערת האפס ' מקבלים את השערת האפס כלומר כאשר 0.5נדחה בוודאות את השערת האפס וכאשר 0.05מקבלים את השערת האפס. התשובה הנכונה היא א. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 67 הסקה על הפרש תוחלות (ממוצעים) של שתי אוכלוסיות בלתי תלויות בהסקה ע"פ מדגם אחד למדנו לאמוד את ערכו של הפרמטר ולבדוק השערות ביחס לערכו. נרחיב את הדיון להסקה סטטיסטית המתבססת על שני מדגמים מקריים מהם נלמד על הפרש הממוצעים 12 1 2ועל יחס השונויות 22 ,איננו מתעניינים בערכו של כל פרמטר אלא בקשרים ביניהם . ישנם מקרים רבים בהם אנו מתעניינים ורוצים ללמוד ולהסיק על הקשרים בין שני ממוצעים ולא על כל ממוצע בנפרד ,הדבר בה לידי ביטוי כאשר הנושא עליו אנו רוצים ללמוד/להסיק הוא הקשר/ההבדלים בין שתי תופעות. לדוגמא: נערוך השוואה בין יכולות של נשים כטייסות קרב ליכולתם של גברים כטייסי קרב . אם נשווה את ממוצע הפגיעות במטרה ונמצא כי 1 2 0הרי נוכל להסיק כי אין הבדל בתפקוד כטייסי קרב בין גברים ונשים. נערוך השוואה בין שני סוגי טיפול שונים השוואת ציונים של שתי שיטות לימוד ,בין שני סוגי תרופות וכו'. קבוצת טיפול וקבוצת ביקורת – במחקרים רבים ,מחקרים אשר בודקים בהם הליך מסוים ולא מחקרי איסוף ישנן קבוצות מחקר וקבוצות ביקורת: בודקים השפעת תרופה מסוימת ,לוקחים שתי קבוצות אחת מקבלת את התרופה והשנייה מקבלת את אותה תרופה אבל חסרת השפעה אמיתית (בשפה המחקרית הפעולה נקראת פלסבו) במטרה לנטרל כל השפעה מלבד הגורם הנבדק המהלכים זהים ויותר מכך כולם בטוחים שהם מקבלים אותה פרוצדורה ,בסוף התהליך יש להשוות בין שתי האוכלוסיות – ממוצעים שונויות וכו'. כאשר עוסקים בהסקה סטטיסטית לפי שני מדגמים יש להבחין בין שני מדגמים בלתי תלויים לבין שני מדגמים תלויים -מזווגים: מדגמים בלתי תלויים – שני המדגמים נבחרים באופן מקרי ,אין תלות בין בחירת המקרים למדגם א לבין בחירתם למדגם ב . דוגמא – לוקחים מדגם בגודל nמבין החיילות הקרביות ומדגם בגודל nמבין החיילים הקרביים (אין הכרח שגודל המדגמים יהיה שווה) מדגמים מזווגים -שני המדגמים בנויים כזוגות של תצפיות ,כלומר לכל פרט במדגם א מותאם פרט ממדגם ב , בין זוגות התצפיות קיימת אי תלות ,שני מדגמים מזווגים הם מדגמים מותאמים סטטיסטית כלומר בין שני המדגמים קיים מתאם /קשר ליניארי. דוגמא: בודקים השכלה של הורים והשכלת ילדיהם. בודקים השפעה של תרופה להורדת לחץ דם על מדגם של חולים – לפני לקיחת התרופה ואחריה – מדגם אחד – לפני ואחרי הוא למעשה שני מדגמים מזווגים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 68 השוואת ממוצעים בין שני מדגמים בלתי תלויים הסקה סטטיסטית על הפרש ממוצעים מתבססת גם היא על משפט הגבול המרכזי: משפט הגבול המרכזי -אם מתוך אוכלוסייה בעלת ממוצע וסטית תקן ,נוציא את כל המדגמים האפשריים בגודל .nסדרת ממוצעי כל המדגמים תתפלג נורמאלית ,עם ממוצע וסטית תקן הנקראת טעות התקן ושווה ל- בניסוח סטטיסטי n . 2 x ~ N , n נורמלית שונות (ריבוע סטית התקן) השווה לריבוע טעות התקן ממוצע ממוצעי המדגמים מתפלג ממוצע השווה לממוצע האוכלוסייה כאשר עוסקים בשתי אוכלוסיות בלתי תלויות ניתן לומר כי השונות של סכום או הפרש בין שני משתנים מקריים בלתי תלויים היא: ) 2 ( X Y ) 2 ( x) 2 (Y 22 22 n2 n2 12 2(X Y) 12 (X Y) n1 n1 ניתן לנסח את הטענה הבאה: אם משתי אוכלוסיות נוציא את כל המדגמים האפשריים בגודל n2 n1אזי התפלגות הדגימה של הפרשי הממוצעים בכל מדגם X 1 X 2שואפת להתפלגות נורמאלית עם ממוצע 1 2 וטעות תקן 22 n2 12 n1 12 22 ( X 1 X 2 ) ~ N 1 2 , ברישום סטטיסטי n1 n2 נורמלית שונות (ריבוע סטית התקן) השווה לסכום ריבועי טעות התקן ,של כל קבוצה ההפרש בין ממוצעי המדגמים מתפלג ממוצע השווה לממוצע להפרש ממוצעי האוכלוסיות © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 69 רווח בר סמך להפרש ממוצעים 12 2 2 12 2 2 (X1 X 2) Z 2 1 ( X 1 X 2 ) Z ) (1 ) (1 n1 n2 n1 n2 2 2 כפי שחישבנו רווח בר סמך לממוצע ניתן לחשב רווח בר סמך להפרש ממוצעים ,מאחר ואנו עוסקים בשני מדגמים ,נתייחס לטעות התקן המשותפת. שאלה : חוקר מעוניין לאמוד את הפרש ממוצעי הגבהים בין בנים ובנות בגילאים , 13החוקר דגם 100בנים ו 100-בנות בגילאי 13ומצא כי ממוצע גובה הבנות היה 160ס"מ וממוצע גובה הבנים היה 156ס"מ ידוע כי סטית התקן לגובה הבנות בגיל זה היא 7ס"מ וסטית התקן לגובה הבנים היא 3.5ס"מ. בנו רווח בר סמך להפרש הממוצעים ברמת סמך של 0.98 נתונים: 2 בנים: 3.52 0.1225 n 100 2 בנות: 72 0.49 n 100 0.1225 0.49 0.7826 22 n2 12 n1 n2 100 n1 100 2 3.5 X 2 156 1 7 Z 0.99 2.33 0.02 ) 2 X 1 160 (1 Z ) (1 2 Z (160 156) 2.33 0.7826 2 1 (160 156) 2.33 0.7826 2.1765 2 1 5.8234 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 70 בדיקת השערות כאשר 2 1 -סטיות התקן ידועות במטרה לבדוק את הבדלים בין שתי שיטות להוראה במתמטיקה מבחינת רמת ההישגים נלקחו שני מדגמים לבדיקת הטענה כי שיטה א עדיפה על פני שיטה ב. מדגם של n1=60סטודנטים למדו ע"פ שיטה א מדגם של n2=40סטודנטים למדו ע"פ שיטה ב. בבחינת הסיום נתקבלו התוצאות X 2 72 : X 1 76 1 8 כמו כן סטיות התקן בשתי האוכלוסיות ידועות 2 6 בדקו את הטענה ברמת מובהקות של 0.05 מבחן סטטיסטי מבחן חד כיווני כלפי מעלה א. השערות : 1 2 0 H0 : 1 2 0 H1 :ממוצע הציונים בשיטה א גבוה יותר אין הבדל בין ממוצעי הציונים בין השיטות ב. רמת מובהקות 0.05 ג. תחומי קבלה /דחייה לH 0 - 22 השערה חד כיוונית - n2 12 n1 82 6 2 1.4 60 40 Z1 Z10.05 Z0.95 1.65 C 1 2 Z1 22 n2 12 n1 1 2 0 C 0 1.4 1.65 2.31 הוא הגבול הקריטי --2.31אם ההפרש בין שני הממוצעים קטן מ 2.31-נקבל את H 0 תחומי קבלה /דחייה לH 0 - תחום דחית H 0 תחום קבלת H0 דוחים את השערת האפס. 4 2.31 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 0 71 ד. החלטת החוקר נדחה את השערת האפס ונקבל את השערת המחקר – מאחר וההפרש בין הממוצעים הוא , 4נמצא בתחום דחיית השערת האפס -יש הבדל בין ממוצעי השיטות לשיטה א הישגים גבוהים יותר. ה. השגיאה האפשרית דחינו את השערת האפס ,השגיאה האפשרית -דחינו את השערת האפס בזמן שהיא נכונה -שגיאה מסוג , 0.05ברמת הגדרת המחקר יש סיכוי של 5%לטעות. ראשון - ההסתברות האמיתית לשגיאה היא רמת המובהקות הקטנה ביותר בה עדיין נקבל את אותן מסקנות כל עוד C>4נקבל את אותן מסקנות – רמת המובהקות המינימאלית (סעיף ג) (X 1 X 2 ) 0 22 n2 12 Z 1 ' רמת המובהקות הקטנה ביותר לדחיית H 0היא . ' 0.0021 רמת המובהקות המינימאלית ,לטעות מסוג ראשון היא ,0.0021כלומר n1 40 2.86 1.4 1 ' 0.9979 ' 0.0021 Z 1 ' בכל רמת מובהקות הגדולה מ 0.0021-נדחה את השערת האפס. הערך שקיבלנו קטן מ C-המשמעות היא שיכולנו להשתמש ב C-קטן יותר ועדיין להגיע לאותן מסקנות ולהחליט את אותן החלטות. בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 22 n2 ' 0.0021 12 ' Z (1 ') ' n1 1 ' 0.9979 ) ' (0.0021) (0.05 דוחים את השערת האפס 40 2.86 1.4 מקבלים את השערת האפס Z1 ' דוחים את השערת האפס. בדיקה ע"י השוואת ערכי Z Z 0.95 1.65 40 2.86 1.4 Z STAT ) ( X 1 X 2 ) ( 1 2 22 n2 12 Z STAT Z1 ' n1 ערך Zהנבדק נקרא גם - Z Criticalערך Zהמוביל אותנו לגבול הקריטי Z STAT ZCRITICALדוחים את השערת האפס )Z STAT (2.86) Z (1.65 Z STAT ZCRITICAL מקבלים את השערת האפס דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 72 תרגילים .1 חוקר טוען כי בגילאי 13בנות רציניות יותר מבנים ולכן ממוצע הציונים שלהן גבוה ממוצע ציוני הבנים במטרה לבדוק את טענתו ,החוקר דגם 80בנים ו 80-בנות בגילאי 13ומצא כי ממוצע ציוני הבנות היה 81 וממוצע ציוני הבנים היה ,78ידוע כי סטית התקן לציוני הבנות בגיל זה היא 7 וסטית התקן לציוני הבנים היא 5בדקו את הטענה ברמת מובהקות של 0.05 .2 מנהל תיקי השקעות רצה לבחון הבדלים בתשואות בין שני אפיקי השקעה ,סולידי וספקולטיבי לאחר חודש של ירידות בו ירד האפיק הסולידי ב 2%-והספקולטיבי ב. 12%- המנהל לקח מדגם מקרי של 16תיקים "סולידיים" ו 20-תיקים ספקולטיביים ובדק את התשואה הממוצעת במשך 12חודשים .הממצאים היו :האפיק הסולידי עלה בממוצע ב 10%-ואילו האפיק הספקולטיבי עלה ב 17%-כמו כן ידוע כי סטית התקן בתיקים הסולידיים היא 2%ובתיקים הספקולטיביים .10% א. בנו רווח בר סמך לתשואה השנתית הממוצעת בכל אחד מאפיקי ההשקעות ברמת סמך של .0.95 ב. בצע מבחן עבור מנהל התיקים ברמת מובהקות של .0.05 .3 נערך מחקר במטרה לקבוע הבדלים ביכולת אצל ילדים בעלי הפרעות קשב וריכוז במטרה לקבוע אם מינון גבוה של ריטלין ישפר את היכולת .קבוצה א בת 50נבדקים קיבלה 10מ"ג ריטלין ביום וקבוצה ב בת 30 נבדקים 5מ"ג .נערך מבחן זהה לשתי הקבוצות ,קבוצה א הממוצע היה 83ואילו בקבוצה ב 80ידוע כי סטית התקן באוכלוסייה במבחן זה היא . 6 א בנו רווח בר סמך להפרש הממוצעים בין שתי רמות הריטלין ,ברמת סמך של .0.98 ב. בדוק את הטענה ברמת מובהקות של .0.04 .4 קיימת טענה כי נשים מעל גיל ( 35אוכלוסייה ב) מעלות יותר משקל במהלך הריון מאשר נשים עד גיל 25 (אוכלוסייה א) ,החוקר דגם 30נשים בהריון בכל שכבת גיל ומצא כי בממוצע אישה מעל גיל 35מעלה 14.5ק"ג בהריון ואילו אישה מתחת לגיל 25מעלה בממוצע 12.5ק"ג בהריון .ידוע כי סטית התקן באוכלוסיית נשים א היא 4 ק"ג ואילו באוכלוסייה ב הסטייה היא 2.3ק"ג ,בדקו את הטענה ברמת מובהקות של . 0.03 .5 השערת האפס ( ) Hoהיא שאין הבדל בין תוחלות זמן השיחה בטלפון סלולארי בין שתי ערים. ההשערה האלטרנטיבית ( ) H1היא שתוחלות זמן השיחה בטלפון סלולארי בשתי הערים שונות. לבדיקת השערות אלו נלקחו שני מדגמים (אחד מכל עיר) וחושבו הנתונים הבאים (בדקות) עיר א' 7.98 ממוצע מדגם 4.84 סטית תקן של האוכלוסייה 10 גודל המדגם בהנחה שזמני השיחה בשתי הערים בלתי תלויים ומתפלגים נורמאלית. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע עיר ב' 4.32 3.61 12 73 א. ברמת מובהקות של 5%נדחה ,Hoאך לא ברמת מובהקות של .1% ב. ברמת מובהקות 1%נדחה .Ho ג. ברמת מובהקות 5%נקבל Ho ד תשובות א' עד ג' אינן נכונות. .6 במסגרת סקר שיווק רוצים להשוות בין זמן הגלישה של נשים מבוגרות לזמן גלישה של גברים מבוגרים. במדגם מקרי של 65נשים נמצא שזמן הגלישה הממוצע היה 22שעות במדגם מקרי של 60גברים נמצא ממוצע של 18שעות .ידוע שסטיית התקן של זמן הגלישה הן של גברים והן של נשים היא .5 האם יש הבדל משמעותי בין זמן גלישה של גברים לזמן גלישה של נשים ? בדוק ברמת מובהקות של .0.05 .7 בדיקת גובה החשבון החודשי עבור השימוש בטלפון הסלולארי בקרב לקוחות בגילאים שונים הראתה תוצאות הבאות: קבוצת גיל מספר חשבונות שנבדקו גובה חשבון ממוצע סטית התקן באוכלוסיה 20-30 8 200 40 30-40 7 190 43 בנוסף נבדקו גם 9חשבונות של לקוחות בגילאים .40-50נתוני המדגם הם: 160 ,240 170 ,160 ,160 ,230 ,150, 210 ,200 א. השווה בין תוחלות גובה החשבון של לקוחות בגילאים 20-30ובגילאים 40 -30רמת מובהקות של .5% ב. בנה רווח סמך לתוחלת גובה החשבון החודשי בגילאים 20-30ברמת סמך של . 90% ג. פי כמה יגדל הרווח אם רמת הסמך תעלה ל?98%- הנח שסטית התקן של גובה החשבון החודשי באוכלוסיית לקוחות בני 40-50ידועה ושווה ל.35 - ד. מצא את רמת המובהקות המינימאלית בה ניתן לדחות את השערת האפס כאשר בודקים השערה שתוחלת גובה התשלום של לקוחות בגילאים 50-40שווה ל 210-שקלים כנגד אלטרנטיבה שתוחלת זו נמוכה יותר. ה. מהו מספר החשבונות המינימאלי שיש לבחור במטרה לבנות רווח סמך לתוחלת גובה החשבון החודשי של לקוחות בגילאים 50-40ברמת סמך של 95%כדי שאורך הרווח לא יעלה על 15שקלים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 74 פתרונות .1 מבחן חד כווני כלפי מעלה נתונים : בנות 7 - n 80 X 1 81 5 n 80 X 2 78 בנים: X1 X 2 3 א. השערות : 1 2 0 H 0 :ממוצע ציוני הבנות אינו גבוה ממוצע ציוני הבנים 1 2 0 H1 :ממוצע ציוני הבנות גבוה יותר ממוצע הבנים ב. רמת מובהקות 0.05 ג. תחומי קבלה ודחית H 0 22 השערה חד כיוונית - n2 12 n1 C 1 2 Z1 52 7 2 0.9617 80 80 Z 1 Z 1 0.05 Z 0.95 1.65 22 n2 12 n1 1 2 0 C 0 0.9617 1.65 1.58 1.58הוא הגבול הקריטי ,אם ההפרש בין שני הממוצעים קטן מ 1.58 -נקבל את H 0 תחום דחית H 0 תחום קבלת H0 3 1.58 0 דוחים את השערת האפס. ד. החלטת החוקר נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים הוא - 3נמצא בתחום דחיית השערת האפס ,ממוצע ציוני הבנות גבוה מממוצע ציוני הבנים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 75 ה. השגיאה האפשרית דחינו את השערת האפס -השגיאה האפשרית היא -דחינו את השערת האפס בזמן שהיא נכונה ,שגיאה מסוג , 0.05בהתאם להגדרת המחקר יש סיכוי של 5%לטעות. ראשון ההסתברות האמיתית לשגיאה היא למעשה רמת המובהקות הקטנה ביותר(המינימאלית) בה עדיין נקבל את אותן מסקנות ,כל עוד C<3נקבל את אותן מסקנות.. (X 1 X 2 ) 0 22 n2 12 Z 1 ' נחשב את השגיאה ע"פ הנקודה הקיצונית ביותר בה היינו מקבלים את אותן מסקנות -הפרש הממוצעים ,נחשב את ההסתברות באמצעות n1 טבלת ההתפלגות הנורמאלית 30 3.12 0.9617 1 ' 0.9991 ' 0.0009 Z 1 ' ההסתברות לשגיאה היא – 0.0009סיכוי של 0.09%לשגיאה. בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 22 n2 ' 0.0009 12 Z (1 ') ' n1 30 3.12 0.9617 1 ' 0.9991 ) ' (0.0009) (0.05 ' דוחים את השערת האפס מקבלים את השערת האפס Z1 ' דוחים את השערת האפס. בדיקה ע"י השוואת ערכי Z Z 0.95 1.65 30 3.12 0.9617 Z STAT ) ( X 1 X 2 ) ( 1 2 22 n2 12 Z STAT Z1 ' n1 ערך Zהנבדק נקרא גם - Z Criticalערך המוביל אותנו לגבול הקריטי Z STAT ZCRITICALדוחים את השערת האפס )Z STAT (3.12) Z (1.65 Z STAT ZCRITICAL מקבלים את השערת האפס דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 76 נתונים :תיק מניות ספקולטיבי .2א. תיק מניות סולידי 10 n 20 X 1 17 2 n 16 X 1 10 X 1 X 2 17 10 7 102 22 2.291 20 16 22 n2 Z 1 0.025 Z 0.975 1.96 22 n2 12 ) (1 2 n1 2 1 ( X1 X 2 ) Z 22 n2 12 n1 Z 1 2 12 ) (1 2 n1 ( X1 X 2 ) Z 7 1.96 2.291 1 2 7 1.96 2.291 2.5 1 2 11.49 .2ב. מבחן דו כווני – רוצים לבחון הבדלים בתשואות בין שני התיקים – אין כוון ברור א. השערות : 1 2 0 H0 : אין הבדל בתשואות בין שני תיקי המניות 1 2 0 H1 : יש הבדל בתשואות בין שני תיקי המניות ב. רמת מובהקות 0.05 ג. תחומי קבלה /דחייה לH 0 - השערה דו כיוונית – יש לחשב שני גבולות קריטיים: 22 n2 12 n1 C1 1 2 Z 1 2 Z10.025 Z0.975 1.96 Z 1 2 C1 0 2.291 1.96 4.49 22 n2 12 n1 C 2 1 2 Z 1 2 102 22 2.291 20 16 22 n2 12 n1 1 2 0 C2 0 2.291 1.96 4.49 4.49הוא הגבול הקריטי ,אם ההפרש בין שני הממוצעים קטן מ 4.49 -נקבל את H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 77 תחום דחית H 0 תחום קבלת H0 4.49 7 4.49 0 X 1 X 2 17 10 7 דוחים את השערת האפס. ד. החלטת החוקר ההפרש בין הממוצעים הוא - 7נמצא בתחום דחיית השערת האפס ,נדחה את השערת האפס ונקבל את השערת המחקר -יש הבדל בין ממוצעי התשואות בין שני סוגי התיקים ,בתיק הספקולטיבי התשואות גבוהות יותר. ה. השגיאה האפשרית דחינו את השערת האפס ,השגיאה האפשרית -דחינו את השערת האפס בזמן שהיא נכונה כלומר שגיאה מסוג - 0.05ברמת הגדרת המחקר יש סיכוי של 5%שטעינו. ראשון הסיכוי "האמיתי" לשגיאה -ההסתברות האמיתית לשגיאה היא בעצם רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן מסקנות . (X 1 X 2) 0 Z 1 12 2 2 נחשב את השגיאה ע"פ הנקודה הקיצונית ביותר בה היינו מקבלים n1 n2 את אותן מסקנות -הפרש הממוצעים ,נחשב את ההסתברות באמצעות 70 Z 3.055 טבלת ההתפלגות הנורמאלית 1 2 . 291 2 הסיכוי לשגיאה מסוג זה הוא . 0.22% 1 0.09989 0.0022 2 בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 22 n2 ' 0.0022 12 ) ' 2 (1 Z ' n1 0.9989 ) ' (0.0022) (0.05 ' דוחים את השערת האפס ' 2 1 70 3.05 2.291 ' 2 מקבלים את השערת האפס Z 1 דוחים את השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 78 בדיקה ע"י השוואת ערכי Z 70 3.055 2.291 Z 0.975 1.96 Z STAT ) ( X 1 X 2 ) ( 1 2 2 2 n2 Z STAT ZCRITICALדוחים את השערת האפס )Z STAT (3.055) Z (1.96 .3א. 12 ' 2 Z STAT Z 1 n1 Z STAT ZCRITICAL מקבלים את השערת האפס דוחים את השערת האפס נתונים :מינון של 10מ"ג מינון של 5מ"ג 6 n 50 X 1 83 6 n 30 X 1 80 X 1 X 2 83 80 3 62 62 1.3856 50 30 22 n2 Z 1 0.01 Z 0.99 2.33 22 n2 12 n1 ) (1 2 2 1 ( X1 X 2 ) Z 22 n2 12 n1 Z 1 2 12 n1 ) (1 2 ( X1 X 2 ) Z 3 2.33 1.3856 1 2 3 2.33 1.3856 0.228 1 2 6.22 .3ב. סוג המבחן – על פניו נראה כי לפנינו מבחן דו כיווני מאחר והרעיון הוא לקבוע אם יש הבדלים בין מינוני רטלין שונים ,אולם המשך השאלה – "במטרה לקבוע אם מינון גבוה ישפר את היכולת" מוביל אותנו למבחן חד כיווני בו המטרה לבדוק האם מינון של 10מ"ג יגרום תוצאות טובות יותר ממינון של 5מ"ג. א. השערות : 1 2 0 H0 : אין הבדל בין שתי רמות הרטלין 1 2 0 H1 : מינון של 10מ"ג רטלין ישפר את היכולת ביחס למינון של 5מ"ג ב. רמת מובהקות 0.04 ג. תחומי קבלה /דחייה לH 0 - © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 79 22 השערה חד כיוונית - n2 12 C 1 2 Z 1 n1 62 62 1.3856 Z 1 Z 10.04 Z 0.96 1.75 50 30 C 0 1.3856 1.75 2.42 22 n2 12 n1 1 2 0 כלומר 2.42הוא הגבול הקריטי -אם ההפרש בין שני הממוצעים קטן מ 2.42 -נקבל את H 0 תחום דחית H 0 תחום קבלת H0 X 1 X 2 83 80 3 3 2.42 0 דוחים את השערת האפס. החלטת החוקר ד. נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים הוא , 3הפרש זה נמצא בתחום דחיית השערת האפס שהוא התחום שמעל - , 2.36מינון של 10מ"ג רטלין משפר את ההישגים יותר ממינון של 5מ"ג. ה. השגיאה האפשרית דחינו את השערת האפס ,השגיאה האפשרית -דחינו את השערת האפס בזמן שהיא נכונה כלומר שגיאה מסוג , 0.04סיכוי של 4%לטעות בהתאם להגדרת המחקר . ראשון ההסתברות האמיתית לשגיאה היא בעצם רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן מסקנות כל עוד C>3נקבל את אותן מסקנות. (X 1 X 2) 0 22 n2 12 Z 1 נחשב את השגיאה ע"פ הנקודה הקיצונית ביותר בה היינו מקבלים את אותן מסקנות -הפרש הממוצעים ,נחשב את ההסתברות באמצעות n1 30 2.165 1.3856 1 0.9850 0.015 Z 1 טבלת ההתפלגות הנורמאלית הסיכוי לשגיאה מסוג זה הוא 1.5% בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 22 n2 ' 0.015 12 Z (1 ') ' n1 1 ' 0.9850 ) ' (0.015) (0.04 ' 30 2.165 1.3856 דוחים את השערת האפס מקבלים את השערת האפס Z1 ' דוחים את השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 80 בדיקה ע"י השוואת ערכי Z Z 0.96 1.75 30 2.165 1.3856 ) ( X 1 X 2 ) ( 1 2 Z STAT 2 2 n2 Z STAT ZCRITICALדוחים את השערת האפס )Z STAT (2.165) Z (1.75 .4 12 Z STAT Z1 ' n1 Z STAT ZCRITICAL מקבלים את השערת האפס דוחים את השערת האפס מבחן חד כווני כלפי מעלה הטענה הנבדקת היא – נשים מעל גיל 35מעלות יותר משקל בהריון מנשים מתחת לגיל . 25 מעל גיל - 35 2.3 n 30 X 1 14.5 מתחת לגיל - 25 4 n 30 X 1 12.5 נתונים : X1 X 2 2 א. השערות : 1 2 0 H 0 :נשים מעל גיל 35אינן מעלות יותר משקל בהריון מנשים מתחת לגיל 25 1 2 0 H1 :נשים מעל גיל 35מעלות יותר משקל בהריון מנשים מתחת לגיל 25 ב. רמת מובהקות 0.03 ג. תחומי קבלה /דחייה לH 0 - 22 השערה חד כיוונית - n2 12 n1 C 1 2 Z1 2.32 42 0.8424 30 30 Z 1 Z 10.03 Z 0.97 1.88 22 n2 12 n1 1 2 0 C 0 0.8424 1.88 1.583 1.583הוא הגבול הקריטי ,אם ההפרש בין שני הממוצעים גדול מ 1.583 -נדחה את H 0 תחום דחית H 0 תחום קבלת H0 דוחים את השערת האפס. 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 1.583 0 81 ד. החלטת החוקר נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים הוא - 2נמצא בתחום דחיית השערת האפס ,מקבלים את השערת המחקר – נשים מעל גיל 35מעלות יותר משקל בהריון מנשים מתחת לגיל .25 ה. השגיאה האפשרית דחינו את השערת האפס ,השגיאה האפשרית -מסוג , 0.03 ברמת הגדרת המחקר. ההסתברות האמיתית לשגיאה היא בעצם רמת המובהקות הקטנה ביותר בה עדיין נקבל את אותן מסקנות . 1 0.9911 0.0089 20 2.374 0.8424 (X 1 X 2) 0 Z 1 22 n2 הסיכוי האמיתי לשגיאה – רמת המובהקות המינימאלית 0.089% 12 Z 1 n1 בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 22 n2 12 Z (1 ') ' דוחים את השערת האפס ' n1 20 2.37 1 ' 0.9911 ' 0.0089 0.8424 דוחים את השערת האפס. ) ' (0.0089) (0.03 מקבלים את השערת האפס Z1 ' בדיקה ע"י השוואת ערכי Z Z 0.97 1.88 20 2.37 0.8424 Z STAT ) ( X 1 X 2 ) ( 1 2 2 2 n2 Z STAT ZCRITICALדוחים את השערת האפס )Z STAT (2.37) Z (1.88 .5 12 Z STAT Z1 ' n1 Z STAT ZCRITICAL מקבלים את השערת האפס דוחים את השערת האפס השערה דו כיוונית להפרשי ממוצעים ,סטיות תקן באוכלוסיה ידועות – התפלגות . Z 1 2 0 H 0 :אין הבדל בין זמן שיחות הטלפון בין שתי הערים 1 2 0 H1 :קיים הבדל בין זמן שיחות הטלפון בין שתי הערים נבדוק גבולות קריטיים עבור 0.05 , 0.01 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 82 4.842 3.612 3.62 10 12 C 1.96 22 22 n2 4.842 3.612 C 2.57 4.74 10 12 n2 12 n1 12 n1 C 0 Z 0.975 C 0 Z 0.995 ההפרש בין הממוצעים הוא 3.66לכן עבור 5%נדחה את השערת האפס ועבור 1%מקבלים את השערת האפס . תשובה א' נכונה .6 מבחן דו כווני: נתונים : נשים 5 : n 65 X 1 22 גברים 5 : n 60 X 2 18 X1 X 2 4 א. השערות : 1 2 0 H 0 :אין הבדל בזמן הגלישה בין גברים לנשים. 1 2 0 H1 :קיים הבדל בזמן הגלישה בין גברים לנשים. ב. רמת מובהקות 0.01 ג. תחומי קבלה /דחייה לH 0 - 22 השערה דו כיוונית - Z 0.975 1.96 n2 Z 0.05 1 2 Z 1 2 12 n1 C 1 2 Z 1 2 52 52 0.8951 60 65 22 n2 12 n1 1 2 0 C 0 0.8951 1.96 1.754 1.754הוא הגבול הקריטי ,אם ההפרש בין שני הממוצעים קטן מ 1.754 -נקבל את H 0 תחום דחית H 0 תחום קבלת H0 4 1.754 0 דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 83 ד. החלטת החוקר נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים , 4 -נמצא בתחום דחיית השערת האפס ,קיים הבדל בין זמן הגלישה בין נשים וגברים. ה. השגיאה האפשרית דחינו את השערת האפס -השגיאה האפשרית -דחינו את השערת האפס בזמן שהיא נכונה , , 0.01בהתאם להגדרת המחקר הסיכוי לשגיאה . 1% שגיאה מסוג ראשון ההסתברות האמיתית לשגיאה היא למעשה רמת המובהקות הקטנה ביותר(המינימאלית) בה עדיין נקבל את אותן מסקנות ,כל עוד C<4נקבל את אותן מסקנות.. (X 1 X 2) 0 22 n2 12 נחשב את השגיאה ע"פ הנקודה הקיצונית ביותר בה היינו מקבלים את אותן מסקנות -הפרש הממוצעים ,נחשב את ההסתברות באמצעות n1 40 4.46 0.8951 ' 0.0004 Z 1 0.9998 Z ' 1 2 ' 2 טבלת ההתפלגות הנורמאלית ההסתברות לשגיאה היא – 0.0004הסיכוי לשגיאה .0.04% 1 בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 22 n2 ' 0.0004 12 Z (1 ') ' n1 0.9998 ) ' (0.0004) (0.05 ' דוחים את השערת האפס ' 2 1 40 4.46 0.8951 מקבלים את השערת האפס ' 2 1 Z דוחים את השערת האפס. בדיקה ע"י השוואת ערכי Z Z C Z 0.975 1.96 40 4.46 0.8951 Z STAT ) ( X 1 X 2 ) ( 1 2 2 2 n2 2 1 ' 2 1 Z STAT Z n1 ערך Zהנבדק נקרא גם - Z Criticalערך המוביל אותנו לגבול הקריטי Z STAT ZCRITICALדוחים את השערת האפס )Z STAT (4.46) Z (1.96 Z STAT ZCRITICAL מקבלים את השערת האפס דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 84 .7 מבחן להשוואת ממוצעים ,סטיות תקן באוכלוסיה ידועות – מבחן , Zמבחן דו כיווני 1 40 X 1 200 n1 8 20 35 2 43 X 2 190 n2 7 30 40 1 2 0 X 1 X 2 10 H 0 :אין הבדל בין הגילאים בגובה הממוצע של חשבון הטלפון 1 2 0 H1 :קיים הבדל בין הגילאים בגובה הממוצע של חשבון הטלפון רמת מובהקות 0.05 40 2 43 2 42.26 8 7 22 C 0 1.96 n2 12 n1 2 1 C 1 2 Z תחום דחית H 0 תחום קבלת H0 10 42.26 0 42.26 הפרש הממוצעים נמצא בתחום קבלת השערת האפס – נקבל את השערת האפס אין הבדל בגובה החשבון. ב. רווח בר סמך n ) 2 (1 X Z n 40 40 200 1.65 8 8 176.66 223.34 ג. ) 2 (1 X Z 200 1.65 ערך Zבטבלה עבור 98%הוא , 2.33ערך Zבטבלה עבור 90%הוא 1.65מאחר והערך עבור 98% גדול פי 1.41המשמעות היא שהרווח יגדל פי 1.41 ד. 0 210 40 X 3 186.66 n3 9 40 50 רמת המובהקות הקטנה ביותר – ה -המינימאלית מתקבלת כאשר ( . C המרחק בין ל - 0 -ערך מוחלט) 210 186.66 2 35 ) ( 9 Z1 0 Z1 ( ) n 1 0.9772 0.0228 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 85 ה. אורך הרווח הוא 15כלומר אורך מחצית הרווח הוא 7.5 n ) (1 2 7.5 X Z n 35 1.96 n ) (1 2 7.5 n X Z ) (1 2 Z 2 84 n © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 1.96 35 n 7.5 86 הסקה סטטיסטית על הפרש ממוצעים -סטיות התקן אינן ידועות כאשר סטיות התקן אינן ידועות ,יש להבחין בין שני מצבים: סטיות התקן אינן ידועות אך שוות - 1 2 סטיות התקן אינן ידועות ואינן שוות - 1 2 סטיות תקן אינן ידועות – אך שוות כאשר אנו טוענים לסטיות תקן שוות ,אין הכוונה לשוויון מלא כלומר זהות בין סטיות התקן אלא שוויון סביב טווח מסוים ,בדומה לבדיקת שוויון בין ממוצעים ,ניתן לבצע מבחן לבדיקת שוויון בין שונויות ,כלומר קיים מבחן להשוואה בין שונויות בו מגדירים גבולות קריטיים ובהתאם לכך ניתן לקבוע האם השונויות /סטיות התקן שוות או לא. כאשר השונות /סטית התקן לא ידועה יש לאמוד אותה – כלומר לחשב את . S כאשר אומדים את סטית התקן ,משתמשים בהתפלגות .t מס' דרגות החופש – , dfכאשר עוסקים בשני מדגמים , n1 1 n2 1 n1 n2 2 -- כלומר מס' דרגות החופש הוא למעשה חיבור דרגות החופש של שני המדגמים. כאשר סטית התקן שווה בשתי האוכלוסיות ,ניתן לרשום את טעות התקן המשותפת כחיבור טעויות התקן: 1 1 n1 n2 2 n2 2 n1 1 1 ( X 1 X 2 ) ~ N 1 2 , 2 n1 n2 נורמאלי ת שונות (ריבוע סטית התקן) השווה לסכום ריבועי טעות התקן ,של כל קבוצה ההפרש בין ממוצעי המדגמים מתפלג ממוצע השווה לממוצע להפרש ממוצעי האוכלוסיות כאשר יש שוויון שונויות ניתן לאמוד את השונות ע"פ אחד משני המדגמים: ( X 2i X 2 ) 2 n2 1 2 S2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ( X 1i X 1 ) 2 n1 1 2 S1 87 מאחר ושני המדגמים אומדים את אותה שונות יהיה מדויק יותר לאמוד את השונות דרך שני המדגמים, אנו אומדים את השונות כממוצע משוקלל של שתי השונויות . ( X 1i X 1 ) 2 ( X 2i X 2 ) 2 2 S n1 n2 2 אם נסדר את הנוסחאות הנ"ל : ( X 2i X 2 ) 2 2 n2 1 ( X 1i X 1 ) 2 S2 2 n1 1 S1 S 12 (n1 1) ( X 1i X 1 ) 2 S 2 2 (n2 1) ( X 2i X 2 ) 2 )S (n1 1) S 2 (n2 1 S n1 n2 2 2 2 1 2 השונות המשוקללת -ממוצע משוקלל של שונויות שני המדגמים רווח בר סמך 2 2 2 2 S S S S 1 2 X 1 X 2 t n1 n 2 2,1 n1 n2 n n2 1 2 2 n1 n 2 2,1 X 2 t 1 X 2 מאחר והשונות היא שונות משוקללת ,ניתן להוציא את , Sמתוך השורש ולקבל : 1 1 1 1 S 1 2 X 1 X 2 t S n1 n 2 2,1 n1 n2 n n2 1 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 n1 n 2 2,1 X2 t 1 X 88 שאלה חוקר מעוניין להשוות שני סוגי כדורים להורדת חם במטרה לאמוד את ההפרש במשך זמן הורדת החם בין שני הכדורים. כדור א' ניתן למדגם מקרי של 19נבדקים ,נמצא כי S 0.8 . X 3.2 כדור ב' ניתן למדגם מקרי של 23נבדקים ,נמצא כי S 0.6 . X 2.5 א. חשבו רווח בר סמך להפרש בין הזמן הממוצע להורדת החם בין שני הכדורים ,ברמת מובהקות של .0.05 ב. בדקו את הטענה כי כדור א' יעיל יותר (משך זמן הורדת החם ארוך יותר) ,ברמת מובהקות של .0.05 נתונים וחישובים: X 1 X 2 3.2 2.5 0.7 S 2 0.6 X 2 2.5 S 1 0.8 t 40, 0.975 2.021 0.05 2 X 1 3.2 t 19 23 2 ,1 2 n1 n 2 2 ,1 )S 1 (n1 1) S 2 (n2 1) 0.8 2 (19 1) 0.6 2 (23 1 S 0.486 n1 n2 2 40 2 S 0.697 2 1 1 1 1 0.697 0.216 n1 n2 19 23 א. t 2 S נציב את הנתונים בנוסחה לחישוב רווח בר סמך: 1 1 1 1 1 2 X 1 X 2 t S n1 n 2 2 ,1 n1 n2 n1 n2 2 S 2 n1 n 2 2 ,1 X 2 t 1 X 0.7 2.021 0.216 1 2 0.7 2.021 0.216 0.263 1 2 1.136 ב. השערה חד כיוונית – כלפי מעלה – המטרה היא לבדוק האם לכדור א' השפעה טובה יותר מאשר לכדור ב' כלומר האם משך הזמן בו החולה נשאר ללא חם לאחר כדור א' ארוך ממשך הזמן לאחר כדור ב'. .1 השערות : 1 2 0 H0 : כדור א' אינו עדיף על כדור ב' במשך זמן הורדת החם. 1 0 H1 : כדור א' עדיף על כדור ב' במשך זמן הורדת החם. 2 .2 רמת מובהקות 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 89 .3 תחומי קבלה /דחייה לH 0 - 1 1 n1 n2 C 1 2 t n1 n 22,1 S 1 2 0 C 0 1.684 0.216 0.363 כלומר 0.363הוא הגבול הקריטי ,במילים אחרות אם ההפרש בין שני הממוצעים קטן מ 0.363 -נקבל את H 0 תחום דחית H 0 תחום קבלת H0 0.7 .4 0.363 0 החלטת החוקר נדחה את השערת האפס ,נקבל את השערת המחקר – מאחר וההפרש בין הממוצעים ,0.7נמצא בתחום דחיית השערת האפס -יש הבדל בין משך השפעת שני הכדורים ,כדור א' משפיע על הורדת החם לפרק זמן ארוך יותר באופן מובהק. .5 השגיאה האפשרית דחינו את השערת האפס ,השגיאה האפשרית -דחינו את השערת האפס בזמן שהיא נכונה ,שגיאה מסוג , 0.05ברמת הגדרת המחקר יש סיכוי של 5%שטעינו. ההסתברות האמיתית לשגיאה היא רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן מסקנות. ) ( X 1 X 2 ) ( 1 2 2 2 tn1 n 2 2,1 ' S S n1 n2 0.0005 ' 0.005 0.995 1 ' 0.9995 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 0.7 0 3.24 0.216 t40,1 ' 90 בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 2 2 tn1 n 2 2,1 ' ' S S n1 n2 0.0005 ' 0.005 דוחים את השערת האפס ' 0.7 0 3.24 0.216 0.995 1 ' 0.9995 ' (0.0005 ) 0.005) (0.05 מקבלים את השערת האפס t40,1 ' דוחים את השערת האפס. בדיקה ע"י השוואת ערכי t t40,0.95 1.684 0.7 0 3.24 0.216 tSTAT ) ( X 1 X 2 ) ( 1 2 2 2 tSTAT tn1 n 2 2,1 ' S S n1 n2 ערך tהנבדק נקרא גם - t Criticalערך המוביל אותנו לגבול הקריטי tSTAT tCRITICALדוחים את השערת האפס )tSTAT (3.24) t (1.684 tSTAT tCRITICAL מקבלים את השערת האפס דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 91 תרגילים .1 נערך מחקר השוואתי בין שני בתי ספר במטרה להשוות בין הישגי התלמידים בכיתות י"ב בין שני בתי הספר ,נלקח מדגם מקרי של תלמידים בכיתה י"ב בכל בית ספר ונבדק ממוצע ציוניהם ,להלן הנתונים: 70 70 70 65 100 בית ספר A 70 80 85 בית ספר B סטיות התקן באוכלוסיות שוות. 80 95 100 90 100 70 90 90 85 85 70 80 80 80 60 70 65 50 א. בנו רווח בר סמך להפרש ממוצעי הציונים בין שני בתי הספר ,ברמת סמך של 0.98 ב. בדקו את הטענה כי קיים פער בהישגים הלימודיים בין שני בתי הספר ברמת מובהקות של 0.05 .2 מדגם מקרי של 20חולים במחלה BBטופלו בתרופה מסוימת ונזקקו בממוצע עד החלמתם ל 60 -מ"ג מהתרופה עם סטיית תקן 6מ"ג ) . ( Sמדגם מקרי של 12חולים במחלה SARAטופלו באותה תרופה ונזקקו לכמות ממוצעת של 64מ"ג מהתרופה עד החלמתם ,עם סטית תקן של 8מ"ג .בהנחה כי סטיות התקן שוות. האם נכונה הטענה כי להחלמה ממחלת SARAנדרשת כמות רבה יותר של התרופה מאשר ל) 0.025 ( BB- .3 השערת האפס ( )Hoהיא שאין הבדל בין תוחלות ההוצאות החודשיות על שימוש בטלפון נייד בין חיילים לחיילות .ההשערה האלטרנטיבית ( )H1היא שתוחלות ההוצאות החודשיות הן שונות. לבדיקת השערות אלו נלקחו שני מדגמים בלתי תלויים של חיילים ושל חיילות והתקבל: חיילות חיילים ₪ 192 ₪ 180 ממוצע מדגם ₪ 31.5 ₪ 26 סטיית תקן מדגמית sˆ 17 15 גודל המדגם בהנחה שהוצאות השימוש של חיילים וחיילות בלתי תלויות ומתפלגות נורמאלית וסטיות התקן שוות ,אזי : א .ברמת מובהקות של 5%נדחה את ,Hoאך לא ברמת מובהקות של .10%ב. נדחה את השערת האפס .ג .ברמת מובהקות 10%נדחה את .Ho .4 ד. ברמת מובהקות של 5% ברמת מובהקות 5%נקבל את Ho בדיקת גובה החשבון החודשי עבור השימוש בטלפון הסלולארי בקרב לקוחות בגילאים שונים הראתה : קבוצת גיל 20-30 30-40 מספר חשבונות שנבדקו 8 7 גובה חשבון ממוצע 200 190 סטית התקן של המדגם 40 43 בנוסף נבדקו גם 9חשבונות של לקוחות בגילאים .40-50נתוני המדגם הם: , 160 ,240 170 ,160 ,160 ,230 ,150, 210 ,200הנח שגובה החשבון החודשי בכל קבוצת גיל מפולג נורמאלית וקיים שוויון שונויות בין גובה החשבון החודשי בקבוצות הגיל השונות. א .השווה בין תוחלות גובה החשבון של לקוחות בגילאים 20-30ובגילאים 40 -30רמת מובהקות של .5% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 92 ב .בנה רווח סמך לתוחלת גובה החשבון החודשי בגילאים 20-30ברמת סמך של . 90%פי כמה יגדל הרווח אם רמת הסמך תעלה ל?98%- בסעיפים ג' ו -ד' הנח שסטית התקן של גובה החשבון החודשי בקרב לקוחות בני 40-50ידועה ושווה ל.35- ג. מצא את רמת המובהקות המינימאלית בה ניתן לדחות את השערת האפס כאשר בודקים השערה שתוחלת גובה התשלום של לקוחות בגילאים 50-40שווה ל 210-שקלים כנגד אלטרנטיבה שתוחלת זו נמוכה יותר. ד .מהו מספר החשבונות המינימאלי שיש לבחור במטרה לבנות רווח סמך לתוחלת גובה החשבון החודשי של לקוחות בגילאים 50-40ברמת סמך של 95%כדי שאורך הרווח לא יעלה על 15שקלים. .5 חברה מסוימת מספקת ללקוחותיה שרותי תמיכה טלפוניים לגלישה באינטרנט .אחד המדדים לטיב השירות הוא הזמן הנדרש לעובד על מנת למצוא ולטפל בבעיה. המנכ"ל טוען שעובדים וותיקים (עובדים לפחות שנה ) נותנים שירות מהיר יותר מעובדים חדשים (פחות משנה). לבדיקת הטענה נלקח מדגם של 38עובדי החברה הוותיקים ו 24-עובדי החברה החדשים .התקבלו התוצאות: מדגם עובדים וותיקים :זמן שירות ממוצע של 6.5דקות עם סטיית תקן מדגמית של 3דקות. מדגם עובדים חדשים :זמן שירות ממוצע של 7דקות עם סטיית תקן מדגמית של 3.4דקות. הניחו שזמן השירות מתפלג נורמאלית וקיים שוויון שונויות. א. בדוק את טענת המנהל ברמת מובהקות של .1% ב. בעבר ממוצע זמן השירות של עובדים חדשים היה 7.5דקות .האם ניתן לומר על סמך תוצאות המדגם שחל שיפור בשירות של העובדים החדשים ? רמת מובהקות .5% ציין מהו המבחן בו אתה משתמש ,נסח את ההשערות ואת ההנחות המתאימות. לפתרון סעיפים ג' ו-ד' הנח שסטיית התקן של זמן השרות של עובדים חדשים ידועה והיא 4דקות. ג. סטטיסטיקאי חישב רווח סמך לתוחלת זמן השירות של עובדים חדשים וקיבל 5.72 8.28 מהי רמת הביטחון (רמת הסמך) לפיה חושב הרווח ? ד. הוחלט לבדוק שוב את טיב השירות של עובדים חדשים .מהו גודל המדגם המינימאלי שצריך לקחת אם רוצים שאורך הרווח לא יעלה על 0.5דקה וזאת ברמת בטחון (רמת סמך) ? 95% .6 מפעל לארטיקים רוצה לבדוק הבדלי מכירה בין שני אזורים ,נלקחו שני מדגמים של חנויות – מדגם א כלל 40חנויות באזור Aומדגם ב' כלל 22חנויות באזור . B מדגם א' – כל חנות קיבלה 300ק"ג ארטיקים ,קצב המכירות הממוצע ליום היה 9ק"ג ארטיקים. מדגם ב' – כל חנות קיבלה 450ק"ג ארטיקים ,קצב המכירות הממוצע היה 13ק"ג ליום. סטית התקן באזור Aהייתה 2.3ק"ג ביום ,ובאזור ב' 2.8ק"ג ביום. א. בנו רווח בר סמך להפרש בין ממוצע המכירות היומי בין שני האזורים – רמת סמך . 0.95 ב. בדקו את הטענה כי אזור ב' בעל פוטנציאל מכירה גבוה יותר ( .) 0.04 ג. מה תהיה השגיאה האפשרית אם קצב המכירה באזור Aיעלה ב.15%- © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 93 פתרונות נתונים וחישובים: .1 S 2 12.67 t24,0.99 2.492 0.02 2 t 1214 2,1 X 2 77.5 2 n1 n 2 2,1 t S 1 13.73 X 1 X 2 80.42 77.5 2.92 X 1 80.42 )S 12 (n1 1) S 2 2 (n2 1) 13.732 (12 1) 12.67(14 1 S 173.35 n1 n2 2 24 S 13.16 1 1 1 1 13.16 5.177 n1 n2 12 14 א. 2 S נציב את הנתונים בנוסחה לחישוב רווח בר סמך: 1 1 1 1 S 1 2 X 1 X 2 t S n1 n 22,1 n1 n2 n1 n2 2 X 1 X 2 t n1n22,1 2 2.92 2.492 5.177 1 2 2.92 2.492 5.177 9.98 1 2 15.82 ב. השערה דו כיוונית – המטרה היא לבדוק האם קיים פער בהישגי התלמידים בין שני בתי הספר. ב.1 השערות : ב.2 1 2 0 H0 : אין הבדל בהישגים בין שני בתי הספר 1 2 0 H1 : יש הבדל בהישגים בין בתי הספר. רמת מובהקות 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 94 ב.3 תחומי קבלה /דחייה לH 0 - 1 1 n1 n2 S 2 t 24, 0.975 2.061 C 2 0 2.064 5.177 10.67 כלומר n1 n 2 2,1 0.05 2 C1,2 1 2 t 1 0 0 t 1214 2 ,1 C 2 0 2.064 5.177 10.67 10.67הוא הגבול הקריטי ,במילים אחרות אם ההפרש בין שני הממוצעים קטן או גדול מ10.68 - נדחה את H 0אם ההפרש בין -10.67ל 10.67-נקבל את H 0 תחום דחית H 0 תחום קבלת H0 10.67 0 2.92 10.67 מסקנה – נקבל את H 0 ב.4 החלטת החוקר נקבל את השערת האפס ונדחה את השערת המחקר – ההפרש בין הממוצעים ,2.92נמצא בתחום קבלת השערת האפס -אין הבדל בהישגי התלמידים בין שני בתי הספר ברמת מובהקות של 0.05 ב.5 השגיאה האפשרית מאחר וקיבלנו את השערת האפס ,השגיאה האפשרית -קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה , כלומר שגיאה מסוג שני . - )C (X 1 X 2 1 1 S n1 n2 t24,1 הטעות היא השטח בין הפרש הממוצעים לבין הגבול הקריטי -נחשב 2 10.67 2.92 5.177 1.497 0.95 2 0.1 0.2 את ההסתברות באמצעות טבלת ההתפלגות tהערך 1.499נמצא בין 24,1 2 2 24,1 t שני ערכים לכן ההסתברות אינה נקודתית אלא בתחום. הסיכוי לשגיאה הוא בין 10%ל.20%- t 0 .9 1 0.1 2 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 95 בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 2 2 ' 2 S S n1 n2 n1 n 2 2 ,1 t ' דוחים את השערת האפס ' 0.5 ' 0.8 0.75 ' 2 מקבלים את השערת האפס 2.92 0 0.564 5.177 0.6 1 ' 2 24,1 t ' (0.5 מקבלים את השערת האפס. ) 0.8) (0.05 בדיקה ע"י השוואת ערכי t t24,0.975 2.061 2.92 0 0.564 5.177 ) ( X 1 X 2 ) ( 1 2 tSTAT 2 2 tSTAT tn1 n 2 2,1 ' S S n1 n2 ערך tהנבדק נקרא גם - t Criticalערך המוביל אותנו לגבול הקריטי tSTAT tCRITICALדוחים את השערת האפס )tSTAT (0.564) t (2.061 .2 tSTAT tCRITICAL מקבלים את השערת האפס דוחים את השערת האפס נתונים וחישובים: n2 20 S2 6 X 2 60 n1 12 tn1 n 2 2,1 t2012 2,0.975 t30,0.975 2.042 S 6.8 S1 8 X 1 64 X 1 X 2 64 60 4 2 )S 12 (n1 1) S 2 2 (n2 1) 62 (20 1) 82 (12 1 S 42.66 n1 n2 2 30 1 1 1 1 6.8 2.48 n1 n2 12 20 S השערה חד כיוונית כלפי מעלה המטרה היא לבדוק האם למחלת SARAנדרשת כמות גדולה יותר של תרופה מאשר למחלת .BB © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 96 .1 השערות : 1 2 0 H0 : אין הבדל בכמות התרופה הנדרשת לשתי המחלות 1 2 0 H1 : למחלת SARAנדרשת כמות גדולה יותר של תרופה .2 רמת מובהקות 0.025 .3 תחומי קבלה /דחייה לH 0 - 1 1 n1 n2 C 1 2 tn1 n 22,1 S 1 2 0 C 0 2.042 2.48 5.064 5.064הוא הגבול הקריטי ,אם ההפרש בין שני הממוצעים גדול מ 5.064 -נדחה את H 0 תחום דחית H 0 תחום קבלת H0 4 5.064 0 מקבלים את השערת האפס .4 החלטת החוקר נקבל את השערת האפס ונדחה את השערת המחקר – ההפרש בין הממוצעים הוא - 4נמצא בתחום קבלת השערת האפס -אין הבדל בכמות התרופה הנדרשת לטיפול בשתי המחלות .5 השגיאה האפשרית מאחר וקיבלנו את השערת האפס ,השגיאה האפשרית היא -קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה כלומר שגיאה מסוג שני . - )C (X 1 X 2 1 1 S n1 n2 הטעות היא השטח בין הפרש הממוצעים לבין הגבול t30,1 הקריטי – נחשב את ההסתברות באמצעות טבלת ההתפלגות , tהסיכוי לשגיאה בין 25%ל40%- 5.064 4 2.48 0.429 t30,1 t30,1 0.6 1 0.75 0.25 0.4 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 97 בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 2 2 tn1 n 2 2,1 ' S S n1 n2 ' 0.05 ' דוחים את השערת האפס ' 40 1.612 2.48 1 ' 0.95 ) ' (0.05) (0.025 מקבלים את השערת האפס t30,1 ' מקבלים את השערת האפס. בדיקה ע"י השוואת ערכי t 40 1.612 2.48 t30,0.975 2.042 tSTAT ) ( X 1 X 2 ) ( 1 2 2 2 tSTAT tn1 n 2 2,1 ' S S n1 n2 ערך tהנבדק נקרא גם - t Criticalערך המוביל אותנו לגבול הקריטי tSTAT tCRITICALדוחים את השערת האפס )tSTAT (1.612) t (2.041 .3 tSTAT tCRITICAL מקבלים את השערת האפס מקבלים את השערת האפס מבחן השערות דו כיווני (אין הבדל בהוצאות השימוש בין חיילים וחיילות) ,שני מדגמים בלתי תלויים , סטיות תקן באוכלוסיות לא ידועות – מבחן .t א .השערות : 1 2 0 H 0 :אין הבדל בהוצאות החודשיות לטלפון בין חיילים וחיילות 1 2 0 H1 :יש הבדל בהוצאות החודשיות לטלפון בין חיילים וחיילות. ב. רמת מובהקות 0.05 ג. תחומי קבלה /דחייה לH 0 - יש לחשב שונות משוקללת (שני מדגמים ב"ת) S 29.06 )S 1 (n1 1) S 2 (n2 1) 262 (15 1) 31.52 (17 1 S 844.66 n1 n2 2 30 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 2 2 98 22 n2 t30,0.975 2.042 n1 n 22,1 2 t30,0.95 1.697 12 n1 1 2 844.66 844.66 10.29 15 17 t n1 n 22, 1 2 C 1 2 Z 22 n2 12 n1 1 2 0 t C0.05 0 2.042 10.29 21.01 C0.1 0 1.697 10.29 17.46 חישבנו את הגבולות הקריטיים עבור רמות מובהקות של 0.1ו 0.05-בשני הגבולות הפרש הממוצעים 12נמצא בתחום קבלת השערת האפס. תשובה ד נכונה. .4 מבחן להשוואת ממוצעים ,סטיות תקן באוכלוסיה אינן ידועות – מבחן , tמבחן דו כיווני S 1 40 X 1 200 n1 8 20 35 S 2 43 X 2 190 n2 7 30 40 X 1 X 2 10 1 2 0 H 0 :אין הבדל בין הגילאים בגובה הממוצע של חשבון הטלפון 1 2 0 H1 :קיים הבדל בין הגילאים בגובה הממוצע של חשבון הטלפון רמת מובהקות 0.05 נחשב את השונות המשוקללת: )S 1 (n1 1) S 2 (n2 1) 432 (7 1) 402 (8 1 S 1714.92 n1 n2 2 13 2 2 1714.92 1714.92 46.29 8 7 C 0 2.16 2 S12 S 2 2 C 1 2 t n1 n2 n1 n 2 2,1 2 תחום דחית H 0 תחום קבלת H0 46.29 0 10 46.29 הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את השערת האפס אין הבדל בין ממוצעי גובה החשבון. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 99 ב. רווח בר סמך S n ) 2 ( n 1)(1 S n X t ) 2 ( n 1)(1 X t 40 40 200 1.895 8 8 173.2 226.79 200 1.895 ערך tבטבלה עבור 98%הוא , 2.998ערך tבטבלה עבור 90%הוא 1.895מאחר והערך עבור 98%גדול פי 1.58המשמעות היא שהרווח יגדל פי . 1.58 ג. 0 210 X 3 186.66 40 n3 9 40 50 סטית התקן ידועה לכן משתמשים בהתפלגות Z רמת המובהקות הקטנה ביותר – ה -המינימאלית מתקבלת כאשר ( . C המרחק בין ל - 0 -ערך מוחלט) 210 186.66 2 35 ) ( 9 0 Z1 Z1 ( ) n 1 0.9772 0.0228 ד. אורך הרווח הוא 15כלומר אורך מחצית הרווח הוא 7.5 n ) (1 2 7.5 X Z ) (1 2 n 35 1.96 7.5 n n X Z ) (1 2 Z 2 1.96 35 n 7.5 84 n .5 מבחן להשוואת ממוצעים ,סטיות תקן באוכלוסיה אינן ידועות – מבחן , tמבחן חד כיווני כלפי מטה. S1 3 X 1 6.5 n1 38 S 2 3.4 X2 7 n 2 24 X 1 X 2 0.5 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 100 1 2 0 H 0 :זמן השירות של עובדים ותיקים אינו מהיר יותר מזמן השירות של עובדים חדשים. 1 2 0 H1 :זמן השירות של עובדים ותיקים מהיר יותר מזמן השירות של עובדים חדשים. רמת מובהקות 0.01 נחשב את השונות המשוקללת: 2 )S 12 (n1 1) S 2 2 (n2 1) 3 2 (38 1) 3.4 2 (24 1 S 9.98 n1 n2 2 60 2 9.98 9.98 1.968 38 24 2 S S n1 n2 C 0 2.39 C 0 t n1 n 22,1 תחום דחית H 0 תחום קבלת H0 0 1.968 0.5 הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את השערת האפס זמן השירות של עובדים ותיקים אינו מהיר יותר מזמן השירות של עובדים חדשים. מבחן חד כיווני כלפי מטה להשוואת ממוצעים בין הממוצע הקיים לממוצע המדגם. ב. H 0 : 7.5זמן השירות עובדים חדשים אינו קצר מזמן השירות של עובדים חדשים בעבר. H1 : 7.5זמן השירות של עובדים חדשים השתפר והתקצר ביחס לעבר 0.05 6.31 3.4 C 7.5 1.714 24 S C 0 t n1,1 n תחום דחית H 0 תחום קבלת H0 7.5 7 6.31 הממוצע החדש גדול מהתחום הקריטי – נמצא בתחום קבלת השערת האפס ,לכן נקבל את השערת האפס – לא חל שיפור בזמן השירות של העובדים החדשים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 101 ג. סטית התקן באוכלוסיה ידועה ,נחשב רווח בר סמך באמצעות התפלגות .Z מחצית הרווח היא .1.28 n ) 2 (1 X Z n ) 2 (1 X Z 5.72 8.28 4 1.28 24 ) 1.56 ) 2 2 (1 (1 S Z 1.28 ) (1 n 2 Z 1.28 24 4 Z 0.1188 ד. ) 0.9406 2 (1 2 Z 1 אורך הרווח " , 0.5נטפל" במחצית הרווח – :0.25 n ) (1 2 X Z 4 0.25 n 1.96 n 0.25 ) (1 2 n X Z ) (1 2 Z 2 984 n .6 נתונים: S 1 2.3 S 2 2.8 א. 1.96 4 n 0.25 X1 9 n1 40 X 2 13 n2 22 נחשב את השונות המשוקללת: 2.3 2 40 2.8 2 22 6.4 40 22 2 2 2 )S 1 (n1 1) S 2 (n2 1 n1 n2 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 S 102 2 2 2 2 S S S S 1 2 X 1 X 2 t n1 n 2 2 ,1 n1 n2 n1 n2 2 6.4 6.4 6.4 6.4 1 2 4 1.96 40 22 40 22 n1 n 2 2 ,1 2 X 2 t 1 X 4 1.96 2.683 1 2 5.316 ב. השערה חד כיוונית כלפי מעלה המטרה – האם אזור א' בעל פוטנציאל מכירות גבוה יותר. .1 השערות : 1 2 0 H0 : לאזור א אין הבדל פוטנציאל מכירות גבוה יותר. 1 2 0 H1 : לאזור א פוטנציאל מכירות גבוה יותר. .2 רמת מובהקות 0.025 .3 תחומי קבלה /דחייה לH 0 - 2 2 S S n1 n2 C 1 2 t n1 n 22,1 1 2 0 C 0 1.671 0.671 1.122 1.122הוא הגבול הקריטי ,אם ההפרש בין שני הממוצעים גדול מ 5.064 -נדחה את H 0 תחום דחית H 0 תחום קבלת H0 4 1.122 0 דוחים את השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 103 .4 החלטת החוקר נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים 4 -נמצא בתחום דחית השערת האפס -אזור ב' בעל פוטנציאל מכירות גבוה יותר .5 השגיאה האפשרית מאחר ודחינו את השערת האפס ,השגיאה האפשרית היא -דחינו את השערת האפס בזמן שהיא נכונה כלומר שגיאה מסוג ראשון . - (X 1 X 2) 0 1 1 S n1 n2 הטעות היא השטח מעבר לנקודה הרחוקה ביותר t60,1 4 0.671 5.96 t60,1 בה נוכל למקם את – Cהנקודה בה X 1 X 2 C 0.0005 t60,1 1 0.9995 בדיקה ע"י השוואת הסתברויות – רמות מובהקות ) ( X 1 X 2 ) ( 1 2 2 2 tn1 n 2 2,1 ' S S n1 n2 ' 0.0005 ' דוחים את השערת האפס ' 40 5.96 0.671 1 ' 0.9995 ) ' (0.0005) (0.05 מקבלים את השערת האפס t 60,1 ' דוחים את השערת האפס. בדיקה ע"י השוואת ערכי t t 60,0.95 1.671 40 5.96 0.671 t STAT ) ( X 1 X 2 ) ( 1 2 2 2 t STAT t n1 n 22,1 ' S S n1 n 2 ערך tהנבדק נקרא גם - t Criticalערך המוביל אותנו לגבול הקריטי tSTAT tCRITICALדוחים את השערת האפס )t STAT (5.96) t (1.671 tSTAT tCRITICAL מקבלים את השערת האפס דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 104 ג. אם קצב המכירות יעלה ב 20%-המשמעות היא שקצב המכירות הממוצע יהיה 10.8ק"ג. במקרה זה הפרש הממוצעים ירד מ 4 -ל. 2.2- המסקנה לא תשתנה מאחר והגבול הקריטי אינו משתנה הפרש הממוצעים עדין נמצא בתחום דחית השערת האפס הסיכוי לשגיאה יגדל – ככל שהפער בין הגבול הקריטי לערך הנבדק גדל כך הסיכוי לשגיאה קטן ולהיפך. נחשב את הסיכוי לשגיאה במקרה זה: 2 2 S S n1 n 2 C 1 2 t n1 n 2 2,1 2.2 0 t 60,1 0.671 3.27 t 60,1 0.005 0.0005 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2.2 t 60,1 0.671 0.995 1 0.9995 105 מדגמים מזווגים הסקה סטטיסטית על הפרשי ממוצעים של שני מדגמים מזווגים שני מדגמים מזווגים ,הינם שני מדגמים הבנויים מזוגות של תצפיות – לכל תצפית במדגם א' קיים בן זוג מתאים במדגם ב'. את הזיווג ניתן ליצור בשני אופנים: א. חקירת אותו נבדק לפני ואחרי טיפול ,כלומר שני המדגמים מכילים למעשה את אותם אנשים ,כל אדם הוא בן הזוג של עצמו – כל אדם מהווה קבוצת ביקורת של עצמו. ב. בחירת זוגות עם משתני רקע דומים .משתני רקע הם למעשה גורמים מתערבים – גורמים אשר יכולים להשפיע על תוצאות המחקר ועל ההבדל בין הזוגות ,כאשר אדם הוא בן הזוג של עצמו (סעיף א) מבחינת משתני רקע/גורמים מתערבים זהו המצב האופטימאלי מאחר ואם קיים הבדל בין הטיפולים סיבתו תהיה הטיפול עצמו ולא הבדלים בין המטופלים. מאחר ואנו עובדים עם זוגות ,שני המדגמים יהיו בעלי אותו גודל ולמעשה ניתן לומר כי אנחנו עוסקים במדגם אחד של nזוגות ,רעיון זה הוא גם הבסיס לניתוח הסטטיסטי אשר נעשה כאילו עסקנו במדגם אחד. מאחר וההתייחסות היא למדגם אחד של nזוגות ,ההסקה נעשית ע"פ מדגם אחד כאשר סטית תקן אינה ידועה . ההסקה נעשית על הפרשי הממוצעים – לטור הפרשים זה נחשב ממוצע dונאמוד את סטית התקן S d רווח בר סמך Sd Sd n 2 n1,1 D d t n 2 n 1,1 d t בדיקת השערות השערה חד כיוונית כלפי מעלה : Sd C 0 t n 1,1 Sd C 0 t n 1,1 n השערה חד כיוונית כלפי מטה : n השערה דו כיוונית : Sd n 2 n 1,1 C2 0 t Sd n 2 n 1,1 C1 0 t נקודת התחלה היא 0מאחר והשערת האפס H 0היא שאין הבדל בין שני המדגמים/בין שני הטיפולים ו C-מתייחס ל. H 0 - © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 106 שאלה: חוקר בדק תרופה להורדת לחץ דם על מדגם מקרי של 10אנשים הסובלים מיתר לחץ דם. לחץ הדם נמדד לפני קבלת התרופה ולאחר קבלת התרופה ,נתקבלו שני מדגמים עבור אותן תצפיות: א .חשבו רווח בר סמך לממוצע הפרשי לחץ הדם באוכלוסיה -לפני הטיפול ואחריו ,ברמת מובהקות של .2% ב .בדקו את הטענה כי התרופה החדשה מורידה את לחץ הדם ,ברמת מובהקות של .1% אחרי השימוש Yi לפני השימוש X i נבדק מס' 10 150 160 1 20 130 150 2 0 150 150 3 30 140 170 4 10 140 150 5 10 140 150 6 20 120 140 7 10 150 160 8 10 140 150 9 20 160 180 10 X-Y di כפי שנאמר לעיל מאחר ואנו עובדים עם זוגות ,אנו עוסקים במדגם אחד של nזוגות ,רעיון זה הוא הבסיס לניתוח הסטטיסטי אשר נעשה כלומר תהליך ההסקה הסטטיסטית יעשה על ממוצע ההפרשים בין התצפיות כלומר על . D i y 2 N di N d i x N 1 ) d i ( xi y i D 1 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 107 נחשב את הנתונים הדרושים: t9,0.99 2.821 2 א. n 1,1 t Sd 8.43 d 14 רווח בר סמך להפרש לחץ הדם הממוצע אחרי לקיחת התרופה ולפני לקיחת התרופה ברמת סמך של 0.98 Sd Sd d t D d t n 1,1 n 1,1 n n 2 2 8.43 8.43 14 2.821 D 14 2.821 10 10 6.49 D 21.52 ב. נבדוק את טענת החוקר כי התרופה החדשה מורידה את לחץ הדם ברמת מובהקות של 0.01 .1 בדיקת השערות – חד כווני כלפי מעלה השערות : D 0 H0 : התרופה אינה גורמת להורדת לחץ הדם. D 0 H1 : התרופה גורמת לירידה בלחץ הדם. מעוניינים לבדוק את ירידת לחץ הדם ,הגודל הנבדק הוא ההפרש בין ממוצע לחץ הדם לפני הטיפול ואחריו לכן ככל שההפרש גבוה יותר ירידת לחץ הדם גדולה יותר. .2 0.01 .3 תחומי קבלה /דחייה לH 0 - S n 7.52 C 0 t ( n 1), (1 ) 8.43 10 C 0 2.821 תחום דחית H 0 תחום קבלת H0 7.52 14 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 0 108 .4 החלטה ההפרש הממוצע שלחץ הדם לפני התרופה ואחריה הוא , 14ערך הנמצא מחוץ לגבול הקריטי כלומר בתחום דחית השערת האפס ,לכן נדחה את השערת האפס ונקבל את השערת המחקר – התרופה גורמת לירידה בלחץ הדם. .5 טעות אפשרית מאחר ודחינו את , H 0הטעות האפשרית היא טעות מסוג ראשון . - 14 5.25 2.665 d 0 S ) n t9, (1 ) ( ברמה של 9דרגות חופש הערך נמצא מחוץ לגבולות הטבלה לכן 0.995 1 0.005 כלומר הסיכוי לשגיאה במסקנה קטן מ0.5% - בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס ' 0.0005 df 9 ' 0.9995 1 ) ' ( 0.0005) (0.01דוחים את השערת האפס. 14 0 5.25 8.43 ( ) 10 t9,1 ' בדיקה ע"י השוואת ערכי t t9,0.99 2.821 14 0 5.25 8.43 ( ) 10 tSTAT tCRITICALדוחים את השערת האפס )tSTAT (5.25) t (2.821 tSTAT 0 S n tSTAT tCRITICAL tSTAT t( n 1)(1 ') מקבלים את השערת האפס דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 109 תרגילים – מדגמים מזווגים .1 מאמן נבחרת רצה לבדוק אם תוספת של אימון משקולות שבועי תגרום לשיפור בהישגיהם של אצנים. לצורך הבדיקה נדגמו 10אצנים ונמדדה מהירותם בריצת 100מ' לפני הוספת האימון ולאחר חודשיים בהם התאמנו אימון שבועי נוסף במשקולות. להלן התוצאות: 4 3 2 אצן מס' 1 10.8 10.6 10.4 10.5 לפני 10.9 10.9 10.2 10.3 אחרי בדקו את הטענה ברמת מובהקות של . 0.01 .2 5 10.9 10.6 7 11.1 11.4 6 10.1 10 9 10.3 10.1 8 10.2 10 10 9.9 10 חוקר בדק את הטענה כי מנת המשכל של ילדים גבוהה משל הוריהם. לבדיקת הטענה נלקח מדגם מקרי של 13הורים וילדיהם ונערכו להם מבחני , IQלהלן התוצאות: 121 118 הורה ילד א. 115 109 136 125 117 115 126 118 112 115 120 120 118 135 129 115 120 124 122 115 120 118 בנו רווח בר סמך להפרש ממוצע מנת המשכל בין ילדים להוריהם ברמת סמך של .0.95 ב. בדקו את הטענה ברמת מובהקות של .0.05 .3 כדי לבחון את יעילות ערכות הרזייה "רזה לתמיד" נבחרו 5אנשים באופן מקרי ונבדק משקלם לפני 124 132 השימוש בערכת ההרזיה של החברה וחודש לאחר מכן .להלן תוצאות הבדיקה: משקל לפני השימוש בערכה משקל לאחר השימוש בערכה 87 84 89 84 75 76 80 76 70 66 האם ניתן לומר ברמת מובהקות של 5%כי תוחלת המשקל לאחר השימוש בערכות ההרזיה של "רזה לתמיד" קטנה לעומת המשקל לפני השימוש בה? .4 בנק ההשקעות "השקעת הרווחת" השיג עבור משקיעיו במהלך שנת ,2005תשואות נמוכות ממתחריו בשוק. על מנת לשנות את התדמית הגרועה ולהוות גורם תחרותי בשוק ,החליטה הנהלת הבנק לשלוח את יועצי ההשקעות לקורס "ניתוח ניירות ערך". כדי לבדוק אם הקורס משפר את תשואות תיקי ההשקעות של היועצים ,נבחרה קבוצה של שישה יועצי השקעות אשר השתתפו בקורס ,ונבדקה תשואת תיקי ההשקעות שלהם לפני ואחרי הקורס. התוצאות שהתקבלו (אחוזים) : היועץ לאחר הקורס לפני הקורס א ב 16 13 ג 14 8 4 -2 ד ה 4 4 7 5 ו 11 10 האם הקורס משפר את התשואות ? בדקו ברמת מובהקות של .1% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 110 .5 כדי לבדוק אם אכילת תרד מגבירה את הכושר הפיסי בחרו קבוצה של חמישה מרימי משקולות ובדקו את המשקל שכל אחד מהם הצליח להרים ביום שבו הם אכלו תרד וביום שבו לא אכלו תרד. התוצאות שהתקבלו (ק"ג) : א 152 145 הספורטאי עם תרד בלי תרד ד ג 141 153 145 150 ב 170 170 ה 148 144 א .האם לאכילת התרד יש השפעה חיובית ברמת מובהקות של ? 5% ב .על סמך המחקרים בתחום הספורט ידוע שממוצע המשקל שמצליח מרים משקולות להרים בדרך כלל (ללא אכילת תרד) הוא 146ק"ג האם על סמך התוצאות לאחר אכילת התרד ניתן לומר שהתרד משפר את התוצאות משמעותית ברמת מובהקות של . 1%נמקו ( .עליכם להתייחס לנתונים על המשקל לאחר אכילת התרד ). .6 חברת סופרמן רצתה לבדוק את השפעת משקה האנרגיה שברשותה על שעות הערנות. נלקח מדגם של 10סטודנטים ונמדד מס' שעות השינה שלהם ללא משקה האנרגיה ולאחר שתייה יומית של חצי ליטר משקה במשך שבוע : 9 10 8 7 5 6 4 3 2 1 נבדק 20 17 18 22 24 19 14 12 19 15שעות ערנות עם משקה 16 18 20 17 20 16 13 14 16 13שעות ערנות בלי משקה בדוק את הטענה ברמת מובהקות של 0.05 .7 במטרה לבדוק פערי שכר בין שני מוסדות ממשלתיים נלקחו 10עובדים בעלי אותו וותק והשכלה ובדקו את שכרם להלן התוצאות: ותק בשנים מוסד A מוסד B 2 4500 4630 4 4850 4480 6 4480 4520 8 5120 4960 10 4960 4870 12 5350 5120 14 5460 5250 16 4870 5280 18 5920 6250 א. בדקו את הטענה כי ישנם פערי שכר בין שני המוסדות ברמת מובהקות של . 0.02 ב. כיצד תשתנה תשובתך אם למדגמים צורפו גם שני המנכ"לים של המוסדות 20 6580 5380 מוסד , ₪ 12560 Aמוסד . ₪ 8450 B ג. חשבו את השגיאה האפשרית החדשה בסעיף ב' ד. הסבירו את תוצאת סעיף ב. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 111 פתרונות .1 נחשב את הנתונים הדרושים: 10 9 8 7 6 5 4 3 2 1 אצן מס' 9.9 10.3 10.2 11.1 10.1 10.9 10.8 10.6 10.4 10.5 לפני 10 10.1 10 11.4 10 10.6 10.9 10.9 10.2 10.3 אחרי 0.1 -0.2 -0.2 0.3 -0.1 -0.3 0.1 0.3 -0.2 -0.2 di שיפור ההישגים – עליה במהירות הריצה כלומר ירידה בזמן הריצה – נבצע בדיקה חד כיוונית כלפי מטה ונבדוק אם הזמן אחרי האימון קצר יותר מהזמן לפניו. אפשרי לבצע גם מבחן חד כיווני כלפי מעלה ולבדוק את הטענה שהזמן לפני ארוך יותר – הממוצע יהיה זה אך חיובי והגבול הקריטי יהיה חיובי שאר הפרמטרים לא ישתנו. t n1,1 t 9,0.99 2.821 א. S d 0.2107 d 0.04 בדיקת השערות – חד כווני כלפי מטה השערות : D 0 H0 : אימון המשקולות אינו משפיע על מהירות הריצה D 0 H1 : אימון המשקולות משפר את מהירות הריצה. ב. 0.01 ג. תחומי קבלה /דחייה לH 0 - S 0.187 C 0 t ( n1), (1 ) n 0.2107 10 תחום דחית H 0 C 0 2.821 תחום קבלת H0 0 0.187 0.04 הגבול הקריטי הוא , -0.187אם ממוצע ההפרשים קטן מהגבול הקריטי נדחה את השערת האפס. מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 112 ד. החלטה ממוצע הפרשי זמן הריצה הוא -0.04והוא גדול מ , -0.187-נמצא בתחום קבלת השערת האפס -נקבל את השערת האפס ונדחה את השערת המחקר – אימון המשקולות אינו משפר את זמן הריצה. ה. טעות אפשרית קיבלנו את , H 0הטעות האפשרית היא טעות מסוג שני . - טעות מסוג שני היא השטח הנמצא בין הגבול הקריטי לערך הנבדק (ממוצע הפרשי הזמנים) -בין 0.193ל0.06- את המרווח ניתן למדוד בערכים מוחלטים מאחר והטבלה והשטחים חיוביים. 0.187 0.04 2.206 0.2107 ( ) 10 ברמה של 9דרגות חופש הערך 0.95 1 0.975 0.025 0.05 הסיכוי לשגיאה במסקנה הוא בין 2.5%ל5%- Cd S ) n t9,(1 ) ( בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.25 ' 0.4 df 9 0.6 1 ' 0.75 0.04 0 0.6 0.2107 ( ) 10 t9,1 ' ' (0.25 מקבלים את השערת האפס. ) 0.4) (0.01 בדיקה ע"י השוואת ערכי t t9,0.99 2.821 0.04 0 0.6 0.2107 ( ) 10 tSTAT tCRITICALדוחים את השערת האפס )tSTAT (0.874) t (2.821 tSTAT 0 S n tSTAT tCRITICAL tSTAT t( n 1)(1 ') מקבלים את השערת האפס מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 113 .2 הורה 124 121 115 109 136 125 117 115 126 118 112 115 120 ילד 132 118 120 118 135 129 115 120 124 122 115 120 118 8 -3 5 9 -1 4 -2 5 -2 4 3 5 -2 di א. רווח בר סמך: t12,0.975 2.179 2 n 1,1 Sd 4.07 t d 2.54 Sd Sd D d t n 1,1 n n 2 4.07 4.07 D 2.54 2.179 13 13 2 n 1,1 d t 2.54 2.179 0.077 D 5.0023 ב. הטענה – לילדים מנת משכל גבוהה מהוריהם – נבדוק את הפרש מנת המשכל בין ילד להורה ונבחן השערה חד כיוונית כלפי מעלה – נבדוק אם ממוצע הפרשי מנת המשכל גבוה מהגבול הקריטי אשר עד אליו אין הבדל בין רמות המשכל. tn 1,1 t12,0.95 1.782 ב.1. Sd 4.07 d 2.54 בדיקת השערות – חד כווני כלפי מעלה השערות : D 0 H0 : מנת המשכל של ילדים אינה גבוהה ממנת המשכל של הוריהם. D 0 H1 : לילדים מנת משכל גבוהה יותר מהוריהם. ב.2. 0.05 ב.3. תחומי קבלה /דחייה לH 0 - תחום דחית H 0 S n C 0 t( n 1),(1 ) 4.07 2.011 13 תחום קבלת C 0 1.782 2.011 2.54 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע H0 0 114 ב.4. החלטה ממוצע הפרשי מנת המשכל בין ילדים להוריהם הוא - 2.54גבוה מהגבול הקריטי שהוא - 2.027נמצא בתחום דחית השערת האפס -נדחה את השערת האפס ונקבל את השערת המחקר – לילדים מנת משכל גבוהה משל הוריהם (ברמת מובהקות של )0.05 ב.5. טעות אפשרית דחינו את , H 0הטעות האפשרית היא טעות מסוג ראשון . - טעות מסוג ראשון – המקום הרחוק ביותר בו יכול להיות Cועדיין לקבל אותן מסקנות. 2.54 0 2.25 4.07 ( ) 13 d 0 t12, (1 ) S ) n ( ברמה של 12דרגות חופש הערך אינו נמצא בטבלה 0.975 1 0.99 0.01 0.025 הסיכוי לטעות הוא בין 1%ל. 2.5%- בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.01 ' 0.025 2.54 0 2.25 4.07 ( ) 13 df 12 0.975 1 ' 0.99 ) 0.05) (0.05 ' (0.01דוחים את השערת האפס. t12,1 ' בדיקה ע"י השוואת ערכי t t12,0.95 1.782 2.54 0 2.25 4.07 ( ) 13 tSTAT tCRITICALדוחים את השערת האפס )tSTAT (2.54) t (1.782 t STAT 0 S n tSTAT tCRITICAL t STAT t( n 1)(1 ') מקבלים את השערת האפס דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 115 .3 לפני השימוש בערכה אחרי השימוש בערכה di 89 84 5 87 84 3 70 75 66 76 4 1 S d 2.34 t n1,1 t 4,0.95 2.132 80 76 4 d 3 הטענה – ערכת ההרזיה גורמת לירידה במשקל – נבדוק את הפרש בין המשקל לפני השימוש בערכה ואחריה – נבדוק אם ממוצע הפרשי המשקל גבוה מהגבול הקריטי אשר עד אליו אין הבדל בין המשקל לפני ואחרי. א. בדיקת השערות – חד כווני כלפי מעלה השערות : D 0 H0 : הערכה אינה משפרת את הירידה במשקל. D 0 H1 : הירידה במשקל כתוצאה מהשימוש בערכה גבוה מהירידה ללא הערכה ב. 0.05 ג. תחומי קבלה /דחייה לH 0 - תחום דחית H 0 S n 2.23 C 0 t ( n1),(1 ) 2.34 5 תחום קבלת H0 C 0 2.132 דוחים את השערת האפס 3 ד. 2.23 0 החלטה ממוצע הפרשי הירידה במשקל עם הערכה ובלעדיה הוא 3ק"ג – .הממוצע גבוה מהגבול הקריטי שהוא .2.23 הממוצע נמצא בתחום דחית השערת האפס -נדחה את השערת האפס ונקבל את השערת המחקר – ערכת רזה לתמיד משפרת את הירידה במשקל ברמת מובהקות של 5% ה. טעות אפשרית דחינו את , H 0הטעות האפשרית היא טעות מסוג ראשון . - טעות מסוג ראשון – המקום הרחוק ביותר בו יכול להיות Cועדיין לקבל אותן מסקנות. 30 2.86 2.34 ( ) 5 d 0 S ) n t4, (1 ) ( ברמה של 4דרגות חופש הערך בטבלה0.975 1 0.99 : 0.01 0.025 הסיכוי לטעות הוא בין 1%ל. 2.5%- © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 116 בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.01 ' 0.05 df 4 0.975 1 ' 0.99 ' (0.01דוחים את השערת האפס. ) 0.05) (0.05 30 2.86 2.34 ( ) 5 t 4,1 ' בדיקה ע"י השוואת ערכי t t 4,0.95 2.132 30 2.86 2.34 ( ) 5 t STAT tSTAT tCRITICALדוחים את השערת האפס )t STAT (2.86) t (2.132 0 S n t STAT t ( n 1)(1 ') tSTAT tCRITICAL מקבלים את השערת האפס דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 117 .4 א 16 13 3 היועץ תשואה לאחר הקורס תשואה לפני הקורס di t 5,0.99 3.635 ג 4 -2 6 ב 14 8 6 ה 7 5 2 ד 4 4 0 2 n 1,1 t S d 2.53 ו 11 10 1 d 3 הטענה – הקורס משפר את תשואות תיקי ההשקעות של היועצים – נבדוק את הפרש התשואות של כל יועץ לפני ואחרי הקורס –.נבדוק אם ממוצע הפרשי התשואות גבוה מהגבול הקריטי אשר עד אליו אין הבדל בין התשואות. א. בדיקת השערות – חד כווני כלפי מעלה השערות : D 0 H0 : הקורס אינו משפר את תשואת תיק ההשקעות. D 0 H1 : הקורס משפר את התשואה בתיק ההשקעות. ב. 0.01 ג. תחומי קבלה /דחייה לH 0 - תחום דחית H 0 S n 3.47 C 0 t ( n1),(1 ) 2.53 6 H0 C 0 3.365 מקבלים את השערת האפס ד. תחום קבלת 3.47 3 0 החלטה ממוצע תשואות תיקי ההשקעות של היועצים לפני ואחרי הקורס אינו שונה .ממוצע הפרש התשואות לפני ואחרי הקורס עמד על . 3%ממוצע זה נמוך מהגבול הקריטי – 3.47%כלומר נמצא בתחום קבלת השערת אפס - נקבל את השערת האפס ונדחה את השערת המחקר – הקורס אינו משפר את תשואות היועצים. ה. טעות אפשרית קיבלנו את , H 0הטעות האפשרית היא טעות מסוג שני . -טעות מסוג שני : 3.47 3 0.455 2.53 ( ) 6 Cd S ) n t5, (1 ) ( © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 118 0.25 0.4 ברמה של 5דרגות חופש הערך בטבלה0.6 1 0.75 : הסיכוי לטעות הוא בין 25%ל. 40%- בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.01 ' 0.05 30 2.904 2.53 ( ) 6 df 5 0.975 1 ' 0.99 ' (0.01מקבלים את השערת האפס. ) 0.05) (0.01 t5,1 ' בדיקה ע"י השוואת ערכי t 30 2.904 2.56 ( ) 6 t5, 0.99 3.365 t STAT tSTAT tCRITICALדוחים את השערת האפס )t STAT (2.904) t (3.365 .5 0 S n t STAT t( n1)(1 ') tSTAT tCRITICAL מקבלים את השערת האפס מקבלים את השערת האפס מבחן חד כיווני כלפי מעלה (האם תרד משפר את הכושר הפיסי) , הספורטאי עם תרד בלי תרד di t 4,0.95 2.132 א 152 145 7 ב 170 170 0 ג 153 150 3 2 n 1,1 t S d 4.18 ד 141 145 -4 ה 148 144 4 d 2 הטענה – תרד משפר את הכוח הפיזי – נבדוק את הפרש המשקל שמרים כל ספורטאי לפני ואחרי אכילת תרד. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 119 א. בדיקת השערות – חד כווני כלפי מעלה השערות : 1 2 0 H 0 :תרד אינו משפר את הכושר הפיסי 1 2 0 אכילת תרד משפרת את הכושר הפיסי H1 : ב. 0.05 ג. תחומי קבלה /דחייה לH 0 - תחום דחית H 0 S C 0 t( n1),(1 ) n 4.183 C 0 2.132 3.988 5 מקבלים את השערת האפס ד. תחום קבלת H0 3.988 2 0 החלטה התרד אינו משפיע על הכושר הפיזי – מקבלים את השערת האפס. ה. טעות אפשרית קיבלנו , H 0הטעות האפשרית היא טעות מסוג שני . - 3.988 2 1.062 4.183 ( ) 5 Cd S ) n t4, (1 ) ( ברמה של 4דרגות חופש הערך בטבלה0.75 1 0.9 : 0.1 0.25 הסיכוי לטעות הוא בין 10%ל.25% - בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 120 0.1 ' 0.25 20 1.069 4.183 ( ) 5 df 4 0.75 1 ' 0.9 ' (0.1מקבלים את השערת האפס. ) 0.25) (0.05 t 4,1 ' בדיקה ע"י השוואת ערכי t t 4,0.95 2.132 20 1.069 4.183 ( ) 5 t STAT tSTAT tCRITICALדוחים את השערת האפס )t STAT (1.069) t (2.132 .5ב. 0 S n t STAT t( n1)(1 ') tSTAT tCRITICAL מקבלים את השערת האפס מקבלים את השערת האפס מבחן על תוחלת /ממוצע של אוכלוסיה אחת ,סטית תקן אינה ידועה -מבחן t מבחן חד כיווני כלפי מעלה נתונים 0 146 : א. ב. S 114.7 10.7 152.8 n5 146 H0 : תרד אינו משפר את הכושר הפיסי 146 H1 : אכילת תרד משפרת את הכושר הפיסי 0.01 10.7 163.93 5 C 146 3.747 S n C 0 t n1,1 תחום דחית H 0 תחום קבלת H0 163.93 C 146 152.8 - 152.8 163.93הממוצע החדש נמצא בתחום קבלת H 0 לכן נקבל את - H 0אכילת תרד אינה משפרת את הכושר הפיסי. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 121 .6 9 10 7 8 6 5 4 3 1 2 נבדק 20 17 18 22 24 19 14 12 19 15שעות ערנות עם משקה 16 18 20 17 20 16 13 14 16 13שעות ערנות בלי משקה 2 1 -2 3 3 4 5 -2 4 -1 d המבחן הוא מבחן דו כיווני האם משקה האנרגיה משפיע על הערנות. חישוב נתונים S 2.584 : א. d 1.7 השערות : D 0 H0 : המשקה אינו משפיע על שעות הערנות. D 0 H1 : המשקה משפיע על הערנות ב. 0.05 ג. תחומי קבלה /דחייה לH 0 - 2.584 1.848 10 C 0 2.262 S n ) ( n1), (1 2 C 0t תחום דחית H 0 תחום קבלת H0 1.848 1.7 0 1.848 נקבל את השערת האפס ד. החלטה ממוצע ההפרשים בין שעות הערנות עם המשקה ובלעדיו 1.7שעות ,ממוצע זה נמצא בתחום קבלת השערת האפס. נקבל את השערת האפס – המשקה אינו משפיע על הערנות. ה. טעות אפשרית מאחר וקיבלנו את , H 0הטעות האפשרית היא טעות מסוג שני . - © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 122 בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס ' (0.05 מקבלים את השערת האפס. ) 0.1) (0.05 ' df 9 0.95 1 0.975 0.05 ' 0.1 2 1.7 0 2.08 2.584 ( ) 10 ' 2 9 ,1 t בדיקה ע"י השוואת ערכי t t9,0.975 2.262 1.7 0 2.08 2.584 ( ) 10 tSTAT tCRITICALדוחים את השערת האפס 0 t STAT S n t STAT t ( n1)(1 ') tSTAT tCRITICAL מקבלים את השערת האפס ) t STAT (2.08) t (2.262מקבלים את השערת האפס .7 המבחן הוא מבחן דו כיווני האם קיים פער בין שני המוסדות – אין כיוון לגבי מוסד מסוים. חישוב נתונים S 449.8 : א. d 135 השערות : D 0 H0 : אין הבדל בשכר בין שני המוסדות D 0 H1 : קיים הבדל בשכר בין שני המוסדות ב. 0.02 ג. תחומי קבלה /דחייה לH 0 - 449.8 401.25 10 0 2.821 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע S n ) ( n1), (1 2 C 0t 123 תחום דחית H 0 תחום קבלת H0 401.25 135 401.25 0 נקבל את השערת האפס ד. החלטה ממוצע ההפרשים בין המשכורת בין שני המוסדות הוא ₪ 135והוא נמצא בתחום קבלת השערת האפס -אין הבדל בין המשכורות בין שני המוסדות. ה. טעות אפשרית מאחר וקיבלנו את , H 0הטעות האפשרית היא טעות מסוג שני . - טעות מסוג שני היא השטח הנמצא בין הגבול הקריטי לערך הנבדק (ממוצע הפרשי השכר) כלומר בין 135ל- , 401.25את המרווח ניתן למדוד בערכים מוחלטים מאחר והטבלה והשטחים חיוביים. 401.25 135 1.87 449.8 ( ) 10 C D S ) n ( ) 9 ,(1 2 t ברמה של 9דרגות חופש 0.979 2 0.95 1 0.05 2 0.025 0.05 0.1 הסיכוי לשגיאה במסקנה הוא בין 5%ל.10%- © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 124 בדיקה ע"י השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.2 ' 0.5 0.9 ' 2 135 0 0.949 449.8 ( ) 10 df 9 0.75 1 ' (0.2 מקבלים את השערת האפס. ) 0.5) (0.02 ' 2 9 ,1 t בדיקה ע"י השוואת ערכי t t9,0.99 2.821 135 0 0.949 449.8 ( ) 10 t STAT tSTAT tCRITICALדוחים את השערת האפס )t STAT (0.949) t (2.821 ב. 0 S n t STAT t ( n1)(1 ') tSTAT tCRITICAL מקבלים את השערת האפס מקבלים את השערת האפס שני המנכ"לים ישנו את הערכים S 1272.2 1272.2 1060.22 11 d 496.36 C 0 2.764 S n ) ( n1), (1 2 C 0t תחום דחית H 0 תחום קבלת H0 0 496.36 1060.22 1060.22 התוצאות בתוך תחום קבלת השערת האפס המסקנות אינן משתנות – מקבלים את השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 125 ג. 1060.22 496.36 1.47 1272.2 ( ) 11 C D ) S n ( t ) 10,(1 2 ברמה של 10דרגות חופש הערך אמנם לא נמצא אך הוא בין 1.372ל 1.812-לכן 0.95 2 0.9 1 0.1 2 0.05 0.1 0.2 הסיכוי לשגיאה במסקנה הוא בין 10%ל.20%- ד. הוספנו שתי משכורות אשר הפער ביניהם כ , ₪ 4000-המסקנה האינטואיטיבית המתבקשת היא שכתוצאה מכך נחליט שבמוסד Aהשכר גבוה יותר ,מאחר ושתי המשכורות שהוספנו הן קיצוניות בכל אחד מהמוסדות הם גרמו להעלאה משמעותית של סטית התקן בכל מוסד וכמובן העלו את סטית התקן בהפרשים בין המשכורות ולכן לא נגרם שינוי בהחלטה ,סטיית התקן כמדד לפיזור "תרמה" כאן ל"סדר" ובכך ערכים קיצוניים יחידים לא שינו את ההחלטה , אולם מאחר ובכל זאת הפער גדל הסיכוי לשגיאה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 126 הסקה סטטיסטית על פרופורציה באוכלוסיה ישנם מצבים בהם אנו רוצים ללמוד ולהסיק על פרופורציה/יחס של משתנה מסוים באוכלוסיה – * מפעל רוצה לבדוק את הפרופורציה/יחס של המוצרים הפגומים המוחזרים ע"י החנויות למפעל. * מפלגה רוצה לאמוד את הפרופורציה מבין מצביעה התומכים במועמד מסוים /הצעה מסוימת. הקונספציה דומה לזו בה עסקנו בהסקה על ממוצעים ,מאחר ואנו עוסקים בתכונות המתפלגות נורמאלית באוכלוסיה אולם בהסקות הסטטיסטיות בהן עסקנו עד עתה -הסקה על ממוצע האוכלוסייה מתוך מדגם ,עסקנו במשתנים אינטרוולים (משתני רווח) ,כאשר אנחנו עוסקים בהסקה על פרופורציה כלומר הסקה ממדגם על הפרופורציה של המשתנה הנבדק באוכלוסיה אנו עוסקים במשתנה מרמה נומינלית – מאחר ולמשתנה הנבדק ישנן שתי אפשרויות – קיים לא קיים ,משתנה זה בהגדרה מדויקת יותר הוא משתנה דיכוטומי – כן או לא - .חיובי /שלישי ,הריון /לא בהריון ,פגום /תקין. המצב אנלוגי למצבים אותם הכרנו בהסתברות – צלף יורה למטרה :בפני הצלף עומדות שתי אופציות – פוגע /מחטיא אין מצבי ביניים ,אם ההסתברות של הצלף לפגוע היא Pאז ההסתברות שלו להחטיא היא 1-Pמאחר וסה"כ האפשרויות /הסתברויות = , )100%( 1אם 70%מהניגשים מבחן עוברים אזי 30%נכשלים. – Pפרמטר – פרופורציית התכונה הנבדקת באוכלוסיה. 1-Pהפרופורציה המשלימה של התכונה הנבדקת באוכלוסיה (שהתכונה אינה מתקיימת בה). - Pסטטיסטי – פרופורציה התכונה הנבדקת במדגם . – 1 Pהפרופורציה המשלימה במדגם. באוכלוסיה 1000ילדים ,ידוע כי 350ילדים לומדים בבית ספר תיכון: 350 0.35 35% 1000 P כלומר הפרופורציה של מספר הילדים הלומדים בבית ספר מתוך כלל הילדים היא , 0.35הילדים הלומדים בבית הספר מהווים 35%מכלל הילדים באוכלוסיה. מנתון זה נובע כי 0.65היא פרופורציית הילדים שאינם לומדים בבית ספר מכלל הילדים. נניח כי Nהוא גודל האוכלוסייה ו M-הוא גודל התכונה הנבדקת באוכלוסיה זו : M N P © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע N M N 1 P 127 ניקח אוכלוסיה בת 100איש ונבדוק את מספר העוברים מתוכם בטסט ראשון בנהיגה נמצא כי 65נוכל לומר כי , P=0.65מאחר וכפי שהוסבר משתנה זה אינו יכול לקבל ערכים אינטרוולים -ישנן שתי אפשרויות – עובר/לא עובר ניתן לאדם שעובר ציון 1ולנכשל ציון . 0 65 1 35 0 נחשב את ממוצע העוברים 0.65 100 מכך אנו למדים כי : P נחשב את סטית התקן: X i X 2 Fi Fi Xi 1 0.652 65 65 1 0 0.652 35 35 0 (1 0.65) 2 65 (0 0.65) 2 35 0.4769 100 ( X i X ) 2 Fi N ) (1 P) 2 M (0 P) 2 ( N M N נציב את Pבמקום הערכים המספריים M N M 2 (1 P) 2 P P(1 P) 2 (1 P) P 2 N N נפרק ונהפוך את כל הביטוי לערכי P P(1 P)1 P P סטית התקן לפרופורציה © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע נוציא גורם משותף ) P(1 P 128 בדומה להתפלגות הממוצע ניתן להגדיר את משפט הגבול המרכזי לפרופורציה משפט הגבול המרכזי לפרופורציה אם מתוך אוכלוסייה בעלת פרופורציה Pלתכונה מסוימת וסטית תקן ) , P(1 Pנוציא את כל המדגמים האפשריים בגודל .nסדרת הפרופורציות של כל המדגמים תתפלג נורמאלית ,עם פרופורציה , P )P(1 P וסטית תקן הנקראת טעות התקן Standard Errorושווה ל- n . SE בניסוח סטטיסטי P(1 P) P ~ N P , n נורמאלית שונות התקן השווה לריבוע טעות התקן סדרת הפרופורציות של המדגמים מתפלג פרופורציות האוכלוסייה P כאשר אנו בודקים פרופורציה של תכונה מסוימת גודל המדגם משמעותי ,מאחר ולפרופורציה במדגמים קטנים אין משמעות – אנו עוסקים במדגמים הגדולים מ 30-איש. מאחר וסדרת הפרופורציות של כל המדגמים מתפלגת נורמלית: P P )P(1 P n כאשר הפרופורציה באוכלוסיה ידועה Z כאשר הפרופורציה באוכלוסיה אינה ידועה P P Z )P(1 P n רווח בר סמך לפרופורציה Pבאוכלוסיה: )P(1 P n )P(1 P P P Z 1 n 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע P Z 1 2 129 שאלה : נערך מדגם של 100מצביעים ונמצא כי 42%מתוכם תומכים במועמד מסוים. בנו רווח בר סמך לפרופורציית המצביעים באוכלוסיה ברמת בטחון של .95% )0.42(1 0.42 0.04935 Z Z 0.975 1.96 1 100 2 ) P (1 P P P Z 1 n ) P (1 P n ) P (1 P n P 0.42 P Z 1 2 2 0.42 1.96 0.04935 P 0.42 1.96 0.04395 0.3232 P 0.5167 32.32% P 51.67% פרופורציית המצביעים למועמד באוכלוסיה היא בין 32.32%ל. 51.67% - קיבלנו רווח רחב – אורך הרווח כ , 20%-ניתן לצמצם בשתי אפשרויות א. הגדלת המדגם – מדגם גדול יותר יקטין את טעות התקן ובכך יצמצמם את הרווח . ב. הקטנת רמת הביטחון – רמת סמך קטנה יותר תגדיל את הרווח אך תפגע בביטחון – תגדיל את הסיכוי לשגיאה. נניח כי גודל המדגם בו התקבלה פרופורציה זו הוא 400מצביעים: )P(1 P )P(1 P P P Z 1 n n 2 )0.42(1 0.42 )0.42(1 0.42 P 0.42 1.96 400 400 2 P Z 1 0.42 1.96 0.3716 P 0.4683 פרופורציית המצביעים היא בין 37.16%ל , 46.83%-כלומר הגדלת המדגם צמצמה את הרווח ל.9%- אם נבדוק באופן מדויק יותר במדגם בן 100איש אורך הרווח הוא , 19.35%במדגם בן 400איש אורך הרווח הוא . 9.67% כפי שלמדנו הגדלת המדגם פי Kתצמצם את אורך הרווח פי K הגדלנו את המדגם פי – 4הרווח הצטמצם פי . 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 130 שאלה : מהו גודל המדגם הדרוש על מנת שאורך הרווח לא יעלה על ? 4% L מחצית אורך הרווח 2% 0.02 2 0.02 )0.42(1 0.42 1.96 n )P(1 P 0.02 n 2 1 Z 2 2339 n 1.96 0.42 0.58 n 0 . 02 גודל המדגם המינימאלי הוא 2339איש. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 131 בדיקת השערות מנהל כ"א בחברה מסוימת טוען כי 40%מעובדי החברה ראויים לקידום ,מנכ"ל החברה טוען כי הערכת מנהל כ"א גבוהה מדי ולכן ראיין 50עובדים ומצא כי 35%מהם ראויים לקידום ,בדקו האם קיים הבדל בין הנחת מנהל כ"א לבין ממצאי המנכ"ל ,ברמת מובהקות של 0.05 P 0.4 H0 : פרופורציית העובדים המועמדים לקידום בחברה היא )40%( 0.4 P 0.4 H1 : פרופורציית העובדים המועמדים לקידום בחברה קטנה מ.)40%( 0.4 - 0.05 בדיקה בשיטה הקלאסית :נחשב את הגבול הקריטי – תחומי קבלה ודחיית השערת האפס: Z 0.95 1.65 0.35 0.65 0.0675 50 )P(1 P n P 0.35 n 50 P 0.4 )P(1 P 0.4 1.65 0.0675 0.288 n C P Z1 תחום דחית H 0 תחום קבלת H0 0.4 0.35 0.288 החלטה: השערת המנכ"ל נמצאת בתחום קבלת השערת האפס ,נקבל את השערת האפס – שיעור המועמדים לקידום אינו נמוך מ.40% – 0.4- שגיאה אפשרית – שגיאה מסוג שני , קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. 0.35 0.288 0.9185 0.0675 CP Z 1 P(1 P) n 1 0.8212 0.1788 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 132 בדיקה שיטת ההסתברויות : נחשב את ההסתברות לקבל ערך נמוך מהשערת המנהל (רמת המובהקות המינימאלית) 0.35 0.4 0.74 0.0675 P P0 Z1 ' P(1 P) n ' 0.2296 רמת המובהקות המינימאלית לדחיית השערת האפס היא 0.2296כאשר רמת המובהקות המינימאלית גדולה מרמת המובהקות בהגדרת המחקר נקבל את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – 5%וקיבלנו שהסיכוי לשגיאה הוא 22.96%נקבל את השערת האפס. ' נדחה את השערת האפס. ' נקבל את השערת האפס. בדיקה ע"פ ערכי : Z ערך Zע"פ נערך המבחן Z 1.65ערך Zנבדק ( Z STAT Z1 ' 0.74בדיקה ע"פ ערך מוחלט) Z STAT Zדוחים את השערת האפס Z STAT Zמקבלים את השערת האפס )Z STAT (0.74) Z (1.65 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע מקבלים את השערת האפס 133 תרגילים .1 במפעל מסוים 29% ,מהעובדים נוהגים לאחר לפחות פעם בחודש .מנהל הייצור של המפעל מציע שיטת תמריצים מיוחדת שעשויה לצמצם את אחוז המאחרים .השיטה נבדקה על מדגם מיקרי של 45עובדים .במדגם נמצא כי 21%מעובדים אחרו לפחות פעם בחודש. א. בדקו את הטענה ברמת מובהקות של ? 0.05 ב. בנו רווח סמך בביטחון של 95%לאחוז המאחרים לפחות פעם בחודש אם תונהג שיטת התמריצים החדשה. .2 במחלקת טלמרקטינג נמצא כי 36%מהשיחות גורמות להתעניינות ולקביעת פגישה אישית. נבדקה השפעתם של תעריפי שכר חדשים על שיפור היקף הפגישות הנקבעות לאחר השיחות על קבוצה של 30 טלפנים ונמצא כי 59%מהשיחות הניבו פגישה . א. בדקו את הטענה ברמת מובהקות של . 0.05 ב. מהו גודל המדגם המינימאלי (בהנחה כי שאר הנתונים אינם משתנים) לדחיית את השערת האפס ? ג. בנו רווח בר סמך לפרופורציית השיחות המניבות בהתאם לממצאי סעיף ב. .3 חברה מצאה כי 17%משעות העבודה (יום עבודה = 8שעות) של עובדיה מושקע בשיטוט באתרי אינטרנט .החברה הודיעה לעובדיה כי היא מכניסה תוכנה חדשה למעקב אחר פעילות האינטרנט של עובדיה. לבדיקת אפקטיביות ההצהרה נלקח מדגם של 40עובדים ונמצא כי בממוצע שוטטו באינטרנט חצי שעה ביום. א. בנו רווח בר סמך לפרופורציית שעות ה"שיטוט" באינטרנט לאחר הודעת החברה . 0.04 ב. בדקו את יעילות ההצהרה ברמת מובהקות של .0.04 ג. חלה טעות בהנחה הבסיסית ונמצא כי פרופורציית השיטוט היא 13%ולא 17%. .4 .1 מהי רמת המובהקות המינימאלית הדרושה בכדי להחליט כי הטענה אפקטיבית. .2 מהו גודל המדגם המינימאלי הדרוש בכדי לדחות את השערת האפס ברמת מובהקות של .0.04 36%מכלל המצביעים לפרלמנט מצביעים לזורו .התבטאויותיו האחרונות גרמו לסערה בקרב המצביעים ובסקר שנערך בקרב 175בעלי זכות הצבעה ,נמצא כי אחוז התומכים בזורו הוא . 32% בדקו את הטענה כי התבטאויותיו גרמו לו לנזק ,ברמת מובהקות של .0.05 .5 אחוזי הצפייה (רייטינג) בתוכנית הלילה של מומו היו בעונה הקודמת 22%בממוצע ,בסקר שכלל 360 בתי אב נמצא כי אחוז הצפייה בתוכנית הראשונה העונה עמד על . 25% בדוק את הטענה כי אחוזי הצפייה בתוכנית עלו ברמת מובהקות של .0.05 .6 42%מהניגשים לטסט ראשון (נהיגה) עוברים 49% .מבין 425נבחנים אשר למדו אצל המורה הידוע מוטי הילוכים עברו טסט ראשון ,האם מוטי הילוכים מורה טוב מהממוצע ? .בדקו ברמת מובהקות של .0.01 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 134 פתרונות .1 מבחן חד כיווני כלפי מטה ,נתונים וחישובים: Z 0.95 1.65 )P(1 P 0.21 0.79 0.0607 n 45 n 45 P 0.29 H0 : הבונוס אינו משפיע על אחוז המאחרים. P 0.29 H1 : הבונוס מצמצם את אחוז המאחרים. P 0.21 P 0.29 רמת מובהקות 0.05 בדיקה בשיטה הקלאסית :נחשב את הגבול הקריטי – תחומי קבלה ודחיית השערת האפס: )P(1 P C P Z1 0.29 1.65 0.0607 0.189 n תחום דחית H 0 קבלת תחום H0 0.29 0.21 0.18 החלטה: אחוז המאחרים החדש – 21%נמצא בתחום קבלת השערת האפס ,נקבל את השערת האפס – התמריצים החדשים אינם מצמצמים את אחוז המאחרים. שגיאה אפשרית – שגיאה מסוג שני , קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. 0.21 0.18 0.494 0.0607 CP Z 1 P(1 P) n 1 0.6517 0.3488 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 135 בדיקה בשיטת ההסתברויות : נחשב את ההסתברות לקבל ערך נמוך מהשערת המנהל (רמת המובהקות המינימאלית) 0.21 0.29 1.317 0.0607 P P Z1 ' P(1 P) n ' 0.0934 רמת המובהקות המינימאלית לדחיית השערת האפס היא 0.0934כאשר רמת המובהקות המינימאלית גדולה מרמת המובהקות בהגדרת המחקר נקבל את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – 5%וקיבלנו שהסיכוי לשגיאה הוא 9.34%נקבל את השערת האפס. ' נדחה את השערת האפס. ' נקבל את השערת האפס. בדיקה ע"פ ערכי : Z ערך Zע"פ נערך המבחן , Z 1.65ערך Zנבדק Z STAT Z דוחים את השערת האפס Z STAT Z מקבלים את השערת האפס ( Z STAT Z1 ' 1.32בדיקה ע"פ ערך מוחלט) )Z STAT (1.32) Z (1.65 ב. מקבלים את השערת האפס רווח בר סמך Z Z 0.975 1.96 1 2 ) P (1 P n ) P (1 P P P Z 1 n 2 P Z 1 2 0.21 1.96 0.0607 P 0.21 1.96 0.0607 0.091 P 0.328 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 136 .2 מבחן חד כיווני כלפי מעלה ,נתונים וחישובים: Z 0.95 1.65 0.41 0.59 0.08979 30 )P(1 P n n 30 P 0.59 P 0.36 H0 : תעריפי השכר החדשים אינם משפיעים על היקף הפגישות P 0.36 H1 : תעריפי השכר החדשים משפיעים על היקף הפגישות P 0.36 0.05 בדיקה בשיטה הקלאסית :נחשב את הגבול הקריטי – תחומי קבלה ודחיית השערת האפס: )P(1 P 0.36 1.65 0.08979 0.508 n C P Z1 תחום דחית H 0 תחום קבלת H0 0.59 0.508 0.36 החלטה: 59%מהשיחות הניבו פגישות – ערך הנמצא בתחום דחית השערת האפס – נדחה את השערת האפס תעריפי השכר החדשים משפרים את אחוז הפגישות . שגיאה אפשרית – שגיאה מסוג ראשון , דחינו את השערת האפס בזמן שהשערת האפס נכונה. חישוב השגיאה האפשרית: 0.59 0.36 2.56 0.08979 P P Z 1 P(1 P) n 1 0.9948 0.0052 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 137 בדיקה בשיטת ההסתברויות : נחשב את ההסתברות לקבל ערך נמוך מהשערת המנהל (רמת המובהקות המינימאלית) 0.59 0.36 2.56 0.08979 P P Z1 ' P(1 P) n 1 ' 0.9948 ' 0.0052 רמת המובהקות המינימאלית לדחיית השערת האפס היא 0.0052כאשר רמת המובהקות המינימאלית קטנה מרמת המובהקות בהגדרת המחקר נדחה את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – 5%וקיבלנו שהסיכוי לשגיאה הוא 0.52%נדחה את השערת האפס. ' נדחה את השערת האפס. ' נקבל את השערת האפס. בדיקה ע"פ ערכי : Z ערך Zע"פ נערך המבחן , Z 1.65ערך Zנבדק Z STAT Z1 ' 2.56 Z STAT Zדוחים את השערת האפס Z STAT Zמקבלים את השערת האפס )Z STAT (2.56) Z (1.65 ב. דוחים את השערת האפס כדי לדחות את השערת האפס בהנחה שכל הגורמים למעט גודל המדגם אינם משתנים נשתמש בZ- P P P(1 P) n 0.23 n 0.59 0.41 1.65 0.59 0.36 0.59 0.41 n Z1 1.65 2 13 n 1.65 0.4918 n 0.23 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 138 ג. Z 0.975 1.96 2 )P (1 P n 1 )P (1 P P P Z 1 n 2 Z 2 1 P Z 0.59 1.96 0.1364 P 0.59 1.96 0.1364 0.3226 P 0.8573 .3 נתונים וחישובים: 0.0625 0.0.9375 0.03827 40 א. )P(1 P n ) P (1 P n 30 P 0.17 P 0.0625 480 Z 0.96 1.75 Z 0.98 2.05 n 40 )P (1 P P P Z 1 n 2 P Z 1 2 0.0625 2.05 0.03827 P 0.0625 2.05 0.03827 0.0159 P 0.1409 ב. מבחן חד כיווני כלפי מטה: P 0.17 H0 : הודעת החברה אינה מקצרת את זמן "השיטוט" של העובדים. P 0.17 H1 : הודעת החברה מקצרת את זמן "השיטוט" של העובדים 0.04 בדיקה בשיטה הקלאסית :נחשב את הגבול הקריטי – תחומי קבלה ודחיית השערת האפס: )P(1 P 0.17 1.75 0.03827 0.1030 n C P Z1 תחום דחית H 0 תחום קבלת H0 0.17 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 0.1030 0.0625 139 החלטה: 6%מזמן העבודה שוטטו העובדים באינטרנט ערך הנמצא בתחום דחיית השערת האפס . נדחה את השערת האפס – הצהרת החברה קיצרה את זמן השיטוט באינטרנט. שגיאה אפשרית – שגיאה מסוג ראשון , דחינו את השערת האפס בזמן שהשערת האפס נכונה. שגיאה אפשרית: 0.0625 0.17 2.8 0.03827 P P Z 1 P(1 P) n 0.0026 בדיקה בשיטת ההסתברויות : נחשב את רמת המובהקות המינימאלית: 0.0625 0.17 2.8 0.03827 P P Z1 ' P(1 P) n ' 0.0026 רמת המובהקות המינימאלית לדחיית השערת האפס היא 0.0026כאשר רמת המובהקות המינימאלית קטנה מרמת המובהקות בהגדרת המחקר נדחה את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – 4%וקיבלנו שהסיכוי לשגיאה הוא 0.26%נדחה את השערת האפס. ' נדחה את השערת האפס. ' נקבל את השערת האפס. בדיקה ע"פ ערכי : Z ערך Zע"פ נערך המבחן , Z 1.75ערך Zנבדק ( Z STAT Z1 ' 2.8בדיקה בערך מוחלט) Z STAT Zדוחים את השערת האפס Z STAT Zמקבלים את השערת האפס )Z STAT (2.8) Z (1.75 דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 140 ג. P 0.13 0.0625 0.13 Z1 ' 1.76 0.03827 ' 0.0392 רמת המובהקות המינימאלית לדחיית השערת האפס היא .0.0392 P P ד. P(1 P) n 2 1.75 0.242 n 0.0675 46 n .4 0.0675 n 0.0625 0.9375 1.75 0.0625 0.13 0.0625 0.9375 n Z1 1.75 מבחן חד כיווני כלפי מטה ,נתונים וחישובים: Z 0.95 1.65 0.32 0.68 0.0352 175 )P(1 P n n 175 P 0.36 H0 : התבטאויותיו של זורו לא גרמו לירידה באחוז התומכים. P 0.36 H1 : התבטאויותיו של גרמו לירידה באחוז התומכים . P 0.32 P 0.36 רמת מובהקות 0.05 נחשב את הגבול הקריטי – תחומי קבלה ודחיית השערת האפס: )P(1 P 0.36 1.65 0.0352 0.301 n C P Z1 תחום דחית H 0 תחום קבלת H0 0.36 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 0.32 0.301 141 החלטה: אחוז ההתומכים ע"פ הסקר – 32%נמצא בתחום קבלת השערת האפס ,נקבל את השערת האפס – התבטאויותיו של זורו לא גרמו לו נזק ולא פגעו באחוז התומכים. שגיאה אפשרית – שגיאה מסוג שני , קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. 0.32 0.301 0.539 0.0352 CP Z 1 P(1 P) n 1 0.7054 0.2946 בדיקה בשיטת ההסתברויות : נחשב את ההסתברות לקבל ערך נמוך מהשערת המנהל (רמת המובהקות המינימאלית) 0.32 0.36 1.136 0.0352 P P Z1 ' P(1 P) n ' 0.1292 רמת המובהקות המינימאלית לדחיית השערת האפס היא 0.1292כאשר רמת המובהקות המינימאלית גדולה מרמת המובהקות בהגדרת המחקר נקבל את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – 5%וקיבלנו שהסיכוי לשגיאה הוא 12.92%נקבל את השערת האפס. ' נדחה את השערת האפס. ' נקבל את השערת האפס. בדיקה ע"פ ערכי : Z ערך Zע"פ נערך המבחן ( Z STAT Z1 ' 1.14בדיקה ע"פ ערך מוחלט) , Z 1.65ערך Zנבדק Z STAT Z דוחים את השערת האפס Z STAT Z מקבלים את השערת האפס )Z STAT (1.14) Z (1.65 .5 מקבלים את השערת האפס מבחן חד כיווני כלפי מעלה ,נתונים וחישובים: Z 0.95 1.65 0.25 0.75 0.023 360 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע )P(1 P n n 360 P 0.25 P 0.22 142 P 0.22 H0 : אחוזי הצפייה בתוכניתו של מומו לא עלו ביחס לעונה הקודמת. P 0.22 H1 : אחוזי הצפייה בתוכניתו של מומו עלו ביחס לעונה הקודמת. רמת מובהקות 0.05 נחשב את הגבול הקריטי – תחומי קבלה ודחיית השערת האפס: )P(1 P 0.22 1.65 0.023 0.2579 n C P Z1 תחום דחית H 0 תחום קבלת H0 0.25 0.258 0.22 החלטה: אחוזי הצפיה ע"פ הסקר – 25%נמצא בתחום קבלת השערת האפס ,נקבל את השערת האפס – אחוזי הצפיה בתוכנית לא עלו העונה ביחס לעונה הקודמת. שגיאה אפשרית – שגיאה מסוג שני , קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. 0.258 0.25 0.3478 0.023 CP Z 1 P(1 P) n 1 0.6368 0.3632 בדיקה בשיטת ההסתברויות : נחשב את ההסתברות לקבל ערך נמוך מהשערת המנהל (רמת המובהקות המינימאלית) 0.25 0.22 1.304 0.023 P P Z1 ' P(1 P) n 1 ' 0.9032 ' 0.0968 רמת המובהקות המינימאלית לדחיית השערת האפס היא 0.0968כאשר רמת המובהקות המינימאלית גדולה מרמת המובהקות בהגדרת המחקר נקבל את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – 5%וקיבלנו שהסיכוי לשגיאה הוא 9.68%נקבל את השערת האפס. ' נדחה את השערת האפס. ' נקבל את השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 143 בדיקה ע"פ ערכי : Z ערך Zע"פ נערך המבחן , Z 1.65ערך Zנבדק Z STAT Z דוחים את השערת האפס Z STAT Z מקבלים את השערת האפס ( Z STAT Z1 ' 1.3בדיקה ע"פ ערך מוחלט) ) Z STAT (1.3) Z (1.65מקבלים את השערת האפס .6 מבחן חד כיווני כלפי מעלה -האם אחוזי המעבר בטסט ראשון אצל מוטי הילוכים גבוהים מהממוצע. נתונים וחישובים: Z 0.99 2.33 0.49 0.51 0.0242 425 )P(1 P n n 425 P 0.49 P 0.42 P 0.42 H0 : אחוזי המעבר בטסט ראשון אצל מוטי הילוכים אינם גבוהים משאר המורים P 0.42 H1 : אחוזי המעבר בטסט ראשון אצל מוטי הילוכים גבוהים משאר המורים רמת מובהקות 0.01 נחשב את הגבול הקריטי – תחומי קבלה ודחיית השערת האפס: )P(1 P 0.42 2.33 0.0242 0.4763 n C P Z1 תחום דחית H 0 תחום קבלת H0 0.42 0.4763 0.49 נדחה את השערת האפס החלטה: אחוזי המעבר בטסט ראשון אצל מוטי הילוכים – 49%גבוהים באופן מובהק מהממוצע (רמת מובהקות של )1% נדחה את השערת האפס שגיאה אפשרית – שגיאה מסוג ראשון , דחינו את השערת האפס בזמן שהשערת האפס נכונה. 0.49 0.42 2.89 0.0242 P P Z 1 P(1 P) n 1 0.9981 0.0019 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 144 בדיקה בשיטת ההסתברויות : נחשב את ההסתברות לקבל ערך נמוך מהשערת המנהל (רמת המובהקות המינימאלית) 0.49 0.42 2.89 0.0242 P P Z1 ' P(1 P) n 1 ' 0.9981 ' 0.0019 רמת המובהקות המינימאלית לדחיית השערת האפס היא 0.0019כאשר רמת המובהקות המינימאלית גדולה מרמת המובהקות בהגדרת המחקר נקבל את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – 1%וקיבלנו שהסיכוי לשגיאה הוא 0.19% נדחה את השערת האפס. ' נדחה את השערת האפס. ' נקבל את השערת האפס. בדיקה ע"פ ערכי : Z ערך Zע"פ נערך המבחן , Z 2.33ערך Zנבדק Z STAT Z דוחים את השערת האפס Z STAT Z מקבלים את השערת האפס )Z STAT (2.89) Z (2.33 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ( Z STAT Z ' 2.33בדיקה ע"פ ערך מוחלט) דוחים את השערת האפס 145 שני מדגמים בלתי תלויים – השוואת פרופורציות בפרק 6עסקנו בהסקה סטטיסטית על הפרשי ממוצעים בשני מדגמים בלתי תלויים ,אותו רעיון ישמש אותנו בהשוואה פרופורציות בין שני מדגמים ב"ת ,השוני המהותי הוא – כאשר משווים פרופורציות אנו עוסקים במדגמים גדולים ( ) n <30מאחר ופרופורציה מתוך מדגם קטן – חסרת משמעות. ) P1 (1 P1 n1 S טעות התקן לפרופורציית מדגם אחד . n1 P1 ) P2 (1 P2 n2 S טעות התקן לפרופורציית מדגם שני . n2 P2 טעות התקן המשוקללת להפרש בין הפרופורציות ) P1 (1 P1 ) P 2 (1 P 2 n1 n2 S רווח בר סמך להפרש פרופורציות ) P1 (1 P1 ) P 2 (1 P 2 ) P1 (1 P1 ) P 2 (1 P 2 P1 P2 P1 P2 Z 1 n1 n2 n1 n2 2 2 P1 P2 Z 1 שאלה: מפעל עורך השוואת בקרת איכות של מוצר מסוים המיוצר בשני פסי יצור ,במדגם של 450מוצרים אשר יוצרו בפס יצור Aנמצאו 25מוצרים פגומים ,במדגם של 500מוצרים אשר יוצרו בפס יצור Bנמצאו 38מוצרים פגומים ,בנו רווח בר סמך להפרש הפרופורציות ברמת סמך של .0.95 עיבוד נתונים: B 41 0.082 500 A P1 1 P1 0.918 n1 500 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 25 0.055 450 P2 1 P2 0.945 n2 450 146 P2 P1 0.082 0.055 0.027 P1 P 2 P1 P2 Z 1 2 Z 1 Z 0.975 1.96 2 0.055 0.945 0.082 0.918 0.01631 450 500 P1 (1 P1 ) P 2 (1 P 2 ) P1 (1 P1 ) P 2 (1 P 2 ) P1 P2 P1 P2 Z 1 n1 n2 n1 n2 2 0.027 1.96 0.01631 P1 P2 0.027 1.96 0.01631 0.00496 P1 P2 0.05869 147 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע בדיקת השערות על הפרש פרופורציות כאשר עוסקים בבדיקת השערות להפרש פרופורציות יש לחשב תחילה את הפרופורציה המשוקללת לשני המדגמים , Pבחישוב טעות התקן נעזר בפרופורציה המשוקללת לשני המדגמים: Pn P n P 1 1 2 2 n1 n2 )P(1 P) P(1 P n1 n2 טעות התקן המשותפת להפרש הפרופורציות ( p1 p 2) - Z STATערך ה Z -הסטטיסטי להפרש הפרופורציות (ערך Zלחישוב רמת מובהקות מינימאלית): P1 P2 )P(1 P) P(1 P n1 n2 Z STAT שאלה: מפעל עורך השוואת בקרת איכות של מוצר מסוים המיוצר בשני פסי יצור ,במדגם של 450מוצרים אשר יוצרו בפס יצור Aנמצאו 25מוצרים פגומים ,במדגם של 500מוצרים אשר יוצרו בפס יצור Bנמצאו 38מוצרים פגומים ,האם קיים שוני באיכות המוצרים בין שני פסי היצור ,בדקו ברמת מובהקות של .0.05 מבחן דו כיווני (האם קיים שוני ? אין כיוון ברור) השערות P1 P2 0 H0 : אין שוני בין פרופורציית הפגומים בין שני פסי הייצור P1 P2 0 H1 : יש שוני בין פרופורציית הפגומים בין שני פסי הייצור רמת מובהקות 0.05 : תחומי קבלה /דחייה לH 0 - נתונים וחישובים: B A 41 0.082 500 P1 P2 0.027 P1 1 P1 0.918 25 0.055 450 Z 0.975 1.96 2 1 n2 450 0.055 450 0.082 500 0.0692 950 0.0692 0.9308 0.0692 0.9308 0.01649 450 500 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע P2 1 P2 0.945 n1 500 Z )P(1 P) P(1 P n1 n2 P ( p1 p 2) 148 השיטה הקלאסית: נחשב את הגבול הקריטי ,מבחן דו כיווני )P(1 P) P(1 P 0 1.96 0.01649 0.03232 n1 n2 2 C P1 P2 Z 1 תחום דחית H 0 תחום קבלת H0 0.027 0.03232 0.03232 0 הפרש הפרופורציות נמצא בתחום קבלת השערת האפס -נקבל את H 0 שגיאה אפשרית קיבלנו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג שני - קיבלנו את השערת האפס בזמן שההשערה האלטרנטיבית – השערת המחקר נכונה. בדיקה ע"י השוואת הסתברויות -רמות המובהקות ' נחשב את רמת המובהקות המינימאלית : ( P1 P2 ) 0 0.027 1.637 P(1 P) P(1 P) 0.01649 n1 n2 ' 0.101 0.0505 ' 0.9495 2 ' 2 ' 2 1 Z 1 ) ' (0.101) (0.05מקבלים את השערת האפס בדיקה ע"י השוואת ערכי Z Z STAT 1.637 1.96 2 Z 1 Z Z STATמקבלים את השערת האפס ראינו ב 3-דרכים שונות כי אין הבדל בטיב המוצרים בין שני פסי היצור לכן נקבל את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 149 תרגילים .1 בבית ספר מסוים כי מתוך מדגם של 160בנים נמצא כי ל 17-בנים יש יותר מציון שלילי אחד ,במדגם של 240בנות נמצא כי ל 19-יש יותר משלילי אחד ,האם נכונה הטענה כי פרופורציית הציונים השליליים בקרב הבנים גבוהה יותר ,בדקו ברמת מובהקות של .0.04 .2 חקלאי רצה להשוות את טיב היבול בין אבוקדו למנגו ,בדגימה של 520מנגו נמצאו 46פסולים למכירה במדגם של 720אבוקדו נמצאו 75פסולים למכירה ,האם יש הבדל בטיב היבול ,בדקו ברמת מובהקות של .5% .3 מפלגה בודקת את השפעת תעמולת בחירות על אחוז מצביעה .במדגם של 854איש טרם התעמולה נמצא כי 188איש תמכו במפלגה ,במדגם לאחר ימי התעמולה -מבין 658נשאלים 172איש הביעו תמיכה במפלגה א. האם נכון לומר כי התעמולה שיפרה את אחוז ההצבעה למפלגה . 0.05 ב. בנו רווח בר סמך להפרש הפרופורציות כתוצאה מהתעמולה 0.05 .4 נערך מחקר במטרה לבדוק את הקשר בין עישון לרמות כולסטרול בדם ,נבדקו 500מעשנים ונמצא כי ל 46-מהם היו רמות כולסטרול גבוהות בדם .נבדקו 500איש שאינם מעשנים ונמצא כי ל 37-מהם היו רמות כולסטרול גבוהות בדם ,האם ניתן לומר כי לקבוצת המעשנים ישנם רמות גבוהות יותר של כולסטרול בדם? בדקו ברמת מובהקות של .0.02 .5 חברת סלולאר מצאה כי מבין 400מנויים המקבלים שירות SMSחינם 225שולחים יותר מ500- הודעות בחודש ואילו מבין 650מנויים המשלמים עבור שירותי 310 , SMSשולחים יותר מ SMS 500-בחודש א. האם למחיר יש השפעה על כמות ה SMS-בדקו ברמת מובהקות של .2% ב. בנו רווח בר סמך להפרש הפרופורציות במחירי הSMS- .6 מנהל מסעדה בטיילת בדק ומצא כי מכל 50איש העוברים בטיילת 8נכנסים לאכול במסעדה ,במטרה לשפר את פרופורציית הנכנסים למסעדה מכלל העוברים בטיילת החליט לחלק מנשרים בכניסה לטיילת לפרסום. הממצאים הראו כי מתוך 350איש אשר עברו בטיילת נכנסו למסעדה 66איש. האם הפרסום עובד – בדקו ברמת ביטחון של .95% .7 לבדיקת הטענה כי אימוני כושר לפני הצבא משפרים את סיכויי הקבלה לסיירת ,נלקחו שני מדגמים: – Aמדגם של 84צעירים המתאמנים בכושר קרבי 146 – B .צעירים אשר אינם מתאמנים. הממצאים הראו כי 23מבין הקבוצה הראשונה התקבלו לסיירות ואילו מהקבוצה השנייה .38 בדקו את הטענה ברמת מובהקות של .5% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 150 פתרונות .1 נתונים וחישובים: Z 0.96 1.75 19 0.0791 240 P1 P2 0.02715 0.09 0.91 0.09 0.91 0.0292 160 240 17 0.10625 160 P1 0.10625 160 0.0791 240 0.09 400 P P2 מבחן חד כיווני כלפי מעלה: השערות P1 P2 0 H0 : פרופורציית הציונים השליליים בקרב הבנים אינה גבוהה מהבנות. P1 P2 0 H1 : פרופורציית הציונים השליליים בקרב הבנים גבוהה מהבנות. רמת מובהקות : 0.04 תחומי קבלה /דחייה לH 0 - א .השיטה הקלאסית: נחשב את הגבול הקריטי ,מבחן חד כיווני )P(1 P) P(1 P 0 1.75 0.0292 0.0511 n1 n2 C P1 P2 Z1 תחום דחית H 0 תחום קבלת H0 0.027 0.0511 0 הפרש הפרופורציות נמצא בתחום קבלת השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 151 שגיאה אפשרית קיבלנו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג שני - קיבלנו את השערת האפס בזמן שההשערה האלטרנטיבית – השערת המחקר נכונה. בדיקה ע"י השוואת הסתברויות -רמות המובהקות ' נחשב את רמת המובהקות המינימאלית : 0.027 0.924 0.0292 ( P1 P2 ) 0 )P(1 P) P(1 P n1 n2 ' 0.1788 Z1 ' 1 ' 0.8212 ) ' (0.1788) (0.04מקבלים את השערת האפס בדיקה ע"י השוואת Z Z 1.75 Z STAT 0.924 Z Z STATמקבלים את השערת האפס .2 מבחן דו כיווני ,נתונים וחישובים: Z 0.975 1.96 P1 P2 0.0156 0.0975 0.9025 0.0975 0.9025 0.017 720 520 46 0.0884 520 75 0.1041 720 P1 0.1041 720 0.0884 520 0.0975 1240 P P2 השערות P1 P2 0 H0 : אין הבדל בטיב היבול בין שני המטעים P1 P2 0 H1 : קיים הבדל בטיב היבול בין שני המטעים רמת מובהקות : 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 152 תחומי קבלה /דחייה לH 0 - א .השיטה הקלאסית: נחשב את הגבול הקריטי ,מבחן דו כיווני )P(1 P) P(1 P 0 1.96 0.017 0.033 n1 n2 2 C P1 P2 Z 1 תחום דחית H 0 תחום קבלת H0 0.0156 0.033 0.033 0 הפרש הפרופורציות נמצא בתחום קבלת השערת האפס. שגיאה אפשרית קיבלנו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג שני - קיבלנו את השערת האפס בזמן שההשערה האלטרנטיבית – השערת המחקר נכונה. בדיקה ע"י השוואת הסתברויות -רמות המובהקות ' נחשב את רמת המובהקות המינימאלית : ( P1 P2 ) 0 0.0156 0.917 0.017 ' 0.3576 0.1788 )P(1 P) P(1 P n1 n2 ' 0.8212 2 ' 2 Z 1 ' 2 1 ) ' (0.3576) (0.05מקבלים את השערת האפס בדיקה ע"י השוואת Z Z STAT 0.917 1.96 2 Z 1 Z Z STATמקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 153 .3 מבחן חד כיווני כלפי מעלה ,נתונים וחישובים: Z 0.95 1.65 P1 P2 0.041 188 0.22 854 0.2379 0.7621 0.2379 0.7621 0.022 658 854 172 0.2613 658 P1 0.2613 658 0.22 854 0.2379 1512 P P2 השערות P1 P2 0 H0 : תעמולת הבחירות אינה משפיעה את אחוז המצביעים. P1 P2 0 H1 : תעמולת הבחירות מעלה את אחוז המצביעים. רמת מובהקות 0.05 : תחומי קבלה /דחייה לH 0 - נחשב את הגבול הקריטי ,מבחן חד כיווני )P(1 P) P(1 P 0 1.65 0.022 0.0363 n1 n2 C P1 P2 Z1 תחום דחית H 0 תחום קבלת H0 0 0.036 0.041 הפרש הפרופורציות נמצא בתחום דחית השערת האפס. שגיאה אפשרית דחינו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג ראשון - דחינו את השערת האפס בזמן שהשערת האפס נכונה. בדיקה ע"י השוואת הסתברויות -רמות המובהקות נחשב את רמת המובהקות המינימאלית : 0.041 1.86 0.022 ( P1 P2 ) 0 )P(1 P) P(1 P n1 n2 ' 0.0314 ' Z1 ' 1 ' 0.9686 ) ' (0.0314) (0.05דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 154 בדיקה ע"י השוואת Z Z 1.65 Z STAT 1.86 Z Z STATדוחים את השערת האפס רווח בר סמך: ב. Z 0.975 1.96 2 188 0.22 854 0.26 0.74 0.22 0.78 0.0222 658 854 ) P1 (1 P1 ) P 2 (1 P 2 n1 n2 1 Z P1 P2 0.04 172 0.26 658 P2 P1 ) P1 (1 P1 ) P 2 (1 P 2 n1 n2 ) P1 (1 P1 ) P 2 (1 P 2 P P1 P2 Z 1 n1 n2 2 2 1 P1 P2 Z 0.04 1.96 0.0222 P 0.04 1.96 0.0222 0.356 P 0.443 35.6% P 44.3% .4 מבחן חד כיווני כלפי מעלה ,נתונים וחישובים: Z 0.98 2.06 P1 P2 0.03 0.089 0.911 0.089 0.911 0.018 500 500 S 37 0.074 500 52 0.104 500 P1 0.104 500 0.074 500 0.089 1000 P P2 השערות P1 P2 0 H0 : רמות הכולסטרול בדם אצל מעשנים אינן גבוהות יותר מאשר אצל לא מעשנים P1 P2 0 H1 : רמות הכולסטרול בדם אצל מעשנים גבוהות יותר מאשר אצל לא מעשנים. רמת מובהקות 0.02 : © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 155 תחומי קבלה /דחייה לH 0 - נחשב את הגבול הקריטי תחום דחית H 0 תחום קבלת H0 0.03 0.037 הפרש הפרופורציות נמצא בתחום קבלת השערת האפס. 0 שגיאה אפשרית קיבלנו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג שני - קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. בדיקה ע"י השוואת הסתברויות -רמות המובהקות נחשב את רמת המובהקות המינימאלית : 0.03 0.81 0.037 ' ( P1 P2 ) 0 Z1 ' )P(1 P) P(1 P n1 n2 1 ' 0.7910 ' 0.209 ) ' (0.209) (0.02מקבלים את השערת האפס בדיקה ע"י השוואת Z Z 2.06 Z STAT 0.81 Z Z STATמקבלים את השערת האפס .5 מבחן דו כיווני – האם למחיר יש השפעה על כמות הSMS - נתונים וחישובים: Z 0.99 2.33 2 1 Z P1 P2 0.08 0.5095 0.4905 0.5095 0.4905 0.0317 400 650 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע S 310 0.4769 650 P2 225 0.5625 400 0.5625 400 0.4769 650 0.5095 1050 P1 P 156 השערות P1 P2 0 H0 : למחיר ה SMS-אין השפעה על כמות ה SMS-הנשלחים P1 P2 0 H1 : למחיר ה SMS-יש השפעה על כמות ה SMS-הנשלחים רמת מובהקות 0.02 : תחומי קבלה /דחייה לH 0 - נחשב את הגבול הקריטי )P(1 P) P(1 P 0 2.33 0.0317 0.073 n1 n2 2 C P1 P2 Z 1 תחום דחית H 0 תחום קבלת H0 0 0.073 0.08 0.073 הפרש הפרופורציות נמצא בתחום דחית השערת האפס. שגיאה אפשרית דחינו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג ראשון - דחינו את השערת האפס בזמן שהשערת האפס נכונה. בדיקה ע"י השוואת הסתברויות -רמות המובהקות נחשב את רמת המובהקות המינימאלית : ' ( P1 P2 ) 0 0.08 2.52 0.0317 )P(1 P) P(1 P n1 n2 ' 0.0118 0.9941 ' 2 ' 2 1 Z 1 ) ' (0.0118) (0.02דוחים את השערת האפס בדיקה ע"י השוואת Z Z STAT 2.52 Z 2.33 Z Z STATדוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 157 ב .רווח בר סמך: ) P1 (1 P1 ) P 2 (1 P 2 n1 n2 ) P1 (1 P1 ) P 2 (1 P 2 P P1 P2 Z 1 n1 n2 2 2 1 P1 P2 Z 0.08 2.33 0.0317 P 0.08 2.33 0.0317 0.0061 P 0.1538 0.61% P 15.38% .6 מבחן חד כיווני כלפי מעלה ,נתונים וחישובים: Z 0.95 1.65 8 0.16 50 P1 P2 0.03 0.186 0.814 0.186 0.814 0.058 350 50 S 66 0.19 350 P1 0.19 350 0.16 50 0.186 400 P P2 השערות P1 P2 0 H0 : הפרסום אינו משפר את המכירות P1 P2 0 H1 : הפרסום משפר את המכירות רמת מובהקות 0.05 : תחומי קבלה /דחייה לH 0 - נחשב את הגבול הקריטי תחום דחית H 0 תחום קבלת H0 0.03 0.097 הפרש הפרופורציות נמצא בתחום קבלת השערת האפס. 0 שגיאה אפשרית קיבלנו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג שני - קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. בדיקה ע"י השוואת הסתברויות – רמות מובהקות נחשב את רמת המובהקות המינימאלית : 0.03 0.51 0.0588 ( P1 P2 ) 0 )P(1 P) P(1 P n1 n2 ' 0.305 ' Z1 ' 1 ' 0.6950 ) ' (0.305) (0.05מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 158 בדיקה ע"י השוואת Z Z STAT 0.51 .7 Z 1.65 Z Z STATמקבלים את השערת האפס מבחן חד כיווני כלפי מעלה ,נתונים וחישובים: Z 0.95 1.65 30 0.205 146 P1 P2 0.069 0.23 0.77 0.23 0.77 0.0576 84 146 S 23 0.274 84 P1 0.274 84 0.205 146 0.2302 230 P P2 השערות P1 P2 0 H0 : אימוני כושר קרבי אינם משפרים את סיכויי הקבלה לסיירות P1 P2 0 H1 : אימוני כושר קרבי משפרים את סיכויי הקבלה לסיירות רמת מובהקות 0.05 : תחומי קבלה /דחייה לH 0 - )P(1 P) P(1 P 0 1.65 0.0576 0.095 n1 n2 תחום דחית H 0 א .השיטה הקלאסית: נחשב את הגבול הקריטי C P1 P2 Z1 תחום קבלת H0 0.069 0.095 הפרש הפרופורציות נמצא בתחום קבלת השערת האפס. 0 שגיאה אפשרית קיבלנו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג שני - קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. בדיקה ע"י השוואת הסתברויות – רמות מובהקות נחשב את רמת המובהקות המינימאלית : 0.069 1.19 0.0576 ( P1 P2 ) 0 )P(1 P) P(1 P n1 n2 ' 0.117 ' בדיקה ע"י השוואת Z Z STAT 0.51 Z 1.65 Z1 ' Z Z STATמקבלים את השערת האפס 1 ' 0.8830 ) ' (0.117) (0.05מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 159 הקירוב הנורמאלי לבינום ניסוי בינומי /התפלגות בינומית – התפלגות הבנויה ממספר מאורעות בלתי תלויים כאשר לכל מאורע ישנם שני מצבים אפשריים -הצלחה /כשלון. בהנחה כי ההסתברות להצלחה בכל מקרה היא pאזי ההסתברות לכישלון (המאורע המשלים ) היא . 1-p חישוב הסתברויות בהתפלגויות בינומיות נעשית באמצעות הנוסחה הידועה גם כנוסחת ברנולי: ההסתברות ל k -מקרים מתוך מדגם של nאפשרויות . n !n !) k k!(n k n PK ( n) p k (1 p) nk k דוגמא לשאלה: במדינת ישראל 35%מבעלי זכות ההצבעה מצביעים למפלגות שמאל ,בוחרים 5אנשים באקראי ,מה ההסתברות ששניים מהם מצביעי שמאל: p 0.35 1 p 0.65 n5 k 2 !5 0.352 0.653 0.3364 !2!3 P2(5) לא ארחיב בנושא זה מאחר וחומר זה אינו שייך לתחום עיסוקו של ספר זה. כאשר אנו עוסקים במדגמים גדולים n 30 -וגם , n p 10ניתן להניח כי ההתפלגות הבינומית שואפת להתפלגות נורמאלית ולכן ניתן לבצע קירוב נורמאלי להתפלגות הבינומית. ממוצע ההתפלגות הבינומית וסטית התקן מבוססים על ההנחות והמסקנות שהוכחו בהסקה סטטיסטית על פרופורציה (ע"מ )120תוך הכפלתם בגודל המדגם: ) np(1 p n p ע"פ משפט הגבול המרכזי : 2 X ~ N , נורמלית שונות מתפלגת ממוצע האוכלוסייה Xi © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע אוכלוסיה נחקרת Z 160 קירוב התפלגות בינומית לנורמאלית התפלגות בינומית X B ~ N np , np(1 p) X i np )np(1 p Z שאלה : במדינת ישראל 35%מבעלי זכות ההצבעה מצביעים למפלגות שמאל ,בוחרים מדגם של 70אנשים באקראי ,מה ההסתברות שלכל היותר 20מהם מצביעי שמאל: על מנת שנוכל לבצע קירוב נורמאלי לבינום צריכים להתקיים התנאים: n 30וגם n p 10 נבדוק תחילה קיום תנאים אלו: n 30 וגם 70 0.35 10 24.5 10 n 100 1 p 0.65 p 0.35 0.1292 4.5 1.13 3.99 20 70 0.35 70 0.35 0.65 Z p ( X i 20) p ( Z 1.13) 0.1292 0.8708 np=24.5 20 ההסתברות שלכל היותר 20איש מתוך 70הם מצביעי שמאל היא . 0.1292 שאלה: באוכלוסייה מסוימת 26%מהגברים קרחים ,בוחרים מדגם של 78גברים. א. מה ההסתברות שלפחות 10גברים יהיו קרחים. ב. מה ההסתברות שבדיוק 21גברים יהיו קרחים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 161 א. 10.28 2.65 3.873 10 78 0.26 78 0.26 0.74 Z 0.0040 0.996 p ( X i 10) p ( Z 2.65) 0.0040 np=20.28 1 0.0040 0.996 10 ההסתברות שלפחות 10גברים מתוך 76קרחים היא . 0.996 ב. כאשר רוצים לענות על השאלה – בדיוק ,נוסיף ונפחית 0.5מהמספר המבוקש ונחשב את ההסתברות בין שני ערכים אלו: כאשר רוצים לחשב את ההסתברות שבדיוק 21גברים קרחים ,נחשב את ההסתברות לכל היותר , 21.5את ההסתברות שלכל היותר 20.5נחסיר בין התוצאות ונקבל בדיוק .21 1.22 0.32 3.873 21.5 78 0.26 78 0.26 0.74 Z p ( X i 21.5) p ( Z 0.32) 0.6255 0.22 0.06 3.873 20.5 78 0.26 78 0.26 0.74 Z p ( X i 20.5) p ( Z 0.06) 0.5239 0.6255 0.5239 0.1016 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 162 תרגילים .1 מבין אוכלוסיית הבוחרים במדינה מסוימת 32%מצביעים למפלגת , XXבוחרים מדגם בין 140איש. א. מה ההסתברות שלכל היותר 50מהם מצביעי .XX ב. לכל היותר 25מהם מצביעי .XX ג. מהו מספר מצביעי XXהמינימאלי שנצפה למצוא. ד. מה ההסתברות ש 30-מהם מצביעי .XX .2 10%מהמחוסנים כנגד שפעת חולים במחלה ,בוחרים מדגם של 100מחוסנים. א. מה ההסתברות ש 20-מהם יחלו בשפעת. ב. מה ההסתברות שבין 30ל 40-מהם יחלו. .3 תרופה מסוימת גורמת לריפוי 80%מהחולים הלוקחים אותה. א. מה ההסתברות שבמדגם של 100איש תרפא התרופה לפחות 75%מהמשתמשים בתרופה. ב. מה ההסתברות שבמדגם של 200איש תרפא התרופה לפחות 75%מהמשתמשים בתרופה. ג. מה ההסתברות שבמדגם של 400איש תרפא התרופה לפחות 75%מהמשתמשים בתרופה. .4 חברה מייצרת מוצר מסוים וטוענת כי 60%מהאוכלוסייה צורכת את המוצר. מה ההסתברות שבמדגם של 500איש נקבל שפחות מ 45%משתמשים במוצר ? מהו מספר האנשים המינימאלי אשר צורך את המוצר במדגם זה ? © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 163 פתרונות .1 n 30וגם n p 10 תנאים לקירוב הנורמאלי לבינום (n 140) 30וגם 140 0.32 10 נבדוק תחילה קיום תנאים אלו: 44.8 10 א. n 140 1 p 0.68 5.2 0.943 5.51 p 0.32 50 140 0.32 140 0.32 0.68 0.1736 Z 0.8264 50 p ( X i 50) p ( Z 0.94) 0.8264 np=44.8 ההסתברות שלכל היותר 50מצביעים מבין 140מצביעי XXהיא . 0.8264 ב. p( X i 25) 19.8 3.59 5.51 25 140 0.32 140 0.32 0.68 Z טבלת ההתפלגות הנורמאלית מתארת תחום בין ( 3.49 3.49התחום הנוצר בין ) X 3 הערך -3.59חורג מגבולות הטבלה לכן תיאורטית בלתי אפשרי בתנאי הפרופורציות הנ"ל שמתוך מדגם של 140איש יהיו מקסימום 25מצביעי .XX ג. מספר האנשים המינימאלי יהיה כאשר : Z=-3.49 X 44.8 5.51 X 140 0.32 140 0.32 0.68 X 26 3.49 19.23 X 44.8 מספר מצביעי XXהמינימאלי שנצפה למצוא במדגם של 140איש הוא 26 :מצביעים. ד. כדי לחשב את ההסתברות שיהיו בדיוק 30מצביעים ,נחשב את ההסתברות שלכל היותר 30.5איש , את ההסתברות שלכל 29.5איש ונחסיר בין ההסתברויות. 14.3 2.6 5.51 30.5 140 0.32 140 0.32 0.68 Z p ( X i 30.5) p ( Z 2.6) 0.0047 15.3 2.78 5.51 29.5 140 0.32 140 0.32 0.68 Z p ( X i 29.5) p ( Z 2.78) 0.0027 0.0047 0.0027 0.002 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 164 .2 n 30וגם n p 10 תנאים לקירוב הנורמאלי לבינום (n 100) 30וגם נבדוק תחילה קיום תנאים אלו: 100 0.1 10 10 10 א. 20.5 100 0.1 10.5 3.5 3 100 0.1 0.9 9.5 3.17 3 Z p ( X i 20.5) p ( Z 3.5) 0.9998 19.5 100 0.1 100 0.1 0.9 Z p ( X i 19.5) p ( Z 3.17) 0.9992 0.9998 0.9992 0.0006 ב. 5 1.67 3 15 100 0.1 11 100 0.1 Z 1 Z 0.33 100 0.1 0.9 3 p ( X i 15) p ( Z 1.67) 0.9525 p ( X i 11) p ( Z 0.33) 0.6293 100 0.1 0.9 0.9525 0.6293 0.3232 .3 תנאים לקירוב הנורמאלי לבינום וגם n 30 100 30 n p 10 100 0.8 10 80 10 א. X i (75%) 75 n 100 1 p 0.2 5 1.25 4 p 0.8 75 100 0.8 100 0.8 0.2 Z p ( X i 75) 1 p ( Z 1.25) 1 0.1056 0.8944 ההסתברות שהתרופה תגרום לריפוי של לפחות 75%מהחולים היא . 0.8944 ב. תנאים לקירוב הנורמאלי לבינום נבדוק תחילה קיום תנאים אלו: n 30וגם n p 10 n 30 200 30 וגם n p 10 200 0.8 10 160 10 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 165 n 200 X i (75%) 150 1 p 0.2 10 1.77 5.656 p 0.8 150 200 0.8 200 0.8 0.2 Z p ( X i 150) 1 p ( Z 1.77) 1 0.0384 0.9616 ההסתברות שהתרופה תגרום לריפוי של לפחות 75%מתוך 200חולים היא . 0.9616 ג. n 30 תנאים לקירוב הנורמאלי לבינום 400 30 n p 10 וגם 400 0.8 10 320 10 n 400 X i (75%) 300 1 p 0.2 20 2.5 8 p 0.8 300 400 0.8 400 0.8 0.2 Z p ( X i 300) 1 p ( Z 2.5) 1 0.0062 0.9938 ההסתברות שהתרופה תגרום לריפוי של לפחות 75%חולים מתוך 400היא . 0.9938 .4 ע"פ טענת החברה p=0.6 30וגםn n p 10 500 30 500 0.6 10 תנאים לקירוב הנורמאלי לבינום 300 10 X i (45%) 225 n 500 1 p 0.4 75 6.84 10.95 p 0.6 225 500 0.6 500 0.6 0.4 Z p ( Z 6.84) לא יתכן שבמדגם של 500איש פחות מ 45%-יצרכו את המוצר. נבדוק מהו מספר האנשים המינימאלי שיצרוך את המוצר מתוך 500איש -נציב : Z=-3.49 X 300 10.95 X 262 X 500 0.6 500 0.6 0.4 3.49 38.21 X 300 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ע"פ נתוני החברה מספר האנשים המינימאלי אשר יצרוך את המוצר במדגם של 500איש הוא , 262מינימום 52%צורכים את המוצר. 166 הסקה סטטיסטית על שונות האוכלוסייה 2 שונות היא מדד פיזור – פיזור האוכלוסייה ביחס לתכונה הנבדקת ,כלומר ככל שהשונות קטנה יותר כך פיזור התכונה הנבדקת קטן יותר – כך הפיזור של התכונה אותה היא מייצגת באוכלוסיה קטן יותר וההיפך. כלומר שונות קטנה משמעותה אוכלוסיה הומוגנית יותר ביחס לתכונה הנבדקת ואילו ככל שהשונות גדלה כך האוכלוסייה (ביחס לתכונה הנבדקת הטרוגנית יותר. (מאחר והשונות היא ריבוע סטית התקן כל ההנחות שהנחנו לעיל מתייחסות גם לסטיית התקן). ישנם מצבים בהם אנו מעוניינים להסיק ממדגם לגבי השונות באוכלוסיה כלומר אנו מעוניינים להסיק ולבדוק לגבי הפיזור באוכלוסיה – הפיזור הקיים בהכנסות (השונות בשכר) השונות /הפיזור של גיל אוכלוסיית מעשנים במדינה מסוימת ביחס למדינה אחרת וכו'. כפי שבנינו רווח בר סמך לממוצע האוכלוסייה ובדקנו השערות על ממוצעים והפרשי ממוצעים ,על בסיס אותו רעיון אנו בודקים השערות על שונות האוכלוסייה 2מתוך מדגם. באמצעות S 2אנו אומדים מתוך מדגם את השונות באוכלוסיה . 2 בדומה למשפט הגבול המרכזי (המתייחס לממוצעי המדגמים) ניתן לנסח משפט לגבי השונות: אם מתוך אוכלוסיה נורמאלית בעלת ממוצע ושונות 2נוציא את כל המדגמים האפשריים בגודל nמסוים 2 )S (n 1 ולכל מדגם נחשב את הסטטיסטי S 2אז הביטוי 2 ( xi x ) 2 2 מתפלג לפי התפלגות ( 2התפלגות חי בריבוע) ,עם n-1דרגות חופש. df=6 df=4 df=10 התפלגות היא התפלגות אסימטרית בעלת זנב ימני ,אולם ככל שמספר דרגות החופש dfגדל 2 ההתפלגות מתקרבת להתפלגות נורמאלית. השטח מתחת לעקומה = 1 נסמן את 2 n 1,1 0.05 14.067 n8 2 7 , 0.95 שימו לב כי 4העמודות הראשונות בטבלת © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 מייצגות את וארבע העמודות אחריהן את 1 167 רווח בר סמך לשונות 2 2 2 ( n 1) S 2 2 n 1, ( n 1) S 2 2 2 n 1,1 בדיקת השערות מבחן דו כיווני גבול תחתון 2 2 n 1, C1 גבול עליון 2 2 n1,1 C2 מבחן חד כיווני השערה חד כיוונית כלפי מעלה 2 n 1,1 C השערה חד כיוונית כלפי מטה 2 n 1, C הערך הנבדק ביחס לגבול הקריטי הוא 2 2 (n 1) S 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 168 שאלה: בישוב קהילתי מסוים הוחלט כי שכר התושבים יהיה בנוי על שונות קבועה של , 2 122500הועלתה טענה כי הפערים בין משכורות עו"ד גבוהים יותר ,נלקח מדגם מקרי של 30עו"ד ונמצא כי השונות המתוקנת שלהם 2 . S 202500 א. בנו רווח בר סמך לשונות משכורת עו"ד ברמת סמך של .0.98 ב. בדקו את הטענה ברמת מובהקות של . 0.05 א. נחשב רווח בר סמך לשונות מנת המשכל של צוערי קורס טיס. 2 2 n 1, 2 0.02 14.26 2 7,0.01 ( n 1) S 2 2 n 1, n 1,1 n 30 49.59 2 2 2 29,0.99 2 ( n 1) S 2 2 2 n 1,1 29 202500 29 202500 2 49.59 14.26 118421 2 411816 חשוב לשים לב כי הערכים גבוהים מאחר וזהו רווח בר סמך לשונות ובמונחי שכר ,אם נסתכל על סטיות תקן הרווח הוא 344.12 641.72כלומר זהו הטווח בו לאומדן הפיזור סביב ממוצע השכר. ב. נבדוק את הטענה כי שונות שכר קבוצת עו"ד בישוב גבוהה יותר משונות השכר בישוב אנו עוסקים במבחן חד כיווני – כלפי מעלה . ב1. השערות: 2 122500 H0 : שונות שכר עו"ד בישוב אינה שונה משונות השכר בישוב 2 122500 H1 : שונות שכר עו"ד בישוב גדולה משונות השכר בישוב ב.2. 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 169 ב.3. תחומי קבלה /דחייה לH 0 - 2 122500 2 S 202500 n 30 42.56 29 202500 47.93 122500 2 29,0.95 C 2 (n 1) S 2 2 ---הערך הנבדק מול הגבול הקריטי תחום דחית H 0 תחום קבלת H 0 47.93 ב.4. מאחר ו- 2 42.56 נמצא בתחום דחית השערת האפס – נדחה את השערת האפס ונקבל את השערת המחקר שונות שכרם של עו"ד הדין גבוהה משונות השכר בישוב. ב.5. מאחר ודחינו את השערת האפס הטעות האפשרית היא טעות מסוג ראשון. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 170 תרגילים .1 שונות מנת המשכל לאוכלוסיית החיילים בצה"ל היא , 2 38נבדקת הטענה כי בקורס טייס שונות מנת המשכל אחידה יותר .נלקח מדגם של 8צוערים )IQ(. 122 , 114 , 111 , 115 , 120 , 122 , 115 , 113 : א. בנו רווח בר סמך לשונות מנת המשכל של צוערי קורס טיס( .ברמת סמך של .)0.98 ב. בדקו את הטענה ברמת מובהקות של . 0.05 .2 ההכנסה הממוצעת לגבר במדינת ישראל היא , ₪ 4560סטיית תקן .₪ 620נלקח מדגם מקרי של 10 נשים להלן הכנסותיהן בש"ח5200 , 4700 , 5650 , 4950 , 7120 , 6250 , 4580 , 5470 , 4380 , 6530 : א. בנו רווח בר סמך לשונות שכר הנשים במדינה (ברמת סמך של .)0.95 ב. בדקו את הטענה כי הכנסתה הממוצעת של אישה גבוהה מההכנסה הממוצעת של גבר . 0.05 ג. בדקו את הטענה כי הכנסת הנשים הטרוגנית יותר מהכנסת הגברים 0.05 .3 מחירה הממוצע של מכונית מסוימת מודל 2005הוא ₪ 95000עם סטית תקן של .₪ 2250 נבדקת הטענה כי תושבי ירושלים שומרים טוב יותר על מכוניותיהם ולכן מחיר המכונית אחיד יותר. נלקח מדגם של 8מכוניות "ירושלמיות" להלן מחירי המכירה שלהן באלפי : ₪ 96.5 , 97 , 94.5 , 92.5 , 95.3 , 94.2 , 95. 5 , 96בדקו את הטענה ברמת מובהקות של 0.025 .4 סטית התקן (היומית) של מניה מסוימת היא 14נק' ,סוחר קנה 51מניות והחליט לרכוש מניות נוספות כאשר מניה "מתעוררת" – שוברת את מחסום השונות היומית הממוצעת. ביום מסוים סטית התקן של מניותיו הייתה 20נק' – בדקו האם עליו להתחיל ולרכוש מניות 0.05 .5 מנתוני משרד הבריאות עולה כי תוחלת משך חיי גברים הוא 74שנים עם סטיית תקן 4שנים. נלקח מדגם מקרי של 10נשים להלן משך חייהן. 93 , 76 , 85 , 95 , 72 , 69 , 95 , 54 , 48 , 65 : א. בנו רווח בר סמך לשונות משך חיי הנשים במדינה (ברמת סמך של .)0.95 ב. בדקו את הטענה כי תוחלת חיי אישה גבוהה מתוחלת חיי גבר . 0.05 ג. בדקו את הטענה כי תוחלת חיי הנשים הטרוגנית יותר מתוחלת חיי הגברים 0.05 .6 מפעל המייצר ברגים משתמש במכונות המייצרות ברגים באורך של 5ס"מ ושונות של 0.25ס"מ ידוע כי רק ברגים באורך של 4.5-5.5ס"מ נארזים והשאר נזרקים. א. בהנחה שהתפלגות הברגים נורמאלית האם נכון יהיה לומר כי המפעל מאבד כ 30%-מתפוקתו ? ב. במטרה לשפר את המכירות המפעל בוחן מכונה חדשה .נלקח מדגם של 10ברגים שיצרה המכונה להלן אורכם בס"מ 5.3 , 4.85 , 4.6 , 5.4 , 5.2 , 4.9 , 5.1 , 4.8 , 5.1 , 5.5 : מה המלצתך ברמת מובהקות של 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 171 פתרונות .1 נאמוד את סטית התקן (סטית תקן מתוקנת) מתוך מדגם שמונת הצוערים: 2 38 2 S 18 n8 הפער בין השונויות נראה גבוה ,אולם במונחי סטית תקן אנו מעוניינים לבדוק אם קיים פער מובהק בין 6.614 א. S 4.24פער שבהחלט יכול להיות זניח. נחשב רווח בר סמך לשונות מנת המשכל של צוערי קורס טיס. 2 2 n 1, 2 2 n 1,1 0.02 1.24 2 7,0.01 18.47 n8 2 7,0.99 2 ( n 1) S 2 2 n 1, 2 ( n 1) S 2 2 2 n 1,1 7 18 7 18 2 18.47 1.24 6.82 2 101.61 ב. נבדוק את הטענה כי שונות מנת המשכל אחידה יותר בקורס טיס (כלומר קטנה יותר) ביחס לכלל החיילים אנו עוסקים במבחן חד כיווני – כלפי מטה . ב1. השערות: 2 38 H0 : שונות מנת המשכל בקורס טיס אינה קטנה מהשונות בכלל צה"ל 2 38 H1 : שונות מנת המשכל בקורס טיס נמוכה משונות מנת המשכל בכלל צה"ל ב.2. 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 172 ב.3. תחומי קבלה /דחייה לH 0 - 2 38 2 S 18 n8 2.17 7 18 3.31 38 2 7,0.05 C 2 (n 1) S 2 2 תחומי דחית H 0 תחומי קבלת H 0 3.31 ב.4. מאחר ו- 2 2.17 נמצא בתחום קבלת השערת האפס – נקבל את השערת האפס ונדחה את השערת המחקר לצוערי קורס טיס יש שונות במנת המשכל השווה לשונות מנת המשכל של כלל חיילי צה"ל. ב.5. .2 מאחר וקיבלנו את השערת האפס הטעות האפשרית היא טעות מסוג שני. נאמוד את שונות השכר באוכלוסיית הנשים מתוך מדגם הנשים: א. 2 S 822401 S 906.8 2 2 n 1, 2 0.05 2.7 2 9,0.025 (n 1) S 2 2 n 1, n 1,1 n 10 19.02 2 2 2 9,0.975 2 (n 1) S 2 2 2 n 1,1 9 822401 9 822401 2 19.02 2.7 389148.79 2 2741336.67 623.81 1655.69 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 173 ב. בדיקת השערות על ממוצע כאשר סטית התקן לא ידועה , בדיקת השערות חד כיוונית – כלפי מעלה -הכנסת הנשים גבוהה יותר. מבחן חד כווני כלפי מעלה ב.1. השערות : 4560 H0 : הכנסתם הממוצעת של נשים אינה שונה מהכנסתם הממוצעת של הגברים 4560 H1 : הכנסתם הממוצעת של נשים גבוהה מהכנסתם הממוצעת של הגברים. ב.2. 0.05 ב.3. תחומי קבלה /דחייה לH 0 - t( n 1),(1 ) t9,0.95 1.833 S 906.8 X 5483 S C 0 t( n 1),(1 ) n 906.8 5085.6 10 C 4560 1.833 תחום דחית H 0 תחום קבלת H0 5085.6 5483 ב.4. 4560 החלטה נדחה את H 0ונקבל את השערת המחקר – הכנסתם הממוצעת של נשים גבוהה מהכנסתם הממוצעת של גברים. ב.5. טעות אפשרית מאחר ודחינו את H 0הטעות האפשרית -דחינו את השערת האפס בזמן שהשערת האפס נכונה . טעות מסוג ראשון . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 174 ההסתברות ה"אמיתית" לטעות מסוג זה במחקר זה היא: 5483 4560 3.21 906.8 10 ' 0.995 1 ג. 0 t9,(1 ') S ) n ברמה של 9דרגות חופש הערך אינו נמצא בטבלה ( , ' 0.005כלומר הסיכוי לשגיאה במסקנה קטן מ.0.5%- בדיקת השערות של שונות ,השערה חד כיוונית כלפי מעלה – אם הכנסת הנשים הטרוגנית יותר אזי השונות שלהן גבוהה יותר. 2 384400 ג1. 2 S 822401 n 10 השערות: 2 384400 H0 : שונות שכר הנשים אינה גבוהה משונות שכר הגברים 2 384400 H1 : שונות שכר הנשים גבוהה משונות שכר הגברים. ג.2. 0.05 ג..3. תחומי קבלה /דחייה לH 0 - 16.92 9 822401 19.25 384400 2 9 , 0.95 C 2 (n 1) S 2 2 תחום קבלת H 0 תחום דחית H 0 19.25 ב.4. מאחר ו- 2 16.92 נמצא בתחום דחית השערת האפס – נדחה את השערת האפס ונקבל את השערת המחקר שונות ההכנסה של נשים גבוהה משונות ההכנסה של גברים. ב.5. מאחר ודחינו את השערת האפס ,השגיאה האפשרית היא שגיאה מסוג ראשון. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 175 .3 תושבי ירושלים שומרים טוב יותר על מכוניותיהם ולכן מחירם אחיד יותר ,כלומר שונות מחירי המכוניות בירושלים נמוכה יותר – מבחן חד כיווני כלפי מטה . א. השערות: 2 2250 2 H0 : שונות מחירי המכונית בירושלים אינה שונה מהשונות בכלל הארץ 2 2250 2 H1 : שונות מחירי המכונית בירושלים נמוכה מהשונות במחירה בכלל הארץ. ב.. 0.05 ג. תחומי קבלה /דחייה לH 0 - 2 22502 2 S 14362 n8 1.69 2.85 7 1436 2 2250 2 2 7,0.025 C 2 (n 1) S 2 2 תחום דחית H 0 תחום קבלת H 0 2.85 ד. מאחר ו- 2 1.69 נמצא בתחום קבלת השערת האפס – נקבל את השערת האפס ונדחה את השערת המחקר שונות מחירי המכונית בירושלים אינה שונה משונות מחירה בכלל הארץ. ה. מאחר וקיבלנו את השערת האפס הטעות האפשרית היא טעות מסוג שני. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 176 .4 מבחן חד כיווני כלפי מעלה – מניה "מתעוררת" התנודתיות גדלה – השונות גדלה . א. השערות 2 196 H0 : שונות המניה אינה גבוהה מהשונות בד"כ 2 196 H1 : שונות המניה גבוהה משונות בד"כ ב. 0.05 ג. תחומי קבלה ודחייה לH 0 - 2 S 400 n 51 67.5 C 50 400 102.04 196 (n 1) S 2 ד. מאחר ו- 2 תחום קבלת H 0 102.04 2 50,0.95 2 תחום דחית H 0 2 67.5 נמצא בתחום דחית השערת האפס – נדחה את השערת האפס ונקבל את השערת המחקר המניה "מתעוררת ושברה את מחסום השונות ,כלומר שונות המניה גבוהה מהשונות שלה בד"כ. ה. מאחר ודחינו את השערת האפס ,השגיאה האפשרית היא שגיאה מסוג ראשון. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 177 נאמוד את שונות משך חיי הנשים באוכלוסייה מתוך מדגם הנשים: .5 א. ב. בדיקת השערות על ממוצע כאשר סטית התקן לא ידועה ,בדיקת השערות חד כיוונית כלפי מעלה – 2 X 75.2 S 16.79 S 281.9 2 ( n 1) S 2 2 n 1, 2 ( n 1) S 2 2 2 n 1,1 9 281.9 9 281.9 2 19.02 2.7 2 133.39 939.67 11.55 30.65 האם תוחלת חיי הנשים גבוהה מתוחלת חיי הגברים. מבחן חד כווני כלפי מעלה ב.1. השערות : 74 H0 : תוחלת חיי הנשים אינה גבוהה מתוחלת חיי הגברים. 74 H1 : תוחלת חיי הנשים גבוהה מתוחלת חיי הגברים. ב.2. 0.05 ב.3. תחומי קבלה /דחייה לH 0 - S 16.79 t( n 1), (1 ) t9, 0.95 1.833 X 75.2 16.79 83.73 10 S C 0 t( n 1), (1 ) n C 74 1.833 תחום דחית H 0 תחום קבלת H0 75.2 83.73 74 מקבלים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 178 השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס ' 0.4 df 9 1 ' 0.6 75.2 74 0.226 16.79 ( ) 10 t9,1 ' ) ' ( 0.4) (0.05מקבלים את השערת האפס. השוואת ערכי t t9,0.95 1.833 72.5 74 0.226 16.79 ( ) 10 t STAT 0 S n t STAT t( n1)(1 ') ערך tהנבדק נקרא גם - t Criticalערך המוביל אותנו לגבול הקריטי tSTAT tCRITICALדוחים את השערת האפס )t STAT (0.226) t (1.833 ב.4. tSTAT tCRITICAL מקבלים את השערת האפס מקבלים את השערת האפס החלטה נקבל את השערת האפס ונדחה את השערת המחקר – תוחלת חיי הנשים אינה גבוהה מתוחלת חיי הגברים. ב.5. טעות אפשרית מאחר וקיבלנו את H 0הטעות האפשרית היא טעות מסוג שני - קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 179 ההסתברות לטעות מסוג זה במחקר זה היא: 83.73 75.2 1.606 16.79 10 S ) n 0.9 1 0.95 ג. C t9,(1 ) ( , 0.05 0.1הסיכוי לשגיאה במסקנה הוא בין 5%ל. 10%- בדיקת השערות של שונות ,השערה חד כיוונית כלפי מעלה – האם משך חיי הנשים בעל הטרוגניות גבוהה יותר ממשך חיי הגברים. ג1. ברמה של 9דרגות חופש הערך אינו נמצא בטבלה 2 144 n 10 S 281.9 השערות: 2 144 H0 : שונות חיי הנשים אינה גבוהה משונות חיי הגברים 2 144 H1 : שונות חיי הנשים גבוהה משונות חיי הגברים. ג.2. רמת מובהקות 0.05 ג..3. תחומי קבלה /דחייה לH 0 - 16.92 9 281.9 17.61 144 2 9 , 0.95 C 2 (n 1) S 2 2 תחום קבלת H 0 תחום דחית H 0 17.61 ב.4. 2 מאחר ו- 2 16.92 נמצא בתחום דחית השערת האפס – נדחה את השערת האפס ונקבל את השערת המחקר שונות חיי הנשים גבוהה משונות חייהם של גברים. ב.5. מאחר ודחינו את השערת האפס ,השגיאה האפשרית היא שגיאה מסוג ראשון. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 180 .6 א. על פי ממוצע וסטית תקן ניתן לקבל אומדן כלל של פיזור האוכלוסייה ידוע כי בתחומים: 2 3 בנתוני השאלה מהאוכלוסייה נמצאים 68.26%מהאוכלוסיה נמצאים 95.44%מהאוכלוסייה נמצאים 99.74%מהאוכלוסייה 0.5 4.5 5.5 5 כ 70%-מהברגים נמצאים בתחום זה – התחום בו הם נארזים המשמעות היא 30%-נזרקים – אובדן של 30% מהתפוקה ב. שיפור המכירות – הקטנת מספר הברגים הנזרקים – הקטנת פיזור הברגים – הקטנת השונות. מבחן חד כיווני כלפי מטה במטרה לבחון אם המכונה החדשה מייצרת ברגים בעלי שונות קטנה יותר. ב1. השערות: 2 0.25 H 0 :שונות המכונה החדשה אינה קטנה משונות המכונות הקיימות 2 0.25 H1 :שונות המכונה החדשה קטנה משונות המכונות הקיימות. ב.2. 0.05 ב.3. תחומי קבלה ודחייה לH 0 - 3.33 2 0.25 n 10 2 S 0.0818 9 0.0818 2.94 0.25 תחום קבלת H 0 ב.4. מאחר ו- 2 9 , 0.05 C 2 (n 1) S 2 2 תחום דחית H 0 3.33 2 2.94 נמצא בתחום דחית השערת האפס – נדחה את השערת האפס ונקבל את השערת המחקר המכונה החדשה מייצרת ברגים עם שונות קטנה באופן מובהק מהמכונה הקודמת. ב.5. מאחר ודחינו את השערת האפס הטעות האפשרית היא טעות מסוג ראשון. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 181 ניתוח שונות ANOVA – Analysis Of Variance - ניתוח שונות חד כיווני One way Analysis of Variance - ניתוח שונות הוא מבחן באמצעותו משווים בין תוחלות של מספר אוכלוסיות K -אוכלוסיות בלתי תלויות K 3 .כלומר :מינימום 3קבוצות. ניתוח השונות נעשה באמצעות ניתוח והשוואת השונות בתוך כל קבוצה/מדגם לבין השונות בין הקבוצות. שונות בתוך הקבוצה – " - Variance Within Groupsשונות בלתי מוסברת" שונות זו נובעת מהשפעת משתנים שאין באפשרותנו לפקח עליהם וממשתנים שלא נלקחו בחשבון בעת תכנון הניסוי/בניית המדגם. • כל אחת מן הקבוצות מורכבת מאינדוידואלים ,פרטים אלו ,שונים אלה מאלה( .שוני במשתנה התלוי – המשתנה אותו בודקים /מנסים לנבא). שונות בין הקבוצות – " - Variance Between Groupsשונות מוסברת" השונות בין תוחלות הקבוצות שונות זו מורכבת משני סוגי שונויות :שונות גורמים מוסברים ושונות גורמים בלתי מוסברים ,ולכן נקראת "השונות המוסברת". • שוני בין קבוצות כאשר ההבדלים בין אנשים בתוך כל קבוצה קטנים מן ההבדלים שקיימים בין הקבוצות. דוגמא: לצורך השוואה בין שלוש שיטות שונות ללימוד אנגלית ,נלקחו 3מדגמים בלתי תלויים של 10סטודנטים כ"א. כל קבוצה למדה אנגלית בשיטה שונה ולאחר 4חודשים נערך מבחן זהה לכל הקבוצות. שונות בתוך קבוצה – מדוע לא נצפה שהשונות בכל קבוצה תהיה שווה לאפס? אנו מבינים אינטואיטיבית מתוך הכרת המושג שונות כי לא תיתכן זהות בין כל הסטודנטים למרות שנחשפו לאותה שיטת לימוד ולכן קיימת שונות בין הפרטים. שונות זו נובעת משני סוגי גורמים – גורמים הניתנים לשליטה ובקרה אך לא ניתנה להם תשומת לב /בקרה בעת בניית המחקר ( -פערי רמות בין הסטודנטים ,מין הסטודנט ,מצב סוציואקונומי ,במידה וקבוצה חולקה לתת קבוצות – הבדלים בין מרצים ,כיתות לימוד ,שעות לימוד ,בודקי בחינות וכו') גורמים אשר אינם ניתנים לשליטה – קשיי ריכוז ,מצב בריאותי וכו'. שונות בין הקבוצות -מדוע קיים שוני בין תוחלות ציוניי הסטודנטים בשלוש הקבוצות השונות ? השונות בין תוחלות הציונים בין הקבוצות יכולה לנבוע משלושה גורמים: א. הבדל בין שיטות ההוראה השונות ,זוהי למעשה השערת המחקר/מטרת המחקר (הבדל מוסבר). ב. גורמים שלא נלקחו בשיקול בעת עריכת ותכנון המחקר (שוני בין מרצים ,מיקום ,שעות לימוד ,פערים בין הקבוצות וכו'). ג. גורמים שאינם בשליטתנו( .מצב בריאותי של סטודנטים /מרצים וכו') © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 182 ה"שונות בין הקבוצות" מבטאת את השונות שבין ממוצעי ציוני תלמידים בקבוצות השונות והיא מורכבת משני סוגי שונויות :שונות גורמים בלתי מוסברים ושונות גורם מוסבר (שיטות ההוראה). תהליך בדיקת השערות על הפרש תוחלות המתבסס על ניתוח שונות ,יוצא מנקודת הנחה כי ככל שהיחס בין השונות בין הקבוצות לבין השונות בתוך הקבוצות יגדל ,מתחזקת הטענה כי השונות בין הקבוצות נובעת מהגורם המוסבר כלומר המשתנה הנבדק (במקרה זה שיטת הלימוד). אם אין הבדל בין שיטות ההוראה -השונות בין הקבוצות והשונות בתוך הקבוצות צריכות להיות שוות ,מאחר ושתיהן אומדות את השונות הבלתי מוסברת. אם קיים הבדל בין שיטות ההוראה -השונות בין הקבוצות צריכה להיות גדולה יותר מהשונות בתוך הקבוצות. הסיבה היא -השונות בין הקבוצות היא סכום של שתי שונויות :השונות הבלתי מוסברת בתוספת השונות המוסברת. לכן היחס בין השונות בין הקבוצות לבין השונות בתוך הקבוצות משמש לנו ככלי בבדיקת ההשערה. היחס בין השונויות מסומן באות F שונות מוסברת שונות בלתי מוסברת שונות בין הקבוצות שונות בתוך הקבוצות F כאשר F 1ניתן לומר כי אין הבדל בין הקבוצות. * * Fקיים הבדל בין הקבוצות – האם הפער מובהק? כאשר 1 בדיקת המובהקות תעשה מול גבול קריטי FC -המתקבל מתוך טבלת התפלגות Fבהתאם לדרגות חופש ורמת מובהקות. התפלגות F התפלגות Fהיא התפלגות אסימטרית חיובית ,למשתנה רציף . F 0 , התפלגות Fתלויה בשני גורמים של דרגות חופש F - df1 , df 2 ,הוא היחס בין שני משתנים המתפלגים 2 ולכן היחס תלוי בשתי דרגות חופש – למונה ולמכנה. הנחות * המדגמים בלתי תלויים. * התפלגות כל אחת מהאוכלוסיות היא נורמאלית. * קיים שוויון שונויות בין האוכלוסיות. 12 2 2 3 2 4 2 אוכלוסייה 1 אוכלוסייה 2 נלקח מדגם בגודל n1 נלקח מדגם בגודל n 2 וחושב בו הגודל: 2 xi x1 n1 1 וחושב בו הגודל : 2 Sˆ12 xi x2 n2 1 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 Sˆ2 183 נגדיר את היחס בין השונויות של שתי אוכלוסיות - 2 S 1 / 12 2 S 2 / 22 על פי הנחות המודל יש שוויון שונויות באוכלוסיות אזי היחס הוא: 2 Sˆ1 2 ˆS 2 אם נחזור על התהליך אינסוף פעמים .דהינו נחשב אינסוף יחסים נקבל: 2 Sˆ1 Fn1 1,n2 1 2 ˆS במילים :יחס זה מתפלג התפלגות .F 2 2 Sˆ1 F 2 ˆS 2 תכונות התפלגות F .1ערכי Fחיוביים. .2לכל שני גדלי מדגמים יש התפלגות Fאחרת. .3ההתפלגות א-סימטרית חיובית -זנב לימין. .4המדגמים נלקחים מאוכלוסיות בלתי תלויות המתפלגות נורמאלית. ניתוח השונות נעשה ע"י ניתוח היחס בין SSBלבין SSW - SSBסכום ריבועים בין קבוצות Sum of Squares Between Groups : - SSWסכום ריבועים בתוך קבוצות Sum of Squares Within Groups : היחס נותן ערך F( Fמחושב) הנבדק מול ערך Fקריטי המחושב מטבלת התפלגות F חישוב ערכים בטבלת – F * לכל רמת מובהקות קיימת טבלת F * החישוב מתייחס לשתי דרגות חופש k-1 , Fk 1,nk ,אופקי n-k ,אנכי . אם F Fk 1,n k ,מחושב (יחס ) Fדוחים את H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 184 טבלת ניתוח שונות ANOVA - מקור סכום דרגות השונות ריבועים חופש בין SSB k-1 SSB k 1 n-k SSW nk MSW קבוצות בתוך SSW קבוצות סה"כ = Kמספר קבוצות SST , ממוצע ריבועים MSB יחס F MSB MSW Fk 1,nk ,1 F n-1 =nסה"כ תצפיות על מנת לחשב את ערכי SSBו SSW-כפי שמפורט בהמשך יש לחשב תחילה ממוצע , Xואומדן סטיית תקן 2 Sלכל מדגם ,ואת הממוצע המשוקלל לכלל המדגמים שסימונו X - n1 x1 n2 x2 .... ממוצע משוקלל ל – Kהמדגמים n1 n2 n3 n4 .... X - SSBסכום ריבועים בין קבוצות Sum of Squares Between Groups : סכום ריבועי הסטיות הבין קבוצתי משקף את השוני בין ממוצעי הקבוצות השונות – סכום ריבועי הסטיות בין הממוצע המשוקלל לממוצע כל מדגם . SSB ni xi x 2 i - SSWסכום ריבועים בתוך קבוצות Sum of Squares Within Groups : סכום ריבועי הסטיות הפנים קבוצתי משקף את השונות הטבעית של הנתונים הנקייה מהגורמים היוצרים את הקבוצות השונות. 2 k SSW ni 1sˆi i 1 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 185 כלל החלטה : אם F Fk 1,nk ,1מחושב (יחס ) Fדוחים את H 0 גבול קריטי FC 1 Fk 1,nk ,1 קבלת H 0 דחיית H 0 בדיקת השערות ההשערות הנבדקות הן : השערת האפס – אין שוני בין תוחלות האוכלוסיות H0 : 1 2 ....... k השערה אלטרנטיבית (השערת המחקר) -קיים שוני בין תוחלות האוכלוסיות H1 : 1 2 ....... k דוגמא: מסעדה רוצה לבדוק האם קיים הבדל בין ארבעת מלצריה העובדים ב 4-אזורים שונים במסעדה ,בגובה השכר (טיפים) שהם מרוויחים ליום . להלן נתוני השכר של כל מלצר כפי שנאספו בדגימה מקרית של מספר ימים. א 110 125 147 106 ב 100 130 160 98 100 115 ג 120 104 150 109 115 120 ד 145 90 110 105 120 135 110 109 האם קיים הבדל בין השכר היומי הממוצע של ארבעת המלצרים ? בדוק את הטענה ברמת מובהקות .5% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 186 פתרון השערות : - H 0 : 1 2 3 4אין הבדל בין השכר היומי הממוצע של ארבעת המלצרים - H1 : 1 2 3 4יש הבדל בין השכר היומי הממוצע של ארבעת המלצרים. רמת מובהקות 0.05 : נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון): ב א ד ג n1 4 n2 6 n3 6 n4 8 x1 122 x2 117.17 x3 119.67 x4 115.5 Sˆ12 344.67 Sˆ22 592.17 Sˆ32 260.27 Sˆ42 304.86 122 4 117.17 6 119.67 6 115.5 8 118.0417 4668 X ממוצע משוקלל SSB ni xi x 4 122 118.04 6 117.17 118.04 2 2 2 i 6 119.67 118.04 8 115.15 118.04 134.79 2 2 k SSW ni 1 sˆi 2 3 344.67 5 592.17 5 260.27 7 304.86 7430.167 i 1 מקור סכום ריבועים דרגות חופש ממוצע ריבועים יחס F השונות בין SSB=134.79 k-1=4-1=3 קבוצות בתוך SSW=7430.1 n-k=24-4=20 קבוצות סה"כ SST=7564.89 SSB =44.93 k 1 SSW =371.5 nk MSB MSW MSB MSW =0.12 F n-1=23 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 187 החלטת החוקר : FC Fk 1,nk , F3,20,0.05 3.1 ) - FC (3.1) F (0.12ברמת מובהקות של , 0.05מקבלים את השערת האפס אין הבדל בין הכנסות המלצרים. FC 3.1 דחיית H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 0.12 קבלת H 0 188 תרגילים .1 נערך מחקר להשוואת הישגי הסטודנטים ,בקורס למיקרו כלכלה בין 4אוניברסיטאות (. )A,B,C,D בדקו את הטענה כי קיים פער בהישגי הסטודנטים בין האוניברסיטאות ,ברמת מובהקות של .0.05 להלן נתוני הציונים מארבעת המדגמים: A 70 67 85 84 95 60 50 70 B 88 46 75 60 70 85 70 40 C 95 90 50 55 60 71 73 85 48 D 100 96 98 45 47 51 76 82 72 .2 49 חברה מסוימת מנוייה ב 3-חברות סלולאריות (א ,ב ,ג) ,החברה מעוניינת לבדוק האם קיים פער בעלויות החודשיות הממוצעות המשולמות לכל חברת סלולארית. נבדקו המדגמים הבלתי תלויים הבאים: חברה א – 6חשבונות :עלות ממוצעת ₪ 246וסטית תקן .₪ 36 חברה ב 10 -חשבונות :עלות ממוצעת ₪ 226וסטית תקן . ₪ 26 חברה ג – 7חשבונות :עלות ממוצעת ₪ 265וסטית תקן . ₪ 49 בדקו את הטענה ברמת מובהקות של . 0.05 .3 מנהל תיקים רצה לבדוק האם קיים הבדל בתשואות היומיות בין 4תיקי השקעות שהוא מנהל ,לצורך הבדיקה דגם מנהל התיקים את תשואות התיקים במשך 7ימי עסקים. התשואות הנדגמות נתונות בטבלה (באחוזים) ,בדקו את הטענה ברמת מובהקות של 0.025 מס' תיק .4 1 2 3 4 1 2 1 3 3 1 1.5 5 2 -2 0.5 4 0.5 0.5 0.75 1.6 -1 -1 2 -1 -3 3 1.5 -2 4 2 1.75 5 3תרופות להורדת לחץ דם נבדקו על מדגם של 32איש ,בדקו את הטענה כי קיים הבדל בין תוחלות לחץ הדם בין הקבוצות השונות ברמת מובהקות של . 0.05 נתוני לחץ הדם של כל קבוצה לאחר חודש של לקיחת התרופה נתונים בטבלה: © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 189 קבוצה 125 127 130 125 124 134 129 122 133 123 A קבוצה 124 128 131 129 119 125 124 129 131 135 B קבוצה 119 128 125 132 140 131 127 117 128 124 135 126 C פתרונות .1 השערות : - H0 : 1 2 3 4אין הבדל בין ממוצע ציוני הסטודנטים בקורסים במיקרו כלכלה. - H1 : 1 2 3 4יש הבדל בין ממוצע ציוני הסטודנטים בקורסים במיקרו כלכלה. רמת מובהקות 0.05 : נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון): ב א ד ג n1 8 n1 8 n1 9 n1 10 x1 72.625 x1 66.75 x1 69.66 x1 71.6 S12 214.267 S12 295.07 S 1 497.155 2 S12 308.5 X 72.66 8 66.75 8 69.66 9 71.6 10 70.228ממוצע משוקלל 8 8 9 10 SSB n i ( x i x )2 8 72.625 70.2282 8 66.75 70.2282 i 9 69.66 70.2282 10 71.6 70.2282 164.39 SSW (n i 1) Si 2 7 214.267 7 295.07 8 308.5 9 497.155 10507.78 i © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 190 סכום ריבועים מקור דרגות חופש יחס F ממוצע ריבועים השונות בין k-1=4-1=3 SSB=164.39 קבוצות בתוך SSW=10507.78 n-k=35-4=31 קבוצות סה"כ SST=10672.17 SSB =54.79 k 1 SSW =338.9 nk MSB MSW MSB MSW =0.16 F n-1=34 החלטת החוקר : FC FK 1,n K, F3,31,0.05 2.92 ) - FC (2.92) F(0.16ברמת מובהקות של , 0.05מקבלים את השערת האפס אין הבדל בין הקורסים. )FC (2.92 דחיית H 0 0.16 קבלת H 0 .2השערות : - H0 : 1 2 3אין הבדל בעלויות בין חברות הסלולר. - H1 : 1 2 3קיים הבדל בעלויות בין חברות הסלולר. רמת מובהקות 0.05 : נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון): ב ג א n1 6 n1 10 n1 7 x1 246 x1 226 x1 265 S12 1296 S12 676 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע S12 2401 191 X 246 6 226 10 265 7 243.08ממוצע משוקלל 6 10 7 SSB n i ( x i x ) 2 6 246 243.082 10 226 243.082 i 7 265 243.082 6331.82 SSW (n i 1) Si 2 5 1296 9 676 6 2401 26970 i מקור סכום ריבועים דרגות חופש יחס F ממוצע ריבועים השונות בין SSB=6331.82 k-1=3-1=2 קבוצות בתוך SSW=26970 n-k=23-3=20 קבוצות סה"כ SST=33301.82 SSB =3165.91 k 1 SSW =1348.5 nk MSB MSW MSB MSW 2.347 F n-1=22 החלטת החוקר : FC FK 1,n K, F2,16,0.05 3.63 ) - FC (3.63) F(1.87ברמת מובהקות של , 0.05מקבלים את השערת האפס אין הבדל בין חברות הסלולר. )FC (3.63 דחיית H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2.347 קבלת H 0 192 .3 השערות : - H0 : 1 2 3 4אין הבדל בין התשואות הממוצעות בתיקי ההשקעות. - H1 : 1 2 3 4קיים הבדל בין התשואות הממוצעות בתיקי ההשקעות. 0.025 רמת מובהקות : נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון): ב א ד ג n1 7 n1 7 n1 7 n1 7 x1 0.928 x1 0.785 x1 1.285 x1 2.228 S12 5.7 S12 3.154 S12 7.965 S12 0.3 X 2.28 7 1.285 7 0.785 7 0.928 7 1.307ממוצע משוקלל 28 SSB n i ( x i x ) 2 7 0.928 1.307 2 7 0.785 1.307 2 i 7 1.285 1.307 2 7 2.228 1.307 2 8.852 SSW (n i 1) Si 2 6 5.7 6 3.154 6 0.3 6 7.965 102.74 i מקור סכום ריבועים דרגות חופש ממוצע ריבועים יחס F השונות בין SSB=8.852 k-1=4-1=3 קבוצות בתוך SSW=102.74 n-k=28-4=24 קבוצות סה"כ SST=111.59 SSB =2.95 k 1 SSW =4.28 nk MSB MSW MSB MSW =0.68 F n-1=27 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 193 החלטת החוקר : FC FK 1,n K, F3,24,0.025 3.72 ) - FC (3.72) F(0.68ברמת מובהקות של , 0.025מקבלים את השערת האפס אין הבדל בין הקורסים. )0.68 FC (3.72 קבלת H 0 דחיית H 0 .4 השערות : - H0 : 1 2 3אין הבדל (בין התרופות) בתוחלות לחץ הדם בין הקבוצות. - H1 : 1 2 3קיים הבדל (בין התרופות) בתוחלות לחץ הדם בין הקבוצות. רמת מובהקות 0.05 : נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון): א ג ב n1 10 n1 10 n1 12 x 1 127.2 x 1 127.5 x1 127.66 S 1 17.28 2 S 1 20.94 2 S 1 40.78 2 X 127.66 13 127.5 11 127.2 11 127.46ממוצע משוקלל 10 10 12 SSB n i ( x i x ) 2 11 127.2 127.462 11 127.5 127.462 i 13 127.66 127.462 1.314 SSW (n i 1) Si 2 11 17.28 11 20.94 13 40.78 871.78 i © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 194 מקור סכום ריבועים דרגות חופש יחס F ממוצע ריבועים השונות בין SSB=1.314 k-1=3-1=2 SSB =0.657 k 1 קבוצות בתוך SSW=871.78 n-k=35-3=32 קבוצות סה"כ SST=873.09 SSW =36.32 nk MSB MSW MSB MSW =0.018 F n-1= 34 החלטת החוקר : FC FK 1,n K, F2,32,0.05 3.32 ) - FC (3.32) F(0.018ברמת מובהקות של , 0.05מקבלים את השערת האפס אין הבדל בין הקורסים. )FC (3.32 דחיית H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 1.87 קבלת H 0 195 קשר סטטיסטי בין שני משתנים קשר סטטיסטי בין שני משתנים משמעותו – שינוי ערך במשתנה אחד גורר אחריו שינוי ערך במשתנה שני. אם קיים קשר סטטיסטי בין לחץ דם להתקפי לב ,המשמעות היא ששינוי בלחץ הדם יגרור שינוי בכמות התקפי הלב או שינוי בסיכוי/הסתברות להתקף לב. כאשר קיים קשר סטטיסטי בין שני משתנים חשוב לדעת את טיב הקשר – קשר חיובי/שלילי ואת עוצמתו (נושאים בהם נדון בהמשך) ידיעת פרמטרים אלו לקשר תאפשר לנו לערוך ניבוי – לנבא ערכים של משתנה אחד כאשר ידועים לנו ערכי המשתנה השני. אם נדע את לחץ הדם נוכל לנבא את הסיכוי להתקף לב. קשר סטטיסטי בין שני משתנים יכול לנבוע מגורמים שונים לכן לפירוש משמעות הקשר יש חשיבות רבה. נמצא כי קיים קשר בין רמות אלכוהול בדם לבין תאונות דרכים – לא נסיק מכך כי אלכוהול גורם לתאונות דרכים מאחר וישנם גורמים מתערבים נוספים היכולים להשפיע או לגרום לקשר אולי הנטייה לשתיית אלכוהול מאפיינת סוג אנשים מסוים אשר הסיכוי שלהם להיות מעורבים תאונה גדול וכו' ,קימות שיטות סטטיסטיות לבדיקת סיבתיות ועוצמת הקשר בין שני משתנים ,בשיטות אלו נדון. קשר ליניארי בין שני משתנים קשר ליניארי – קשר קווי בין שני משתנים ,נדון במספר סוגי קשר ליניארי: אין קשר Y X קשר שלילי מושלם Y X קשר חיובי חלש Y X © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע X קשר שלילי X קשר חיובי מושלם Y Y קשר חיובי Y X 196 כאשר רוצים לבדוק קשר בין שני משתנים יש להגדיר לכל נבדק את שני המשתנים המבוקשים – משתנה X ומשתנה .Y דוגמה :לשבעה שחקני כדורסל נמדד הגובה ומס' הקליעות אשר קלעו לסל ב 10-משחקים : מס' קליעות לסל – Y גובה בסמ' X - שחקן מס' 74 172 1 76 178 2 79 181 3 84 184 4 89 186 5 87 191 6 92 195 7 נציג את הנתונים בדיאגראמת פיזור: 95 90 80 קליעות לסל Y 85 75 200 195 190 185 גובה X 180 175 70 170 ניתן לראות ע"פ דיאגראמת הפיזור כי קיים קשר ליניארי חיובי בין שני המשתנים ,הקשר הוא קשר חזק מאחר ואוסף הנקודות מרוכז סביב קו ישר. את עוצמת הקשר ניתן לחשב ע"י מדד סטטיסטי הנקרא – מקדם המתאם . ע"פ מקדם המתאם ניתן להעריך את עוצמת הקשר כאשר הקשר הוא קשר חזק ניתן ע"פ מקדם המתאם לבנות קו ישר – קו התחזית – ישר אשר באמצעותו ניתן לערוך ניבוי ,כאשר הקשר בין המשתנים הוא קשר חלש יהיו סטיות גדולות בניבוי ולכן אינו אפקטיבי. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 197 מקדם המתאם בין שני משתנים מקדם המתאם מסומן באות .r מקדם המתאם מקבל ערכים בין -1ל1- r =1קשר חיובי מושלם , 1 r 1 r = 0אין קשר r = -1 ,קשר שלילי מושלם ככל ש r -שואף ל 1-הקשר הליניארי החיובי חזק יותר והפוך לכיוון השלילי. סימנו של ) r ( rמעיד על כיוון הקשר .ערכו המוחלט rעל עוצמת הקשר. מקדם המתאם הליניארי Coefficient of Correlation r- היחס בין השונות המשותפת של שני משתנים לבין מכפלת סטיות התקן שלהם הוא המדד לכוון הקשר ועוצמתו. השונות המשותפת של שני משתנים – COVE(XY) - Covariance ) ( xi x)( yi y n דרך נוספת לחישוב )COV(XY COV ( XY ) xi yi n x y xi yi x y n n COV ( XY ) השונות המשותפת מתארת את ההשתנות של שני המשתנים בו זמנית -אם הם מתפתחים באותו כיוון אזי קיים ביני הם יחס ישר ולכן השונות המשותפת חיובית ,כאשר הם מתפתחים בכיוונים מנוגדים ,קיים יחס הפוך לכן השונות המשותפת שלילית. * ה – Covarianceמקבל כל ערך .כלומר covx, y : * covx, y 0הקשר הליניארי הוא קשר ישר (חיובי) * covx, y 0הקשר הליניארי הוא קשר הפוך (שלילי) * covx, y 0אין מתאם מקדם המתאם ) COV ( XY x y r מקדם המתאם הינו מספר טהור -אינו תלוי ביחידות מדידה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 198 נחשב את מקדם המתאם בשאלת הכדורסלנים: )( xi x)( yi y yi y ( xi x) 2 xi x yi xi 106.74 81 9- 140.42 11.86- 74 172 41.02 49 7- 34.22 5.86- 76 178 11.44 16 4- 8.1225 2.86- 79 181 0.14 1 1 0.0225 0.14 84 184 12.84 36 6 4.6225 2.14 89 186 28.56 16 4 51.1225 7.14 87 191 100.26 81 9 124.32 11.14 92 195 301 280 Y 83 ( yi y ) 2 362.85 X 183.86 ניתן לחשב את מקדם המתאם גם בדרך הבאה: y 6.324 ( xi x)( yi y) 301 43 x 7.199 COV ( XY ) n 7 ) COV ( XY 43 r 0.944 x y 7.199 6.324 הקשר הוא חיובי ומאחר והוא קרוב ל 1-הוא חזק ,כמעט קשר מושלם. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 199 רגרסיה ליניארית כאשר קיים קשר ליניארי בין שני משתנים ,ניתן למצוא חוקיות בקשר – חוקיות אשר תאפשר לנו לבצע תחזית – לערוך ניבוי כל ערכו של משתנה אחד כאשר ידוע המשתנה השני. ניתן לחשב את ערכו של Xכאשר ידוע , X/Y Yאו את ערכו של Yכאשר ידוע .Y/X X מאחר והקשר בין שני המשתנים הינו קשר ליניארי ,החיזוי מתבטא בקו ישר המקשר בין שני המשתנים ,קו חיזוי/תחזית נקרא קו הרגרסיה. ככל שהקשר בין שני המשתנים חזק יותר ,כך החיזוי מדויק יותר. כאשר עורכים מחקר מגדירים משתנה תלוי ומשתנה בלתי תלוי ,המשתנה התלוי – Yהמשתנה הבלתי תלוי , X בשאלת שחקני הכדורסל בדקנו את הקשר בין גובה השחקן למספר הקליעות לסל – גובה השחקן ,המשתנה התלוי היה מס' הקליעות – Yוהבלתי תלוי – גובה השחקן , Xכלומר מס' הקליעות תלוי בגובה ולא ההיפך. -Yמשתנה תלוי. -Xמשתנה בלתי תלוי. קו הרגרסיה הוא קו ישר ולכן מתבסס על משוואת הקו הישר y mx n - mמייצג את שיפוע הקו (קצב התקדמות הקו – התזוזה ב y-על כל תזוזה אחת ב) x- nמייצג את נקודת החיתוך של הקו עם ציר . y מאחר ובד"כ בין המשתנים אין התאמה מלאה כמעט אף פעם אי אפשר להעביר ישר שכל נקודות המדידה נמצאות בדיוק עליו .לכן ,השאיפה היא למצוא את הישר המתאים ביותר לאוסף הנקודות ) (xi,yiשמדדנו. הקו "המדויק ביותר" צריך להיות קרוב לערכים האמיתיים (נקודות המדגם) כלומר על הקו לעבור במקום בו הסטיות מהנקודות במדגם הן הקטנות ביותר. הדרך המקובלת היא שיטת הריבועים פחותים ( . ) Least squares הסימנים השליליים של הסטיות מבוטלים באמצעות העלאה בריבוע . לפי קריטריון זה " :הקו הטוב ביותר " הוא הקו המביא למינימום את סכום ריבועי הסטיות. כאשר הקשר בין שני המשתנים הוא קשר חיובי/שלילי מלא – התאמה מלאה מתקבל קו הרגרסיה המדויק ביותר , אולם בפועל לא קיימים משתנים בעלי התאמה מלאה ולכן נוצר קו דמיוני הקו המדויק ביותר – קו הרגרסיה יהיה הקו שסך הסטיות ממנו אל הערכים הוא הקטן ביותר. 95 קו הרגרסיה הוא למעשה מעין ממוצע ריבועי הסטיות. 90 80 קליעות לסל Y 85 75 200 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 195 190 185 גובה X 180 175 70 170 200 - Yi m y xi n yקו הרגרסיה לחיזוי yע"פ .x x x ) COV ( XY 2x my x ny Y my X x x בשאלת הכדורסלנים: Y 83 COV ( XY ) 43 2 x 51.84 43 0.83 Y m y X 83 0.86 183.86 69.6 51.84 x X 183.85 ) COV ( XY 2x Y m y xi n y x Xi Y my X x קו הרגרסיה x ) COV ( XY 2x Y Y 0.83 X 69.6 שונות מוסברת r2 - מדד זה מציג את יכולת מודל הרגרסיה להסביר את ניבוי המשתנה התלוי על ידי המשתנה הבלתי תלוי .ככל שמדד זה גבוה יותר היכולת לומר שהמשתנה התלוי מוסבר על ידי השתנה הבלתי תלוי גבוהה יותר. הערך של השונות המוסברת נמדד באחוזים. כאשר - r2=1השונות המוסברת מקסימאלית כלומר יכולת הניבוי היא מוחלטת. ככל שהשונות המוסברת גדולה הסיכוי לטעות בניבוי קטנה . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 201 תרגילים לפניכם נתונים על 7עובדות -מס' ילדים לכל עובדת ומס' איחורים לעבודה בחודש: 1. 6 2 3 7 5 6 4 1 2 5 3 4 2 5 4 3 4 2 1 3 4 א. הציגו את הנתונים בדיאגראמת פיזור. ב. מהו מקדם המתאם בין מס' הילדים למס' האיחורים בחודש. ג. חשבו את קו הרגרסיה לחיזוי מס' האיחורים בחודש ע"פ מספר הילדים. ד. מהי תחזית האיחורים (הניבוי) ע"פ קו הרגרסיה לעובדת עם 8ילדים. .2 להלן מס' נתונים על שני משתנים: r 0.82 y 6 x 4 Y 81 מס עובדת מס ילדים מס' איחורים X 70 yמשתנה תלוי x ,משתנה בלתי תלוי חשבו את ערכו של yכאשר .X=85 להלן נתונים על מס' השיעורים הפרטיים שתלמידים לומדים לפני מבחן במתמטיקה והציון במבחן: .3 4 82 5 90 1 95 6 85 0 100 2 75 8 95 מס' שיעורים ציון א. מהו המשתנה התלוי ומהו המשתנה הבלתי תלוי ? הציגו את הנתונים בדיאגראמת פיזור ב. מהו מקדם המתאם ג. חשבו את קו הרגרסיה ומצאו כמה שיעורים פרטיים יש ללמוד כדי לקבל ציון של ? 94 .4 הנהלת בנק החליטה לבדוק האם קיים קשר בין מספר שנות הניסיון של היועץ בענף ההשקעות ,לבין התשואה שהשיג בתיק ההשקעות שלו .התקבלו התוצאות הבאות : היועץ -Yתשואה שהשיג היועץ – Xמספר שנות ניסיון א 13 6 ב 8 2.5 ג 21 ד 4 3 ה 5 2.5 ו 10 5 א. מה תוכל לומר על הקשר בין התשואה שהשיג היועץ למספר שנות הניסיון שלו ? ב. האם ניתן לבצע תחזית לתשואה שישיג יועץ בעל 3שנות ותק ? אם כן ,תן תחזית והסבר מדוע היא שונה מהתוצאות הקיימות בלוח עבור ותק זהה .אם לא ,נמק מדוע. ג. האם ניתן לבצע תחזית לתשואה שישיג יועץ בעל 20שנות ותק ? אם כן ,תן תחזית .אם לא ,נמק מדוע. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 202 .5 במחקר שנערך בקרב טניסאים נתגלה מתאם חיובי בין הצלחותיהם בתחרויות על דשא לבין הצלחותיהם בתחרויות על משטח קשה .משמעות הדבר היא( :בחר בתשובה הנכונה) א. רוב הטניסאים שנוטים להיכשל בתחרויות על דשא ,נוטים להצליח בתחרויות על משטח קשה. ב. אין קשר בין הצלחה על דשא לבין הצלחה על משטח קשה. ג. לטניסאי שהצליח בתחרות על משטח קשה כדאי להתחרות גם על דשא. ד. רוב הטניסאים שנוטים להצליח בתחרות על דשא זוכים בפרסים כספיים גבוהים. .6 במדגם בגודל 20תצפיות על שני משתנים X :ו Yהתקבלו התוצאות הבאות: 20 20 X Y 17800 20 Y 2 232000 i 1 X 2 2320 i 1 Y 100 X 10 i 1 מה ערכו של מקדם המתאם הליניארי ( ) rx , yבין Xו? Y - א- 0.6875 . ג- 0.000214 . ב0.3125 . ד0.48 . .7 נתונה משוואת הרגרסיה הבאה .Y = 50 + 0.5X1 – 0.8X2 :בחר תשובה אפשרית לגבי .X2 ,X1 ,Y א. Yשכר של פועל כפונקציה של – X1מספר הפריטים שמייצר ו X2-מספר תלונות נגדו מצד הממונה עליו. ב. Yשכר של פועל כפונקציה של – X1מספר שנות ותק ו – X2-מספר שנות לימוד. ג. Yשכר של פועל כפונקציה של – X1מספר היעדרויות לא מוצדקות ו – X2-מספר פריטים שהוא מייצר. ד. התשובות א ',ב' ,ג' נכונות .8 סטודנט ערך חישובים לבדיקת הקשר בין שני משתנים Xו .Y-הוא מצא שמשוואת הרגרסיה היא: Y=4.13-0.6Xוכי מקדם המתאם .R= - 1.55לאור הממצאים ניתן לקבוע כי: א .קיים קשר חיובי חזק בין שני המשתנים. ב .קיים קשר שלילי חלש בין המשתנים. ג .קיים קשר חיובי חלש בין שני המשתנים. ד .הסטודנט טעה בחישוביו. .9 סטודנט המבצע מעבדה בפיסיקה התבקש לבנות מודל רגרסיה ליניארית כדי להסביר את Y בעזרת . Xהוא קיבל את הנתונים הבאים המבוססים על מדגם הכולל 8מדידות: 8 כמו כן ,שיפוע קו הרגרסיה הוא 0.4569מקדם המתאם בין המשתנים הוא: א. 0.69 ב. 0.46 ג. 0.78 ד. 0.91 X i2 14.24 X 1.25 i 1 8 Yi2 4.83 Y 0.7125 i 1 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 203 פתרונות .1 א. 5 6 3 4 2 0 מס ילדים X ב .נחשב את מקדם המתאם: ( xi x) ( yi y) 7.857 y 1.293 ( xi x)( yi y) 7.857 1.1224 7 1 מס איחורים Y 7 6 5 4 3 2 1 0 n ) COV ( XY 1.1224 0.626 x y 1.385 1.293 x 1.385 Y 3.571 X 3.285 COV ( XY ) r מקדם המתאם בין מס' הילדים למס' האיחורים בחודש הוא – 0.626מתאם חיובי . ג. חישוב קו הרגרסיה: Y m y xi n y x 0.585 1.1224 (1.385) 2 x ) COV ( XY x 2 my x n y Y m y X 3.571 0.585 3.285 1.649 x x Y 0.585 X i 1.649 Y 0.585 X i 1.649 ד. נציב בקו הרגרסיה x=8 .2 כדי לחשב את ערכו של yעלינו למצוא את משוואת קו הרגרסיה ,מתוך הנתונים נמצא את )COV(XY Y 0.585 8 1.649 6.329 r 0.82 ) 19.68 COV ( XY y 6 Y 81 x 4 X 70 ) COV ( XY ) COV ( XY 0.82 ) 0.82 24 COV ( XY x y 46 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע r 204 Y m y xi n y x 1.23 19.68 (4) 2 x ) COV ( XY 2x my x n y Y m y X 81 1.23 70 5.1 x x Y 1.23 X i 5.1 Y 1.23 85 5.1 99.45 ערכו של yהוא . 99.45 .3 א. הציון הוא המשתנה התלוי מאחר הוא תלוי במס' השיעורים הפרטיים. שעורים פרטיים – בלתי תלוי. 10 6 8 2 4 ציון מבחן 120 100 80 60 40 20 0 0 שיעורים פרטיים ע"פ דיאגראמת הפיזור ניתן לראות כי אין קשר בין שני המשתנים – העקומה חסרת כיוון ברור. ב. נחשב את מקדם המתאם: ( xi x) ( yi y) 17.2857 y 8.06 Y 88.85 ( xi x)( yi y) 17.2857 2.4693 x 2.657 X 3.714 COV ( XY ) n 7 ) COV ( XY 2.4693 r 0.115 x y 2.657 8.06 מקדם המתאם r 0.115המשמעות היא שאין קשר בין שיעורים פרטיים לציון ,מקדם המתאם שואף ל.0- ג. מאחר ואין מתאם ,אין יכולת ניבוי ולכן קו הרגרסיה אינו רלוונטי. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 205 .4 נחשב את מקדם המתאם: x y 21.08 xi yi 170.5 y 4.784 x 1.675 Y 6.33 X 3.33 נשתמש בנוסחה השנייה לחישוב הCOV(XY) - xi yi x y 170.5 21.11 7.3066 n 6 ) COV ( XY 7.3066 0.911 x y 1.675 4.784 COV ( XY ) r מקדם המתאם בין מס שנות הוותק לתשואה הוא – 0.911מתאם חיובי חזק ,כלומר קיים קשר חיובי חזק בין מס' שנות הוותק לתשואה. ב. חישוב קו הרגרסיה: Y m y xi n y x 2.6 7.3066 (1.675) 2 x ) COV ( XY x 2 my x n y Y m y X 6.33 2.6 3.33 2.33 x x Y 2.6 X i 2.33 נבצע תחזית לתשואה שישיג יועץ בעל 3שנות וותק : תחזית ליועץ בעל 3שנות ותק – נציב xi 3 y 2.6 3 2.35 5.45 יועץ בעל 3שנות ותק ישיג תשואה של .5.45% התחזית אינה זהה לתצפיות בלוח מאחר וקו הרגרסיה בנוי על ריבועי הסטיות מהקו ולכן מתקיים קירוב ,ככל שמקדם המתאם גבוהה יותר כך הסטיות מקו האמצע קטנות – החיזוי טוב יותר , כאשר המתאם הוא r 1החיזוי מדויק. ג. מתמטית ניתן לבצע חיזוי מאחר ויצרנו קו רגרסיה לכן ניתן להציב xi 20ונקבל . y 2.6 20 2.35 49.65בפועל חיזוי זה בעייתי – ברמה מציאותית קשה להניח שהתשואה גדלה באופן ליניארי בכל שנת ותק -אדם עם 30שנות ותק יצור תשואות של ? 75%הסיבה לכך נובעת מכך שהערך 20 גבוה באופן חריג מכל ערכי חמשת ערכי המדגם ,עליהם נבנה קו הרגרסיה סביר להניח כי אם היינו משלבים במדגם גם אנשים ברמות וותק כאלו היינו מקבלים מתאם אחר וקו רגרסיה אחר. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 206 .5 ניתן לראות ע"פ השאלה כי קיים קשר חיובי בין ההצלחה בתחרויות על דשא להצלחה בתחרויות על משטח קשה לכן התשובה הנכונה היא ג. א – מצביעה על קשר שלילי ,ב – מצביעה כי לא קיים קשר ,ד – אין כל קשר למתאם בין שתי התחרויות. ) COV ( XY חישוב מקדם המתאם : x y .6 r xi yi n x y xi yi x y n n COV ( XY ) xi 2 X 2 17800 20 10 100 110 תשובה א נכונה. 232000 100 2 40 20 20 COV ( XY ) 2320 10 2 4 20 y 110 0.6875 4 40 .7 n x r ע"פ המשוואה הפועל מקבל תוספת של ₪ 0.5עבור X1ומורידים לו ₪ 0.8עבור X2 התשובה הנכונה א. מקבל תוספת עבור מספר הפריטים ומנקים לו עבור מס' התלונות. .8 1 r 1בתשובה בשאלה r=-1.55נתון זה בלתי אפשרי . תשובה ד' נכונה .9 8 Yi 2 4.83 8 X i 2 14.25 Y 0.7125 i 1 ) COV ( XY x y X 1.25 i 1 r Xi2 X 2 n ) COV ( XY 2 x my x נעזר בנתונים ובנוסחאות הנ"ל ,נחשב את סטיות התקן לשני המשתנים: 14.24 4.83 1.25 2 0.2175 y 0.7125 2 0.096 8 8 ) COV ( XY 0.4569 ) 0.09937575 COV ( XY 0.2175 0.09937575 r 0.6877 0.2175 0.096 x התשובה הנכונה א. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 207 2 מבחן לאי תלות מבחן 2שייך לקבוצת מבחנים סטטיסטיים הנקראת סטטיסטיקה א – פרמטרית במבחני סטטיסטיים קודמים בהם עסקנו הנחת היסוד הייתה -האוכלוסייה מתפלגת נורמאלית ,מאחר ועסקנו במשתנים כמותיים. קבוצה זו של מבחנים סטטיסטיים מאופיינת בכך שלא ניתן להניח התפלגות נורמאלית של האוכלוסיות שכן המשתנים הם משתנים איכותיים (או נומינליים או מסולם סדר ) . מבחנים אלו נקראים מבחנים פרמטריים. מבחן 2הוא מבחן באמצעותו בודקים האם יש תלות (קשר) בין משתנים איכותיים משתנים איכותיים – משתנים אשר לא ניתן לבצע עליהם ניתוחים כמותיים כמו ממוצע ,פיזור וכו' – צבע עיניים , שיער ,נמוך /גבוה וכו' משתנים נומינליים – משתנים שמיים . מבחן לאי תלות המבחן מבוסס על השוואת בין נתונים בטבלת שכיחויות המבוססת על ניסוי (הנקראת , )observedלבין לטבלה תיאורטית מקבילה (הנקראת ) expectedהמתארת מצב של אי תלות (חוסר קשר) בין שני המשתנים שבטבלה במקורית. כאשר הטבלה הנתונה שונה משמעותית מהטבלה התיאורטית – המשמעות היא קיום קשר ( תלות ) בטבלה המקורית. הטבלה התיאורטית המקבילה ( )expectedהיא טבלה אותה אנו בונים בהסתמך על ידע הסתברותי המאפיין אי תלות – כאשר אין תלות בין שני משתנים מתקיים P A B P( A) P( B) : נתאר מצב של אי תלות בין שני משתנים בטבלה: A A B )P( A) P( B )P( A) P( B )P(B B )P( A) P( B )P( A) P( B )P(B )P(A )P(A סה"כ =)100%( 1 כאשר שני משתנים מקיימים את התנאים הנ"ל אזי הם משתנים בלתי תלויים. שאלה במדינה מסוימת נבדק האם יש קשר בין מין (גבר/אישה) לצבע המכונית בה הוא נוהג יש לבדוק האם קיים קשר בין מין הנהג לצבע הרכב ברמת מובהקות של . 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 208 צבע המכונית מין הנהג אדום שחור צבע אחר סה"כ גברים 40 37 48 125 נשים 50 23 2 75 סה"כ 90 60 50 200 על בסיס נתונים אלו ועל בסיס הטבלה המראה מצב של אי תלות -נבנה טבלה המעידה על אי תלות. צבע המכונית מין הנהג אדום צבע אחר שחור סה"כ גברים 125 נשים 75 סה"כ 90 60 50 90 200 נהפוך את הטבלה לטבלת הסתברויות: 200 125 200 צבע המכונית מין הנהג אדום צבע אחר שחור סה"כ גברים 0.625 נשים 0.375 סה"כ 0.45 0.3 ע"פ הגדרת טבלה המקיימת שני משתנים בלתי תלויים נבנה את טבלת ההסתברויות: 0.25 0.45*0.625 1 0.25*0.625 צבע המכונית מין הנהג אדום שחור צבע אחר סה"כ גברים 0.28125 0.1875 0.15625 0.625 נשים 0.16875 0.1125 0.09375 0.375 סה"כ 0.45 0.3 0.25 1 נכפיל את ערכי ההסתברות בסה"כ של הטבלה המקורית ( )200ונקבל טבלה החדשה המתארת את הערכים המתארים מצב של אי תלות – טבלת ה.expected- צבע המכונית מין הנהג אדום שחור צבע אחר סה"כ גברים 56.25 37.5 31.25 125 נשים 33.75 22.5 18.75 75 סה"כ 90 60 50 200 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 209 הטבלה אשר יצרנו הינה טבלת הערכים במצב בו אין תלות בין המשתנים את טבלה זו נבחן מול הטבלה המקורית. הטבלה המקורית – טבלת התצפית – Observed צבע המכונית מין הנהג אדום שחור צבע אחר סה"כ גברים 40 37 48 125 נשים 50 23 2 75 סה"כ 90 60 50 200 הטבלה אשר בנינו – הטבלה אשר נצפה למצוא כאשר אין קשר בין המשתנים Expected - צבע המכונית מין הנהג אדום שחור צבע אחר סה"כ גברים 56.25 37.5 31.25 125 נשים 33.75 22.5 18.75 75 סה"כ 90 60 50 200 מטרת המבחן – לבדוק האם קיים קשר בין המשתנים. ביצוע המבחן בפועל – בדיקה האם הפער בין כל נתון בטבלה הצפויה המייצגת חוסר קשר לבין טבלת הנתונים אשר נצפו בפועל הוא פער מובהק. כאשר הפער הוא פער מובהק ,המשמעות היא שהנתונים אשר התקבלו מעידים כי קיים קשר בין המשתנים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 210 המבחן הסטטיסטי השערות: א. H0 : אין תלות בין מין הנהג לצבע המכונית אותה הוא נוהג H1 : יש תלות בין מין הנהג לצבע המכונית ב. רמת מובהקות המבחן 0.05 ג. תחומי דחייה /קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 2 21 31,0.95 C 2 2,0.95 5.99 מה בוחנים מול הגבול הקריטי ? הערך הנבחן מול הגבול הקריטי הוא סכום ריבוע הסטיות בין טבלת הנצפה לצפוי ביחס לצפוי: Expected (40 56.25) 2 (50 33.75) 2 (37 37.5) 2 (23 22.5) 2 56.25 33.75 37.5 22.5 oij eij 2 eij (48 31.25) 2 (2 18.75) 2 36.48 31.25 18.75 2 Observed אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 תחום קבלת H 0 תחום דחית H 0 36.48 ד. ערך ה. 5.99 החלטה 2 הנבדק , 36.48גבוה מהגבול הקריטי , 5.99לכן נדחה את השערת האפס -בין המשתנים קיימת תלות. מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 211 תרגילים .1 לבדיקת הטענה הרווחת כי לכדורגלנים יש משיכה לדוגמניות נבדקו כדורגלנים ונשאלו על בנות הזוג שלהן – הנתונים בטבלה: בדקו האם קיים קשר ברמת מובהקות של .0.05 כדורגלן 65 33 98 דוגמנית לא דוגמנית .2 לא כדורגלן 62 40 102 127 73 200 נבדקו הרגלי שתית האלכוהול של 100מהמרים ו 100-שאינם מהמרים במטרה לבדוק האם קיימת תלות בין אלכוהול והימורים .בדקו את הטענה ברמת מובהקות של . 0.01 בקבוק אלכוהול ביום 22 13 35 מהמרים לא מהמרים .3 100 100 200 בדקו האם קיימת תלות בין אזור מגורים לקבלה לקורס טיס ברמת מובהקות של .0.05 קיבוצים 36 19 55 מתקבלים לא מתקבלים .4 2כוסות אלכוהול ביום 45 34 79 מקסימום כוס ביום 33 53 86 מושבים 24 21 45 עירונים 48 42 90 108 82 190 במטרה לבדוק הבדלים במספר האיחורים בשנה בין עובדים וותיקים לחדשים בחברה מסוימת ,נרשמו ציונים למספר האיחורים לכל עובד : עובדים ותיקים עובדים חדשים סה"כ ציון לא טוב 29 28 57 ציון טוב 95 35 130 124 63 187 האם ניתן לומר ברמת מובהקות של 5%שקיימת תלות בין מספר האיחורים לוותק העובד ? .5 חברה בודקת צוות את צוות השיווק במטרה לבדוק האם קיים הבדל ביכולת בין עובדים בעלי תואר ראשון לבין עובדים ללא השכלה אקדמית .האם קיימת תלות בין היכולת השיווקית להצלחה 0.05 עסקאות עובדים מוצלחות סה"כ חדשים בעל תואר 30 10 40 חסר תואר 14 46 60 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 44 56 100 212 פתרונות .1 כדורגלן 65 33 98 דוגמנית לא דוגמנית סה"כ לא כדורגלן 62 40 102 127 73 200 הטבלה היא טבלת הצפייה –. o נבנה את הטבלה הצפויה למצב של אי תלות – . e כדורגלן 62.23 35.77 98 דוגמנית לא דוגמנית סה"כ לא כדורגלן 64.77 37.23 102 127 73 200 המבחן הסטטיסטי א. השערות: H0 : אין משיכה/תלות בין כדורגלנים לדוגמניות H1 : יש משיכה/תלות בין כדורגלנים לדוגמניות ב. רמת מובהקות המבחן 0.05 ג. תחומי דחייה /קבלה לH 0 - 2 את הגבול הקריטי מוצאים בטבלת C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 22121,0.95 C 21,0.95 3.84 הערך הנבחן מול הגבול הקריטי: Expected oij eij 2 (65 62.23)2 (33 35.77)2 (62 64.77)2 (40 37.23)2 0.66 37.23 64.775 35.77 62.23 eij 2 Observed © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 213 אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 תחום קבלת H 0 תחום דחית H 0 3.84 ד. ערך 0.66 החלטה 2 הנבדק , 0.66קטן מהגבול הקריטי , 3.84לכן נקבל את השערת האפס אין תלות בין כדורגלנים לדוגמניות. ה. מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני . .2 מהמרים לא מהמרים בקבוק אלכוהול ביום 22 13 35 2כוסות אלכוהול ביום 45 34 79 מקסימום כוס ביום 33 53 86 100 100 200 הטבלה היא טבלת הצפייה – . o נבנה את הטבלה הצפויה למצב של אי תלות – . e מהמרים לא מהמרים בקבוק אלכוהול ביום 17.5 17.5 35 2כוסות אלכוהול ביום 39.5 39.5 79 מקסימום כוס ביום 43 43 86 100 100 200 המבחן הסטטיסטי א. ב. השערות: H0 : אין תלות בין אלכוהול להימורים H1 : יש תלות בין אלכוהול להימורים לדוגמניות רמת מובהקות המבחן 0.01 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 214 תחומי דחייה /קבלה לH 0 - ג את הגבול הקריטי מוצאים בטבלת 2 C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 22131,0.99 C 22,0.95 9.21 הערך הנבחן מול הגבול הקריטי: Expected (22 17.5) 2 (13 17.5) 2 (45 39.5) 2 (34 39.5) 2 (33 43) 2 (53 43) 2 8.49 17.5 17.5 39.5 39.5 43 43 oij eij 2 eij 2 Observed אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 אזור קבלת H 0 אזור דחית H 0 9.21 ד. ערך 8.49 החלטה 2 הנבדק 8.49קטן מהגבול הקריטי , 9.21לכן נקבל את השערת האפס אין תלות בין אלכוהול להימורים. חשוב לציין – אם נבדוק בטבלה נוכל לראות כי עבור רמת מובהקות גבוהה יותר – 0.05 0.025היינו דוחים את השערת האפס ה. מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 215 .3 טבלת הצפייה – . o קיבוצים 36 19 55 מתקבלים לא מתקבלים עירונים 48 42 90 מושבים 24 21 45 108 82 190 נבנה את הטבלה הצפויה למצב של אי תלות – . e קיבוצים 31.26 23.74 55 מתקבלים לא מתקבלים עירונים 51.16 38.84 90 מושבים 25.58 19.42 45 108 82 190 המבחן הסטטיסטי א. השערות: H0 : אין תלות בין אזור מגורים לקבלה לקורס טיס H1 : יש תלות בין אזור מגורים לקבלה לקורס טיס ב. רמת מובהקות המבחן 0.05 ג. תחומי דחייה /קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 22131,0.95 C 22,0.95 5.99 הערך הנבחן מול הגבול הקריטי: Expected oij eij 2 (36 31.26)2 (19 23.74)2 (24 25.58)2 (21 19.42)2 (48 51.16)2 (42 38.84)2 2.34 38.84 51.16 19.42 25.58 23.74 31.26 eij 2 Observed © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 216 אזור קבלת H 0 אזור דחית H 0 5.99 ד. ערך 2.34 החלטה 2 הנבדק 2.34קטן מהגבול הקריטי , 5.99לכן נקבל את השערת האפס אין תלות בין אזור מגורים לקבלה לקורס טיס. ה. מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני. .4 ציון טוב 95 35 130 עובדים ותיקים עובדים חדשים סה"כ ציון לא טוב 29 28 57 124 63 187 הטבלה היא טבלת הצפייה –. o נבנה את הטבלה הצפויה למצב של אי תלות – . e ציון טוב 86.2 43.8 130 עובדים ותיקים עובדים חדשים סה"כ ציון לא טוב 37.8 19.2 57 124 63 187 המבחן הסטטיסטי א. ב. השערות: H0 : אין תלות בין מספר האיחורים לוותק H1 : יש תלות בין מספר האיחורים לוותק רמת מובהקות המבחן 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 217 תחומי דחייה /קבלה לH 0 - ג. את הגבול הקריטי מוצאים בטבלת 2 C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 22121,0.95 C 21,0.95 3.84 הערך הנבחן מול הגבול הקריטי: Expected oij eij 2 (95 86.2)2 (35 43.8)2 (29 37.8)2 (28 19.2)2 8.74 19.2 37.8 86.2 43.8 eij 2 Observed אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 תחום קבלת H 0 תחום דחית H 0 8.74 ד. ערך 3.84 החלטה 2 הנבדק , 8.74ערך זה גבוה מהגבול הקריטי - , 3.84נמצא בתחום דחיית השערת האפס. נדחה את השערת האפס יש תלות בין מספר האיחורים לוותק. ה. מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 218 .5 בעל תואר 30 10 40 עסקאות מוצלחות עובדים חדשים סה"כ חסר תואר 14 46 60 44 56 100 הטבלה היא טבלת הצפייה –. o נבנה את הטבלה הצפויה למצב של אי תלות – . e בעל תואר 17.6 22.4 40 עסקאות מוצלחות עובדים חדשים סה"כ חסר תואר 26.4 33.6 60 44 56 100 המבחן הסטטיסטי א. השערות: H0 : אין תלות בין יכולת השיווק להשכלה האקדמית. H1 : יש תלות בין יכולת השיווק להשכלה האקדמית. ב. רמת מובהקות המבחן 0.05 ג. תחומי דחייה /קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 22121,0.95 C 21,0.95 3.84 הערך הנבחן מול הגבול הקריטי: Expected oij eij 2 (30 17.6)2 (10 22.4)2 (14 26.4)2 (46 33.6)2 26 33.6 26.4 22.4 17.6 eij 2 Observed © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 219 אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 אזור קבלת H 0 אזור דחית H 0 26 ד. ערך 3.84 החלטה 2 הנבדק , 26ערך זה גבוה מהגבול הקריטי - , 3.84נמצא בתחום דחיית השערת האפס. נדחה את השערת האפס יש תלות השכלה אקדמית ליכולת השיווק. ה. מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 220 שימוש בתוכנת Excelלהסקה סטטיסטית בפרק זה נדון בשימוש באקסל לצורך הסקה סטטיסטית. לפני שמתחילים בניתוח סטטיסטי באקסל יש לבחור במבחן /פעולה הסטטיסטית המבוקשת ,באופן הבא: בוחרים בתפריט כלים Data Analysis אם האופציה Data Analysisלא קיימת יש להתקינה ע"י כלים תוספות וסימון Analysis Tool Pack יופיע החלון הבא( :ניתן לבחור כל מבחן סטטיסטי כרצוננו). © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 221 מבחני הסקה סטטיסטית מבחן tלהפרש תוחלות 2 -מדגמים בלתי תלויים ,שונויות לא ידועות אך שוות שאלה בית ספר רצה לבחון אם תוכנית לימוד חדשה תשפר את הישגי התלמידים בספרות . נלקח מדגם אקראי של 10תלמידים אשר למדו בתוכנית החדשה ,ו 10-תלמידים אשר למדו בתוכנית הרגילה תוכנית חדשה 68 , 81 , 85 , 75 , 79 , 91 , 84 , 86 , 95 , 78 תוכנית רגילה 75 , 85 , 71 , 74 , 88 , 91 , 95 , 71 ,76 , 84 בדקו את הטענה ברמת מובהקות של 0.05 שלבי עבודה בExcel - .1 פתח חוברת עבודה ב – .Excelצור גיליון בשם תוכניות לימודים ורשמו את תצפיות שני המדגמים. .2 בחר ב – כלים t – Test: Two – Sample assuming equal variances :Data Analysis לחצו okלאישור. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 222 טווחי הנתונים .3ייפתח התפריט הבא: רמת מובהקות כותרות במידה ורוצים להוסיף הפרש הממוצעים ע"פ השערת האפס 0 - סימון מיקום הופעת הפלט .4לחצו okלאישור ,וקבלו את הפלט היכן שביקשת. .5יתקבל הפלט הבא: ממוצע Mean חדשה רגילה 83.4 76 37.6 25.11 10 10 ^ אומדן השונות מתוך המדגם S Variance – מס' תצפיות – גודל המדגם n Observations שונות משוקללת Pooled Variance H0 Hypothesized Mean Difference דרגות חופש Df t Stat P(T<=t) one-tail - 0 1 1 S n1 n2 31.355 0 18 t n1 n 22,1 t18,1 2.955014 ההסתברות לשגיאה ( האמיתית) השערה חד כיוונית 0.004237 t Critical one-tailערך tבטבלה – חד כיווני 1.734 P(T<=t) two-tailהסתברות לשגיאה ( האמיתית) ,השערה דו כיוונית 0.008474 t Critical two-tailערך tבטבלה – דו כיווני 2.100924 באמצעות פלט מחשב זה ניתן להגיע למסקנות בדרך מהירה יותר – בוחנים באמצעות ההסתברויות ללא צורך לחשב את הגבול הקריטי אם במקרה של שני מדגמים אם Tstat Tn1,1דוחים את H 0 Tstat Tn1n22,1דוחים את . H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 223 .6ננתח את התוצאות ע"פ שתי הדרכים שלמדנו – שתי הדרכים המקובלות: השערה חד כיוונית – כלפי מעלה – המטרה היא לבדוק האם שיטת הלימוד החדשה משפרת את הישגי א. התלמידים בספרות. השערות : .1 1 2 0 1 0 2 H 0 :השיטה החדשה אינה משפרת את הישגי התלמידים H1 : השיטה החדשה משפרת את הישגי התלמידים. רמת מובהקות 0.05 .2 דרך גבולות קריטיים: תחום י קבלה ודחית H 0 .3 2 2 S S n1 n2 C 1 2 tn1 n 22,1 2 2 S S 31.355 31.355 2.5041 n1 n2 10 10 t18,0.95 1.734 1 2 0 C 0 1.734 2.504 4.34 תחומי קבלה /דחייה לH 0 - תחום דחית H 0 תחום קבלת H0 7.4 .4 4.34 0 החלטת החוקר נדחה את השערת האפס ונקבל את השערת המחקר – מאחר וההפרש בין הממוצעים ,7.4נמצא בתחום דחיית השערת האפס – השיטה החדשה משפרת את הישגי התלמידים בספרות. .5 השגיאה האפשרית מאחר ודחינו את השערת האפס ,השגיאה האפשרית -דחינו את השערת האפס בזמן שהיא נכונה כלומר שגיאה מסוג , 0.05ברמת הגדרת המחקר יש סיכוי של 5%שטעינו. ההסתברות האמיתית לשגיאה היא בעצם רמת המובהקות הקטנה ביותר בה עדיין נקבל את אותן מסקנות - ההסתברות לקבל ערך גבוה מהערך שקיבלנו להפרש .7.4 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 224 1 1 n1 n2 C 0 t n1 n 22,1 S 7.4 0 t18,1 2.5041 2.955 t18,1 שימו לב – זהו הערך המופיע בפלט המחשב t Stat -- 0.995 1 0.9995 0.0005 0.005 באמצעות המחשב ניתן להגיע לתוצאה מדויקת יותר מאשר בטבלאות 0.00423 הערך המופיע בפלט - P(T<=t) one-tail ב .דרך תוצאות הפלט כפי שהן – דרך ההסתברויות: .3 תחום קבלה ודחית H 0 Tstat 2.955 Tn1 n 22,1 1.734 תחום דחית H 0 תחום קבלת H0 0 1.734 2.955 ערכים אלו מתייחסים להסתברויות /לשטחים הנמצאים מתחת לעקומת ההתפלגות משמאל לערכים. .4 החלטת החוקר אם Tstat Tn1n22,1דוחים את השערת האפס 2.955 1.734 נדחה את השערת האפס ונקבל את השערת המחקר – השיטה החדשה משפרת את הישגי התלמידים בספרות. .5 השגיאה האפשרית באמצעות המחשב ניתן להגיע לתוצאה מדויקת יותר מאשר בטבלאות 0.00423 הערך המופיע בפלט - P(T<=t) one-tail יכולנו לערוך את המבחן ע"פ - בהגדרת המחקר שלנו 0.05ע"פ פלט המחשב 0.00423לכן אנחנו דוחים את השערת האפס © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 225 מבחן tלשני מדגמים תלויים (מזווגים) שאלה חברת סופרמן רצתה לבדוק את השפעת משקה האנרגיה שברשותה על שיפור הערנות. נלקח מדגם של 10סטודנטים כאשר נבדק משך ערנותם ביום במשך שבוע ללא המשקה ולאחר שתייה יומית של חצי ליטר משקה במשך שבוע ( :בטבלה נתונים משך שעות הערנות ביום) 14 17 14 12 17 13 15 14 12 13 לפני 15 19 12 14 19 15 12 18 12 14 אחרי א .בדקו את הטענה ברמת מובהקות של 0.05 שלבי עבודה בEXCEL - .1פתחו חוברת עבודה ב – Excelוהזינו את הנתונים . .2בחר ב – Tools | Data Analysis © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 226 .3 יפתח לפניכם מסך להזנת הנתונים: טווחי הנתונים מובהקות השערת האפס .4 כותרות לחצו על O.Kותקבלו בגיליון אחר את טופס הנתונים -בתחתית עמוד האקסל מצד ימין ניתן לעבור בין הגיליונות: הגיליון המתקבל הוא: t-Test: Paired Two Sample for Means לפני אחרי Meanממוצע 14.1 15 Varianceשונות מתוקנת (אומדן לשונות באוכלוסיה) S 7.777778 3.211111 ^ - Observationsגודל המדגם 10 - Pearson Correlationמקדם המתאם r 0.666996 Hypothesized Mean Differenceהפרש הממוצעים ע"פ השערת האפס 0 - dfדרגות חופש (שני מדגמים מזווגים הם למעשה מדגם אחד של nתצפיות 9 t 9,1 t Statנלקח תמיד בערכו המוחלט -1.36895 P(T<=t) one-tailה -האמיתית בהתאם לתוצאות (חד כיווני) 0.102102 t Critical one-tailערך tבטבלה (חד כיווני) 1.833114 P(T<=t) two-tailה -האמיתית בהתאם לתוצאות (דו כיווני) 0.204205 t Critical two-tailערך tבטבלה – דו כיווני 2.262159 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 10 227 .5ננתח את התוצאות בשלוש שיטות שונות: השערה חד כיוונית – כלפי מעלה – המטרה היא לבדוק האם המשקה משפר את הערנות. השערות : א. D 0 H0 : המשקה אינו משפר את הערנות D 0 H1 : המשקה משפר את הערנות. רמת מובהקות 0.05 ב. שיטה ראשונה – ע"פ רמת המובהקות :מאחר ורמת מובהקות המבחן היא 0.05וע"פ פלט המחשב ה - האמיתית היא - 0.102רצינו רמת שגיאה של 5%וקיבלנו רמת שגיאה של 10%המשמעות היא קבלת השערת האפס – כאשר המובהקות גבוהה מהנדרשת התוצאות נמצאות בתחום קבלת השערת האפס. שיטה שנייה -דרך גבולות קריטיים: פלט המחשב אינו מתוכנן לשיטה זו ולכן חסרים בו שני ערכים S של ההפרשים חישוב ערכים אלו נותן S 2.079 dממוצע ההפרשים ואומדן סטיית התקן d 0.9 = dהפרש הממוצעים שהוא גם ממוצע ההפרשים. את Sניתן לחשב גם באמצעות האקסל – בחירת בתפריט הפונקציות בפונקציות סטטיסטיות בפונקציה STDEV והכנסת הפרשי הערכים בין שני המדגמים. ג. תחומי קבלה /דחייה לH 0 - S C d t n 1,1 n t 9,0.95 1.833 2.079 0.657 10 S n D 0 C 0 1.833 0.657 1.205 תחום דחית H 0 תחום קבלת H0 1.205 .4 0.9 0 החלטת החוקר נקבל את השערת האפס – מאחר וההפרש בין הממוצעים ,0.9נמצא בתחום קבלת השערת האפס – המשקה אינו משפר את הערנות. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 228 .5 השגיאה האפשרית מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני - שיטה שלישית דרך תוצאות הפלט כפי שהן – דרך ההסתברויות: .1 תחומי קבלה /דחייה לH 0 - Tstat 1.368 T9,0.95 1.833 תחום דחית H 0 תחום קבלת H0 1.833 1.368 0 ערכים אלו מתייחסים להסתברויות /לשטחים הנמצאים מתחת לעקומת ההתפלגות משמאל לערכים. .4 החלטת החוקר אם Tstat Tn1n22,1מקבלים את השערת האפס 1.368 1.833 נקבל את השערת האפס ונדחה את השערת המחקר – המשקה אינו משפר את הערנות. ברמת מובהקות 5%נדחה את השערת האפס .ניתן להסיק מהתוצאות שיש עליה בתוחלת שעות העבודה ליום כתוצאה מהמעבר לשעות עבודה גמישות. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 229 2 מבחן לאי תלות בעזרת Excel מטרת המבחן היא לבדוק האם קיימת תלות /קשר מובהק בין שני משתנים איכותיים. לשם ביצוע המבחן ,בונים טבלת שכיחויות משותפת לשני המשתנים ומשווים בין השכיחות הנצפית במדגם ( )Observedלבין השכיחות הצפויה בהנחת היעדר קשר בין שני המשתנים (.)Expected הערך של 2מבוסס על הסטיות בין השכיחות הנצפית לבין השכיחות הצפויה .ככל שמרחקים אלו גדולים יותר, אז הקשר בין שני המשתנים חזק יותר – ככל שהסטייה בין הטבלה שמציינת מצב של אי תלות לטבלה הנבדקת גדלים המשמעות היא שהתלות/הקשר חזק יותר. ככל ש 2רחוק יותר מ 0 -כך יש סיכוי גבוה יותר להסיק שיש קשר מובהק בין שני המשתנים ( דחיית השערת האפס). דוגמה בדקו האם קיימת תלות בין אזור מגורים לקבלה לקורס טיס ברמת מובהקות של .0.05 מתקבלים לא מתקבלים א. קיבוצים 36 19 55 מושבים 24 21 45 עירונים 48 42 90 השערות : H 0 אין קשר בין אזור מגורים לקבלה לקורס טיס : H1 יש קשר בין אזור מגורים לקבלה לקורס טיס 108 82 190 הטבלה הנתונה היא טבלת הנתונים אשר התקבלו במחקר – טבלת הObserved - נבנה טבלה זו באקסל ומתחתיה נבנה את הטבלה הצפויה למצב של אי תלות (עמ' הבא) .1 מתחת לטבלת ה , Observed -נבנה את טבלת ה . Expected -נקבל את הטבלה הבאה: © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 230 נחשב את מובהקות התוצאה בעזרת הפונקציה . CHITEST .2 בחלון הפונקציות נבחר ב"פונקציות סטטיסטיות" ומתוכה את הפונקציה .CHITEST ב- ACTUAL _RANGEנזין את נתוני Observedלא כולל שמות הקטגוריות והסיכומים בשוליים. ב- EXPECTED RANGEנזין את נתוני טבלת Expected ונלחץ OKלאישור הערך המוחזר הוא ערך הסתברותי ל -נסמנו כ ' -למעשה רמת המובהקות במבחן שהתבצע כדי שנדחה את השערת האפס ' לכן נקבל את השערת האפס. אם נרצה לתרגם תוצאה זו ולקבל את ההחלטה בדרך שלמדנו במבחן אי תלות ,ניתן לתרגם ערך זה לערכי 2 באמצעות האקסל – נשתמש בפונקציה . CHIINV מיקום התא בו נמצאת תוצאת הנוסחה הקודמת או הצבת הערך שמצאנו דרגות החופש )(r-1)(c-1 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 231 בהתאם למבחן 2יש לחשב את הערך הקריטי באמצעות הטבלה C 2 21 31,0.95 C 2 2,0.95 5.99מאחר והתוצאה שקיבלנו באקסל – 2.34קטנה מהערך הקריטי נקבל את השערת האפס. התוצאה שהתקבלה היא מאוד מובהקת ( אלפא מינימאלית קטנה מאוד .) ' 0.001לכן נדחה את השערת האפס ונסיק כי קיים קשר בין מין הנהג ומספר עבירות התנועה שעשה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 232 רגרסיה ליניארית לפניכם נתונים על 7עובדות -מס' ילדים לכל עובדת ומס' איחורים לעבודה בחודש: 7 5 6 6 2 3 5 3 4 3 4 2 4 1 2 2 5 4 א. מהו מקדם המתאם בין מס' הילדים למס' האיחורים בחודש. ב. חשבו את קו הרגרסיה לחיזוי מס' האיחורים בחודש ע"פ מספר הילדים. 1 3 4 מס עובדת מס ילדים מס' איחורים שלבי העבודה: .1 פתח חוברת עבודה ב – . Excelוהזינו את הנתונים. .2בוחרים בתפריט כלים Data Analysis .3 : לחץ okלאישור. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 233 יפתח התפריט הבא: ערכי ציר y המשתנה התלוי ערכי ציר X משתנה בלתי תלוי לאחר שהזנתם את הנתונים ,לחצו O.Kותקבלו קובץ נתונים בגיליון אחר של אותה חוברת עבודה (מעבר בין הגיליונות בתחתית העמוד © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 234 תוצאות הפלט SUMMARY OUTPUT מקדם המתאם Regression Statistics 0.626458 Multiple R 0.392449 R Square Adjusted R -1.4 1.193065 Square Standard Error 1 Observations ANOVA Significance F Upper Lower Upper 95.0% 95.0% 95% F MS SS Df 3.229767 0.656752 4.597264 7 Regression 1.423404 7.117021 5 Residual 11.71429 12 Total Standard Lower 95% P-value t Stat Error Coefficients -9E+177 4E+177 Intercept 0 0 X Variable 1 5.887655 -2.58978 X Variable 2 3.3E-292 -1E-292 X Variable 3 -4E+291 -4E+291 X Variable 4 -8.5E+40 -8.5E+40 X Variable 5 4.633122 -1.33525 4.633122 -1.33525 0.214734 1.420393 1.160901 1.648936 X Variable 6 1.422019 -0.25181 1.422019 -0.25181 0.132241 1.797155 0.325574 0.585106 X Variable 7 ny x שיפוע קו הרגרסיה- Yi m y xi n y x x x Yi 0.585 xi 1.646 235 my – ניתן לחשב את קו הרגרסיה © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע מבחן מס 1 פרק ראשון ((48% בפרק זה שתי שאלות .ענה על 4סעיפים בלבד בכל אחת מבין השאלות .משקל כל סעיף .6% שאלה :1ענו על ארבעה סעיפים בלבד בנק ההשקעות "השקעת הרווחת" השיג עבור משקיעיו במהלך שנת ,2005תשואות נמוכות ממתחריו בשוק. על מנת לשנות את התדמית הגרועה ולהוות גורם תחרותי בשוק ,החליטה הנהלת הבנק לשלוח את יועצי ההשקעות לקורס "ניתוח ניירות ערך". כדי לבדוק אם הקורס משפר את תשואות תיקי ההשקעות של היועצים ,נבחרה קבוצה של שישה יועצי השקעות אשר השתתפו בקורס ,ונבדקה תשואת תיקי ההשקעות שלהם לפני ואחרי הקורס. התוצאות שהתקבלו (אחוזים) : היועץ לאחר הקורס לפני הקורס א 16 13 ב 14 8 ג 4 2- ד 4 4 ה 7 5 ו 11 10 התקבל הפלט הבא : t-Test: Paired Two Sample for Means Mean Variance Observations Pearson Correlation Hypothesized Mean Difference Df t Stat P(T<=t) one-tail t Critical one-tail P(T<=t) two-tail t Critical two-tail Variable 1 9.33 26.27 6 0.881113 0 Variable 2 6.33 27.47 6 5 2.904738 0.016802 3.36493 0.033605 4.032143 הערות - variable1 :לאחר הקורס - variable2לפני הקורס ענה על השאלות הבאות בעזרת הפלט: א. האם לקורס "ניתוח ניירות ערך" יש השפעה חיובית ברמת מובהקות של ? 1%מהו המבחן בו אתה משתמש? נסח את ההנחות וההשערות המתאימות. ב. מה תהיה מסקנתך אם תבצע מבחן לבדיקת ההשערות H 0 : d 2לעומת . H1 : d 2באותה רמת מובהקות? נמק. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 236 בהמשך לתוצאות הקודמות ,החליטה הנהלת הבנק לבדוק האם קיים קשר בין מספר שנות הניסיון של היועץ בענף ההשקעות ,לבין התשואה שהשיג .התקבלו התוצאות הבאות : א 13 6 היועץ -Yתשואה שהשיג היועץ – Xמספר שנות ניסיון ב 8 2.5 ג 21 ד 4 3 ו 10 5 ה 5 2.5 תוצאות הפלט : SUMMARY OUTPUT Regression Statistics 0.9116570 Multiple R 0.8311184 R Square 0.7888980 Adjusted R Square 2.4079592 Standard Error 6 Observations ANOVA Regression Residual Total Df 1 4 5 Intercept X Coefficient s -2.35 2.60 SS MS 114.1 5.8 F 19.685 Significance F 0.0113 Standard Error 2.189 0.587 t Stat P-value Upper 95% 3.732 4.233 114.1 23.2 137.3 -1.072 4.437 0.344 0.011 Lower 95% -8.425 0.974 Upper 95.0% 3.732 4.233 Lower 95.0% -8.425 0.974 ענה על השאלות הבאות בעזרת הפלט: ג. האם ניתן לבצע תחזית לתשואה שישיג יועץ בעל 3שנות ותק ? אם כן ,תן תחזית והסבר מדוע היא שונה מהתוצאות הקיימות בלוח עבור ותק זהה .אם לא ,נמק מדוע. ד. האם ניתן לבצע תחזית לתשואה שישיג יועץ בעל 20שנות ותק ? אם כן ,תן תחזית .אם לא ,נמק מדוע. ה. מה תוכל לומר על הקשר בין התשואה שהשיג היועץ למספר שנות הניסיון שלו ? שאלה :2ענו על ארבעה סעיפים בלבד חברה מסוימת מספקת ללקוחותיה שרותי תמיכה טלפוניים לגלישה באינטרנט .אחד המדדים לטיב השירות הוא הזמן הנדרש לעובד על מנת למצוא ולטפל בבעיה. מנהל החברה חושב שהעובדים הוותיקים ( העובדים לפחות שנה אחת ) נותנים שירות מהיר יותר מאשר העובדים החדשים ( פחות משנה אחת ). לבדיקת הטענה נלקח מדגם של 122עובדי החברה הוותיקים ו 65-עובדי החברה החדשים .התקבלו התוצאות: מדגם עובדים וותיקים :זמן שירות ממוצע של 6.5דקות עם סטיית תקן מדגמית של 3דקות. מדגם עובדים חדשים :זמן שירות ממוצע של 7דקות עם סטיית תקן מדגמית של 3.4דקות. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 237 הניחו שזמן השירות מתפלג נורמאלית וקיים שוויון שונויות. א. בדוק את טענת המנהל ברמת מובהקות של .1%ציין מהו המבחן בו אתה משתמש ,נסח את ההשערות ואת ההנחות המתאימות. ב. בעבר ממוצע זמן השירות של עובדים חדשים היה 7.5דקות .האם ניתן לומר על סמך תוצאות המדגם שחל שיפור בשירות של העובדים החדשים ? רמת מובהקות .5% ציין מהו המבחן בו אתה משתמש ,נסח את ההשערות ואת ההנחות המתאימות. לפתרון סעיפים ג' ו-ד' הנח שסטיית התקן של זמן השרות של עובדים חדשים ידועה והיא 4דקות. ג. סטטיסטיקאי חישב רווח סמך לתוחלת זמן השירות של עובדים חדשים וקיבל 5.72 8.28 מהי רמת הביטחון (רמת הסמך) לפיה חושב הרווח ? ד. הוחלט לבדוק שוב את טיב השירות של עובדים חדשים .מהו גודל המדגם המינימאלי שצריך לקחת אם רוצים שאורך הרווח לא יעלה על 0.5דקה וזאת ברמת בטחון (רמת סמך) ? 95% ה. בתום קבלת השירות מדרג כל לקוח את רמת המקצועיות של השירות שקיבל.התקבלו התוצאות הבאות : ציון טוב ציון לא טוב סה"כ 90 32 עובדים ותיקים 122 40 25 עובדים חדשים 65 סה"כ 130 57 187 האם ניתן לומר ברמת מובהקות של 5%שקיימת תלות בין רמת המקצועיות לוותק של העובדים ? © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 238 פרק שני ()52% ענו על 10שאלות בלבד בפרק זה (כל שאלה .)5.2%סמן את התשובה הנכונה או את התשובה הקרובה ביותר לתשובה הנכונה . .1 משקל חיילים בשרות סדיר מתפלג נורמאלית עם ממוצע 75ק"ג וסטיית תקן 12ק"ג. ליום ספורט נבחרו 16חיילים באופן מקרי לתחרות משיכת חבל. ההסתברות שמשקלם הכולל עולה על 1128ק"ג היא : א0.0668 . .2 ב0 . ג0.9332 . ד1 . ידוע כי משך זמן הייבוש (תחת תנאים קבועים) של צבע מסוים לעץ מתפלג נורמאלית עם ממוצע 90דקות .כימאי הציע תוסף לצבע ,אשר לדבריו יקצר את משך זמן הייבוש .במדגם מקרי בגודל 4עם התוסף התקבלו זמני הייבוש הבאים בדקות 90 ,85 ,85 ,80 : זמן הייבוש עם התוסף מתפלג גם כן נורמאלית. מהי רמת המובהקות המינימאלית לקבלת טענת הכימאי? א 0 0.025 .ב 0.025 0.05 .ג 0.05 0.1 .ד 0.1. .3 בונים רווח סמך לתוחלת של אוכלוסיה נורמאלית אחת על סמך מדגם בן Nתצפיות .אם נבנה רווח סמך צר פי שלושה ,באותה רמת סמך ,נזדקק למדגם בגודל: א3N . .4 ב1.73N . ג9N . ד0.33N . חוקר ביצע ניסוי .הוא ניסח את ההשערות הבאות : H0 : 0 H1 : 0 .לצורך בדיקה הוא לקח מדגם מקרי בגודל 5מתוך אוכלוסיה המתפלגת נורמאלית עם שונות לא ידועה .על סמך תוצאות המדגם הוא חישב וקיבל . t stat 2.611 t x 2.611 : לכן המסקנה היא : א .הוא ידחה H 0ברמת מובהקות 0.1אך לא כן ברמת מובהקות .0.05 ב .הוא ידחה H 0ברמת מובהקות 0.05אך לא כן ברמת מובהקות .0.025 ג .הוא ידחה H 0ברמת מובהקות 0.025אך לא כן ברמת מובהקות 0.01 ד .הוא לא ידחה H 0ברמת מובהקות . 0.1 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 239 .5 בדקת השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של 5%ודחית את השערת האפס. לפניך שני משפטים: .1 אילו תבדוק את אותה השערה ,על סמך אותו המדגם ,כנגד אלטרנטיבה דו צדדית, ברמת מובהקות של ,2.5%תגיע לאותה מסקנה. .2 .6 רמת המובהקות המינימאלית לדחיית השערת האפס עבור מבחן דו צדדי היא .10% א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. השערת האפס ( ) Hoהיא שאין הבדל בין תוחלות ההכנסות בין שתי ערים. ההשערה האלטרנטיבית ( ) H1היא שתוחלות ההכנסות בשתי הערים שונות. לבדיקת השערות אלו נלקחו שני מדגמים ב"ת (אחד מכל עיר) וחושבו הנתונים הבאים באלפי שקלים: עיר א' עיר ב' ממוצע מדגם 7.98 4.32 סטית תקן של האוכלוסייה 4.84 3.61 10 12 גודל המדגם בהנחה שההכנסות בשתי הערים בלתי תלויות ומתפלגות נורמאלית, א .ברמת מובהקות של 5%נדחה את ,Hoאך לא ברמת מובהקות של .1% ב .ברמת מובהקות 1%נדחה את .Ho ג .ברמת מובהקות 5%נקבל את Ho ד תשובות א' עד ג' אינן נכונות. .7נבנה רווח סמך לתוחלת אוכלוסייה נורמאלית 100 200ברמת סמך (ביטחון) של .99% לפניך מספר טענות לגבי המשמעות של רווח הסמך: .1הסיכוי שתוחלת האוכלוסייה שווה ל 150 -הוא .99% .2בסיכוי של 99%נמצאת תוחלת האוכלוסייה בין 100ל .200 - .3הסיכוי שתוחלת האוכלוסייה היא בין 100ל 200 -הוא .1% .4הסיכוי שתוחלת האוכלוסייה לא נמצאת בתוך הרווח שבין 100ל 200 -הוא .1% רק אחת מבין התשובות הבאות נכונה : א .רק טענה 1וטענה 3נכונות. ב .רק טענה 1וטענה 3נכונות. ג .רק טענה 1וטענה 4נכונות ד .רק טענה 2וטענה 4נכונות. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 240 .8במבחן שנערך נמצא כי רמת המובהקות המינימאלית לדחיית H0היא .3%משמעות הדבר היא: א .ניתן לדחות את H0ברמת מובהקות של .1% ב .לא ניתן לדחות את H0ברמת מובהקות של .10% ג .לא ניתן לדחות את H0ברמת מובהקות של .1% ד .לא ניתן לדחות את H0ברמת מובהקות של ,10%אך ניתן לדחות את H0ברמת מובהקות של .1% .9חברה לסוכר אורזת על פי משקל .משקל השקיות מפולג נורמאלית עם סטיית תקן של 0.06ק"ג.לצורך בדיקת השערת האפס ( )Hoהטוענת כי תוחלת משקל הארוזה בייצור שווה 2ק"ג לעומת האלטרנטיבה האומרת כי התוחלת שונה מ 2-ק"ג .נלקח מדגם של 50שקיות .במדגם התקבל ממוצע 1.99ק"ג .על כן: א .יש לדחות את השערת האפס ברמת מובהקות של .0.01 ב .יש לדחות את השערת האפס ברמת מובהקות של .0.05 ג .יש לדחות את השערת האפס ברמת מובהקות של ,0.1אך לא ברמת מובהקות .0.05 ד .אין לדחות את השערת האפס ברמת מובהקות של .0.1 סטודנט המבצע מעבדה בפיסיקה התבקש לבנות מודל רגרסיה ליניארית כדי להסביר את Y 10 בעזרת . Xהוא קיבל את הנתונים הבאים המבוססים על מדגם הכולל 8מדידות: כמו כן ,שיפוע קו הרגרסיה הוא .0.4569-מקדם המתאם בין המשתנים הוא: א0.69 . ב0.46 . ג. 0.78 ד. 0.91 11סטטיסטיקאי החליט על מדיניות לפיה הוא משתמש תמיד ברמת מובהקות של .1% לטווח הארוך ,הוא החליט נכונה: א .בערך ב 1%ממספר בדיקת ההשערות שביצע. ב .בערך ב 99%ממספר בדיקת ההשערות שביצע. ג. בערך ב 1%ממספר השערות האפס הנכונות שבדק. ד .בערך ב 99%מספר השערות האפס הנכונות שבדק. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 241 מבחן מס 2 פרק ראשון ((48% בפרק זה שתי שאלות .ענה על 4סעיפים בלבד בכל אחת מבין השאלות .משקל כל סעיף .6% שאלה :1ענו על ארבעה סעיפים בלבד במסגרת המאמצים לשיפור הישגי הספורט במדינה ,נערכו מספר מחקרים .כאן נתמקד בתחום הרמת המשקולות. כדי לבדוק אם אכילת תרד מגבירה את הכושר הפיסי בחרו קבוצה של חמישה מרימי משקולות ובדקו את המשקל שכל אחד מהם הצליח להרים ביום שבו הם אכלו תרד וביום שבו לא אכלו תרד. התוצאות שהתקבלו (ק"ג) : הספורטאי עם תרד בלי תרד א 152 145 ב 170 170 ד ג 141 153 145 150 ה 148 144 התקבל הפלט הבא : t-Test: Paired Two Sample for Means בלי תרד עם תרד Variable Variable 2 1 150.8 152.8 Mean 120.7 114.7 Variance 5 5 Observations 0.925959 Pearson Correlation Hypothesized Mean 0 Difference 4 Df 1.069045 t Stat 0.172636 P(T<=t) one-tail 2.131846 t Critical one-tail 0.345271 P(T<=t) two-tail 2.776451 t Critical two-tail בעזרת הפלט ענה על השאלות הבאות: א. האם לאכילת התרד יש השפעה חיובית ברמת מובהקות של .5%מהו המבחן בו אתם משתמשים ? נסחו את ההנחות וההשערות המתאימות. ב. על סמך המחקרים בתחום הספורט ידוע שממוצע המשקל שמצליח מרים משקולות להרים בדרך כלל (ללא אכילת תרד) הוא 146ק"ג האם על סמך התוצאות לאחר אכילת התרד ניתן לומר שהתרד משפר את התוצאות משמעותית ברמת מובהקות של . 1%נמקו ( .עליכם להתייחס לנתונים על המשקל לאחר אכילת התרד ). © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 242 בהמשך לתוצאות הקודמות הוחלט להעמיק את הבדיקות בקרב מרימי המשקולות .החוקרים היו מעוניינים לבדוק האם יש קשר בין מספר שעות האימון שקדמו להרמת המשקלות לבין המשקל שכל אחד מחמשת מרימי המשקלות הצליח להרים לאחר האימון .התקבלו התוצאות הבאות : הספורטאי -Yמשקל שמרים כל ספורטאי – Xמספר שעות אימון א 145 5 ב 170 7 ד ג 145 150 4 5.5 ה 144 3.5 תוצאות הפלט : SUMMARY OUTPUT Regression Statistics 0.897386 Multiple R 0.805302 R Square 0.740403 Adjusted R Square 5.597619 Standard Error 5 Observation s ANOVA df 1 Regression 3 Residual 4 Total 388.8 94 482.8 Significance F F MS SS 0.038846 12.40851 388.8 31.33333 Upper Lower Upper Lower P-value t Stat Standard Coefficien 95.0% 95.0% 95% 95% Error ts 148.2855 81.31448 148.2855 81.31448 0.001648 10.91054 10.52193 114.8 Intercept 13.7048 0.695197 13.7048 0.695197 0.038846 3.522572 2.043961 7.2 X Variable 1 בעזרת הפלט ענה על השאלות הבאות : ג .תן תחזית למשקל שירים משקולן שמתאמן 7שעות .מדוע תחזית זו אינה זהה לאחד מהנתונים שבלוח (התצפית השנייה) ? ד .אמוד את השינוי שיחול במשקל שירים כל ספורטאי אם יוריד חצי שעה מאימוניו . ה .מה תוכל לומר על עוצמת הקשר בין המשתנים וטיב החיזוי ? © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 243 שאלה 2 לעמותת "תנו לחיות בכבוד" ,המסייעת לאזרחים המצויים בקשיים כלכליים ,ישנם 100מתנדבים מתוכם 60 צעירים ו 40 -מבוגרים .כל אחד מהם מקבל בתחילת שנה רשימה של תורמים פוטנציאלים ,מהם הוא אמור לנסות ולגייס תרומות לטובת פעילות העמותה .בסיכום שנערך לשנת 2005התקבלו הנתונים הבאים: סה"כ 44 56 100 א. צעיר 14 46 60 מבוגר 30 10 40 לא הצליחו לגייס תרומות הצליחו לגייס תרומות סה"כ האם ניתן לומר שקיימת תלות בין גילו של המתנדב לבין הצלחתו בגיוס תרומות ? 0.01 אברהם יצחק ויעקב הם מתנדבים בעמותה .בסוף שנת 2005נמצא שאברהם גייס תרומות מ 11-תורמים והקדיש בממוצע 33דקות עם אומדן סטיית תקן של 4דקות לכל תורם ואילו יצחק גייס תרומות מ 16 -תורמים והקדיש בממוצע 41דקות עם אומדן סטיית תקן של 4.5דקות לכל תורם .יעקב גייס תרומות מ 13 -תורמים והקדיש בממוצע 35דקות עם אומדן סטיית תקן של 4דקות לכל תורם. הנח שהזמן שמקדיש כל אחד מהמתנדבים מפולג נורמאלית ושקיים שוויון שונויות בין הזמנים וכן אי תלות בין שלושת המתנדבים. ב. האם ניתן להסיק ברמת מובהקות של 5%שאברהם משכנע יותר מהר מיעקב ? ג. יצחק חישב רווח סמך לתוחלת משך הזמן שהוא מקדיש לשכנוע תורם. רווח הסמך שהתקבל הוא .) 38.25 , 43.25( :מהי רמת הסמך (רמת הביטחון) שבה חושב הרווח ? ד. כדי לעודד את המתנדבים ולדרבן אותם להצליח יותר באיסוף התרומות הוחלט על מבצע פרסים שיוענקו לכל מי שיצליח להעלות את מספר התורמים מהם הצליח לגייס תרומות .נבחרו 4מתנדבים ולכל אחד מהם נבדק :מספר התורמים לפני מבצע הפרסים ואחרי מבצע הפרסים .נמצא ששניים העלו את מספר התורמים ,אחד ירד במספר התורמים ואחד לא שינה כלל .לאור ההפרשים הבאים : ,-2 ,0, 3 , 5האם מספר התורמים עלה באופן משמעותי ברמת מובהקות של ? 5% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 244 פרק שני ()52% ענה על 10שאלות בלבד בפרק זה (כל שאלה .)5.2%סמן את התשובה הנכונה או את התשובה הקרובה ביותר לתשובה הנכונה. .1 במחקר חינוכי על תלמידי בית ספר מסוים התגלה מתאם שלילי בין ציוני מבחן הגמר בספרות לבין ציוני מבחן הגמר בפיסיקה .משמעות המתאם השלילי היא( :בחר בתשובה הנכונה) א. רוב התלמידים שנוטים להיכשל במבחן אחד נכשלים גם בשני. ב. אין קשר בין הצלחה במבחן אחד להצלחה בשני. ג. רוב התלמידים שהצליחו במבחן השני קיבלו ציון שלילי. ד. רוב התלמידים שנוטים להצליח במבחן אחד נוטים שלא להצליח במבחן השני .2 משקל ארגז אבוקדו מתפלג נורמאלית עם תוחלת של 10ק"ג וסטיית תקן של 2ק"ג . מה ההסתברות כי משקלו הכולל של משטח אבוקדו שנבחר באקראי ומכיל 36ארגזים יהיה לפחות 340ק"ג ? בחר בתשובה הקרובה ביותר א0.9525 . .3 ג0.0475 . ב1 . ד0.4335 . מכון התקנים רוצה לבדוק את תוחלת המשקל של בלוקים המיוצרים במפעל מסוים .ידוע כי סטיית התקן של משקל הבלוקים היא 200גרם .מהו גודל המדגם המינימאלי שעליהם לבדוק אם רוצים שברמת ביטחון של 95%המרחק בין תוחלת המשקל האמיתית לממוצע המשקל במדגם לא יעלה על 50גרם ? (בחר בתשובה הקרובה ביותר ) א174 . .4 ב246 . ג8 . ד62 . הממוצע של בדיקת דם מסוימת הוא .200חוקר טוען כי נטילת סמים מורידה את הערך הנמדד .נבדק מדגם מקרי של 25מכורים לסמים ,ובמדגם נמצא כי ממוצע בדיקת הדם הוא 188.6עם סטיית תקן של המדגם .30ה α-המינימאלית לדחיית H 0היא( :בחר בתשובה הקרובה ביותר) א0 0.001 . ב0.001 0.01 . ג0.01 α ≤ 0.025 . .5 בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת .לפניך 2טענות: .I ככל שהמדגם לפיו חושב הרווח גדול יותר ,רווח הסמך ארוך יותר. .II ככל שרמת הביטחון (רמת הסמך) של הרווח קטנה יותר ,הרווח ארוך יותר. ד0.025 > α ≤ 0.05 . א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 245 השערת האפס ( )Hoהיא שאין הבדל בין תוחלות ההוצאות החודשיות על שימוש בטלפון נייד בין חיילים .6 לחיילות .ההשערה האלטרנטיבית ( )H1היא שתוחלות ההוצאות החודשיות הן שונות. לבדיקת השערות אלו נלקחו שני מדגמים בלתי תלויים של חיילים ושל חיילות והתקבל: חיילות חיילים ₪ 192 ₪ 180 ממוצע מדגם ₪ 31.5 ₪ 26 סטיית תקן מדגמית sˆ 17 15 גודל המדגם בהנחה שהוצאות השימוש של חיילים וחיילות בלתי תלויות ומתפלגות נורמאלית ,אזי : א .ברמת מובהקות של 5%נדחה את ,Hoאך לא ברמת מובהקות של .10%ב. ד. ג .ברמת מובהקות 10%נדחה את .Ho תשובות א' עד ג' אינן נכונות. ברמת מובהקות 5%נקבל את Ho .7במדגם בגודל 20תצפיות על שני משתנים X :ו Yהתקבלו התוצאות הבאות: 20 X Y 17800 i 1 20 Y 2 232000 i 1 20 X 2 2320 Y 100 X 10 i 1 מה ערכו של מקדם המתאם הליניארי ( ) rx , yבין Xו? Y - א- 0.6875 . ב0.3125 . H 0 : 200לעומת .8יהי ג- 0.000214 . ד0.48 . . H1 : 200כדי לבדוק השערות אלה באוכלוסיה בעלת התפלגות נורמאלית וסטית תקן 40נלקח מדגם בגודל 16והוחלט לדחות את H 0אם ממוצע המדגם יהיה מעל . 218 אזי רמת המובהקות היא: א0.0359 . ב0.0446 . ד0.05 . ג0.9641 . .9במבחן שנערך נמצא כי רמת המובהקות המינימאלית לדחיית H0היא .5%משמעות הדבר היא : א. ניתן לדחות את H0ברמת מובהקות של .3% ב. לא ניתן לדחות את H0ברמת מובהקות של .10% ג. לא ניתן לדחות את H0ברמת מובהקות של .3% ד. לא ניתן לדחות את H0ברמת מובהקות של ,10%אך ניתן לדחות את H0ברמת מובהקות של .5% .I .10אם בבדיקת השערת אפס מסוימת כנגד אלטרנטיבה חד צדדית , H 1 הוחלט ברמת מובהקות לדחות את השערת האפס ,אז בכל רמת מובהקות הקטנה מ -תתקבל אותה מסקנה. . II אם בבדיקת השערת אפס מסוימת כנגד אלטרנטיבה חד צדדית , H 1 הוחלט ברמת מובהקות לא לדחות את השערת האפס ,אז בכל רמת מובהקות הקטנה מ -תתקבל אותה מסקנה. א. שתי הטענות נכונות. ב. שתי הטענות אינן נכונות. ג. רק טענה Iנכונה. ד. רק טענה IIנכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 246 מבחן מס 3 פרק ראשון ((48% בפרק זה שתי שאלות .ענה על 4סעיפים בלבד בכל אחת מבין השאלות .משקל כל סעיף .6% שאלה :1ענו על ארבעה סעיפים בלבד בדיקת גובה החשבון החודשי עבור השימוש בטלפון הסלולארי בקרב לקוחות בגילאים שונים הראתה תוצאות הבאות: קבוצת גיל 20-30 30-40 מספר חשבונות שנבדקו 8 7 גובה חשבון ממוצע 200 190 סטית התקן של המדגם 40 43 בנוסף נבדקו גם 9חשבונות של לקוחות בגילאים .40-50נתוני המדגם הם: 160 ,240 170 ,160 ,160 ,230 ,150, 210 ,200 הנח שגובה החשבון החודשי בכל קבוצת גיל מפולג נורמאלית וקיים שוויון שונויות בין גובה החשבון החודשי בקבוצות הגיל השונות. א. השווה בין תוחלות גובה החשבון של לקוחות בגילאים 20-30ובגילאים 40 -30רמת מובהקות של .5% ב. בנה רווח סמך לתוחלת גובה החשבון החודשי בגילאים 20-30ברמת סמך של . 90%פי כמה יגדל הרווח אם רמת הסמך תעלה ל?98%- בסעיפים ג' ו -ד' הנח שסטית התקן של גובה החשבון החודשי בקרב לקוחות בני 40-50ידועה ושווה ל.35- ג. מצא את רמת המובהקות המינימאלית בה ניתן לדחות את השערת האפס כאשר בודקים השערה שתוחלת גובה התשלום של לקוחות בגילאים 50-40שווה ל 210-שקלים כנגד אלטרנטיבה שתוחלת זו נמוכה יותר. ד. מהו מספר החשבונות המינימאלי שיש לבחור במטרה לבנות רווח סמך לתוחלת גובה החשבון החודשי של לקוחות בגילאים 50-40ברמת סמך של 95%כדי שאורך הרווח לא יעלה על 15שקלים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 247 שאלה :2ענה על ארבעה סעיפים בלבד בהסתמך על הפלט המצורף. עושים סקר על שימוש בטלפון סלולארי בקרב אחים .לצורך בצוע הסקר בוחרים במדגם של 6זוגות אחים. תוצאות הסקר הם בלוח שלפניך. זמן האוויר החודשי של האח הבכור בדקות 200 170 160 150 120 220 זמן האוויר החודשי של האח הצעיר בדקות 240 215 200 190 170 150 t-Test: Paired Two Sample for Means Mean Variance Observations Pearson Correlation Hypothesized Mean Difference Df T Stat P(T<=t) one-tail t Critical one-tail P(T<=t) two-tail t Critical two-tail Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations צעיר 194.1667 1024.167 6 0.986934 20 5 1.535738 0.092599 2.015049 0.185199 2.570578 בכור 170 1280 6 0.986934067 0.974038853 0.967548566 6.444985309 6 ANOVA df 1 4 5 Regression Residual Total Intercept צעיר Significance F F MS SS 0.000255 150.07646233.84866 6233.848657 41.5378356 166.1513426 6400 Upper 95% Lower 95% P-value t Stat Standard Error Coefficients 4.86843959 -93.3306 0.066684 -2.5011532 17.68427547 -44.23108218 1.35339453 0.8532776 0.00025512.2505672 0.090064079 1.103336046 בהסתמך על הפלט א. בדוק השערה על כך שתוחלת זמן האוויר החודשי של האחים הצעירים גדולה ביותר מ 20-דקות מתוחלת זמן האוויר של האחים הבכורים ברמת מובהקות של .10% ב. מה תהיה מסקנתך ברמת מובהקות של 5%אם תתייחס למבחן הדו-צדדי(דו-זנבי) בסעיף הקודם. ג. תן תחזית לזמן האוויר החודשי של האח הבכור אם אחיו הצעיר קיבל חשבון חודשי של 180דקות זמן אוויר. ד. תאפיין את עוצמת הקשר ומהותו בין זמן האוויר החודשי של האחים הבכורים והאחים הצעירים .מהו אחוז השונות המוסברת על-ידי הרגרסיה? © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 248 פרק שני ()52% ענו על 8שאלות בלבד בפרק זה (כל שאלה .)6.5%סמן את התשובה הנכונה או את התשובה הקרובה ביותר לתשובה הנכונה . השערת האפס נדחית ברמת מובהקות של 5%כנגד אלטרנטיבה חד-צדדית .אם תבצע אותו המבחן על .1 סמך אותם הנתונים כנגד אלטרנטיבה דו-צדדית: א .השערת האפס בטוח תדחה ברמת מובהקות של .2.5% ב .השערת האפס בטוח תדחה ברמת מובהקות של .5% ג .השערת האפס בטוח תדחה ברמת מובהקות של .10% ד .השערת האפס בטוח תתקבל ברמת מובהקות של .5% הנהלת חברה החליטה לאמוד זמן ש"מבלה" לקוח ממוצע בתחנת השרות של החברה .סטית תקן של הזמן .2 היא 12.481דקות .על סמך מדגם של 20לקוחות חושב רווח סמך לתוחלת הזמן 29.43-40.37:דקות. רמת הסמך של הרווח היא: א95% . .3 ב97.5% . ד99% . ג98% . הוחלט לבדוק האם קיים קשר בין מידת שביעות הרצון של לקוח מהמכשיר הסלולארי שלו לבין מין. נתוני המדגם הראו את התוצאות הבאות: גברים נשים מין 160 130 40 70 מרוצה לא מרוצה א. ניתן לומר שיש קשר בין שביעות הרצון למין בר.מ .של 2.5%ו.5% - ב. ניתן לומר שאין קשר בין שביעות הרצון למין בר.מ .של 2.5%ו.5% - ג. ניתן לומר שאין קשר בין שביעות הרצון למין בר.מ .של 2.5%ויש קשר בר.מ .של .5% שביעות רצון ד .ניתן לומר שאין קשר בין שביעות הרצון למין בר.מ .של 5%ויש קשר בר.מ .של .2.5% .4 בונים שני רווחי סמך לתוחלת של אוכלוסייה נורמאלית כאשר סטיית התקן ידועה .רמת הסמך של שני הרווחים זהה .הרווח הראשון נבנה על סמך מדגם בגודל ,100בעוד שהרווח השני נבנה על סמך מדגם בגודל .500הרווח הראשון : א .ארוך פי 5מהרווח השני. ג. ארוך פי 2.236מהרווח השני. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ב .ארוך פי 25מהרווח השני. ד .קצר פי 5מהרווח השני. 249 .5 ילד מחייג במהלך יום ל 8-חברים בממוצע בעוד שסטיית התקן של מספר החיוגים היומי היא .2מה הסיכוי שב 60-יום שנבחרו באקראי יחייג הילד בסה"כ לפחות 512פעם לחבריו? ב. 0.0032 ג. ד. 0.0394 0.451 א. 0.0197 .6 סטודנט ערך חישובים לבדיקת הקשר בין שני משתנים Xו .Y-הוא מצא שמשוואת הרגרסיה היא: Y=4.13-0.6Xוכי מקדם המתאם .R= - 1.55לאור הממצאים ניתן לקבוע כי: ה .קיים קשר חיובי חזק בין שני המשתנים. ו .קיים קשר שלילי חלש בין המשתנים. ז .קיים קשר חיובי חלש בין שני המשתנים. ח .הסטודנט טעה בחישוביו. .7 בונים רווח סמך לשיעור הצרכנים המשתכנעים לקנות טלפון סלולארי חדש לאחר שראו את הפרסומת שלו .במדגם של 100צרכנים השתכנעו 21לקנות טלפון סלולארי חדש לאחר שראו את הפרסומת שלו.רווח הסמך שנבנה ברמת סמך של 98%הוא: א(0.21 0.1073) . .8 ב (0.21 0.041) .ג (0.21 0.095 .ד(0.21 0.061) . השערת האפס ( ) Hoהיא שאין הבדל בין תוחלות זמן השיחה בטלפון סלולארי בין שתי ערים. ההשערה האלטרנטיבית ( ) H1היא שתוחלות זמן השיחה בטלפון סלולארי בשתי הערים שונות. לבדיקת השערות אלו נלקחו שני מדגמים (אחד מכל עיר) וחושבו הנתונים הבאים (בדקות) עיר א' 7.98 ממוצע מדגם 4.84 סטית תקן של האוכלוסייה 10 גודל המדגם בהנחה שזמני השיחה בשתי הערים בלתי תלויים ומתפלגים נורמאלית, עיר ב' 4.32 3.61 12 א. ברמת מובהקות של 5%נדחה ,Hoאך לא ברמת מובהקות של .1% ב. ברמת מובהקות 1%נדחה .Ho ג. ברמת מובהקות 5%נקבל Ho ד תשובות א' עד ג' אינן נכונות. .9 נתונה משוואת הרגרסיה הבאה .Y = 50 + 0.5X1 – 0.8X2 :בחר תשובה אפשרית לגבי .X2 ,X1 ,Y ד. Yשכר של פועל כפונקציה של – X1מספר הפריטים שמייצר ו X2-מספר תלונות נגדו מצד הממונה עליו. ה. Yשכר של פועל כפונקציה של – X1מספר שנות ותק ו – X2-מספר שנות לימוד. ו. Yשכר של פועל כפונקציה של – X1מספר היעדרויות לא מוצדקות ו – X2-מספר פריטים שהוא מייצר. ד. התשובות א ',ב' ,ג' נכונות. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 250 מבחן מס 4 פרק ראשון ((48% בפרק זה שתי שאלות .ענה על 4סעיפים בלבד בכל אחת מבין השאלות .משקל כל סעיף .6% שאלה :1ענה על ארבעה סעיפים בלבד ספקית אינטרנט עורכת סקר כללי בקרב גולשים באינטרנט .במדגם מקרי של 20נשים ובמדגם מקרי של 20 גברים נבדק זמן הגלישה באינטרנט בשעות במשך חודש .הנח אי תלות בין שני המדגמים. התקבל הפלט הבא : t-Test: Two-Sample Assuming Equal Variances נשים גברים Variable Variable 2 1 16.65 19 Mean 121.5026 207.4737 Variance 20 20 Observations 164.4882 Pooled Variance Hypothesized Mean 0 Difference 38 Df 0.579429 t Stat 0.282859 P(T<=t) one-tail 1.685954 t Critical one-tail 0.565719 P(T<=t) two-tail 2.024394 t Critical two-tail ענה בעזרת הפלט על השאלות הבאות : א .האם ניתן לומר שתוחלת זמן הגלישה באינטרנט של גברים גבוה משמעותית מזה של הנשים ברמת מובהקות של . ? 10%מהו המבחן בו אתם משתמשים ? נסחו את ההשערות המתאימות ואת הנחות המבחן. ב .בדקו את ההשערה : H 0 : 1 2 2 H 1 : 1 2 2 ברמת מובהקות של . 10% ג .חשבו רווח סמך לתוחלת זמן הגלישה החודשי של הגברים ברמת בטחון (רמת סמך) של .95% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 251 ספקית האינטרנט מתעניינת בקשר בין גיל הגולשים לזמן השימוש החודשי בשעות .במדגם של 20גולשים התקבל הפלט הבא : SUMMARY OUTPUT Regression Statistics 0.842371 Multiple R 0.70959 R Square Adjusted R 0.693456 Square 3.357133 Standard Error 20 Observations ANOVA df 1 Regression 18 Residual 19 Total Significance F F MS 3.17E-06 43.98126 495.6838 11.27034 SS 495.6838 202.8662 698.55 Standard Error Coefficients 2.131305 38.37872 Intercept 0.051543 0.34183 X Variable 1 P-value t Stat 5.85E-13 18.00714 3.17E-06 -6.63184 Lower 95% 33.90101 -0.45012 ענה על השאלות הבאות בעזרת הפלט : מה תוכל לומר על הקשר בין גיל הגולשים לזמן הגלישה ? ד. ה. מהי התחזית לזמן הגלישה באינטרנט של גולש שגילו הוא ? 25 שאלה :2ענה על ארבעה סעיפים בלבד חברת "הרזייה כדרך חיים" משווקת ערכות הרזיה בקופסאות .על הקופסאות מצוין שמשקל הקופסה הוא בממוצע 500גרם עם סטיית תקן של 6גרם . צרכנים פנו בתלונה לרשות להגנת הצרכן בטענה שמשקל הקופסה נמוך מהמצוין על-גבי הקופסה. לשם בדיקת הטענה נלקח מדגם של 9קופסאות ונמצא כי משקלן היה: 475, 493, 502, 500, 495,490 , 496, 498,503הנח שמשקל קופסה מתפלג נורמאלית באוכלוסיה. א. בדוק את טענת הצרכנים ברמת מובהקות של 2.5% מה תהיה מסקנתך ברמות מובהקות של 1% ו ? 10% -נמק ללא חישוב מחדש! ב. מהי רמת המובהקות המינימאלית לקבלת טענת הצרכנים? ג. חשב רווח בר סמך ברמת ביטחון של 95%לתוחלת משקל הקופסאות. הנח כי סטיית התקן של ערכות ההרזיה אינה ידועה לך! © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 252 ד. לחברה קו ייצור חדש העובד בשתי משמרות :משמרת יום ומשמרת לילה. התקבלו התוצאות הבאות על תפוקת 160עובדי שתי המשמרות : סה"כ 60 100 160 משמרת לילה 25 25 50 משמרת יום 35 75 110 תפוקה נמוכה תפוקה גבוהה סה"כ האם יש תלות בין המשמרת לגובה התפוקה ? רמת מובהקות .5% ה. כדי לבחון את יעילות הערכות נבחרו 5אנשים באופן מקרי ונבדק משקלם לפני השימוש בערכת ההרזיה של החברה וחודש לאחר מכן .להלן תוצאות הבדיקה: לפני השימוש בערכת ההרזיה 78 68 73 85 87 אחרי השימוש בערכת ההרזיה 74 64 74 82 82 האם ניתן לומר ברמת מובהקות של 5%כי תוחלת המשקל לאחר השימוש בערכות ההרזיה של "רזה לתמיד" קטנה לעומת המשקל לפני השימוש בה? © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 253 פרק שני ()52% ענה על 10שאלות בלבד בפרק זה (כל שאלה .)5.2%סמן את התשובה הנכונה או את התשובה הקרובה ביותר . .1 200גרם וסטיית תקן של 50גרם. משקל תפוח "גרנד" מתפלג נורמאלית עם תוחלת של ירקן מוכר תפוחי "גרנד" באריזות של 16תפוחים .ההסתברות שממוצע משקל של תפוח באריזה ינוע בין 175גר' ל 215 -גר' היא: א0.8621 . .2 ג0.6628 . ב0.8849 . ד0.7431 . במאמר פורסם שרמת המובהקות המינימאלית לדחיית השערת האפס היא .5%משמעות הדבר הוא: א .שהשערת האפס תידחה ברמת מובהקות של 5%בלבד. ב .שהשערת האפס תידחה בכל רמת מובהקות של 5%לפחות ותתקבל בכל רמת מובהקות הנמוכה מ.5% - ג .שהשערת האפס תתקבל בכל רמת מובהקות של 5%לפחות ותידחה בכל רמת מובהקות הנמוכה מ.5% - ד .שהשערת האפס תידחה רק ברמת מובהקות בין 5%ל.10% - .3 מכון התקנים רוצה לבדוק את תוחלת המשקל של בלוקים המיוצרים במפעל מסוים .ידוע כי סטיית התקן של משקל הבלוקים היא 200גרם .מהו גודל המדגם המינימאלי שעליהם לבדוק אם רוצים שברמת ביטחון של 95% אורך רווח הסמך לתוחלת לא יעלה על 100גרם? (בחר בתשובה הקרובה ביותר). א248 . .4 ג53 . ב110 . ד62 . בונים שני רווחי סמך לתוחלת של האוכלוסייה נורמאלית כאשר סטיית התקן ידועה .רמת הסמך של שני הרווחים זהה .הרווח הראשון נבנה על סמך מדגם בגודל ,100בעוד שהרווח השני נבנה על סמך מדגם בגודל .500הרווח הראשון : א .ארוך פי 5מהרווח השני. ב. ג .ארוך פי 2.236מהרווח השני. ד .קצר פי 5מהרווח השני. .5 ארוך פי 25מהרווח השני. בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת .לפניך שתי טענות: .1 ככל שהמדגם לפיו חושב הרווח גדול יותר ,רווח הסמך ארוך יותר. .2 ככל שרמת הסמך של הרווח גדולה יותר ,הרווח ארוך יותר. א. שתי הטענות נכונות ב. שתי הטענות לא נכונות ג. רק טענה ראשונה נכונה ד. רק טענה שנייה נכונה © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 254 .6 יצרן מזרונים רוכש קפיצים מספק הטוען כי ממוצע עמידתם בלחץ של הקפיצים שלו הינו 40ק"ג עם סטיית תקן של 12ק"ג .עקב תלונות קונים חושד היצרן כי ממוצע עמידתם בלחץ של הקפיצים נמוך מכפי שטוען הספק .לשם כך בוחר היצרן מדגם מקרי של 36קפיצים מתוצרת הספק ומוצא כי ממוצע עמידתם בלחץ הוא 38.5ק"ג .רמת המובהקות המינימאלית עבורה תתקבל טענת היצרן היא: א. ב. 0.28 0.2266 0.2 ג. ד. 1 .7חברה לסוכר אורזת על פי משקל .משקל השקיות מפולג נורמאלית עם סטיית תקן של 0.06ק"ג.לצורך בדיקת השערת האפס ( )Hoהטוענת כי תוחלת משקל הארוזה בייצור שווה 2ק"ג לעומת האלטרנטיבה האומרת כי התוחלת שונה מ 2-ק"ג .נלקח מדגם של 50שקיות .במדגם התקבל ממוצע 1.99ק"ג .על כן: א. יש לדחות את השערת האפס ברמת מובהקות של .0.01 ב. יש לדחות את השערת האפס ברמת מובהקות של .0.05 ג. יש לדחות את השערת האפס ברמת מובהקות של ,0.1אך לא ברמת מובהקות .0.05 ד. אין לדחות את השערת האפס ברמת מובהקות של .0.1 .8 בדקת השערה חד צדדית ברמת מובהקות 0.05וקיבלת את השערת האפס. סמן את התשובה הנכונה: א .מסקנה זהה תקבל גם ב 0.1 - ב H 0 .תידחה ב. 0.01 - ג .מסקנה זהה תקבל גם ב – 0.02 ד H 0 .תידחה בהכרח ב. 0.07 - .9 הנח כי הציונים בקורס מסוים באוניברסיטה מפולגים נורמאלית .להלן ציוני בחינה של 6נבחנים שנדגמו מקרית .86 ,65 ,70 ,49 ,99 ,63 :רווח בר סמך ברמת ביטחון 0.95לממוצע הציונים בקורס הוא: א. .10 72 ± 17.07 ב. 72 ± 18.71 72 ± 17.81 ג. ד. 72 ± 14.27 סטודנט המבצע מעבדה בפיסיקה התבקש לבנות מודל רגרסיה ליניארית כדי להסביר את Y בעזרת . Xהוא קיבל את הנתונים הבאים המבוססים על מדגם הכולל 8מדידות: 8 כמו כן ,שיפוע קו הרגרסיה הוא 0.4569מקדם המתאם בין המשתנים הוא: ב. 0.46 ג. 0.78 ד. 0.91 X i2 14.24 X 1.25 i 1 8 Yi2 4.83 א. 0.69 .11 סטטיסטיקאי החליט על מדיניות לפיה הוא משתמש תמיד ברמת מובהקות של .2.5% Y 0.7125 i 1 לטווח הארוך ,הוא החליט נכונה: א. בערך ב 2.5%ממספר השערות האפס הנכונות שבדק. ב .בערך ב 97.5%ממספר השערות האפס הנכונות שבדק. ג .בערך ב 2.5%ממספר בדיקת ההשערות שביצע. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ד .בערך ב 97.5%ממספר בדיקת ההשערות שביצע. 255 מבחן מס' 5 פרק ראשון – 40% .1בבורסה לני"ע בודקים את מחזורי העסקות במדד המעוף במשך מספר ימים ,כמה ימים לאחר מכן נערכה בדיקה דומה על מדד ת"א ,100להלן הממצאים (מס' עסקות במיליונים) : מדד מעוף 2 1.5 4 3.2 1.5 4.7 3.9 2 1.8 ת"א 100 1.5 2.3 2 2.5 4.1 2.7 5.1 1.8 2.4 א .האם קיים פער במחזורי העסקות בין המדדים השונים ,בדקו ברמת מובהקות ?0.05 ב .השנה שעברה הייתה ידועה כשנת מיתון ומחזורי המסחר היו נמוכים ,מחזור המסחר היומי הממוצע במדד המעוף היה כ 2.1-מיליון ₪עם סטית תקן של ,₪ 300000האם נכונה הטענה כי המשק מתאושש ומחזורי המסחר השנה גבוהים יותר? ()0.05 ג .הנהלת הבורסה מעוניינת להכניס לבדיקה גם את מדדי הנדל"ן ומדד האג"ח (תל בונד) ,להלן הממצאים (מס' עסקאות במיליונים): נדל"ן 1.2 1.4 1 2.1 2.5 1.8 1.9 2 2.4 תל בונד 1.4 1.8 2.3 2.1 2.5 1.7 0.9 1.4 2.2 בדקו האם קיים שוויון במחזורי העסקאות בין ארבעת מדדי הבורסה הנ"ל ()0.05 .2תנועת הצופים מעוניינת לבדוק האם קיים קשר בין גיל לבין המוטיבציה להיות בתנועה ,לצורך הבדיקה נערך מדגם של 235חניכים ,ונאספו הנתונים הבאים: רמת מוטיבציה כיתות ד-ו כיתות ו-ט כיתות י-יב גבוהה 35 42 51 128 נמוכה 28 35 44 107 סה"כ 63 77 95 235 בצעו את הבדיקה עבור התנועה ברמת מובהקות של .0.01 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 256 פרק שני – 60% .1אחוז המצביעים לראש הממשלה עמד על ,45%במסגרת קמפיין לשיפור מעמדו של ראש הממשלה ,נדגמו 500איש ונמצא כי 255מתוכם תומכים בראש הממשלה. החוקרים החליטו כי הקמפיין שיפר את התמיכה בראש הממשלה. מהם סיכויי השגיאה בהחלטה? א0.2% . ב0.14% . ג0.1% . ד .אף תשובה אינה נכונה .2בהמשך לשאלה ,1אחד החוקרים ניסח את השערות המחקר באופן הבא: H1 : ___ 0 החלטת החוקרים הייתה זה להחלטתם בסעיף 1 מהם סיכויי השגיאה בהחלטה? ___________ H0 : 7 .לצורך בדיקה הוא לקח .3 חוקר ביצע ניסוי .הוא ניסח את ההשערות הבאות : H1 : 7 מדגם מקרי בגודל 15מתוך אוכלוסיה המתפלגת נורמאלית עם שונות לא ידועה .על סמך תוצאות המדגם הוא חישב וקיבל t 1.88 : לכן המסקנה היא : א .הוא ידחה H 0ברמת מובהקות 0.1אך לא כן ברמת מובהקות .0.05 ב .הוא ידחה H 0ברמת מובהקות 0.05אך לא כן ברמת מובהקות .0.025 ג .הוא ידחה H 0ברמת מובהקות 0.025אך לא כן ברמת מובהקות 0.01 ד .הוא לא ידחה H 0ברמת מובהקות . 0.1 .4 רופא בדק את משך הזמן הלוקח לתרופה נגד כאבים להורדת הכאב ,ביחס לתרופה קודמת אשר משך זמן השפעתה הוא 40דקות, בדגימה של 10חולים התקבלו התוצאות הבאות: 38,40,37,35,41,42,39,35,37,40 מהי רמת המובהקות המינימאלית לקבלת טענת הרופא? א 0 0.025 .ב 0.025 0.05 .ג 0.05 0.1 .ד 0.1. .5 במסגרת המאמצים לשיפור הישגי הרצים למרחקים קצרים ,נערך מחקר לבדיקת ההישגים ע"י מאמנת ביחס להישגים ע"י מאמן ,.להלן התוצאות ,בשניות בריצת 500מטר ד ה ג ב א הספורטאי 74 70.5 76.5 85 76 מאמן 72 72.5 75 85 72.5 מאמנת מהי השגיאה האפשרית בטענה כי מאמנות טובות יותר ממאמנים ? 0.05 א 0.1 0.15 .ב 0.1 0.25 .ג 0.05 0.1 .ד0.05 0.1 . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 257 .6 מבחן חי בריבוע לאי תלות התבסס על טבלת ,2/2הערך הנבדק היה 9וברמת מובהקת של 0.05נדחתה השערת האפס כיצד תשתנה ההחלטה במעבר לטבלת ? 5/2 א אין שינוי בהחלטה ב מקבלים את השערת האפס ג לא ניתן לקבל החלטה ללא נתונים ד לא ניתן לנתח נתונים בטבלת 5/2 .7 בדקת השערה כנגד אלטרנטיבה דו צדדית ברמת מובהקות של 5%ודחית את השערת האפס. לפניך שני משפטים: .1 אילו תבדוק את אותה השערה ,על סמך אותו המדגם ,כנגד אלטרנטיבה חד צדדית, ברמת מובהקות של ,2.5%תגיע לאותה מסקנה. .2 .8 רמת המובהקות המינימאלית לדחיית השערת האפס עבור מבחן חד צדדי היא 2.5% א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. פנצ'ר מאכר רוצה לבדוק את תוחלת המשקל של הצמיגים במחסן. ידוע כי סטיית התקן של משקל הצמיגים היא 1100גרם. מהו גודל המדגם המינימאלי שעליו לבדוק ,אם הוא מעוניין שברמת ביטחון של 95%המרחק בין המשקל הנמוך למשקל הגבוה לא יעלה על 300גרם? (בחר בתשובה הקרובה ביותר ) א52 . .9 ב26 . ד244 . ג206 . בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת .לפניך 2טענות: * ככל שהמדגם לפיו חושב הרווח קטן יותר ,רווח הסמך קצר יותר. * ככל שרמת הביטחון (רמת הסמך) של הרווח גדולה יותר ,הרווח קצר יותר. א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 258 .10 השערת האפס ( )Hoהיא שאין הבדל בין ההוצאות החודשיות הממוצעות למשלוח מסרונים בין גברים ונשים .ההשערה האלטרנטיבית ( )H1היא שההוצאות החודשיות הן שונות. לבדיקת השערות אלו נלקחו שני מדגמים בלתי תלויים של גברים ונשים והתקבל: א. נשים גברים ₪ 98 ₪ 90 ממוצע מדגם ₪ 16 ₪ 10 סטיית תקן מדגמית 17 15 גודל המדגם ברמת מובהקות של 5%נדחה את ,Hoאך לא ברמת מובהקות של .10% ב. ברמת מובהקות 10%נדחה את .Hoג .ברמת מובהקות 5%נקבל את Ho ד .ברמות מובהקות של 10%וגם של 5%מקבלים את Ho ה .אף תשובה אינה נכונה. .11השערת האפס נדחית ברמת מובהקות של 2%כנגד אלטרנטיבה דו-צדדית .אם תבצע אותו המבחן על סמך אותם הנתונים כנגד אלטרנטיבה חד-צדדית: א .השערת האפס בטוח תדחה ברמת מובהקות של .3% ב .השערת האפס בטוח תדחה ברמת מובהקות של .1% ג .השערת האפס בטוח תדחה ברמת מובהקות של .10% ד .השערת האפס בטוח תתקבל ברמת מובהקות של .4% .12 הנהלת תחנת דלק ,בדקה את הזמן הממוצע בו נמצא לקוח בתחנה. לצורך הבדיקה דגמה התחנה 26לקוחות ,סטית תקן של הזמן היא 4דקות. החישוב הראה כי תוחלת הזמן היא 11 - 6 :דקות. מהנתונים ניתן להסיק כי רמת הביטחון במסקנה היא: א .גדולה מ99%- ב .קטנה מ99%- ג .קטנה מ99.5% - ד .אף תשובה לא נכונה ה .יש יותר מתשובה אחת נכונה © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 259 מבחן 6 פרק ראשון – 40% .1מסעדה בדקה את הטיפים אשר מרוויחים ארבעת מלצריה במשך מספר ימים. להלן נתוני השכר של כל מלצר כפי שנאספו בדגימה מקרית של מספר ימים. א 48 55 60 81 105 120 74 ב 62 75 70 69 125 80 61 ד 78 71 80 88 95 110 85 ג 85 90 50 44 98 75 80 א .האם קיים פער בין השכר של עובד ג לעובד ד( .בדקו ברמת מובהקות של )0.05 ב .ידוע כי אחיו של מלצר ד ,אשר עבד במסעדה לפניו ,השתכר בממוצע ₪ 93למשמרת ,האם נכון לומר כי שכרו של האח היה גבוה יותר משכרו של מלצר ד' (.)0.01 ג. האם נכונה הטענה כי ברמת מובהקות של 0.05רמת השכר של כל המלצרים זהה. .2חברת ביטוח מעוניינת לבדוק האם קיים קשר בין גיל הנהג למספר התאונות אותן עבר בשנה. מספר תאונות 17-22 23-30 מעל 30 עד 1 15 30 40 85 מעל 1 25 25 35 85 סה"כ 40 55 75 170 בצעו את הבדיקה עבור התנועה ברמת מובהקות של .0.01 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 260 פרק שני – 60% .1חברת סלולר החליטה לאמוד את משך זמן ש"מבלה" לקוח ממוצע בתחנת השרות של החברה .סטית תקן של הזמן היא 12.481דקות .על סמך מדגם של 20לקוחות חושב רווח סמך לתוחלת הזמן 29.43-: 40.37דקות .רמת הסמך של הרווח היא: א95% . ב97.5% . ג98% . ד99% . .2 במבחן שנערך נמצא כי רמת המובהקות המינימאלית לדחיית H0היא .5%המשמעות היא : א. ניתן לדחות את H0ברמת מובהקות של .3% ב. לא ניתן לדחות את H0ברמת מובהקות של .10% ג. לא ניתן לדחות את H0ברמת מובהקות של .3% ד. לא ניתן לדחות את H0ברמת מובהקות של ,10%אך ניתן לדחות את H0ברמת מובהקות של .5% .3 חוקר ביצע ניסוי .הוא ניסח את ההשערות הבאות : H 0 : 15 H1 : 15 .לצורך בדיקה הוא לקח מדגם מקרי בגודל 30מתוך אוכלוסייה המתפלגת נורמאלית עם שונות לא ידועה .על סמך תוצאות המדגם הוא חישב וקיבל , t 2.45 :לכן המסקנה היא : א .הוא ידחה H 0ברמת מובהקות 0.1אך לא כן ברמת מובהקות .0.05 ב .הוא ידחה H 0ברמת מובהקות 0.05אך לא כן ברמת מובהקות .0.025 ג .הוא ידחה H 0ברמת מובהקות 0.025אך לא כן ברמת מובהקות 0.01 ד .הוא לא ידחה H 0ברמת מובהקות . 0.1 .4 השערת האפס ( ) Hoהיא שאין הבדל בין תוחלות זמן השיחה בטלפון סלולארי בין שתי ערים. ההשערה האלטרנטיבית ( ) H1היא שתוחלות זמן השיחה בטלפון סלולארי בשתי הערים שונות. לבדיקת השערות אלו נלקחו שני מדגמים (אחד מכל עיר) וחושבו הנתונים הבאים (בדקות) עיר א' 7.98 ממוצע מדגם 4.84 סטית תקן של האוכלוסייה 10 גודל המדגם בהנחה שזמני השיחה בשתי הערים בלתי תלויים ומתפלגים נורמאלית. עיר ב' 4.32 3.61 12 א. ברמת מובהקות של 5%נדחה ,Hoאך לא ברמת מובהקות של .1% ב. ברמת מובהקות 1%נדחה .Ho ג. ברמת מובהקות 5%נקבל Ho ד תשובות א' עד ג' אינן נכונות. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 261 .5 לבדיקת הצלחת דיאטה להרזיה ניתן תפריט לחמישה גברים ונבדק משקלם לאחר שבוע משה דוד שאול דני יוסי 74 70.5 76.5 85 76 לפני 72 72.5 75 85 72.5 אחרי מהי השגיאה האפשרית בטענה כי התפריט החדש גורם לירידה במשקל ? 0.05 א 0.1 0.15 .ב 0.1 0.25 .ג 0.05 0.1 .ד0.05 0.1 . .6 בונים שני רווחי סמך לתוחלת של אוכלוסייה נורמאלית כאשר סטיית התקן ידועה .רמת הסמך של שני הרווחים זהה .הרווח הראשון נבנה על מדגם בגודל ,100הרווח השני נבנה על מדגם בגודל .500הרווח הראשון : ב. ארוך פי 5מהרווח השני. ב. ארוך פי 25מהרווח השני. ג. ארוך פי 2.236מהרווח השני. ד. קצר פי 5מהרווח השני. .7 חוקר ביצע ניסוי .הוא ניסח את ההשערות הבאות . H 0 : 0 H1 : 0 : לצורך בדיקה הוא לקח מדגם מקרי בגודל 5מתוך אוכלוסייה המתפלגת נורמאלית עם שונות לא ידועה .על סמך תוצאות המדגם הוא חישב וקיבל : . t stat 2.776לכן המסקנה היא : א. ידחה H 0ברמת מובהקות 0.1אך לא כן ברמת מובהקות .0.05 ב. ידחה H 0ברמת מובהקות 0.05אך לא ברמת .0.025 ג. ידחה H 0ברמת מובהקות 0.025אך לא ברמת 0.01 .8 ד .הוא לא ידחה H 0ברמת מובהקות .0.1 בדקת השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של 5%וקיבלת את השערת האפס. לפניך שני משפטים: .1 אילו תבדוק את אותה השערה ,על סמך אותו המדגם ,כנגד אלטרנטיבה דו צדדית, ברמת מובהקות של ,10%תגיע לאותה מסקנה. .2 רמת המובהקות המינימאלית לדחיית השערת האפס עבור מבחן דו צדדי היא .10% א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. .9 בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת .לפניך 2טענות: .I ככל שהמדגם לפיו חושב הרווח גדול יותר ,כך רווח הסמך יהיה קצר יותר. .II ככל שרמת הביטחון (רמת הסמך) של הרווח גדולה יותר ,יהיה הרווח ארוך יותר. א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 262 בדקו .10 H 0 : 100לעומת . H1 : 100כדי לבדוק השערות אלה באוכלוסייה בעלת התפלגות נורמאלית וסטית תקן ,20נלקח מדגם בגודל ,8והוחלט לדחות את H 0אם ממוצע המדגם יהיה מעל .110 אזי רמת המובהקות היא: א0.0359 . ג0.9641 . ב0.0793 . ד0.05 . .11הנח כי הציונים בקורס מסוים באוניברסיטה מפולגים נורמאלית .להלן ציוני בחינה של 8נבחנים שנדגמו מקרית,86 ,65 ,70 ,49 ,99 ,63,71,94 : רווח בר סמך ברמת ביטחון 0.95לממוצע הציונים בקורס הוא: ב. 72 ± 18.71 ג. 74.62 ± 11.76 ד72 ± 7.57 . א. 74.62 ± 7.57 .12 סטטיסטיקאי חישב רווח בר סמך לתוחלת זמן השירות של עובדי שירות לקוחות 5.72 8.28 גודל המדגם 65 -עובדים ונמצא כי X 7וסטית התקן של כלל העובדים היא 3.4ד'. מהו גודל המדגם המינימאלי על מנת שאורך הרווח לא יעלה על 0.5דקה ,ברמת בטחון של ? 95% א. 711 ב860 . ג. 1040 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ד .אף תשובה אינה נכונה ,התשובה הנכונה היא_____ 263 מבחן 7 פרק ראשון – 40% .1רשת פיצריות בדקה את הפדיון היומי בארבעה סניפים מבין סניפי הרשת. להלן הנתונים היומיים אשר (באלפי שקלים). נתניה רמת גן הרצליה ירושלים 18 14 12 15 15 15 14 12 19 21 17 18 16 16 14 12 14 11 16 15 21 14 16 15 א .האם קיים הבדל בין הכנסות הרשת בסניפים השונים (רמת מובהקות ?.)5% ב .האם נכונה הטענה כי צריכת הפיצות של תושבי רמת גן אינה זהה לצריכת הפיצות של תושבי נתניה? (ברמת מובהקות של .)5% ג. ממוצע הפדיון היומי בכל סניפי הרשת עומד על 15.1עם סטית תקן של ,2.5האם נכונה הטענה כי סניף נתניה הוא סניף "חזק" וממוצע ההכנסות בו גבוה מהממוצע הרשתי (יש לבצע בדיקה מלאה ברמת מובהקות של .)3% ד .מנהל סניף נתניה מעונין להוכיח להנהלה כי הסניף שלו בעל הכנסות גבוהות מהממוצע הרשתי ,מהי רמת המובהקות בה עליו להשתמש כדי להוכיח את טענתו. .2אוניברסיטה בדקה האם יש תלות בין אישיות הסטודנט לבין תחום לימודיו ,הסטודנטים חולקו לשני טיפוסי אישיות ,נתוני התצפיות בטבלה מדעי החברה מדעי הטבע מדעי הרוח סה"כ טיפוס אישיות א' 56 47 50 153 טיפוס אישיות ב' 8 14 5 27 סה"כ 64 61 55 180 בדקו האם יש תלות בין טיפוס אישיות ,אליו משתייך הסטודנט לבין תחום הלימוד שלו ברמת מובהקות .0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 264 פרק שני – 60% .1 חוקר קיבל את השערת האפס על סמך הנתונים הבאים: n9 14.5 6 0 10 C 15 מנתונים אלה עולה כי סיכויי השגיאה במסקנות הם: א. .2 1.22% ב. ג0.62% . 40.13% ד35.6% . במבחן שנערך נמצא כי ברמת מובהקות של 5%דחינו את .H0המשמעות היא : א .ניתן לדחות את H0ברמת מובהקות של .3% ב. לא ניתן לדחות את H0ברמת מובהקות של .10% ג. לא ניתן לדחות את H0ברמת מובהקות של .3% ד .נדחה את H0ברמת מובהקות של ,10%אך לא ניתן לדעת לגבי רמת מובהקות של .3% .3חוקר ביצע ניסוי .הוא ניסח את ההשערות הבאות H 0 : 4 H1 : 4 : לצורך בדיקה הוא לקח מדגם מקרי בגודל 20מתוך אוכלוסייה המתפלגת נורמאלית ,עם סטית תקן ,2לאור תוצאות המדגם הוא חישב וקיבל בטבלה את הערך :2.33 לכן המסקנה היא : א .הוא ידחה H 0ברמת מובהקות של 4%אך לא כן ברמת מובהקות .1% ב .הוא ידחה H 0ברמת מובהקות 5%אך לא כן ברמת מובהקות .2.5% ג .הוא ידחה H 0ברמת מובהקות 2.5%אך לא כן ברמת מובהקות 1.5% ד .אף תשובה אינה נכונה ה .יש יותר מתשובה אחת נכונה. ידוע כי 80%מהאוכלוסייה עובדים .בעקבות תוכנית ויסקונסין יש הטוענים כי אחוז העובדים .4 באוכלוסייה עלה ויש הטוענים כי אחוז העובדים לא השתנה. כדי לבדוק זאת נלקח מדגם מקרי של 400איש ונמצא כי 336מתוכם עובדים מהי רמת המובהקות המינימלית לדחיית השערת האפס? א0.05 . .5 ג0.0146 . ב0.0137 . ד_____ . בהמשך לתרגיל ,4מהם אחוזי השגיאה במסקנה אם הטענה נבדקה ברמת מובהקות של .1% א44.04% . ב40.13% . ג0.62% . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ד0.52% . 265 .6לבדיקת השפעת שיעורי תגבור ,בחינה נערכה פעמיים ,לפני שעורי תגבור ולאחר 10שיעורי תגבור, להלן הציונים. מספר נבחן לפני אחרי 1 74 76 2 81 85 3 76 81 4 78 83 5 84 80 רשמו את סוג המבחן: ________________________________________________________________ רשמו את ההשערות: _____________________________________________________________ H 0 _____________________________________________________________ H 1 בהמשך לשאלה ,6מהי רמת המובהקות המינימאלית לדחיית השערת האפס? .7 א 0.1 ' 0.15 .ב 0.2 ' 0.5 .ג 0.05 ' 0.1 .ד 0.05 ' 0.1 .ה_____ ' ____ . בונים רווח בר סמך לתוחלת של אוכלוסייה נורמאלית כאשר סטיית התקן ידועה .הרווח נבנה על סמך .8 מדגם של 10איש ורמת מובהקות של .10% לאחר מכן בונים רווח חדש על סמך מדגם של 40איש ורמת מובהקות של .5% א .לא יהיה שינוי באורך הרווח המקורי ב .הרווח החדש יהיה קצר יותר אך בפחות מפי 2מהקודם ג. הרווח החדש יהיה קצר ביותר מפי 2מהקודם. ד .הרווח החדש יהיה קצר פי 2מהרווח הקודם. ה .בגלל שני השינויים ,לא ניתן יהיה לדעת מה יקרה לרווח. ביבי רוצה לפרסם לציבור כי אחוזי התמיכה בו בעליה ,ע"פ סקר קודם אחוזי התמיכה בו היו ,35% .9 בסקר חדש שנערך על 500איש נמצא כי 200איש תומכים בביבי. באיזו רמת מובהקות עליו לנתח את הנתונים כדי שיוכל לפרסם כי אחוזי התמיכה בו עלו. א .רמת מובהקות נמוכה מ1%- ב .רמת מובהקות גבוהה מ1.5%- ג. רמת מובהקות נמוכה מ5%- ד .רמת מובהקות נמוכה מ.1.13%- © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 266 .10 בדקת השערה כנגד אלטרנטיבה חד צדדית ומצאת כי רמת המובהקות המינימאלית היא .2% לפניך שני משפטים: .11 .1 באלטרנטיבה דו צדדית ,ברמת מובהקות של 5%תדחה את השערת האפס .2 רמת המובהקות המינימאלית לדחיית השערת האפס עבור מבחן דו צדדי היא .4% א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. בדקו H 0 : 100לעומת . H1 : 100כדי לבדוק השערות אלה באוכלוסייה בעלת התפלגות נורמאלית וסטית תקן מדגמית של 20נלקח מדגם בגודל ,8הוחלט לדחות את H 0אם ממוצע המדגם יהיה מעל . 110 אזי רמת המובהקות היא: א0.0359 . ג0.9641 . ב0.1 . ד0.05 . .12חברה מייצרת ברגים ומתחייבת לקוטר בורג של 5מ"מ. במדגם מקרי של 9ברגים נמצאו הקטרים הבאים ב-מ"מ: 4.2 3.9 5.1 5 4.8 4.5 5.2 4.6 4.9 רווח בר סמך ברמת ביטחון 2%לממוצע קוטר הברגים הוא: א. 5 ± 0.333 ב. 4.68 ± 0.333 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ג. 4.68 ± 0.1765 ד5 ± 0.415 . 267 מבחן 8 פרק ראשון – 40% .1לקראת החגים נערכה השוואת מחיר "סל קניות לחג" בין מספר רשתות שיווק (בסניפים שונים) להלן הנתונים אשר התקבלו (המספרים מציינים מחיר סל קניות ב)₪- רשת הריבוע העגול רשת הלקוח התמוי 900 960 1020 860 960 1100 1420 1020 860 1100 940 1020 1100 840 1240 980 א .האם קיים פער במחיר "סל קניות לחג" בין שתי הרשתות? בדקו ברמת מובהקות ?10% ב .במסע פרסום של רשת הריבוע העגול ,מפרסמת הרשת כי עלות סל קניות לחג ברשת בשנה שעברה עמדה על ,₪ 1120ואילו השנה סל קניות לחג ברשת זול יותר .האם יש אמת בפרסום (רמת מובהקות )0.05 ג .לאור טענת צרכנים לקרטל ולהתאמת מחירים בין הרשתות ,ערכה המועצה לצרכנות בדיקה של שתי רשתות נספות .בדקו ברמת מובהקות של ,0.05האם טענת הצרכנים נכונה. רשת A רשת B 840 920 960 880 1020 840 1060 856 780 1020 900 1080 1000 970 1100 830 920 .2תחנת דלק מעסיקה עובדים בשלוש משמרות ,מנהל התחנה רוצה לבדוק את הטענה כי יש קשר בין שעות העבודה לבין התפוקה ,לצורך בדיקת הטענה נלקח מדגם של 390מעובדי המאפיה ונבדקה תפוקת העובדים (כמה מכוניות תודלקו ע"י העובדים בכל משמרת) ביחס למשמרת ,בדקו את הטענה ברמת מובהקות של .0.01 תפוקה תפוקה גבוהה תפוקה נמוכה סה"כ משמרת בוקר 35 20 55 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע משמרת צהרים 20 30 50 משמרת ערב 40 25 65 95 75 170 268 פרק שני – 60% .3מכונאי בדק האם בלמים חדשים של מכוניות שונים מבלמים ישנים יותר ,הבדיקה נעשתה ביחס לבלמים שמשך זמן העצירה שלהם במהירות של 60קמ"ש הוא 51.58שניות. בדגימה של 10מכוניות נבדקו זמני הבלימה במהירות של 60קמ"ש ,להלן התוצאות: 39,53,52,48,61,49,48,42,32,37 מהי רמת המובהקות המינימאלית לקבלת טענת המכונאי? א2.31% . ב. 1.1% ג. 0.55% ד. 5% ד. .4במסגרת המאמצים לבדיקת השפעת אכילת קורנפלקס לפני תחרות ,על הישגי רצי מרתון ,נערך מחקר לבדיקת ההישגים לאחר אכילת קורנפלקס וללא אכילת קורנפלקס (טבלת זמנים בדקות). להלן התוצאות בדקות: איתן 205 195 משה איתי דוד יוסי שם הרץ 220 185 200 ללא קורנפלקס 180 200 190 190 172 קורנפלקס מהי השגיאה האפשרית בטענה כי קורנפלקס טוב להישגים ? 0.05 א 0.1 ' 0.15 .ב 0.1 0.25 .ג 0.025 ' 0.05 .ד 0.5 0.8 .ה____ . .3 בשנה שעברה מחיר ממוצע של אופני שטח חדשות עמד על ,₪ 7580לבדיקת הטענה כי מחירי האופנים ירדו השנה ביחס לשנה שעברה ברמת מובהקות של ,5%נלקח מדגם של 7זוגות אופני שטח חדשות ונבדק מחירם. להלן הממצאים6740 ,6880 , 6440 ,7300 ,7860 ,7580 ,7720 : על פי נתונים אלו ,מהו הסיכוי לשגיאה במסקנה: א 0.025 0.05 .ב 0.1 0.25 .ג 0.05 0.1 .ד 0.05 0.1 .ה____ ___. .4 בדקתם השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של 5%ודחית את השערת האפס. לפניך שני משפטים: .1 אם תבצעו את אותה בדיקה עם מדגם גדול יותר ,בהנחה שבכל הנתונים האחרים אין שינוי רמת המובהקות המינימאלית תקטן. .2 אם תבצעו את אותה בדיקה עבור אלטרנטיבה דו צדדית ,ברמת מובהקות כפולה תגיעו לאותה מסקנה. א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 269 .5אחוז הצפייה בתוכנית "הפח הגדול" בשיא העונה ,עמד בשנה שעבר על 28%לתוכנית. בשיא העונה החדש של "הפח" נדגמו 780בתי אב ,ונמצא כי 241בתי אב צפו בתוכנית. ברמת מובהקות של ,5%החליטו בהפקת התוכנית ,כי השנה יש גידול באחוזי הצפייה. מהם סיכויי השגיאה בהחלטה? א5% . ב4.09% . ג2.5% . ה .אף תשובה אינה נכונה ד6.5% . .6בהמשך לשאלה ,5מה היו אחוזי השגיאה במסקנה ,אם ההפקה הייתה עובדת עם רמת מובהקות של ,2% ומקבלת את אותה מסקנה – "השנה יש גידול באחוזי הצפייה". א5% . ב4.8% . ג21.5% . ד38.21% . .7חוקר ביצע ניסוי .הוא ניסח את ההשערות הבאות H1 : 100 : ה .אף תשובה אינה נכונה H 0 : 100לצורך הבדיקה הוא לקח מדגם מקרי בגודל 16מתוך אוכלוסייה המתפלגת נורמאלית עם שונות ידועה. על סמך תוצאות המדגם הוא קיבל בטבלה ערך של .1.96 לכן המסקנה היא : א .הוא ידחה H 0ברמת מובהקות 0.1אך לא כן ברמת מובהקות .0.03 ב .הוא ידחה H 0ברמת מובהקות 0.15אך לא כן ברמת מובהקות .0.07 ג .הוא ידחה H 0ברמת מובהקות 0.2כמו כן גם ברמת מובהקות 0.09 ד .אף תשובה אינה נכונה ה .תשובות א-ג נכונות. .8 בעל דוכן פלאפל ,רוצה לבדוק את תוחלת משקל כדורי הפלאפל. ידוע כי סטיית התקן של למשקל הכדורים היא 12גרם. מהו גודל המדגם המינימאלי שעליו לבדוק ,אם הוא מעוניין שברמת ביטחון של 98%המרחק בין משקל הכדור הקטן ביותר ,למשקל הכדור הגדול ביותר ,לא יעלה על 9גרם? (בחר בתשובה הקרובה ביותר ) א30 . ב38 . ד39 . ג52 . ה____________ . .9 בודקים השערות על אוכלוסייה נורמלית אחת ,כאשר סטיית התקן ידועה. .I בבדיקה חד צדדית תגיעו לאותן מסקנות ולאותה שגיאה כמו בבדיקה דו צדדית ובלבד שגודל המדגם יהיה פי ,2לטובת המבחן הדו צדדי. .II בבדיקה חד צדדית תגיעו לאותן מסקנות ולאותה שגיאה כמו בבדיקה דו צדדית ובלבד שהיחס בין המדגמים יהיה פי 2 לטובת המבחן הדו צדדי. א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 270 .10 השערת האפס ( )Hoהיא שאין הבדל בין ההוצאות החודשיות הממוצעות לנסיעות לעבודה בין גברים ונשים .ההשערה האלטרנטיבית ( )H1היא גברים מוציאים יותר על נסיעות לעבודה. לבדיקת השערות אלו נלקחו שני מדגמים של גברים ונשים והתקבל: ממוצע מדגם סטיית תקן גודל המדגם נשים ₪ 180 ₪ 20 15 גברים ₪ 197.8 ₪ 36 17 א. ברמת מובהקות של 5%נדחה את ,Hoאך לא ברמת מובהקות של .10% ב. ברמת מובהקות 10%נדחה את .Ho ג. ברמת מובהקות 5%נקבל את Ho ד. ברמות מובהקות של 10%וגם של 5%מקבלים את Ho ה .אף תשובה אינה נכונה. .11חוקר ביצע ניסוי חד כווני על מדגם של 16איש ,הוא מצא כי סטיית התקן היא .6 לאור תוצאות המדגם ,חישב החוקר ומצא כי הערך בטבלה הוא ,2.13לאור ממצאים אלו ניתן להסיק: א .הוא ידחה H 0ברמת מובהקות של 3%אך לא כן ברמת מובהקות .5% ב .הוא ידחה H 0ברמת מובהקות 2%אך לא כן ברמת מובהקות . 3% ג .הוא ידחה H 0ברמת מובהקות של 3%כמו גם ברמת מובהקות 5.5% ד .הוא ידחה את H 0בכל רמת מובהקות הגבוהה מ2.5% - ה .יש יותר מתשובה אחת נכונה. .12 נערך מדגם של 30איש ,לבדיקת לחץ הדם ,ונמצא כי לחץ הדם הממוצע הוא 134עם סטית תקן של .11 מהו רווח הסמך ללחץ הדם באוכלוסייה ,ברמת מובהקות של ?1% _____________________________________________ © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 271 מבחן 9 פרק ראשון – 40% .1רשת דוכני פלאפל המונה 40סניפים ,מעוניינת להוסיף גם נקניקיות וחביתות ירק לתפריט. ידוע כי הרווח החודשי הממוצע לסניף ,₪ 52500עם סטיית תקן של .₪ 8500 לצורך בדיקת כדאיות ,עורכת הרשת מבחן על מדגם מייצג של 30%מסניפיה ,בהם החלו למכור חביתות ירק ,המבחן נערך ברמת מובהקות של ,4%ונמצא כי הרווח החודשי הממוצע עמד על . ₪ 57500 לצורך בדיקת כדאיות ,עורכת הרשת מבחן על מדגם מייצג של 45%מסניפיה ,בהם החלו למכור נקניקיות ,המבחן נערך ברמת מובהקות של ,5%ונמצא כי הרווח החודשי הממוצע עמד על .₪ 58200 א .איזה שינוי אם בכלל ישפר את רווחי הרשת. (יש לערוך מבחן מלא כולל חישובי שגיאה ,לכל תוספת מוצעת). ב .אחד ממנהלי הרשת טוען ,כי שתי התוספות (נקניקיות וחביתות ירק) משפרות את רווחי הסניפים ,ולכן אפשר לאפשר לכל מנהל סניף להחליט מה להוסיף לתפריט, בדקו את טענתו ברמת מובהקות של ( 5%מבחן מלא). ג .הנהלת מעוניינת לבדוק האם קיים הבדל בהכנסות בין סניפי הרשת ,לצורך הבדיקה חולקו כל הסניפים לארבע קבוצות שוות ,להלן נתוני ההכנסות (בעשרות אלפי )₪בכל קבוצה במשך מספר ימים: קבוצה א קבוצה ב קבוצה ג קבוצה ד 4 4.9 5.2 3.9 5 5.1 5.1 4.5 5.2 4.5 4.6 4.9 5.3 5.5 4.3 5.3 5.5 4.9 5.8 5.5 4.4 5.6 5.6 5.9 4.3 5.4 5.7 4.8 5.4 5.3 ערכו בדיקה לבקשת החברה ברמת מובהקות של .5% .2חוקר מעוניין לבדוק האם קיימת תלות בין מצב משפחתי ,לבין לקיחת סיכונים בהשקעות ,לצורך הבדיקה נלקחו 500גברים ,אשר חולקו לרווקים ונשואים ,ונמדדו מספר ההשקעות שלהם בסיכון ,בסיכון נמוך וללא סיכון .בדקו האם קיימת תלות בין מצב משפחתי ,לבין רמת הסיכון בהשקעה ,ברמת מובהקות של .0.05 סה"כ 312 188 500 השקעות ללא סיכון 100 60 160 השקעות בסיכון נמוך 92 78 170 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע השקעות בסיכון 120 50 170 רווקים נשואים סה"כ 272 פרק שני – 60% .1 42%מתושבי המדינה תומכים במועמד ,Bלראשות הממשלה .במדגם 500איש ונמצא 230איש מתוכם תומכים במועמד: האם חל גידול באחוז התומכים במועמד .Bברמת מובהקות של ?4% ____________________________________________________________________ ____________________________________________________________________ .2 ע"פ נתוני שאלה ,1סיכויי השגיאה במסקנה הם: א4% . .3 ג5.46% . ב3.67% . ה________. ד96% . נערך מחקר ברמת מובהקות של ,5%השפעת תרופה Bעל הורדת לחץ ,להלן הנתונים. לפני 120 135 140 128 136 164 אחרי 115 125 145 120 132 141 מהם הסיכויים לשגיאה במסקנה? א2.28% . .4 ב4.67% . ד40.25% . ג2.5% . ה________. חוקר ביצע ניסוי דו כווני על מדגם של 30איש ,הוא מצא כי סטיית התקן המדגמית היא .6 לאור תוצאות המדגם ,חישב החוקר ומצא כי הערך בטבלה הוא ,2.462 לאור ממצאים אלו ניתן להסיק: א .הוא ידחה H 0ברמת מובהקות של 6%אך לא כן ברמת מובהקות .10% ב .הוא ידחה H 0ברמת מובהקות 5.5%אך לא כן ברמת מובהקות .2.5% ג .הוא ידחה H 0ברמת מובהקות 2.5%אך לא כן ברמת מובהקות 5.5% ד .הוא ידחה את H 0בכל רמת מובהקות שהיא לפחות .2.5% ה .יש יותר מתשובה אחת נכונה. .5 175איש עוברים ליד דוכן לוטו ביום 35 ,אנשים מהם נעצרים וקונים כרטיס הגרלה .ביום מסוים החליט מפעל הפיס להעניק שי לכל קונה כרטיס ,במטרה לבדוק האם השי תורם לשווק .נמצא כי מבין 350איש שעברו ליד הדוכן 84 ,איש קנו כרטיס הגרלה .מהי רמת המובהקות המינימלית לדחיית השערת האפס? א. .6 18.94% ב15.15% . ג17.6% . ד_____ . בשנה שעברה היה ממוצע ציוני הקורס בסטטיסטיקה ,76השנה נבחרו 16סטודנטים ולמדו עם תוכנית לימוד חדשה ,במטרה לשפר את ההישגים ,ממוצע הציונים של קבוצה זו היה 79.73עם סטיית תקן .7מהי רמת המובהקות המינימלית לדחיית השערת האפס? א5% . ב2.5% . ג0.62% . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ד2.37% . ה_____. 273 .7 בהמשך לשאלה ,6החוקר בדק את הטענה ברמת מובהקות של ,1%מהם סיכויי השגיאה במסקנה שקיבל? א 0.1 ' 0.15 .ב 0.25 0.4 .ג 0.05 0.1 .ד ____ ____ .ה___ ' ___ . .8 בטבלה נתוני דקות דיבור בטלפון סלולארי בשבוע ,כפי שנמדדו על קבוצת בנים וקבוצת בנות בגילאי 25 במטרה למצוא את ההבדלים (אם קיימים) ,הבדיקה נעשתה ברמת מובהקות של .6% בנים 178 184 146 180 176 160 178 165 150 בנות 184 143 198 208 210 186 220 189 183 א .רשמו את ההשערות________________________ : ב .מהי מסקנת החוקר? _______________________________________________________________________ .9 בהמשך לשאלה ,8מהם סיכויי השגיאה במסקנות החוקר ,אם החליט לעבוד עם רמת מובהקות של ? 1% א 0.1 ' 0.15 .ב 0.5 0.8 .ג 0.05 0.1 .ד ____ ____ .ה___ ' ___ . .10 בדקת השערה כנגד אלטרנטיבה דו צדדית ומצאת כי רמת המובהקות המינימאלית ,לדחיית השערת האפס היא ,4%לפניך שני טענות: .11 .1 באלטרנטיבה חד צדדית ,ברמת מובהקות של ,2.5%תדחה את השערת האפס .2 באלטרנטיבה דו צדדית ,ברמת מובהקות של 3%תדחה את השערת האפס. א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. 4800 6500הוא רווח בר סמך לממוצע השכר באוכלוסייה ,הרווח נערך מתוך מדגם של 40איש, אם נגדיל את המדגם ל 100-איש ,יהיה הרווח: א 4000 7000 .ב 3035 4111.ג 3456 8344 .ד_____ _____ . .12במדגם של 20איש ,נמצא כי משקלם הממוצע הוא 78ק"ג עם סטית תקן של 6ק"ג. מהו רווח הסמך למשקל באוכלוסייה ,ברמת מובהקות .5% א 75.37 80.62 .ב 75.19 80.80 .ג 74.23 81.35 .ד_____ _____ . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 274 מבחן 10 .1להלן אחוזי התשואה היומיים אשר נצפו במשך 10ימים במדד המעוף ובמדד ת"א .75 מדד מעוף 2 0.75 -1 3.6 1.6 4.1 2.1 -3 -0.9 1 ת"א 100 1.6 0.1 -2 2.1 3.5 2.2 5.1 -2.5 -1.2 0.2 ברמת מובהקות של ,5%האם על פי מדגם זה ניתן לקבוע כי יש מדד שההשקעה בו עדיפה? א .הגבול הקריטי בבדיקה זו הוא: __________________________________________________________ ב .החלטת החוקר היא: __________________________________________________________________ _______________________ _____________________ ג .השגיאה בהחלטת החוקר היא: א20% . ב50% . ד .אף תשובה אינה נכונה ג30% . ד .בהנחה שהחוקר בדק האם השקעה במדד המעוף טובה יותר ,אזי רמת המובהקות המינימאלית בבדיקה זו היא: ב40% . א0.2% . ג 10%. ד .אף תשובה אינה נכונה .2אוניברסיטה בדקה האם קיים קשר בין גיל הסטודנט להישגיו בלימודים ,עזרו לאוניברסיטה לבדוק ברמת מובהקות של .5% הישגים/גיל 18-22 22-26 26-30 טובים ומעולים 10 20 40 70 בינוניים ונמוכים 40 20 15 75 סה"כ 50 40 55 145 הגבול הקריטי הוא: א5.99 . ב7.81 . ג9.49 . ד .אף תשובה אינה נכונה הערך הנבדק מול הגבול הקריטי הוא: א29.21 . ב35.47 . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ג19.17 . ד .אף תשובה אינה נכונה 275 .3המכללה בודקת את הישגי הסטודנטים ,על מדגם של 12סטודנטים מכל כיתה (ארבע ככיתות לומדות במקביל) להלן ציוני הסטודנטים בכל כיתה: א 60 75 64 100 85 91 75 67 40 70 85 40 ב 100 95 55 48 100 45 60 95 100 80 40 55 ג 75 66 100 95 40 35 100 95 86 60 70 80 ד 35 100 95 100 40 60 70 80 40 90 60 50 מנתונים אלו עולה כי ברמת מובהקות של ,5%הגבול הקריטי לבדוק את הטענה הוא: א2.75 . ג2.83 . ב8.59 . ד .אף תשובה אינה נכונה מנתונים אלו עולה כי הערך הנבדק מול הגבול הקריטי הוא: ד .אף תשובה אינה נכונה ג4.77 . ב8.53 . א4.46 . מניתוח הנתונים המסקנה היא דוחים /מקבלים את השערת האפס. .4אחוז המצביעים ליו"ר אגודת הסטודנטים ,בבחירות בשנה שעברה עמד על .41%במסגרת הנתונים שאוספת מפלגתו של היו"ר לקראת הבחירות הקרבות ,נמצא כי מבין 280סטודנטים, 126תומכים ביו"ר הנוכחי. במטרה לבדוק האם מספר תומכיו של היו"ר עלה ,נבדקו נתונים אלו ברמת מובהקות של .5% והוחלט: א .לדחות השערת האפס. ב. לקבל את השערת האפס. .5בהמשך לשאלה ,4סיכויי השגיאה בהחלטה הם? ב38.21% . ב30.27% . .6חוקר ניסח את ההשערות הבאות H1 : 10 : ג5% . ד .אף תשובה אינה נכונה . H 0 : 10 לצורך בדיקה הוא לקח מדגם מקרי בגודל 14איש ,מתוך אוכלוסייה המתפלגת נורמאלית, על סמך תוצאות המדגם הוא חישב וקיבל t 2.16 : לכן המסקנה היא : א .הוא ידחה H 0ברמת מובהקות 1%אך לא כן ברמת מובהקות .5% ב .הוא ידחה H 0ברמת מובהקות 3%אך לא כן ברמת מובהקות .2% ג .הוא ידחה H 0ברמת מובהקות 4%אך לא כן ברמת מובהקות 1% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 276 ד .הוא לא ידחה H 0ברמת מובהקות . 1.5% ב .יש יותר מתשובה אחת נכונה. .7מרצה בדק את השפעת שיטת לימוד חדשה בשיפור הישגי הסטודנטים ,ממוצע ציוני הסטודנטים בשיטה הישנה עומד על ,69השיטה החדשה נוסתה על 16סטודנטים ,ובמבחן התקבלו הציונים : 60 71 74 68 76 71 95 55 84 76 70 95 84 63 80 65 מהי רמת המובהקות המינימאלית לקבלת טענת המרצה? ב0.025 0.05 . א0 0.025 . ג0.05 0.1 . ד 0.1. .8במסגרת בדיקת פורמולה חדשה להרזיה ,ניתנה הפורמולה ל 5-אנשים (הנתונים בטבלה). החוקרים בדקו ברמת מובהקות של ,5%והחליטו כי הפורמולה אינה מסייעת בהורדה במשקל. מהי השגיאה האפשרית בהחלטת החוקרים? נבדק משקל לפני משקל אחרי א 85 87 ב 94 85 א 0.1 0.15 .ב0.1 0.25 . .9 ג 96 94 ד 83 88 ג0.05 0.1 . ה 105 96 ד 25% . מבחן חי בריבוע לאי תלות התבסס על טבלת ,4/3הערך הנבדק היה ,15ורמת המובהקת .5% כיצד תשתנה ההחלטה במעבר ל? 4/4 - א .אין שינוי בהחלטה ב .בטבלה הראשונה דוחים את השערת האפס ,ובטבלה השנייה מקבלים. ג .לא ניתן לקבל החלטה ללא נתונים. ד .ברמת מובהקות של ,1%מקבלים את השערת האפס בשתי הטבלאות. ה .יש יותר מתשובה אחת נכונה. .10בדקת השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של 3%ודחית את השערת האפס. לפניך שני משפטים: המשמעות היא בשכל רמת מובהקות גבוהה מ 3%תדחה את השערת האפס ,וברמת מובהקות נמוכה .1 מ 3%-תקבל את השערת האפס. יתכן כי ברמת בטחון גבוהה יותר ,תקבל את השערת האפס. .2 א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 277 .11נבדק רווח בר סמך ,ונמצא כי אורך הרווח הוא ,30ידוע כי סטיית התקן של אוכלוסיית הגורם הנבדק היא ,85ורמת הביטחון היא ,98%מהו גודל המדגם הנדרש כדי שאורך הרווח לא יעלה על ?15 ב697 . א277 . ד .אף תשובה אינה נכונה ג395 . .12בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת .לפניך 2טענות: .1רווח מדויק יותר במונחי מדגם ,ורווח מדויק יותר במונחי רמת מובהקות הם בעלי כיוונים מנוגדים. .2גבולות קריטיים באלטרנטיבה דו צדדית ,יהיו זהים לגבולות הרווח שנבנה. א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. .13השערת האפס ( – )Hoאין הבדל בשכר השעתי בתפקידי ניהול בין גברים לנשים. ההשערה האלטרנטיבית ( )H1השכר השעתי של נשים גבוה יותר. לבדיקת השערות אלו נלקחו שני מדגמים ,של גברים ונשים בתפקידי ניהול בכירים. הנתונים להלן נלקחו מתוך המדגמים: גברים ₪ 240 ₪ 32 25 ממוצע מדגם סטיית תקן גודל המדגם נשים ₪ 254 ₪ 21 20 א. ברמת מובהקות של 4%נדחה את ,Hoאך לא ברמת מובהקות של .6% ב. ברמת מובהקות 8%נדחה את .Ho ג. ברמת מובהקות 1%נקבל את Ho ד. ברמות מובהקות של 10%וגם של 6%מקבלים את Ho ה .אף תשובה אינה נכונה. ו .יש יותר מתשובה אחת נכונה. .14 בהמשך לשאלה ..13 התברר כי חלה טעות בחישוב סטית התקן במדגם הגברים והיא ,40כתוצאה מכך ,בהנחה כי הבדיקה נערכה ברמת מובהקות של ,5% השגיאה האפשרית במסקנות היא: א5% . ב10% . ג .בין 20%ל30%- © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ד .בין 25%ל40%- ה .אין תשובה נכונה. 278 .15קיבלתם את השערת האפס ,כאשר ביצעתם מחקר דו כיווני. א .אם תבצעו את מחקר זהה בהשערה חד כיוונית ,יש סיכוי שתידחו את השערת האפס. ב .אם תבצעו מחקר זהה ,בהשערה חד כיוונית ,וברמת מובהקות כפולה ,תגיעו בדיוק לאותם מסקנות. ג .ברמת מובהקות נמוכה יותר ,תגיעו בוודאות לאותן מסקנות. ה .ברמת מובהקות גבוהה יותר ,יתכן ותגיעו למסקנות הפוכות. ו .יש יותר מתשובה אחת נכונה. .16 לפני חמש שנים ,הוצאות משפחה ממוצעת בחודש היו ,₪ 4800עם סטיית תקן של . ₪ 750במטרה לבדוק האם הוצאות משפחה כיום גבוהות יותר ,נלקח מדגם של 20משפחות ,ונמצא כי ההוצאה הממוצעת למשפחה היא ,₪ 5150הטענה נבדקת ברמת ביטחון של .96% לעניות דעתכם הסטטיסטית ,החוקרים צריכים לדחות /לקבל את השערת האפס. השגיאה האפשרית בתוצאות היא: א 2.5% ב1.88% . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ג4% . ד3.6% . ה .אין תשובה נכונה. 279 מבחן 11 .1להלן נתוני משקל של 10נבדקים ,לפני דיאטה ואחרי 3חודשי דיאטה. לפני 65 84 95 84 88 78 90 72 76 92 אחרי 62 80 82 78 92 74 85 75 72 89 ברמת מובהקות של ,5%האם ניתן לקבוע כי הדיאטה יעילה? א .הגבול הקריטי בבדיקה זו הוא: __________________________________________________________ ב .החלטת החוקר היא: __________________________________________________________________ _____________________ _______________________ ג .השגיאה בהחלטת החוקר היא: ___________________________________________________________________ _______________________________________________________ .2אוניברסיטה בדקה האם קיים קשר בין גיל הסטודנט להישגיו בלימודים ,עזרו לאוניברסיטה לבדוק ברמת מובהקות של .5% הישגים/גיל 18-22 22-26 26-30 טובים ומעולים 40 30 20 90 בינוניים ונמוכים 20 40 50 110 סה"כ 60 70 70 200 א .הגבול הקריטי הוא: ____________________________________________________________________ ב .החלטת החוקר היא: ___________________________________________________________________________ ___________________________________________________________________________ _________________________________________________________ © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 280 .3מסעדה בודקת את הטיפים שמקבלים שלושה מלצרים בערב: א 95 110 120 80 80 100 120 ב 120 130 60 50 100 120 90 ג 85 140 100 120 85 95 85 80 מנתונים אלו עולה כי ברמת מובהקות של ,5%הגבול הקריטי לבדוק את הטענה הוא: ________________________________________________________ מנתונים אלו עולה כי הערך הנבדק מול הגבול הקריטי הוא: ________________________________________________________ מניתוח הנתונים המסקנה היא דוחים /מקבלים את השערת האפס. .4אחוז המצביעים לראשות הממשלה ,בבחירות הקודמות עמד על .62%במסגרת הנתונים שאוספת מפלגתו של לקראת הבחירות הקרבות ,נמצא כי מבין 600מצביעים, 396תומכים בראש הממשלה. האם ברמת מובהקות של ,5%נקבל או נדחה את ההשערה כי אחוזי התמיכה בראש הממשלה עלו. ב .עלו. ב .לא עלו. .5בהמשך לשאלה ,4סיכויי השגיאה בהחלטה הם? ג1.97% . ב2.06% . ג5% . .6חוקר ניסח את ההשערות הבאות H1 : 50 : ד .אף תשובה אינה נכונה . H 0 : 50 לצורך בדיקה הוא לקח מדגם מקרי בגודל 30איש ,מתוך אוכלוסייה המתפלגת נורמאלית, על סמך תוצאות המדגם הוא חישב וקיבל t 2.462 : לכן המסקנה היא : א .הוא ידחה H 0ברמת מובהקות 1%אך לא כן ברמת מובהקות .5% ב .הוא ידחה H 0ברמת מובהקות 3%אך לא כן ברמת מובהקות .2% ג .הוא ידחה H 0ברמת מובהקות 4%אך לא כן ברמת מובהקות 1% ד .הוא לא ידחה H 0ברמת מובהקות . 1.5% ד .יש יותר מתשובה אחת נכונה. ה .אף תשובה אינה נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 281 .7מרצה בדק את השפעת שיטת לימוד חדשה על הישגי הסטודנטים ,ממוצע ציוני הסטודנטים בשיטה הישנה עומד על ,73.98השיטה החדשה נוסתה על 12סטודנטים ,ובמבחן התקבלו הציונים : 76 100 95 60 70 97 68 62 88 81 76 78 מהי רמת המובהקות המינימאלית לקבלת טענת המרצה? 10% א. ב5% . ד .אף תשובה אינה נכונה ג25% . ברמת מובהקות של ,5%המרצה ידחה /יקבל את השערת האפס. .8במסגרת בדיקת פורמולה חדשה להרזיה ,ניתנה הפורמולה ל 10-אנשים (הנתונים בטבלה). החוקרים בדקו ברמת מובהקות של ,5%והחליטו כי הפורמולה אינה מסייעת בהורדה במשקל. מהי השגיאה האפשרית בהחלטת החוקרים? משקל ממוצע סטיית תקן א31.92% . .9 ב12.6% . לפני אחרי 79 88 12 21 ג25.06% . ד5% . ה .אף תשובה אינה נכונה. מבחן חי בריבוע לאי תלות התבסס על טבלת ,4/3הערך הנבדק היה ,14ורמת המובהקת .2.5% כיצד תשתנה ההחלטה במעבר ל 4/4 -ורמת מובהקות של ?10% ג .אין שינוי בהחלטה ד .בטבלה הראשונה דוחים את השערת האפס ,ובטבלה השנייה מקבלים. ג .לא ניתן לקבל החלטה ללא נתונים. ד .ברמת מובהקות של ,1%מקבלים את השערת האפס בשתי הטבלאות. ה .יש יותר מתשובה אחת נכונה. .10בדקת השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של 3%וקיבלת את השערת האפס. לפניך שני משפטים: .1 המשמעות היא שהגבול הקריטי נקבע ברמת מובהקות נמוכה יותר. .2 יתכן כי ברמת בטחון גבוהה יותר ,תקבל את השערת האפס. א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 282 .11נבדק רווח בר סמך ,ידוע כי סטיית התקן של אוכלוסיית הגורם הנבדק היא ,90ורמת הביטחון היא ,95% גודל המדגם הוא 16איש ,מהו אורך הרווח? א. ב1.37 . 4.56 ג24 . ד .אף תשובה אינה נכונה .12בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת .לפניך 2טענות: .1ככל שרמת הביטחון גבוהה יותר ,הרווח יהיה גדול יותר. .2ככל שהמדגם גדול יותר ,הרווח יהיה גדול יותר. א. שתי הטענות נכונות. ב. שתי הטענות לא נכונות. ג. רק הטענה הראשונה נכונה. ד. רק הטענה השנייה נכונה. .13השערת האפס ( – )Hoאין הבדל בשכר החודשי בתפקידי ניהול בין גברים לנשים. ההשערה האלטרנטיבית ( )H1השכר החודשי של נשים גבוה יותר. לבדיקת השערות אלו נלקחו שני מדגמים ,של גברים ונשים בתפקידי ניהול בכירים. הנתונים להלן נלקחו מתוך המדגמים: גברים ₪ 15600 ₪ 3800 25 ממוצע מדגם סטיית תקן באוכלוסיה גודל המדגם נשים ₪ 18800 ₪ 4200 20 א. ברמת מובהקות של 4%נדחה את ,Hoאך לא ברמת מובהקות של .6% ב. ברמת מובהקות 8%נדחה את .Ho ג. ברמת מובהקות 1%נקבל את Ho ד. ברמות מובהקות של 10%וגם של 6%מקבלים את Ho ה .אף תשובה אינה נכונה. ו .יש יותר מתשובה אחת נכונה. .14 בהמשך לשאלה ,13התברר כי חלה טעות בחישוב סטית התקן במדגם הגברים והיא ,4200כתוצאה מכך ,בהנחה כי הבדיקה נערכה ברמת מובהקות של ,5% השגיאה האפשרית במסקנות היא: א 2.5% ב0.41% . ג .בין 5%-10% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ד .בין 25%ל .40%-ה .אין תשובה נכונה. 283 .15דחיתם את השערת האפס ,כאשר ביצעתם מחקר דו כיווני. א .אם תבצעו את מחקר זהה בהשערה חד כיוונית ,בוודאות תידחו את השערת האפס. ב .אם תבצעו מחקר זהה ,בהשערה חד כיוונית ,וברמת מובהקות כפולה ,תגיעו לאותו גבול קריטי. ג .ברמת מובהקות נמוכה יותר ,תגיעו בוודאות לאותן מסקנות. ו .ברמת מובהקות גבוהה יותר ,יתכן ותגיעו למסקנות הפוכות. ז .יש יותר מתשובה אחת נכונה. .16 לפני חמש שנים ,עלות סל קניות לחג הייתה ,₪ 785עם סטיית תקן של .₪ 100במטרה לבדוק האם עלות סל קניות היום גבוהה יותר ,נלקח מדגם של 16משפחות ,ונמצא כי ההוצאה הממוצעת לסל קניות הייתה ,₪ 840הטענה נבדקת ברמת ביטחון של .96% לעניות דעתכם הסטטיסטית ,החוקרים צריכים לדחות /לקבל את השערת האפס. השגיאה האפשרית בתוצאות היא: א 2.5% ב2% . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ג1.39% . ד0.5% . ה .אין תשובה נכונה. 284 פתרון מבחן לדוגמה מס 1 .1 שני מדגמים מזווגים ,מבחן חד כיווני כלפי מעלה (האם הקורס משפר את התשואות) , שונויות/סטיות תקן באוכלוסיות אינן ידועות ,מבחן .t 1 2 0 H 0 :הקורס אינו משפר את התשואה 1 2 0 H1 : הקורס משפר את התשואה החלטה :מאחר ולפנינו פלט מחשב נעזר בפלט ולכן אין צורך בחישוב גבול קריטי: שתי אפשרויות החלטה : א .רמת מובהקות המחקר 0.01 כלומר עבור כל הקטנה מרמת מובהקות זו נדחה את H 0וההיפך. ע"פ הפלט ניתן לראות כי הסיכוי ה"אמיתי" לשגיאה – . ' 0.016 ) ( ' 0.0168) ( 0.01לכן נקבל את השערת האפס. הסיכוי האמיתי לשגיאה הוא 1.68%לעומת הסיכוי לשגיאה המוגדר שהוא .1% t stat t n1,1נדחה את H 0 דרך נוספת ע"פ ערכי t t stat t n1,1נקבל את H 0 ) (t stat 2.904) (t5,0.99 3.364לכן נקבל את H 0 ב. כאשר - H 0 : D 2המבחן הוא מבחן דו כיווני ( ) H1 : D 2 נתונים 0 2 : S d 2.53 d 3 0.01 n6 6.16 2.53 6 d C 2 4.032 S n 2 n1,1 C 0 t - 3 6.16הפרש הממוצעים נמצא בתחום קבלת H 0 לכן נקבל את - H 0הפרש התשואות לפני ואחרי הקורס אינו שונה מ2- כאשר - H1 : D 2המבחן הוא מבחן חד כיווני כלפי מעלה ( 0.01 ) H 0 : D 2 נתונים: d C 5.47 2.53 6 2 3.36 S n C 0 t n1,1 - 3 5.47הפרש הממוצעים נמצא בתחום קבלת H 0 לכן נקבל את - H 0הפרש התשואות לפני ואחרי הקורס אינו גדול מ2- © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 285 ג. ע"פ הפלט ניתן לבנות את משוואת הרגרסיה (עיינו בפרק על הסקה באמצעות אקסל) קו הרגרסיה הוא y 2.6 xi 2.35 תחזית ליועץ בעל 3שנות ותק – נציב xi 3 y 2.6 3 2.35 5.45 יועץ בעל 3שנות ותק ישיג תשואה של .5.45% התחזית אינה זהה לתצפיות בלוח מאחר וקו הרגרסיה בנוי על ריבועי הסטיות מהקו ולכן מתקיים קירוב ,ככל שמקדם המתאם גבוהה יותר כך הסטיות מקו האמצע קטנות – החיזוי טוב יותר ,כאשר המתאם הוא r 1החיזוי מדויק. ד. מתמטית ניתן לבצע חיזוי מאחר ויצרנו קו רגרסיה לכן ניתן להציב xi 20ונקבל . y 2.6 20 2.35 49.65בפועל חיזוי זה בעייתי – ברמה מציאותית קשה להניח שהתשואה גדלה באופן ליניארי בכל שנת ותק -אדם עם 30שנות ותק יצור תשואות של ? 75%הסיבה לכך נובעת מכך שהערך 20 גבוה באופן חריג מכל ערכי חמשת ערכי המדגם ,סביר להניח כי אם היינו משלבים במדגם גם אנשים ברמות וותק כאלו היינו מקבלים מתאם אחר וקו רגרסיה אחר. ה. ע"פ משוואת הרגרסיה כל שנת ותק מעלה את התשואה פי , 2.6שיפוע קו הרגרסיה. הקשר בין התשואה לשנות ותק הוא קשר חיובי חזק , r 0.911 -אולם הקשר אינו מושלם ,מקדם המתאם עדיין רחוק מ 1-ולכן החיזוי אינו מדויק. .2א. מבחן להשוואת ממוצעים ,סטיות תקן באוכלוסיה אינן ידועות – מבחן , tמבחן חד כיווני כלפי מטה. S1 3 S 2 3.4 X 1 6.5 n1 122 X2 7 n2 65 X 1 X 2 0.5 1 2 0 H 0 :זמן השירות של עובדים ותיקים אינו מהיר יותר מזמן השירות של עובדים חדשים. 1 2 0 H1 :זמן השירות של עובדים ותיקים מהיר יותר מזמן השירות של עובדים חדשים. רמת מובהקות 0.01 נחשב את השונות המשוקללת: 2 )S 12 (n1 1) S 2 2 (n2 1) 32 (122 1 1) 3.4 2 (65 1 S 9.88 n1 n2 2 185 2 9.88 9.88 1.122 65 122 C 0 2.326 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 S S n1 n2 C 0 t n1 n 22,1 286 תחום דחית H 0 תחום קבלת H0 0 1.122 0.5 הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את השערת האפס זמן השירות של עובדים ותיקים אינו מהיר יותר מזמן השירות של עובדים חדשים. ב. מבחן חד כיווני כלפי מטה להשוואת ממוצעים בין הממוצע הקיים לממוצע המדגם. 7.5 7.5 H0 : 0.05 H1 : 3.4 6.79 65 S n C 7.5 1.671 C 0 tn1,1 תחום דחית H 0 תחום קבלת H0 7.5 6.79 7 הממוצע החדש גדול מהתחום הקריטי – נמצא בתחום קבלת השערת האפס ,לכן נקבל את השערת האפס – לא חל שיפור בזמן השירות של העובדים החדשים. ג. סטית התקן באוכלוסיה ידועה ,נחשב רווח בר סמך באמצעות התפלגות .Z מחצית הרווח היא .1.28 n ) 2 (1 X Z n ) 2 (1 X Z 5.72 8.28 4 1.28 64 2.56 ) ) 2 2 (1 (1 Z Z 0.0104 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע S 1.28 n 1.28 64 4 ) 2 (1 ) (1 0.9948 Z Z 2 2 1 287 ד. n ) (1 2 X Z 4 0.25 n 1.96 n 0.25 ) (1 2 n X Z ) (1 2 Z 2 1.96 4 n 0.25 984 n ה. 2 מבחן לאי תלות ,נתונה טבלת , Observedנשווה אותה לטבלה תיאורטית מקבילה הטבלה לה נצפה במצב של אי תלות Expected - ציון לא טוב 32 25 57 עובדים ותיקים עובדים חדשים סה"כ ציון טוב 90 40 130 122 65 187 נבנה את הטבלה הצפויה למצב של אי תלות – . E ציון לא טוב 37.19 19.81 57 עובדים ותיקים עובדים חדשים סה"כ ציון טוב 84.81 45.19 130 122 65 187 המבחן הסטטיסטי .1 השערות: H0 : אין תלות בין ותק לטיב השירות H1 : יש תלות בין ותק לטיב השירות .2 רמת מובהקות המבחן 0.05 .3 תחומי דחייה /קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 2 2121,0.95 C 2 1,0.95 3.84 הערך הנבחן מול הגבול הקריטי: (32 37.19) 2 (25 19.81) 2 (90 84.81) 2 (40 45.19) 2 2.99 37.19 19.81 84.81 45.19 2 ) (o e ie i 2 i אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 288 תחום דחית H 0 תחום קבלת H 0 3.84 .4 החלטה -ערך 2 2.99 הנבדק 2.99קטן מהגבול הקריטי , 3.84לכן נקבל את השערת האפס אין תלות בין ותק למקצועיות השירות. .5 שגיאה -מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 289 פרק שני .1 התפלגות נורמאלית ,משפט הגבול המרכזי :אם 16חיילים שוקלים 1128ק"ג – כל חייל שוקל בממוצע 70.5ק"ג .מה ההסתברות שמשקלו של חייל יהיה מעל 70.5ק"ג התשובה הנכונה היא ג. 70.5 75 1.5 12 ( ) 16 P( Z 1.5) 0.0668 Z 1 0.0668 0.9332 .2 n4 S 4.082 X 85 0 90 85 90 3.489 4.082 ( ) 4 0.95 1 0.975 מאחר וסטית התקן אינה ידועה נשתמש בהתפלגות t n1,1 t3,1 t t3,1 0.025 0.05 התשובה הנכונה היא ב .3 כאשר מגדילים את גודל המדגם פי , Kאורך הרווח קטן פי K לכן אם הרווח צר פי 3אזי המדגם גדל פי 32 9 התשובה הנכונה היא ג .4 החוקר בדק מדגם של 5אנשים בהשערה דו כיוונית ,נחשב את ' עבור t 2.611 0.05 ' 0.1 0.975 ' ' דוחים את השערת האפס כלומר כאשר 2 0.95 1 2.611 2 4,1 t 2 n1,1 t ' מקבלים את השערת האפס 0.5נדחה בוודאות את השערת האפס וכאשר 0.05מקבלים את השערת האפס. התשובה הנכונה היא א. .5 נבדוק את הטענות :טענה ראשונה – אילו נבדוק את אותה טענה במבחן דו צדדי ברמת מובהקות של 2.5%כלומר הגבול הקריטי יהיה בשני הצדדים – בכל צד 1.25%מאחר ודחינו את השערת האפס עבור 5% ואיננו יודעים את הערך הנבדק אין לנו נתונים כדי לאמת את הטענה. טענה שנייה – במבחן דו צדדי ברמת מובהקות של 10%נקבל את אותו גבול קריטי כלומר אותה מסקנה – נדחה את השערת האפס ,אולם מאחר והערך הנבדק אינו ידוע לא ניתן לקבוע אם זו רמת המובהקות המינימאלית – יתכן כי ברמת מובהקות קטנה יותר עדיין נדחה את השערת האפס. התשובה הנכונה היא ב. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 290 .6 השערה דו כיוונית להפרשי ממוצעים ,סטיות תקן באוכלוסיה ידועות – התפלגות . Z 1 2 0 H 0 :אין הבדל בתוחלות ההכנסה בין שתי הערים 1 2 0 H1 :קיים הבדל בתוחלות ההכנסה בין שתי הערים נבדוק גבולות קריטיים עבור 0.05, 0.01 4.84 2 3.612 3.62 10 12 C 1.96 4.84 2 3.612 4.74 10 12 C 2.57 22 22 n2 n2 12 C 0 Z 0.975 n1 12 C 0 Z 0.995 n1 ההפרש בין הממוצעים הוא 3.66לכן עבור 5%נדחה את השערת האפס ועבור 1%מקבלים את השערת האפס . התשובה הנכונה היא א. .7 רווח בר סמך לתוחלת ברמת ביטחון של , 99%ע"פ משפט הגבול המרכזי 99%ממוצעי כל המדגמים בגודל nנמצאים בתחום המתקבל –ו 1%-מחוץ לתחום ,לכן הסיכוי שממוצע האוכלוסייה נמצא בתחום זה הוא . 99% התשובה הנכונה היא ד. .8 ' נדחה את השערת האפס ' נקבל את השערת האפס התשובה הנכונה היא ג. .9 השערה דו כיוונית ,סטית התקן באוכלוסיה ידועה – התפלגות : Z 0.06 0 2 X 1.99 n 50 נחשב את הסיכוי האמיתי לשגיאה – רמת המובהקות המינימאלית ' 1.18 ' 2 1 Z 2 1.99 1.1785 0.06 50 ' 2 1 Z ' 0.119 11.9% ' נדחה את השערת האפס ' נקבל את השערת האפס 0 n 0.8810 ' 2 ' 2 1 Z 1 התשובה הנכונה היא ד. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 291 .10 8 Yi 2 4.83 8 X i 2 14.25 Y 0.7125 i 1 ) COV ( XY x y X 1.25 i 1 r Xi2 X 2 n ) COV ( XY 2 x my x נעזר בנתונים ובנוסחאות הנ"ל ,נחשב את סטיות התקן לשני המשתנים: 14.24 4.83 1.25 2 0.2175 y 0.7125 2 0.096 8 8 ) COV ( XY 0.4569 ) 0.09937575 COV ( XY 0.2175 0.09937575 r 0.6877 0.2175 0.096 x התשובה הנכונה היא א. .11 כאשר הסטטיסטיקאי עובד ברמת מובהקות של 1%המשמעות היא רמת בטחון של , 99%כלומר כאשר הוא עורך מבחן לבדיקת השערות ברמת בטחון של 99%הסיכוי לשגיאה הוא 1%כלומר הוא החליט נכון בערך ב 99%-מבדיקות ההשערות שביצע. התשובה הנכונה היא ב. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 292 פתרון מבחן מס 2 .1 שני מדגמים מזווגים ,מבחן חד כיווני כלפי מעלה (האם תרד משפר את הכושר הפיסי) , שונויות/סטיות תקן באוכלוסיות אינן ידועות ,מבחן .t 1 2 0 H 0 :תרד אינו משפר את הכושר הפיסי 1 2 0 H1 : אכילת תרד משפרת את הכושר הפיסי החלטה :מאחר ולפנינו פלט מחשב נעזר בפלט ולכן אין צורך בחישוב גבול קריטי: שתי אפשרויות החלטה : א. ע"פ - רמת מובהקות המחקר 0.05 כלומר עבור כל הקטנה מרמת מובהקות זו נדחה את H 0וההיפך. ע"פ הפלט ניתן לראות כי הסיכוי ה"אמיתי" לשגיאה – ה האמיתית היא 0.1726 ) ( ' 0.1726) ( 0.05לכן נקבל את השערת האפס. t stat t n1,1נדחה את H 0 ב. ע"פ t ב. מבחן על תוחלת /ממוצע של אוכלוסיה אחת ,סטית תקן אינה ידועה -מבחן t t stat t n1,1נקבל את H 0 ) (t stat 1.069) (t n1,1 2.131לכן נקבל את H 0 מבחן חד כיווני כלפי מעלה נתונים 0 146 : S 114.7 10.7 152.8 146 H0 : תרד אינו משפר את הכושר הפיסי 146 H1 : אכילת תרד משפרת את הכושר הפיסי n5 0.01 163.93 C 10.7 5 146 3.747 S n C 0 t n1,1 - 152.8 163.93הממוצע החדש נמצא בתחום קבלת H 0 לכן נקבל את - H 0אכילת תרד אינה משפרת את הכושר הפיסי. ע"פ הפלט ניתן לבנות את משוואת הרגרסיה (עיינו בפרק על הסקה באמצעות אקסל) קו הרגרסיה הוא y 7.2 xi 114.8 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 293 ג. תחזית למשקולן שמתאמן 7שעות – נציב xi 7 y 7.2 7 114.8 165.2 משקולן שמתאמן 7שעות ירים 165.2ק"ג. התחזית אינה זהה לתצפיות בלוח מאחר וקו הרגרסיה בנוי על ריבועי הסטיות מהקו ולכן מתקיים קירוב ,ככל שמקדם המתאם גבוהה יותר כך הסטיות מקו האמצע קטנות – החיזוי טוב יותר ,כאשר המתאם הוא 1החיזוי מדויק. ד. אם כל מתאמן יוריד חצי שעת אימון – מאחר ושיפוע הקו הוא 7.2הורדת חצי שעה תוריד 3.6ק"ג במשקל , ניתן לבדוק זאת גם ע"י הצבת זמן הקטן בחצי שעה בכל אחד מהזמנים ומציאת המשקל המתאים Y 147.2 161.6 150.8 140 136.4 X 4.5 6.5 5 3.5 3 אם נחשב את המשקל הממוצע אחרי השינוי – 147.2ק"ג ,המשקל הממוצע לפני השינוי 150.8ק"ג אכן ירידה של 3.6ק"ג. ה. עוצמת הקשר – , 0.897קשר חיובי חזק אבל לא מושלם ,ככל שמקדם המתאם שואף ל 1-הקשר חזק יותר ומכאן חיזוי מדויק יותר. .2 מבחן 2 לאי תלות ,נתונה טבלת , Observedנשווה אותה לטבלה תיאורטית מקבילה הטבלה לה נצפה במצב של אי תלות Expected - מבוגר 30 10 40 לא הצליח לגייס הצליח לגייס צעיר 14 46 60 44 56 100 נבנה את הטבלה הצפויה למצב של אי תלות – . E מבוגר 17.6 22.4 40 לא הצליח לגייס הצליח לגייס צעיר 26.4 33.6 60 44 56 100 המבחן הסטטיסטי .1 .2 השערות: H0 : אין תלות בין גיל המתנדב להצלחתו בגיוס תרומות H1 : יש תלות בין גיל המתנדב להצלחתו בגיוס תרומות רמת מובהקות המבחן 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 294 .3 מציאת תחומי דחייה/קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 2 21 21,0.99 C 21,0.99 6.63 הערך הנבחן מול הגבול הקריטי: (30 17.6) 2 (14 26.4) 2 (10 22.4) 2 (46 33.6) 2 26 17.6 26.4 22.4 33.6 תחום דחית H0 i תחום קבלת 26 .4 2 ) (o e ie i 2 2 החלטה -ערך H0 6.63 הנבדק 26גדול מהגבול הקריטי , 6.63לכן נדחה את השערת האפס יש תלות בין הגיל לבין ההצלחה בגיוס תרומות. .5 שגיאה -מאחר ודחינו את השערת האפס ,השגיאה האפשרית היא שגיאה מסוג ראשון . ב. מבחן חד כיווני כלפי מטה (אברהם משכנע יותר מהר – זמן קצר יותר) שני מדגמים בלתי תלויים , להשוואה בין הממוצעים ,שונויות באוכלוסיה לא ידועות – מבחן .t S1 4 נתוניםS 1 4 : X 1 33 n1 11 X 2 35 n2 13 X 1 X 2 2 .1 השערות : 1 2 0 H 0 :זמן השכנוע של אברהם אינו מהיר מזמן השכנוע של יעקב 1 2 0 H1 :זמן השכנוע של אברהם מהר יותר מיעקב .2 רמת מובהקות 0.05 .3 תחומי קבלה ודחית H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 295 יש לחשב שונות משוקללת (שני מדגמים ב"ת) 2 )S 12 (n1 1) S 2 2 (n2 1) 4 2 (13 1) 4 2 (11 1 S 16 n1 n2 2 22 22 n2 t n1 n 22,1 t 22,0.95 1.717 12 n1 C 1 2 t ( n1 n2 2), 1 16 16 1.638 11 13 22 n2 12 1 2 0 n1 C 0 1.717 1.638 2.81 תחומי קבלה /דחייה לH 0 - תחום דחית H 0 תחום קבלת H0 0 .4 2.81 2 החלטה נקבל את השערת האפס ההפרש בין הממוצעים נמצא בתחום קבלת השערת האפס אברהם אינו משכנע מהר יותר. .5 השגיאה האפשרית מאחר וקיבלנו את השערת האפס ,השגיאה האפשרית היא שגיאה מסוג שני . 0.48 2.798 2 16 16 11 13 1 0.75 0.25 t 22,1 1 0.6 0.4 0.25 0.4 ג. רווח בר סמך אורך הרווח הוא S S X t ) ( n 1)(1 n n 2 ) ( n 1)(1 2 X t 43.25 - 38.25 = 5כלומר מחצית רווח היא 2.5 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 296 מאחר ואנו מתייחסים לרווח בלבד אין השפעה לממוצע . S t 2.5 ) ( n 1)(1 n 2 4.5 2.5 16 0.99 2 0.975 1 t 2.22 t ) 15(1 2 ) 15(1 2 0.02 0.05 ד. שני מדגמים מזווגים ,שונויות לא ידועות ,מבחן , tמבחן חד כיווני כלפי מעלה. d 0 .1 n4 S 3.109 d 1.5 D 0 H 0 :הפרסים לא יעלו את מספר התורמים D 0 H1 :הפרסים יעלו את מספר התורמים 0.05 .2 .3 תחום דחית H 0 תחום קבלת S n 3.657 H0 C 0 t ( n1),(1 ) 3.109 4 3.657 C 0 2.353 1.5 0 .4 מקבלים את השערת האפס ,מספר התורמים לא עלה כתוצאה מהפרסים. .5 השגיאה האפשרית שגיאה מסוג שני 3.109 4 3.657 1.5 t 3,(1 ) ) 1.3875 t 3,(1 1 0.75 0.25 1 0.9 0.1 0.1 0.25 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 297 פרק שני .1 מתאם שלילי משמעותו – כאשר משתנה אחד עולה השני יורד .מתאם חיובי – שני המשתנים "נעים" באותו כיוון יכול להיות בתחום השלילי ויכול להיות בתחום החיובי. התשובה היא ד. .2 התפלגות נורמאלית ,משפט הגבול המרכזי :אם משטח של 36ארגזים שוקל 340ק"ג אז כל ארגז שוקל בממוצע 9.44ק"ג .מה ההסתברות שמשקלו של ארגז יהיה מעל 9.44ק"ג 9.44 10 1.68 2 ( ) 36 P( Z 1.68) 0.0465 התשובה הנכונה היא א. Z 1 0.0465 0.9535 .3 המרחק בין ממוצע המשקל האמיתי לממוצע המשקל במדגם לא יעלה על 50ג' המשמעות היא שאורך רווח הסמך הוא בין הערך הגבוה לממוצע לערך הנמוך הוא 100ג' התשובה הנכונה היא ד n ) (1 2 X Z 200 50 n n 50 1.96 ) (1 2 n X Z ) (1 2 Z 2 1.96 200 n 50 n 61.46 .4 השערה חד כיוונית כלפי מטה – הסמים מורידים את ערך הבדיקה. מבחן – tסטית התקן באוכלוסיה לא ידועה .ה -המינימאלית היא המרחק בין 0 200ל 188.6 - 200 188.6 1.9 30 ( ) 25 t 24,1 תשובה ד נכונה .5 0 tn1,1 S ) ( n 0.95 1 0.975 0.025 0.05 כאשר מגדילים את המדגם -מקטינים את אורך הרווח . כאשר מקטינים את רמת המובהקות מגדילים את אורך הרווח – כאשר מקטינים את רמת המובהקות מגדילים את הביטחון וההיפך .רמת ביטחון קטנה – רווח קטן. משפט ראשון – אינו נכון ,הפוך. משפט שני – אינו נכון ,הפוך. תשובה נכונה ב. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 298 .6 מבחן השערות דו כיווני (אין הבדל בהוצאות השימוש בין חיילים וחיילות) ,שני מדגמים בלתי תלויים , סטיות תקן באוכלוסיות לא ידועות – מבחן .t S 1 31.5 X 1 192 n1 17 S 1 26 X 2 180 n2 15 ג. השערות : X 1 X 2 12 1 2 0 H 0 :אין הבדל בהוצאות החודשיות לטלפון בין חיילים וחיילות 1 2 0 H1 :יש הבדל בהוצאות החודשיות לטלפון בין חיילים וחיילות. ב. רמת מובהקות 0.05 ג. תחום י קבלה ודחית H 0 יש לחשב שונות משוקללת (שני מדגמים ב"ת) S 29.06 2 )S 12 (n1 1) S 2 2 (n2 1) 26 2 (15 1) 31.5 2 (17 1 S 844.66 n1 n2 2 30 22 n2 t30,0.975 2.042 t30,0.95 1.697 12 n1 C 1 2 Z 1 2 n1 n 22,1 2 t n1 n 22, 1 2 844.66 844.66 10.29 15 17 22 n2 12 1 2 0 n1 t C0.05 0 2.042 10.29 21.01 C0.1 0 1.697 10.29 17.46 חישבנו את הגבולות הקריטיים עבור רמות מובהקות של 0.1ו 0.05-בשני הגבולות הפרש הממוצעים 12נמצא בתחום קבלת השערת האפס. תשובה ג נכונה. ) COV ( XY חישוב מקדם המתאם : x y .7 r xi yi n x y xi yi x y n n COV ( XY ) xi 2 X 2 17800 20 10 100 110 תשובה א נכונה. 20 232000 100 2 40 20 y 110 0.6875 4 40 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע n COV ( XY ) 2320 10 2 4 20 x r 299 .8 תחום דחית H 0 תחום קבלת H0 200 218 התפלגות נורמאלית ,סטית תקן באוכלוסיה ידועה נחשב את ההסתברות לקבלת ערך גדול מ 218כלומר ההסתברות לדחות את השערת האפס.) C =218( . 218 200 1.8 40 16 C 0 n 1 0.9641 Z 1 0.0359 תשובה א נכונה. .9 רמת המובהקות המינימאלית לדחיית ' -- , H 0 ' דוחים את H 0 ' מקבלים את H 0 כלומר אם הסיכוי האמיתי לשגיאה קטן מהסיכוי שהוגדר במחקר – דוחים את השערת האפס. תשובה ג נכונה. .10 טענה ראשונה – הטענה אינה נכונה ,רמת מובהקות קטנה יותר תרחיק את Cלמעלה ולכן יתכן מצב שנקבל את השערת האפס טענה שנייה – טענה נכונה ,אם קיבלנו את השערת האפס עבר רמת מובהקות מסוימת המשמעות היא שהערך הנבדק קטן מ , C-רמת מובהקות קטנה יותר תגדיל את Cולכן ברור כי נשאר עם אותה מסקנה. תשובה ד נכונה © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 300 פתרון מבחן מס 3 .1א. מבחן להשוואת ממוצעים ,סטיות תקן באוכלוסיה אינן ידועות – מבחן , tמבחן דו כיווני S 1 40 X 1 200 n1 8 20 35 S 2 43 X 2 190 n2 7 30 40 X 1 X 2 10 1 2 0 H 0 :אין הבדל בין הגילאים בגובה הממוצע של חשבון הטלפון 1 2 0 H1 :קיים הבדל בין הגילאים בגובה הממוצע של חשבון הטלפון רמת מובהקות 0.05 נחשב את השונות המשוקללת: )S 1 (n1 1) S 2 (n2 1) 432 (7 1) 402 (8 1 S 1714.92 n1 n2 2 13 2 2 1714.92 1714.92 46.29 8 7 2 S12 S 2 2 C 1 2 t n1 n2 n1 n 2 2,1 C 0 2.16 2 תחום דחית H 0 תחום קבלת H0 46.29 10 0 46.29 הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את H 0אין הבדל בין ממוצעי גובה החשבון. ב. רווח בר סמך S n ) 2 ( n 1)(1 X t S n ) 2 ( n 1)(1 X t 40 40 200 1.895 8 8 173.2 226.79 200 1.895 ערך tבטבלה עבור 98%הוא , 2.998ערך tבטבלה עבור 90%הוא 1.895מאחר והערך עבור 98%גדול פי 1.58המשמעות היא שהרווח יגדל פי . 1.58 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 301 ד. 40 0 210 X 3 186.66 n3 9 40 50 סטית התקן ידועה לכן משתמשים בהתפלגות Z רמת המובהקות הקטנה ביותר – ה -המינימאלית מתקבלת כאשר ( . C המרחק בין ל - 0 -ערך מוחלט) 210 186.66 2 35 ) ( 9 Z1 0 Z1 ( ) n 1 0.9772 0.0228 אורך הרווח הוא 15כלומר אורך מחצית הרווח הוא 7.5 ה. n ) (1 2 7.5 X Z n 35 1.96 ) (1 2 7.5 n n X Z ) (1 2 Z 2 84 n .2א. 1.96 35 n 7.5 שני מדגמים מזווגים ,התפלגות ,tמבחן חד כיווני כלפי מעלה. 1 2 20 H 0 :ממוצע זמן האוויר של הצעירים אינו גבוה מזמן האוויר הבכורים 1 2 20 זמן האוויר של הצעירים גבוה מזמן האוויר של הבכורים H1 : 0.1 שימו לב – הפלט מתייחס להשערת האפס -פער של 20ד' בזמן האוויר הסיכוי האמיתי לשגיאה ע"פ הפלט הוא ' 0.0925סיכוי זה קטן מ 0.1 - 10%-לכן נדחה ת השערת האפס ברמת מובהקות של .10% ב. ע"פ הפלט ההסתברות האמיתית לשגיאה גם במבחן דו כיווני וגם במבחן חד כיווני גדולה מ 0.05-לכן נקבל את השערת האפס ברמת מובהקות של . 0.05 ג. ע"פ הפלט ניתן לבנות את משוואת הרגרסיה : y 1.103xi 44.23 y 1.103 180 44.23 154.31 ד. xi 180 מקדם המתאם , r 0.9869מעיד על קשר חיובי חזק מאוד – מקדם המתאם שואף ל1- לכן יכולת הניבוי ע"י קו הרגרסיה גבוהה מאוד (שונות מוסברת – לא נלמדה בקורס – אין צורך) © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 302 פרק שני .1 השערת האפס נדחית ברמת מובהקות של 0.05המשמעות היא שעבור כל רמת מובהקות גבוהה יותר נדחה את השערת האפס ,לגבי רמת מובהקות נמוכה יותר ,לא ניתן לדעת בלי בדיקה. כאשר ההשערה דו כיוונית רמת המובהקות מתחלקת ל.2- תשובה ג' נכונה מאחר ו 10%-מתחלקים ל 2-בדו כיווני ולכן התוצאה שווה .5% - .2 סטית התקן באוכלוסיה נתונה – התפלגות . Z n 5.47 ) (1 2 12.481 20 1.96 רמת הסמך /רמת הביטחון = 95% / 0.95 מחצית הרווח היא 5.47 X Z n ) (1 2 ) (1 2 Z Z 0.05 5.47 ) (1 2 n 5.47 20 12.481 X Z ) (1 2 ) (1 2 0.975 2 Z Z 1 תשובה א נכונה .3 מבחן 2 לאי תלות -נתונה טבלת , Observedנשווה אותה לטבלה תיאורטית מקבילה הטבלה לה נצפה במצב של אי תלות Expected - Observed 200 200 400 Expected 200 200 400 גברים 160 130 290 נשים 40 70 110 מרוצה לא מרומה סה"כ גברים 145 145 290 נשים 55 55 110 מרוצה לא מרומה סה"כ המבחן הסטטיסטי א. השערות: H0 : אין תלות בין מין לשביעות הרצון H1 : יש תלות בין מין לשביעות הרצון © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 303 ב. ג. רמת מובהקות המבחן 0.05 מציאת תחומי דחייה/קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 22121,0.95 C 21,0.95 3.84 C 21,0.975 5.02 הערך הנבחן מול הגבול הקריטי: (160 145)2 (130 145)2 (40 55)2 (70 55)2 11.28 145 145 55 55 2 ) (o e ie i 2 i אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 שני אזורי דחית H0 11.28 ד. החלטה -ערך 2 אזור קבלת H 0 5.02 3.84 הנבדק 11.28גדול משני הגבולות הקריטיים ,לכן נדחה את השערת ברמת מובהקות של 2.5%ושל - 5%יש קשר בין שביעות רצון למין בשתי הרמות. תשובה א נכונה .4 הגדל המדגם פי Kתקטין את אורך הרווח פי K ,לכן הגדלת המדגם פי ( 5מ 100-ל )500-תקצר את הרווח פי , 2.236כלומר במדגם של 100הרווח ארוך פי .2.236 תשובה ג' נכונה .5 תשובה א' נכונה .6 512 8.53 n 60 2 8 60 8.53 8 Z1 2.065 1 0.9803 0.0197 2 ( ) 60 X 1 r 1בתשובה בשאלה r=-1.55נתון זה בלתי אפשרי . תשובה ד' נכונה © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 304 .7 רווח בר סמך לפרופורציה : נערך מדגם של 100מצביעים ונמצא כי 21השתכנעו .21% - נבנה רווח בר סמך לפרופורציית המשתכנעים באוכלוסיה ברמת בטחון של .98% )0.21(1 0.21 0.0407 Z Z 0.99 2.33 1 100 2 ) P (1 P n ) P (1 P n ) P (1 P P P Z 1 n 2 P 0.21 P Z 1 2 0.21 2.33 0.0407 P 0.21 2.33 0.0407 0.21 0.095 P 0.21 0.095 התשובה הנכונה ג' .8 השערה דו כיוונית להפרשי ממוצעים ,סטיות תקן באוכלוסיה ידועות – התפלגות . Z 1 2 0 H 0 :אין הבדל בין זמן שיחות הטלפון בין שתי הערים 1 2 0 H1 :קיים הבדל בין זמן שיחות הטלפון בין שתי הערים נבדוק גבולות קריטיים עבור 0.05, 0.01 4.842 3.612 C 1.96 3.62 10 12 4.842 3.612 C 2.57 4.74 10 12 22 22 n2 n2 12 n1 12 n1 C 0 Z 0.975 C 0 Z 0.995 ההפרש בין הממוצעים הוא 3.66לכן עבור 5%נדחה את השערת האפס ועבור 1%מקבלים את השערת האפס . תשובה א' נכונה .9 ע"פ המשוואה הפועל מקבל תוספת של ₪ 0.5עבור X1ומורידים לו ₪ 0.8עבור X2 מקבל תוספת עבור מספר הפריטים ומנקים לו עבור מס' התלונות. התשובה הנכונה היא א. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 305 פתרון מבחן לדוגמה מס 4 .1 שני מדגמים בלתי תלויים ,מבחן חד כיווני כלפי מעלה (תוחלת זמן הגברים גבוהה מתוחלת זמן הנשים) , שונויות/סטיות תקן באוכלוסיות אינן ידועות ,מבחן .t 1 2 0 H 0 :תוחלת זמן גלישה אצל גברים אינה גבוהה מתוחלת הזמן אצל הנשים 1 2 0 H1 : תוחלת זמן גלישה אצל גברים גבוהה מתוחלת הזמן אצל הנשים החלטה :מאחר ולפנינו פלט מחשב נעזר בפלט ולכן אין צורך בחישוב גבול קריטי: שתי אפשרויות החלטה : א .רמת מובהקות המחקר 0.1 כלומר עבור כל הקטנה מרמת מובהקות זו נדחה את H 0ולהיפך. ע"פ הפלט ניתן לראות כי הסיכוי ה"אמיתי" לשגיאה – רמת המובהקות המינימאלית – . ' 0.282 ) ( ' 0.282) ( 0.1נקבל את השערת האפס. הסיכוי האמיתי לשגיאה הוא 28.28%לעומת הסיכוי לשגיאה המוגדר שהוא .10% t stat t n1,1נדחה את H 0 דרך נוספת ע"פ ערכי t t stat t n1,1נקבל את H 0 ) (tstat 0.579) (t38,0.90 1.685לכן נקבל את H 0 ב. 1 2 2 1 2 2 H 0 :תוחלת זמן גלישה אצל גברים אינה גבוהה בשעתיים מתוחלת זמן הנשים H1 : תוחלת זמן גלישה אצל גברים גבוהה בשעתיים מתוחלת הזמן אצל הנשים 0.1 נתונים: 1 2 2.35 2 S 164.48 164.48 164.48 8.83 20 20 C 2 1.685 t38,0.9 1.685 S S n1 n2 2 n 1,1 C 1 2 t הפרש הממוצעים נמצא בתחום קבלת H 0 לכן נקבל את - H 0זמן הגלישה אצל גברים אינו גבוה בשעתיים מזמן הגלישה אצל הנשים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 306 ג. 2 2 2 2 S S S S 1 2 X 1 X 2 t n1 n 22,1 n1 n2 n1 n2 2 X 1 X 2 tn1n22,1 2 2.35 1.684 4.055 1 2 2.35 1.684 4.055 4.478 1 2 9.179 ד. מקדם המתאם בין גיל הגולשים לזמן הגלישה הוא , 0.84מקדם זה מעיד על קשר חיובי – ככל שהגיל עולה כך עולה זמן הגלישה ,הקשר די חזק . ה. קו הרגרסיה הוא y 0.341xi 38.37 תחזית זמן גלישה לגולש שגילו 25 .2א. y 0.341 25 38.37 46.89 מבחן להשוואת ממוצעים ,סטית התקן באוכלוסיה ידועה – מבחן , Zמבחן חד כיווני כלפי מטה. 0 500 500 500 6 494.6 n 9 H 0 :משקל הקופסא אינו נמוך מ 500-גר'. H1 :משקל הקופסא נמוך מ 500-גר'. רמת מובהקות 0.025 בדיקה ע"י גבול קריטי 6 496.08 9 C 500 1.96 n C 0 Z1 תחום דחית H 0 תחום קבלת H0 494.6 496.08 500 נדחה את השערת האפס משקל הממוצע של קופסא נמצא בתחום דחיית השערת האפס כלומר משקל הקופסא נמוך מ 500 -גר'. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 307 בדיקה ע"י רמת מובהקות ' 0.0038 500 494.66 2.67 6 ) ( 9 1 ' 0.9962 ' דוחים את השערת האפס ' מקבלים את השערת האפס Z1 ' ) ' (0.0035) (0.025דוחים את השערת האפס. מאחר ורמת המובהקות המינימאלית היא , 0.38% -- 0.0038נדחה את השערת האפס ברמות מובהקות של 10%ושל .1% ב. רמת המובהקות המינימאלית חושבה בסעיף הקודם . 0.0038 ג. סטית התקן אינה ידועה – התפלגות , tנחשב רווח בר סמך: S S X t n 1,1 n n 2 2 n 1,1 X t 8.485 8.485 494.66 2.306 9 9 488.13 501.18 494.66 2.306 ד. מבחן 2 לאי תלות ,נתונה טבלת , Observedנשווה אותה לטבלה תיאורטית מקבילה הטבלה לה נצפה במצב של אי תלות Expected - משמרת יום משמרת לילה תפוקה נמוכה 35 25 60 תפוקה גבוהה 75 25 100 סה"כ 110 50 160 נבנה את הטבלה הצפויה למצב של אי תלות – . E משמרת יום משמרת לילה תפוקה נמוכה 41.25 18.75 60 תפוקה גבוהה 68.75 31.25 100 סה"כ 110 50 160 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 308 המבחן הסטטיסטי .1 השערות: H0 : אין תלות בין המשמרת לגובה התפוקה. H1 : יש תלות בין המשמרת לגובה התפוקה. .2 רמת מובהקות המבחן 0.05 .3 מציאת תחומי דחייה/קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 R 1C 1,1 דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ( Rשורות) ( C ,עמודות). C 2 2121,0.95 C 2 1,0.95 3.84 הערך הנבחן מול הגבול הקריטי: (35 41.25)2 (75 68.75)2 (25 18.75)2 (25 31.25)2 4.84 41.25 68.75 18.75 31.25 2 ) (o e ie i 2 i אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 תחום דחית H0 תחום קבלת 4.84 .4 החלטה -ערך 2 H0 3.84 הנבדק 4.84גבוה מהגבול הקריטי , 3.84לכן נדחה את השערת האפס יש תלות בין המשמרת לתפוקה. .5 שגיאה -מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 309 ה. מדגם מזווג – מבחן חד כיווני כלפי מעלה (ניתן לבצע גם מבחן כלפי מטה). משקל לפני השימוש בערכה 87 85 73 68 78 משקל אחרי השימוש בערכה 82 82 74 64 74 5 3 1- 4 4 d S d 2.34 1 2 0 1 2 0 d 3 H 0 :השימוש בערכה אינו משפר את הירידה במשקל. H1 : השימוש בערכה משפר את הירידה במשקל. רמת מובהקות 0.05 - תחום דחית H 0 תחומי דחייה וקבלה להשערת האפס S C 0 t( n 1),(1 ) d n 2.34 C 0 2.132 2.23 5 דוחים את השערת האפס תחום קבלת H0 3 2.23 0 השוואת הסתברויות – רמות מובהקות 0 S n t( n 1),(1 ') ' דוחים את השערת האפס ' מקבלים את השערת האפס 0.01 ' 0.025 df 4 0.975 1 ' 0.99 ) 0.025) (0.05 ' (0.01דוחים את השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 30 2.8 2.34 ( ) 5 t4,1 ' 310 השוואת ערכי t t4,0.95 2.132 30 2.795 2.34 ( ) 5 tSTAT tSTAT tCRITICALדוחים את השערת האפס )tSTAT (2.795) t (2.132 0 S n tSTAT t( n 1)(1 ') tSTAT tCRITICAL מקבלים את השערת האפס דוחים את השערת האפס החלטה דוחים את השערת האפס -הערכה משפרת את ההרזיה תוחלת המשקל לאחר השימוש בערכה קטנה מהתוחלת ללא השימוש בערכה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 311 פרק שני .1 התפלגות נורמאלית ,משפט הגבול המרכזי , :נחשב את ההסתברות למשקל נמוך מ 175-ג' ,את ההסתברות למשקל נמוך מ 215 -ג' ,נחסיר בין ההסתברויות ונקבל את ההסתברות למשקל בין שני ערכים אלו. 175 200 2 50 ( ) 16 P( Z 2) 0.0228 Z 215 200 1.2 50 ( ) 16 P( Z 1.5) 0.8849 Z התשובה הנכונה היא א. 0.8849 0.0228 0.8621 .2 ' דוחים את השערת האפס ' מקבלים את השערת האפס התשובה הנכונה היא ב. .3 200 n 2 n 61.46 50 1.96 1.96 200 n 50 התשובה הנכונה היא ד .4 כאשר המדגם גדל פי Kרווח הסמך מתקצר פי K ,לכן אם הרווח הראשון נבנה על מדגם בגודל 100 לעומת הרווח השני שנבנה על סמך מדגם של 500אזי הרווח השני קצר פי 5 לכן הרווח הראשון ארוך פי 5 . התשובה הנכונה היא ג. .5 ככל שהמדגם גדול יותר – רווח הסמך קצר יותר – טענה 1לא נכונה. ככל שרמת המובהקות קטנה יותר הרווח גדל – ככל שרמת המובהקות קטנה ,רמת הסמך 1 גדלה לכן ככל שרמת הסמך גדלה הרווח ארוך יותר -טענה 2נכונה. התשובה הנכונה היא ד. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 312 38.5 .6 ' 0.2266 n 36 40 38.5 0.75 12 36 1 ' 0.7734 התשובה הנכונה היא ב. .7 12 0 40 Z1 ' השערה דו כיוונית 1.99 ' 0.238 0.06 n 50 0.8810 ' 2 2 1.99 1.178 0.06 50 1 ' דוחים את השערת האפס ' מקבלים את השערת האפס 0 2 ' 2 Z 1 0.238 דוחים את השערת האפס. 0.238 מקבלים את השערת האפס. התשובה הנכונה היא ד. .8 עבור 0.05קיבלנו את השערת האפס . המשמעות היא שרמת המובהקות המינימאלית , ' 0.05ברמת מובהקות קטנה מ 0.05-נקבל בוודאות את אותן מסקנות ,ברמות מובהקות גבוהות מ 0.05-לא ניתן לדעת. התשובה הנכונה היא ג. .9 סטית התקן אינה ידועה ,נחשב רווח בר סמך ע"י התפלגות . t n6 S 17.82 X 72 S S X t n 1,1 n n 2 X t 2 17.82 17.82 72 2.571 6 6 n 1,1 72 2.571 72 18.71 התשובה הנכונה היא ב. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 313 .10 8 Yi 2 4.83 8 X i 2 14.25 Y 0.7125 i 1 ) COV ( XY x y X 1.25 i 1 r Xi2 X 2 n ) COV ( XY 2 x my x נעזר בנתונים ובנוסחאות הנ"ל ,נחשב את סטיות התקן לשני המשתנים: 14.24 4.83 1.252 0.2175 y 0.71252 0.096 8 8 ) COV ( XY 0.4569 ) 0.09937575 COV ( XY 0.2175 0.09937575 r 0.6877 0.2175 0.096 התשובה הנכונה היא א. x .11 כאשר הסטטיסטיקאי עובד ברמת מובהקות של 2.5%המשמעות היא רמת בטחון של , 97.5%כלומר כאשר הוא עורך מבחן לבדיקת השערות ברמת בטחון של 97.5%הסיכוי לשגיאה הוא 2.5%כלומר הוא החליט נכון בערך ב 97.5%-מבדיקות ההשערות שביצע. התשובה הנכונה היא ד. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 314 פתרון מבחן 5 .1א .מבחן דו כווני ,שני מדגמים בלתי תלויים ,סטית תקן באוכלוסייה אינה ידועה 1 2 0 H0 : לא קיים פער במחזורי העסקאות בין שני המדדים 1 2 0 H1 : קיים פער במחזורי העסקאות בין שני המדדים. רמת מובהקות 0.05 חישוב גבול קריטי S 2 1.16 t16, 0.975 2.12 0.05 2 9 9 2 ,1 t X 2 2.71 2 n1 n 2 2 ,1 S 1 1.23 X 1 2.73 X 1 X 2 2.73 2.71 0.02 t )S 1 (n1 1) S 2 (n 2 1) 1.23 2 (9 1) 1.16(9 1 S 1.42 n1 n 2 2 16 2 2 2 2 2 S S 1.42 1.42 0.5617 n1 n 2 9 9 C 0 2.12 0.5617 1.19 תחום דחית H 0 תחום קבלת H0 0.02 1.19 1.19 0 החלטת החוקר נקבל את השערת האפס ונדחה את השערת המחקר – ההפרש בין הממוצעים ,0.02נמצא בתחום קבלת השערת האפס -אין פער במחזורי העסקאות בין שני המדדים ,ברמת מובהקות של .0.05 השגיאה האפשרית מאחר וקיבלנו את השערת האפס ,השגיאה האפשרית -שגיאה מסוג שני - -קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה .חישוב השגיאה: 1.19 0.02 2.082 0.5617 2 88 2 ,1 t 0.5 0.1 5% 10% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע C X1 X 2 2 2 2 S S n1 n2 0.975 2 n1 n 2 2 ,1 t 0.95 1 315 ד .מבחן חד כווני כלפי מעלה ,סטית התקן באוכלוסיה ידועה ,מבחן Z H 0 : 2.1אין הבדל במחזורי המסחר במדד המעוף בין השנה לשנה שעברה H1 : 1 2.1מחזורי המסחר במדד המעוף השנה ,גבוהים ממחזורי המסחר בשנה שעברה רמת מובהקות 0.05 חישוב גבול 0 2.1 Z 1 Z 10.05 Z 0.95 1.65 0.3 2.73 קריטי תחום דחית H 0 2.265 0.3 9 C 2.1 1.65 תחום קבלת H0 2.265 2.73 0 החלטת החוקר נדחה את השערת האפס ונקבל את השערת המחקר – מחזורי המסחר השנה במדד המעוף ,גבוהים ממחזורי המסחר בשנה שעברה ,ברמת מובהקות של .0.05 השגיאה האפשרית מאחר ודחינו את השערת האפס ,השגיאה האפשרית -שגיאה מסוג ראשון - -דחינו את השערת האפס בזמן שהשערת האפס נכונה .חישוב השגיאה: 0 2.73 2.1 Z 1 6.3 0.3 Z 1 n 9 6.3 1 0.9990 0.001 Z 1 0.1% ה .להשוואה בין 4מדגמים נשתמש בניתוח שונות חד כווני – ANOVA - H 0 : 1 2 3 4אין הבדל בין מדדי הבורסה במחזורי המסחר - H1 : 1 2 3 4יש הבדל בין מדדי הבורסה במחזורי המסחר. רמת מובהקות 0.05 : © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 316 ב א X 1 2.73 ^ ד ג X 2 2.71 X 3 1.81 X 4 1.81 ^ ^ ^ S 1 1.51 S 2 1.345 S 3 0.27 S 4 0.27 n1 9 n2 9 n3 9 n4 9 2 2 2 2.73 9 2.71 9 1.81 9 1.81 9 2.265 9999 2 X ממוצע משוקלל SSB ni ( xi x) 2 7.47 SSW (ni 1) S i 27.07 2 i i ממוצע ריבועים דרגות חופש מקור סכום ריבועים השונות בין SSB=7.47 קבוצות בתוך SSW=27.07 n-k=36-4=32 קבוצות סה"כ SST=34.54 n-1=35 k-1=4-1=3 SSB =2.49 MSB k 1 SSW =0.845 MSW nk יחס F MSB =2.94 MSW F החלטת החוקר : FC FK 1,n K , F3,32,0.05 2.92 ) - F (2.94) FC (2.92ברמת מובהקות של , 0.05דוחים את השערת האפס יש הבדל בין מחזורי המסחר במדדי הבורסה השונים.. 2.92 2.94 דחיית H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע קבלת H 0 317 .2 רמת המוטיבציה גבוהה נמוכה סה"כ כיתות ו-ט 42 35 77 כיתות ד-ו 35 28 63 סה"כ 128 107 235 כיתות י-יב 51 44 95 הטבלה היא טבלת הצפייה –. o נבנה את הטבלה הצפויה למצב של אי תלות – . e רמת המוטיבציה גבוהה נמוכה סה"כ כיתות ו-ט 41.94 35.06 77 כיתות ד-ו 34.31 28.69 63 כיתות י-יב 51.75 43.25 95 סה"כ 128 107 235 המבחן הסטטיסטי השערות: א. : H0 : H1 אין תלות בין גיל לבין מוטיבציה להיות בתנועה. יש תלות בין גיל לבין מוטיבציה להיות בתנועה. ב. רמת מובהקות המבחן 0.01 ד. תחומי דחייה /קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 3121,0.99 C 2 2,0.99 9.21 הערך הנבחן מול הגבול הקריטי: (35 34.31) 2 (28 28.69) 2 (42 41.94) 2 (35 35.06) 2 34.31 28.69 41.94 35.06 אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 eij תחום קבלת H 0 9.21 ערך 2 ij (51 51.75) 2 (44 43.25) 2 0.054 51.75 .43.25 תחום דחית H 0 ד. eij o 2 0.054 החלטה 2 הנבדק , 0.054קטן מהגבול הקריטי , 9.21לכן נקבל את השערת האפס אין תלות בין גיל לבין מוטיבציה להיות בתנועת נוער. ה. מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני . © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 318 פתרון חלק ב .1 )P(1 P 0.51 0.49 0.02235 n 500 255 P 0.51. 500 n 500 P 0.45 0.51 0.45 2.68 1 0.9963 0.0037 0.02235 Z 1 סיכויי השגיאה הם . 0.37% התשובה הנכונה ד .2החוקר ניסח השערה דו כיוונית לכן עבד עם 0.9963 0.0074 2 2 1 סיכויי השגיאה 0.74% 0.975 0.05 ' 0.1 .3 ' 2 1.88 0.95 1 ' 2 t 14,1 תשובה נכונה א .4 ^ S 2.2891 38.4. n 10 0 40 40 38.4 2.21 0.95 1 ' 0.975 0.025 0.05 2.2891 10 תשובה נכונה ב .5 ד הספורטאי א ב ג מאמן 76 85 70.5 76.5 74 מאמנת 72.5 85 75 72.5 72 D -3.5 0 -1.5 2 -2 ^ S d 1.8708 ה n5 1 1.195 0.75 1 ' 0.9 0.1 ' 0.25 1.8708 5 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע t 9,1 ' d 1 t 4,1 ' 319 בדיקת רמת המובהקות המינימאלית מראה כי היא גבוהה מ( 0.05-רמת המובהקות במחקר) ולכן זוהי שגיאה מסוג שני , לכן 0.1 0.25 התשובה הנכונה ב .6טבלה של 2/2מהווה 1דרגת חופש ולכן הגבול הקריטי הוא ,3.84הערך הנבדק הוא 9ולכן דוחים את השערת האפס. בטבלת ,5/2יש 4דרגות חופש לכן הגבול הקריטי הוא , 9.49הערך הנבדק הוא 9כלומר מקבלים את השערת האפס. תשובה נכונה ב. .7רמת מובהקות של 2.5%במבחן חד צדדי ,מייצרת את אותו גבול כמו רמת מובהקות של 5%במבחן דו צדדי, לכן נקבל את אותה מסקנה. אם דחינו את השערת האפס אין זה אומר כי זו רמת המובהקות המינימאלית – .רמת המובהקות המינימאלית נקבעת ע"פ התוצאות בפועל ,ואילו רמת המובהקות ע"י הגדרות המחקר .לכן רק הטענה הראשונה נכונה תשובה נכונה ג .8 Z 0.975 1.96 2 2 n 206.59 1 Z 1100 L 300 1.96 1100 n 300 2 2 Z ) (1 2 n L 2 תשובה נכונה ג .9 ככל שהמדגם גדול יותר ,אורך הרווח יהיה קטן יותר .ככל שרמת הביטחון גדולה יותר ,רמת המובהקות קטנה יותר ולכן הרווח ארוך יותר .לכן רק טענה 2נכונה. תשובה נכונה ד. .10 מבחן דו כיווני ,שני מדגמים בלתי תלויים ,סטית התקן באוכלוסיה לא ידועה. נחשב את רמת המובהקות המינימאלית: © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 320 n 2 15 S 2 10 X 2 90 n1 17 S 1 16 )S 1 (n1 1) S 2 (n 2 1) 16 2 (17 1) 10(15 1 S 183.2 n1 n 2 2 30 2 2 2 X 1 98 X1 X 2 8 2 2 S S 183.2 183.2 4.794 n1 n 2 17 15 8 ' 1.668 1 0.95 ' 0.1 4.794 2 ' דוחים את השערת האפס ' מקבלים את השערת האפס ' 2 1715 2 ,1 t תשובה נכונה ד .11 השערת האפס נדחית במבחן דו צדדי ברמת מובהקות של ,2%אזי במבחן חד צדדי בטוח נדחה ברמת מובהקות של .1%בכל רמת מובהקות גדולה מ 1%בטוח נדחה את השערת האפס . לכן יש יותר מתשובה אחת נכונה – א ,ב ,ג נכונות. ? .12 2 1 Z n 26 L5 L 4 5 Z 1 2 26 2 2 0.975 0.05 2 4 n 1.96 1 2 2 1 1 Z Z חישבנו את רמת המובהקות – 0.05כלומר רמת הביטחון היא ,95%לכן תשובות א,ב,ג נכונות התשובה הנכונה היא ה – יש יותר מתשובה אחת נכונה © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 321 פתרון מבחן 6 .1א מבחן דו כווני ,סטיית תקן לא ידועה ,מבחן tלשני מדגמים בלתי תלויים. נתונים: S 1 20.26 X 1 74.57 . n1 7ג S 2 12.8 X 2 86.71 . n2 7ד X 2 X 1 12.14 1 0 H 0 :אין הבדל בין המלצרים. 1 2 0 H1 :קיים הבדל בין המלצרים. 2 רמת מובהקות 0.05 נחשב את השונות המשוקללת: )S 1 (n1 1) S 2 (n2 1 287.26 n1 n2 2 2 2 2 2 S 2 S S 0 2.179 9.0594 19.74 n1 n2 C 1 2 t n1 n 22,1 תחום דחית H 0 תחום קבלת H0 19.74 0 12.14 19.74 הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את השערת האפס אין הבדל בין שכר המלצרים ג, ו-ד. ב .מבחן על תוחלת של אוכלוסייה כאשר סטית התקן לא ידועה 93 t ( 7 1)(10.01) t 6,0.99 3.143 S 12.8 0 86.71 .1השערות : .2 86.71 H0 : שכר האח אינו שונה משכרו של מלצר ד. 86.71 H1 : שכר האח גבוה משכרו של מלצר ד. 0.01 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 322 .3 תחומי דחייה וקבלה להשערת האפס תחום דחית H 0 S C 0 t( n1),(1 ) n 100.96 12.8 7 H0 C 86.71 3.143 מקבלים את השערת האפס. .4 תחום קבלת 93 100.96 86.71 החלטה השכר הממוצע של האח ₪ 93נמצא בתחום קבלת השערת האפס ,נקבל את השערת האפס. שכר האח אינו גבוה משכרו של מלצר ד. טעות אפשרית .5 קבלנו את H 0הטעות האפשרית – טעות מסוג שני - קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. 100.96 93 1.68 4.837 ברמה של 9דרגות חופש הערך נמצא מתאים ל- , 0. 05 0.1 0.9 1 0.95 ) הסיכוי לשגיאה במסקנה הוא בין .10% - 5% ג. C S n t 6,(1 ) ( להשוואה בין 4מדגמים נשתמש בניתוח שונות חד כווני – ANOVA - H 0 : 1 2 3 4אין הבדל בין השכר היומי הממוצע של ארבעת המלצרים - H1 : 1 2 3 4יש הבדל בין השכר היומי הממוצע של ארבעת המלצרים. רמת מובהקות 0.05 : נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון): ב א ד ג n1 7 n1 7 n1 7 n1 7 x 1 77.57 x 1 77.43 x 1 74.57 x 1 86.71 S 1 711.62 2 S 1 484.95 2 S 1 410.62 2 77.57 7 77.43 7 74.57 7 86.71 7 79.07 7777 S 1 163.9 2 X ממוצע משוקלל SSB ni ( xi x) 2 7 77.57 79.07 7 77.43 79.07 2 2 i 7 74.57 79.07 7 86.71 79.07 584.91 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 323 SSW (ni 1) S i 6 711.62 6 484.95 6 410.62 6 163.9 10626.54 2 i מקור סכום ריבועים ממוצע ריבועים דרגות חופש יחס F השונות בין k-1=4-1=3 SSB=584.91 SSB =194.97 k 1 קבוצות בתוך SSW=10626.54 n-k=28-4=24 SSW =442.77 nk קבוצות סה"כ SST=11211.45 MSB MSW MSB =0.44 MSW F n-1=27 החלטת החוקר : FC FK 1,n K , F3, 24,0.05 3.0088 ) - FC (3.0088) F (0.44ברמת מובהקות של , 0.05מקבלים את השערת האפס אין הבדל בין הכנסות המלצרים. )0.44 FC (3.0088 דחיית H 0 .2 קבלת H 0 מספר תאונות 23-30 17-22מעל 30 85 40 30 15 עד 1 85 35 25 25 מעל 1 170 75 55 40 סה"כ הטבלה היא טבלת הצפייה –. o נבנה את הטבלה הצפויה למצב של אי תלות – . e מספר תאונות 23-30 17-22מעל 30 37.5 27.5 20 עד 1 37.5 27.5 20 מעל 1 75 55 40 סה"כ © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 85 85 170 324 המבחן הסטטיסטי השערות: א. : H0 אין תלות בין גיל הנהג לבין מספר תאונות הדרכים. : H1 יש תלות בין גיל הנהג למספר תאונות הדרכים. ב. רמת מובהקות המבחן 0.01 ה. תחומי דחייה /קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 3121,0.99 C 2 2,0.99 9.21 הערך הנבחן מול הגבול הקריטי: (15 20) 2 (30 27.5) 2 (40 37.5) 2 (25 20) 2 20 27.5 37.5 20 אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 eij תחום קבלת H 0 9.21 ערך 2 (25 27.5) 2 (35 37.5) 2 3.287 27.5 .37.5 תחום דחית H 0 ד. eij ij o 2 3.287 החלטה 2 הנבדק , 3.287קטן מהגבול הקריטי , 9.21לכן נקבל את השערת האפס אין תלות בין גיל הנהג לבין מספר תאונות הדרכים. מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני . ה. פרק שני .1מחצית הרווח היא ,5.47 5.47 5.47 1.96 12.48 n 20 ) (1 2 5.47 Z 0.975 0.05 2 1.96 1 n ) (1 2 ) (1 2 Z Z רמת הסמך = רמת ביטחון = 1 1 0.05 0.95 תשובה א ,נכונה. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 325 .2הכלל אומר: ' דוחים את השערת האפס ' מקבלים את השערת האפס מאחר ורמת המובהקות המינימלית היא ,5%המשמעות היא שבכל רמת מובהקות גבוהה מ 5%-נדחה את השערת האפס ,ובכל רמת מובהקות הקטנה או שווה ל 5%-נקבל את השערת האפס. מנתונים אלו עולה המסקנה כי תשובה ג נכונה. .3השערה חד כיוונית כלפי מעלה ,מבחן ,tמאחר והשונות באוכלוסייה אינה ידועה .נתון לנו כי הערך המתקבל בטבלת ,tהוא .2.45על סמך ערך זה ו 29-דרגות חופש נחפש את ההסתברות בטבלה .ערך זה נמצא בטבלה ( )2.46תחת עמודה .0.99 כלומר רמת המובהקות המינימאלית היא .1% ' דוחים את השערת האפס ' מקבלים את השערת האפס כלומר בכל רמת מובהקות הגבוהה מ ,1%-דוחים את השערת האפס. התשובה הנכונה ג. .4מבחן השערות דו כיווני (אין הבדל בתוחלת זמן השיחה בטלפון סלולארי בין שתי הערים) ,שני מדגמים בלתי תלויים ,סטיות תקן באוכלוסיות ידועות – מבחן .Z א .השערות : 1 2 0 H 0 :אין הבדל בתוחלת זמן השיחה בטלפון סלולארי בין שתי הערים. 1 2 0 H1 :יש בתוחלת זמן השיחה בטלפון סלולארי בין שתי הערים. ב .רמת מובהקות 0.05 ג. תחומי קבלה /דחייה לH 0 - מאחר והתשובות מתמקדות בשתי רמות מובהקות – ,0.05ו ,0.1-נבדוק גבולות קריטיים עבור שתי רמות אלו. 22 n2 Z 0.975 1.96 12 n1 Z 0.95 1.65 C 1 2 Z 1 2 4.84 3.61 0.8859 10 12 22 n2 12 n1 1 2 0 C0.05 0 1.96 0.8859 1.736 C0.1 0 1.65 0.8859 1.461 הפרש הממוצעים הוא ,3.66ואותו אנו בודקים מול הגבולות הקריטיים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 326 חישבנו את הגבולות הקריטיים עבור רמות מובהקות של 0.1ו 0.05-בשני הגבולות הפרש הממוצעים 3.66עובר את הגבול הקריטי ,ולכן בשתי רמות המובהקות ,נדחה את השערת האפס. תשובה ד נכונה. יוסי .5 שאול דני משה דוד לפני 76 85 70.5 76.5 74 אחרי 72.5 85 75 72.5 72 D 3.5 0 1.5 -2 2 ^ n5 S d 2.0916 d 1 מאחר ואין אנו יודעים אם מדובר על שגיאה מסוג ראשון או שני ,נבדוק בשלב ראשון ,אם מקבלים או דוחים את השערת האפס. 1.994 2.0916 5 2.132 S n C 0 t n1,1 ע"פ הגבול הקריטי אשר קיבלנו ,אנחנו מקבלים את השערת האפס ,לכן השגיאה האפשרית במחקר ,היא שגיאה מסוג שני 1.994 1 1.062 0.75 1 0.9 0.1 0.25 2.0916 5 t 4,1 שגיאה מסוג שני , לכן 0.1 0.25 התשובה הנכונה ב .6 כאשר מגדילים את המדגם פי ,Kמקצרים את הרווח פי שורש של ,Kלכן אם מדגם אחד גדול מהשני פי ,5הרווח יתקצר פי שורש של חמש – .2.236 לכן התשובה הנכונה היא ג. .7 החישוב אשר התקבל לאחר בדיקת המדגם ,ה t-הסטטיסטי ,הוא למעשה הערך המתקבל בטבלה ,לכן נחפש בטבלה ב 4-דרגות חופש ,את הערך הנ"ל (בערכו המוחלט). הערך מתאים ל ,0.975-כלומר רמת מובהקות של ,0.025מאחר והמבחן הוא דו כיווני 0.05 , ' דוחים את השערת האפס ' מקבלים את השערת האפס תשובה נכונה א. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 327 .8 טענה ראשונה :כאשר בודקים טענה חד צדדית ,ברמת מובהקות מסוימת וטענה דו צדדית ברמת מובהקות כפולה ,מקבלים את אותן גבולות קריטיים ולכן בהכרח מגיעים לאותן מסקנות – .הטענה נכונה. טענה שנייה :קבלת השערת האפס עבור רמת מובהקות מסוימת ,אין בא כדי לומר מאומה על רמת המובהקות המינימלית ,ולכן קבלה ברמת מובהקות של ,5%אינה מציגה כל נתון על רמת המובהקות המינימאלית – .הטענה אינה נכונה. .9 תשובה נכונה ג. טענה ראשונה :ככל שלוקחים מדגם גדול יותר הרווח קצר יותר – כאשר מגדילים את הדגם פי Kמקצרים את הרווח פי שורש של – .Kהטענה נכונה. טענה שנייה :ככל שרמת הביטחון גדולה יותר (רמת המובהקות קטנה יותר) הרווח גדול יותר .הטענה נכונה. תשובה נכונה א. .10 100 C 0 20 n8 Z 1 n n תשובה נכונה ב. C 110 C 0 Z 1 110 100 1.41 1 0.9207 0.0793 20 8 .11 1.96 ) (1 2 16.97 Z 11.76 16.97 8 Z 1 X 74.62 1.96 n ) (1 2 Z 74.62 11.76 תשובה נכונה ג. 2 .12 L 0.5 Z ) (1 2 n L 2 3.4 Z 1.96 ) (1 2 2 תשובה נכונה א. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 1.96 3.4 n n 710.54 0 .5 2 328 פתרון מבחן 7 לפתרון השאלה יש צורך בהשוואה בין ארבעה מדגמים, .1א. לכן נשתמש בניתוח שונות חד כווני – ANOVA - H 0 : 1 2 3 4אין הבדל בהכנסות ,בין הסניפים השונים של הרשת. - H1 : 1 2 3 4יש הבדל בהכנסות בין הסניפים השונים של הרשת. רמת מובהקות 0.05 : נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון): ב א ד ג n1 5 n1 7 n1 7 n1 5 x 1 16.40 x 1 16.29 x 1 14.57 x 1 14.4 S 1 4. 3 2 S 1 13.24 2 S 1 2.62 2 16.4 5 16.29 7 14.57 7 14.4 5 15.41 5775 S 1 6 .3 2 X ממוצע משוקלל SSB ni ( xi x) 2 5 16.4 15.41 7 16.29 15.41 2 2 i 7 14.57 15.41 5 14.4 15.41 20.29048 2 2 SSW (ni 1) S i 5 4.3 7 13.24 7 2.62 5 6.3 137.5429 2 i מקור סכום ריבועים דרגות חופש ממוצע ריבועים יחס F השונות בין SSB=20.29048 k-1=4-1=3 קבוצות בתוך SSW=137.5426 n-k=24-4=20 קבוצות סה"כ SST=157.833 SSB =6.763492 k 1 SSW =6.87714 nk MSB MSW MSB =0.9834 MSW F n-1=23 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 329 החלטת החוקר : FC FK 1,n K , F3, 24,0.05 3.098 ) FC (3.098) -F (0.98347ברמת מובהקות של , 0.05מקבלים את השערת האפס בהכנסות בין הסניפים השונים של הרשת.. ) 0.98 FC (3.098 דחיית H 0 .2 קבלת H 0 מבחן השערות דו כיווני (אין הבדל בתוחלת צריכת הפיצה) ,שני מדגמים בלתי תלויים ,סטיות תקן באוכלוסיות לא ידועות – מבחן . t ב .השערות : 1 2 0 H 0 :אין הבדל בצריכת הפיצות בין תושבי רמת גן לתושבי נתניה. 1 2 0 H1 :אין הבדל בצריכת הפיצות בין תושבי רמת גן לתושבי נתניה. ג .רמת מובהקות 0.04 ג. תחומי קבלה /דחייה לH 0 - S 1 (n1 1) S 2 (n2 1) 4.3 4 13.24 6 S 9.664 n1 n2 2 10 2 2 2 2 2 S S 0 2.228 1.82 4.055 n1 n2 2 n1 n 2 2 ,1 C 1 2 t תחום דחית H 0 תחום קבלת H0 4.055 0.11 0 4.055 הפרש הממוצעים הוא ,0.11ואותו אנו בודקים מול הגבולות הקריטיים. חישבנו את הגבולות הקריטיים – . 4.055מקבלים את השערת האפס – אין הבדל בצריכת הפיצה בין שתי הערים. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 330 ד .החלטת החוקר -מקבלים את השערת האפס – אין הבדל בצריכת הפיצה בין שתי הערים ,ברמת מובהקות של .5% ה .שגיאה אפשרית – השגיאה האפשרית היא שגיאה מסוג שני , קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. חישוב סיכויי השגיאה – 4.055 0.11 2.16 1.82 2 7 5 2 ,1 t C X1 X 2 2 2 2 S S n1 n2 0.5 0.1 5% 10% 0.975 2 n1 n 2 2 ,1 t 0.95 1 ג .מבחן השערות על תוחלת ,סטית תקן באוכלוסייה ידועה ,מבחן Zחד כווני כלפי: מבחן סטטיסטי .1 השערות 15.1 : H 0 :סניף נתניה אינו סניף "חזק" ביחס לשאר סניפי הרשת. 15.1 סניף נתניה הוא סניף "חזק" ביחס לשאר סניפי הרשת. H1 : 0.03 .2 רמת מובהקות .3 תחומי קבלה ודחית H 0 השערה חד כיוונית - n 1.118 Z 1 Z 10.03 Z 0.97 1.78 2.5 5 C 0 Z 1 0 15.1 n C 15.1 1.78 1.118 17.09 השיטה הקלאסית – גבולות קריטיים תחום דחית H 0 תחומי קבלה /דחייה לH 0 - תחום קבלת H0 נדחה את השערת האפס. 17.09 .4 16.4 15.1 החלטת החוקר - נקבל את H 0ונדחה את השערת המחקר – סניף נתניה אינו סניף "חזק" ביחס לשאר סניפי הרשת. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 331 .5 השגיאה האפשרית : קיבלנו את השערת האפס ,השגיאה האפשרית – קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. שגיאה מסוג שני . 17.09 16.4 0.617 2.5 5 חישוב השגיאה האפשרית: 26.76% 0.2676 Z1 B C Z1 n 1 0.7324 Z1 0.62 ד .יש לחשב רמת מובהקות מינימלית לדחיית השערת האפס: 17.09 15.1 1.78 2.5 5 ' 3.75% ' 0.0375 Z1 ' 0 Z1 ' n 1 ' 0.9625 Z1 ' 1.78 .2 סה"כ מדעי הרוח מדעי הטבע מדעי החברה 56 47 50 153 8 14 5 27 64 61 55 180 טיפוס אישיות א' טיפוס אישיות ב' סה"כ הטבלה היא טבלת הצפייה –. o נבנה את הטבלה הצפויה למצב של אי תלות – . e סה"כ מדעי הרוח מדעי הטבע מדעי החברה 54.4 51.85 46.75 153 9.6 9.15 8.25 27 64 61 55 180 טיפוס אישיות א' טיפוס אישיות ב' סה"כ המבחן הסטטיסטי א. ב. השערות: : H0 אין תלות בין אישיות הסטודנט לבין תחום לימודיו. : H1 יש תלות בין אישיות הסטודנט לבין תחום לימודיו. רמת מובהקות המבחן 0.05 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 332 תחומי דחייה /קבלה לH 0 - ג. את הגבול הקריטי מוצאים בטבלת 2 C 2 3121,0.99 C 2 2,0.99 5.99 הערך הנבחן מול הגבול הקריטי: אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 (50 46.75) 2 (47 51.85) 2 (56 54.4) 2 (5 5.25) 2 46.75 51.85 54.4 8.25 eij 2 ij eij o 2 (14 9.15) 2 (8 9.6) 2 4.84 9.15 9.6 תחום דחית H 0 תחום קבלת H 0 5.99 ד. ערך 4.84 החלטה 2 הנבדק , 4.84קטן מהגבול הקריטי , 5.99לכן נקבל את השערת האפס -אין תלות בין אישיות הסטודנט ,לבין תחום לימודיו. מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני . ה. פרק שני .1 0 10 14.5 6 C 15 n9 15 14.5 0.25 1 0.5987 0.0.4013 40.13% 6 9 Z1 תשובה נכונה ב. .2 ' דוחים את השערת האפס ' מקבלים את השערת האפס תשובה נכונה ד. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 333 2 n 20 .3השערה דו כיוונית. Z 2.33 ' ' 2.33 1 0.99 0.01 ' 0.02 2% 2 2 ' 2 1 Z התשובות הנכונות א +ג ,כלומר תשובה נכונה ה. .4 336 0.84 400 P n 400 2.18 1 ' 0.9854 ' 0.0146 1.46% התשובה הנכונה ג. P0 0.8 0.84 0.8 0.84 0.16 400 Z 1 ' .5נתון כי הטענה נבדקה ברמת מובהקות של ,1%ברמת מובהקות זו אנחנו מקבלים את השערת האפס ,ולכן יש טעות מסוג שני ,לכן יש לחשב את , כדי לחשב את , יש לחשב את .C 0.84 0.16 0.8427 400 0.8427 0.84 0.1472 0.15 1 0.5596 0.4404 44.04% 0.84 0.16 400 C 0.8 2.33 Z 1 תשובה נכונה א. .6מבחן – שני מדגמים מזווגים ,מבחן דו כווני. השערות: D 0 H0 : D 0 H1 : .7רמת המובהקות המינימלית: n5 S 3.78 2.4 ' 1.42 0.75 1 0.9 0.2 ' 0.5 3.78 2 תשובה נכונה ב X 2.4 ' t n 1,1 2 5 .8ככל שמקטינים את אלפא – מגדילים את רמת הביטחון ,כלומר מגדילים את הרווח. ככל שמגדילים את גודל המדגם מקטינים את הרווח – הגדלת מדגם פי ,Kתקטין את הרווח פי K אז מה קורה במקרה המתואר? הרווח התקצר פי 2מאחר והמדגם גדל פי ,4אולם הקטינו את אלפא ,לכן הרווח התרחב/התארך. תשובה נכונה ב. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 334 200 0.4 500 .9 n 500 P 2.28 1 ' 0.9887 ' 0.0113 1.13% P0 0.35 0.4 0.35 0.4 0.6 500 Z 1 ' מצאנו את רמת המובהקות המינימאלית ,כדי לפרסם שהתמיכה בו עלתה ,צריך לדחות את השערת האפס, בהתאם לכלל: ' דוחים את השערת האפס ' מקבלים את השערת האפס התשובה הנכונה היא ב. .10נבדוק את שתי הטענות: טענה ראשונה -ברמת מובהקות של 5%דו צדדי ,נקבל 2.5%מכל צד ,ולכן אם רמת המובהקות המינימאלית היא ,2%אזי נדחה את השערת האפס – טענה נכונה. טענה שנייה – אם רמת המובהקות המינימלית במבחן חד צדדי היא ,4%אזי במבחן דו צדדי בו מחלקים את אלפא לשניים ,נגיע לאותה נקודה עם רמת מובהקות של - 4%הטענה נכונה. התשובה הנכונה א. .11מבחן ,tסטית התקן לא ידועה ,נמצא את רמת המובהקות: 110 100 1.414 20 8 Z 1 1 0.9 0.1 תשובה נכונה ב. 12 n8 S 20 t ( n 1) (1 ) 2.896 S 0.431 X 4.68 2 0.431 0.1765 20 8 תשובה © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2.896 S n t 4.68 0.1765 335 פתרון מבחן 8 .1א .שני מדגמים בלתי תלויים ,מבחן דו כווני ,סטית תקן לא ידועה – מבחן . t .1השערות : 1 2 0 H 0 :אין הבדל במחיר סל קניות לחג ,בין שתי הרשתות. 1 2 0 H1 :יש הבדל במחיר סל קניות לחג ,בין שתי הרשתות.. .2רמת מובהקות 0.1 ג. n2 7 תחומי קבלה /דחייה לH 0 - _ X 2 982.86 S 2 106.1 n1 9 _ X 1 1048.89 S 1 178.92 )S 1 (n1 1) S 2 (n2 1 23116.55 n1 n2 2 2 2 2 2 S S 0 1.761 76.62 134.93 n1 n2 2 n1 n 2 2 ,1 C 1 2 t תחום דחית H 0 תחום קבלת H0 134.93 0 66.03 134.93 הפרש הממוצעים הוא 66.03ואותו אנו בודקים מול הגבולות הקריטיים. חישבנו את הגבולות הקריטיים – . 134.93מקבלים את השערת האפס – אין הבדל במחיר סל קניות לחג בין שתי הרשתות. ד .החלטת החוקר -מקבלים את השערת האפס – ברמת מובהקות של ,5%אין הבדל במחיר סל קניות לחג בין שתי הרשתות. ה .שגיאה אפשרית – השגיאה האפשרית היא שגיאה מסוג שני , קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. חישוב סיכויי השגיאה – 134.93 66.03 0.8992 76.62 2 7 5 2 ,1 t C X1 X 2 2 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 0.9 2 S S n1 n2 0.2 0.5 20% 50% 2 S 2 n1 n 2 2 ,1 t 0.75 1 336 ב .בדיקת השערות חד כיוונית כלפי מטה ,השוואה בין תוחלות ,סטיית התקן לא ידוע – מבחן . t מבחן סטטיסטי .1 השערות 120 : H0 : עלות סל קניות לחג גדולה מ.₪ 1120 - 1120 H1 : עלות סל קניות לחג ,נמוכה מ.₪ 1120- 0.05 .2 רמת מובהקות .3 תחומי קבלה ודחית H 0 S השערה חד כיוונית כלפי מטה - n C 0 t n 1,1 t n 1,1 t 8,0.95 1.860 59.64 178.92 9 S n 0 1120 C 1120 1.860 56.94 1009.07 תחום דחית H 0 גבולות קריטיים תחומי קבלה /דחייה לH 0 - תחום קבלת H0 נקבל את השערת האפס. .4 1120 החלטת החוקר - 1009.07 1048.89 נקבל את H 0ונדחה את השערת המחקר – סל קניות השנה אינו זול יותר ביחס לשנה שעברה. .5 השגיאה האפשרית : קיבלנו את השערת האפס ,השגיאה האפשרית – קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה. שגיאה מסוג שני . חישוב השגיאה האפשרית: 25% 40% ג. 1048.89 1009.07 0.6677 178.91 9 0.25 0.4 t 8,1 0.6 1 0.75 C t 8,1 S n 0.6677 t8,1 ניתוח שונות חד כווני – ,ANOVAלהשוואה בין ארבעה מדגמים: - H 0 : 1 2 3 4אין הבדל בעלות סל קניות לחג ,בין הרשתות השונות. - H1 : 1 2 3 4יש הבדל בעלות סל קניות לחג ,בין הרשתות השונות. רמת מובהקות 0.05 : © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 337 נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון): תמוי עגול ב א n1 9 n1 7 n1 8 n1 9 x1 1048.89 x 1 982.86 x 1 922 x1 955.56 S 1 178.92 2 2 S 1 106.12 2 S 1 84.23 2 2 S 1 108.18 2 2 1048.89 9 982.86 7 922 8 955.56 9ממוצע משוקלל X 978.66 9789 SSB ni ( xi x) 2 74999.37 SSW (ni 1) S i 466918 2 i i מקור סכום ריבועים ממוצע ריבועים דרגות חופש יחס F השונות בין k-1=4-1=3 SSB=74999.37 SSB =24999.79 k 1 קבוצות בתוך SSW=466918 n-k=33-4=29 MSB =16100.62 קבוצות SSW nk MSB =1.55 MSW F MSW החלטת החוקר : FC FK 1,n K , F3, 29,0.05 2.934 )FC (2.934)- F (1.55 ברמת מובהקות של , 0.05מצאנו כי אין הבדל בעלות סל קניות לחג בין הסניפים – מקבלים את הטענה כי קיים קרטל והשוואת מחירים בין הסניפים )1.55 FC ( 2.934 דחיית H 0 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע קבלת H 0 338 הטבלה הנתונה היא טבלת הצפייה –. o .2 תפוקה משמרת בוקר תפוקה גבוהה תפוקה נמוכה סה"כ 35 20 55 משמרת צהרים 20 30 50 משמרת ערב 95 75 170 40 25 65 נבנה את הטבלה הצפויה למצב של אי תלות – . e תפוקה משמרת בוקר תפוקה גבוהה תפוקה נמוכה סה"כ 30.74 24.26 55 משמרת צהרים 27.94 22.06 50 משמרת ערב 95 75 170 36.32 28.68 65 המבחן הסטטיסטי : H0 אין בין שעות המשמרת לבין תפוקת העובד. א. השערות: : H1 יש תלות בין שעות המשמרת לתפוקת העובד. ב. רמת מובהקות המבחן 0.01 ג. תחומי דחייה /קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 3121,0.99 C 2 2,0.99 5.99 הערך הנבחן מול הגבול הקריטי: (35 30.74) 2 (20 24.26) 2 (20 27.94) 2 (30 22.06) 2 30.74 24.26 27.94 22.06 eij 2 ij o eij 2 (40 36.32) 2 (25 28.68) 2 7.3 36.32 28.68 תחום דחית H 0 תחום קבלת H 0 7.3 ד. ערך 5.99 החלטה 2 הנבדק , 7.3גבוה מהגבול הקריטי , 5.99לכן נדחה את השערת האפס ונקבל את השערת המחקר -יש תלות בין המשמרת לבין התפוקה. ה. מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון -אלפא. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 339 פרק שני .1 0 52.26 ' S 8.62 X 46.1 n9 52.263 46.1 2.26 1 0.975 ' 0.05 5% 8.62 2 התשובה הנכונה ד. 10 t 91,1 ' 2 .2שני מדגמים מזווגים ,מבחן דו כווני – כדי לדעת מהי השגיאה האפשרית ,עלינו לדעת בשלב ראשון האם מדובר על שגיאה מסוג ראשון או שגיאה מסוג שני – אלפא או ביתא. לכן נחשב את רמת המובהקות המינימלית ונשווה ל - 5%-רמת המובהקות במדגם. X 8.6 n5 S 8.93 8.6 0 ' 2.15 0.95 1 0.975 5% ' 10% 8.93 2 ' t 41,1 2 5 ' דוחים את השערת האפס ' מקבלים את השערת האפס רמת המובהקות היא ,5%ורמת המובהקות המינימלית היא בין 5%ל ,10%-לכן מקבלים את השערת האפס – בכדי לחשב את סיכויי השגיאה במסקנות ,עלינו לחשב את ביתא - ,בכדי לחשב את ביתא ,עלינו לחשב את הגבול הקריטי – .C 11.086 תשובה נכונה ד. 8.93 5 C 0 2.776 S n S 8.93 C 0 t n 1,1 X 8.6 n5 2 11.086 8.6 0.6224 0.6 1 0.75 50% 80% 8.93 2 t 4,1 5 .3בשלב ראשון נחשב את רמת המובהקות המינימלית: 0 7580 S 637.883 n7 X 7074.29 7580 7074.29 2.097 0.95 1 ' 0.975 2.5% ' 5% 637.883 ' דוחים את השערת האפס ' מקבלים את השערת האפס t 7 1,1 ' 7 מאחר ורמת המובהקות המינימלית קטנה מ ,5%-כלומר קטנה מרמת המובהקות של המחקר ,דוחים את השערת האפס ,ולכן הסיכויים האמיתיים לשגיאה שווים לרמת המובהקות המינימלית. תשובה נכונה א. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 340 2 .4אם נבצע את אותה בדיקה על מדגם כפול – נקצר את אורך הרווח ,אך לא תהיה לכך כל השפעה על רמת המובהקות – משפט לא נכון. אם נשתמש ברמת מובהקות כפולה ובמבחן דו צדדי – מאחר ונחלק את אלפא לשניים ,נגיע לאותו גבול קריטי ולכן בהכרח לאותן מסקנות – משפט נכון. התשובה הנכונה ד. .5נחשב את רמת המובהקות המינימאלית: 241 P 0.3089 780 1.74 1 ' 0.9591 ' 0.409 4.09% התשובה הנכונה ב. n 780 P0 0.28 0.3089 0.28 Z 1 ' 0.3089 0.6910 780 .6מאחר ורמת המובהקות המינימלית היא ,4.09%ברור כי ניתוח ברמת מובהקות של ,2%משמעותו ,קבלת השערת האפס ,מאחר וההפקה קיבלה את אותה מסקנה ,יש כאן שגיאה – שגיאה מסוג שני. נחשב את ,Cבמטרה לאפשר לנו לחשב את ביתא. )P (1 P n Z 0.98 2.05 C P0 Z1 241 P 0.3089 780 n 780 P0 0.28 0.3089 0.6910 0.3139 780 0.3139 0.3089 0.3022 1 0.6179 0.3821 38.21% 0.3089 0.6910 התשובה הנכונה ד. 780 C 0.28 2.05 .7מבחן דו כווני ,סטית התקן באוכלוסייה ידועה – התפלגות ,Zע"ס תוצאות המדגם קיבל בטבלה 1.96 Z ' 1.96 ' 0.05 2 1 ' דוחים את השערת האפס ' מקבלים את השערת האפס תשובה א נכונה. .8 12 L9 תשובה נכונה ב. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע Z 0.99 2.33 Z 1 2 n L 2 2.33 12 n n 38 9 2 341 Z1 .9אין קשר בין גודל המדגם לבין בדיקה חד/דו כיוונית ,הגבול יהיה זה בהתאם ליחסים בין רמות המובהקות ולא המדגמים – אף תשובה אינה נכונה – תשובה נכונה ב. .10שני מדגמים בלתי תלויים ,סטיות תקן לא ידועות – מבחן ,tנחשב את רמת המובהקות המינימאלית. S 2 36 __ X 2 197.8 n2 17 __ S 1 20 X 1 180 n1 15 S 1 (n1 1) S 2 (n2 1) 400 14 1296 16 S 877.86 n1 n2 2 30 2 1.696 (197.8 180) 0 t 30,1 ' 877.86 877.86 15 17 X 2 1 2 2 2 2 1 X 2 t n1 n 2 2,1 ' S S n1 n2 ' 0.05 ' 5% ' דוחים את השערת האפס ' מקבלים את השערת האפס 1 ' 0.95 התשובה הנכונה ד. t15,1 ' 2.13 .11ע" הנתונים ' 0.25 : n 16 S 6 ' דוחים את השערת האפס ' מקבלים את השערת האפס התשובה הנכונה היא ה – תשובות ג+ד נכונות. .12 t 29, 0.995 2.756 0.01 ) 2 29,(1 t ) ( n 1), (1 2 S 11 t X 134 S S X t X t ) ( n 1)(1 ( n 1 () 1 ) n n 2 2 11 11 134 2.756 30 30 134 2.756 128.46 139.53 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 342 פתרון מבחן 9 1א .מבחן השערות על תוחלת ,סטית תקן באוכלוסייה ידועה ,מבחן Zחד כווני כלפי: א .השערות : 52500 H 0 :מכירת חביתות ירק ,לא תשפר את ההכנסות. 52500 H1 :מכירת חביתות ירק ,תשפר את ההכנסות. ב. רמת מובהקות 0.04 ג .תחומי קבלה ודחית H 0 השערה חד כיוונית - n Z 1 Z 10.04 Z 0.96 1.75 8500 12 56794 תחומי קבלה /דחייה לH 0 - 12 0 52500 n 8500 C 0 Z 1 C 52500 1.75 תחום דחית H 0 תחום קבלת נדחה את השערת האפס. H0 ד .החלטת החוקר - 57500 52500 56794 נדחה את H 0ונקבל את השערת המחקר – הוספת חביתות ירק ,משפרת את הרווחיות. ה. השגיאה האפשרית : דחינו את השערת האפס ,השגיאה האפשרית – דחינו את השערת האפס בזמן שהשערת האפס נכונה. שגיאה מסוג ראשון . חישוב השגיאה האפשרית: 57500 52500 2.03 8500 12 ' 2.12% © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע ' 0.0212 Z1 ' 1 ' 0.9788 0 Z1 ' n Z1 ' 2.03 343 על מדגם של 18( 45%סניפים) ,בודקים כדאיות הכנסת נקניקיות לתפריט – מבחן על תוחלת ,מבחן חד כווני כלפי מעלה ,סטית התקן ידועה – מבחן .Z א .השערות : 52500 H 0 :מכירת נקניקיות ,לא תשפר את ההכנסות. 52500 H1 :מכירת נקניקיות ,תשפר את ההכנסות. ב. רמת מובהקות 0.05 ג .תחומי קבלה ודחית H 0 השערה חד כיוונית - n Z 1 Z 10.05 Z 0.95 1.65 8500 18 55805 18 0 52500 n 8500 C 0 Z 1 C 52500 1.65 תחום דחית H 0 תחום קבלת H0 נדחה את השערת האפס. 58200 52500 55805 ד .החלטת החוקר - נדחה את H 0ונקבל את השערת המחקר – הוספת נקניקיות ,תשפר את הרווחיות. ה .השגיאה האפשרית : דחינו את השערת האפס ,השגיאה האפשרית – דחינו את השערת האפס בזמן שהשערת האפס נכונה. שגיאה מסוג ראשון . חישוב השגיאה האפשרית: 58200 52500 2.85 8500 18 ' 0.22% ' 0.0022 Z1 ' 1 ' 0.9978 0 Z1 ' n Z1 ' 2.85 שני השינויים טובים לרשת בבדיקת שני השינויים חל שיפור ברווחיות. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 344 1ב .כוונת המנהל היא – שני השינויים :חביתות ירק/נקניקיות ,משפרים את הרווחיות באותה מידה ,השאלה היא אם הטענה שלו נכונה. בכדי לבדוק זאת – נבחן שני מדגמים בלתי תלויים ,מבחן דו כווני ,סטיות התקן ידועות. השערות : א. 1 2 0 H0 : אין הבדל ברווחיות כתוצאה מהוספת נקניקיות/חביתות ירק 1 2 0 H1 : אין הבדל ברווחיות כתוצאה מהוספת נקניקיות/חביתות ירק ב. רמת מובהקות 0.05 ג. תחומי קבלה /דחייה לH 0 - השערה דו כיוונית – יש לחשב שני גבולות קריטיים: 22 n2 12 n1 22 C1 1 2 Z 1 2 Z 0.975 1.96 Z 1 2 n2 12 n1 8500 2 8500 2 3470.11 12 18 C1 0 3470.11 1.96 6801.41 C 2 1 2 Z 1 2 22 n2 12 n1 1 2 0 C2 0 3470.11 1.96 6801.41 הגבול הקריטי הוא 6801.41 תחום דחית H 0 תחום קבלת H0 6801 700 0 6801 X 1 X 2 58200 57500 700 מקבלים את השערת האפס. ד. החלטת החוקר ההפרש בין הממוצעים נמצא בתחום קבלת השערת האפס ,מקבלים את השערת האפס ,ודוחים את השערת המחקר -אין הבדל ברווחיות בין הוספת חביתות ירק או נקניקיות לתפריט. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 345 השגיאה האפשרית ה. קיבלנו את השערת האפס ,השגיאה האפשרית -קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה כלומר שגיאה מסוג שני . (X 1 X 2 ) C 22 n2 12 (X 1 X 2 ) C Z 1 2 22 n2 n1 12 Z 1 2 n1 6801 700 1.75 3470.11 0.0802 8.02% Z 1 2 0.9599 2 1 1ג .לפתרון השאלה יש צורך בהשוואה בין ארבעה מדגמים, לכן נשתמש בניתוח שונות חד כווני – ANOVA - H 0 : 1 2 3 4אין הבדל בהכנסות ,בין הסניפים השונים של הרשת. - H1 : 1 2 3 4יש הבדל בהכנסות בין הסניפים השונים של הרשת. רמת מובהקות 0.05 : נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון): ב א ד ג n1 9 n1 6 n1 7 n1 8 x1 4.93 x 1 5.08 x 1 5.19 x 1 5.03 S 1 0.55 2 2 S 1 0.412 2 S 1 0.57 2 2 S 1 0.63 2 2 X 5.046ממוצע משוקלל SSB ni ( xi x) 2 0.2627 i SSW (ni 1) S i 8.0519 2 i מקור סכום ריבועים דרגות חופש ממוצע ריבועים יחס F השונות בין SSB=0.2627 k-1=4-1=3 קבוצות בתוך SSW=8.0519 n-k=30-4=26 קבוצות © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע SSB =0.08756 k 1 SSW =0.3096 nk MSB MSW MSB =0.2828 MSW F 346 החלטת החוקר : FC FK 1,n K , F3, 26,0.05 2.975 ברמת מובהקות של , 0.05מקבלים את השערת האפס )FC (2.975) F (0-.2828 אין הבדל בהכנסות בין הסניפים השונים של הרשת.. )0.2828 FC ( 2.975 קבלת H 0 דחיית H 0 .2 סה"כ 312 188 500 השקעות ללא סיכון 100 60 160 השקעות בסיכון נמוך 92 78 170 השקעות בסיכון 120 50 170 רווקים נשואים סה"כ הטבלה היא טבלת הצפייה –. o נבנה את הטבלה הצפויה למצב של אי תלות – . e סה"כ השקעות ללא סיכון 312 188 500 99.84 60.16 160 השקעות בסיכון נמוך 106.08 63.92 170 השקעות בסיכון 106.08 63.92 170 רווקים נשואים סה"כ המבחן הסטטיסטי א. השערות: : H0 אין תלות בין מצב משפחתי ללקיחת סיכונים בהשקעות. : H1 יש תלות בין מצב משפחתי ללקיחת סיכונים בהשקעות. ב. רמת מובהקות המבחן 0.05 ג. תחומי דחייה /קבלה לH 0 - את הגבול הקריטי מוצאים בטבלת 2 C 2 3121,0.95 C 2 2,0.95 5.99 הערך הנבחן מול הגבול הקריטי: © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 347 אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את H 0 eij 2 9.82 ij o eij תחום דחית H 0 תחום קבלת H 0 9.82 ד. ערך 2 5.99 החלטה 2 הנבדק , 9.82ערך זה גדול מהגבול הקריטי , 5.99לכן נדחה את השערת האפס -יש תלות בין המצב המשפחתי לבין לקיחת סיכונים בהשקעות. ה. מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון. פרק שני .1נחשב את רמת המובהקות המינימאלית. 230 0.46 500 P n 500 1.79 1 ' 0.9633 ' 0.0367 3.67% ' דוחים את השערת האפס ' מקבלים את השערת האפס P0 0.42 0.46 0.42 0.46 0.54 500 Z 1 ' חל גידול באחוז התומכים ב.B- .2חישבנו בסעיף א – .3.67% .3שני מדגמים מזווגים – נחשב את רמת המובהקות המינימאלית. S 8.37 __ X 8.83 n6 8.83 0 2.58 1 ' 0.975 ' 0.025 2.5% 8.37 t 5'1 ' 6 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 348 .4 0.02 2% 0.99 2 1 2.412 2 ' דוחים את השערת האפס ' מקבלים את השערת האפס 29,1 t תשובה נכונה ד. .5 0.876 0.24 0.2 0.24 0.76 350 84 0.24 350 Z1 ' P 35 0.2 175 P0 1 ' 0.8106 ' 18.94% תשובה נכונה א. .6 79.73 S 7 1 ' 0.975 ' 2.5% 79.73 76 2.13 7 10 0 76 n 16 0 t15,1 ' S n תשובה ב נכונה. t15,1 ' .7בדיקה ברמת מובהקות של ,1%משמעותה קבלת השערת האפס ,לכן השגיאה היא שגיאה מסוג שני – ביתא .בכדי לחשב את ביתא ,יש צורך לחשב את .C 7 80.55 16 80.55 79.73 t15,1 0.4705 7 16 0.6 1 0.75 0.5 0.8 .8 1 2 0 H 0 :אין הבדל בדקות דיבור בין גברים לנשים. 1 2 0 H1 :יש אין הבדל בדקות דיבור בין גברים לנשים. n2 9 S 2 22.32 _ n1 9 X 2 191.22 C 76 2.602 S 1 13.88 t15,1 _ X 1 168.55 )S 1 (n1 1) S 2 (n2 1 S 345.48 n1 n2 2 2 ' 0.99 ' 2% 2 1 2 191.22 168.55 2.587 345.48 345.48 9 9 ברמת מובהקות של ,6%דוחים את השערת האפס. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 349 2 t ' 16,1 2 .9ברמת מובהקות של ,1%מקבלים את השערת האפס ,לכן השגיאה היא מסוג שני – ביתא. נחשב את .C 0.75 0.5 0.8 2 0.6 1 התשובה הנכונה ב. .10 ' דוחים את השערת האפס ' מקבלים את השערת האפס C 0 2.921 8.76 25.58 25.58 22.66 t 0.3341 16,1 8 . 762 2 ע"פ האמור בטבלה – טענה א נכונה ואילו טענה ב לא נכונה. התשובה הנכונה ג. .11אם נגדיל את המדגם מ 40-ל ,100-נגדיל אותו פי ,2.5לכן הרווח יתקצר פי 2.5 4111 3035 4111 התשובה הנכונה ב. .12 __ X 78 S 6 t19,0.975 2.093 6500 2.5 3035 4800 2.5 n 20 6 6 78 2.093 20 20 75.19 80.80 78 2.093 התשובה הנכונה ב. © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 350 השימוש במחשבון Casio fxלחישובים סטטיסטיים עיינו באיור בעמוד הבא .1 לשימושים סטטיסטיים יש לעבור ל mode -סטטיסטי -לחצו על modeואח"כ על המספר 2 .2 כדי לצאת חזרה כלומר לבטל את ה mode -הסטטיסטי יש ללחוץ modeואח"כ את המספר 1 * חשוב לציין כי עד שלא יבוטל המצב הסטטיסטי הנתונים שהזנתם ישמרו במחשבון , גם לאחר שהמחשבון יכבה . כאשר עובדים עם נתונים בודדים – כלומר ללא שכיחות – כל נתון מופיע כערך בודד לאחר שעברתם ל mode-סטטיסטי נזין נתונים : 4נלחץ על ( m+הכפתור הימני ביותר למטה בקבוצת הכפתורים השחורים באמצע) 6נלחץ על m+ xi 7נלחץ על m+ 4 10נלחץ על m+ 6 7נלחץ על m+ 8 כל הנתונים הוזנו ניתן לקבל חישובים: 10 נלחץ על shiftואח"כ על 2 7 3 נקבל על המסך : xn 1 2 1 xn x כאשר נלחץ 1ואח"כ = נקבל את הממוצע כאשר נלחץ 2ואח"כ = נקבל את סטית התקן כאשר נלחץ 3ואח"כ = נקבל אומדן לסטיית התקן באוכלוסיה S אם הזנתם את הנתונים הרשומים בטבלה הנ"ל תקבלו: x7 xn 2 xn 1 2.236 כאשר עובדים עם נתונים עם שכיחות (מספר הפעמים שמופיע כל נתון): .1נזין את הנתונים כפי שהזנו בדוגמא הקודמת .2נזין את השכיחות :נלחץ על החץ התחתון (בכפתור ה) Replay - נקבל את ערך , x1נלחץ שוב על החץ התחתון נקבל Freq1 כלומר נוכל להזין את השכיחות של משתנה מס' 1נלחץ = את המספר ושוב = וכך נרד ונזין את כל השכיחויות © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 351 .3לאחר שהזנו את כל הנתונים ניתן לקבל את כל החישובים בהתאם לסעיף הקודם אם עקבתם אחרי ההסבר והזנתם את נתוני הטבלה הנ"ל תקבלו: xn 1 1.67 xn 1.63 x 7.238 שימוש במקש shiftואח"כ 1יפתח מסך 3 = נקבל את סה"כ הנבדקים n fi 2 5 7 3 4 xi 4 6 8 10 7 =2 n Ex Ex 2 3 2 1 נקבל את סה"כ עמוד xi fi = 1נקבל את סה"כ עמודת ( xi x)2 fiכלומר E ( xi x)2 fi Replay - Mode 2כניסה - Mode 1יציאה Shift 2 M+ הזנת נתונים Shift 1 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 352 לוח התפלגות נורמאלית – Z The Standardized Normal Distribution 0.09 0.0010 0.0014 0.0019 0.0026 0.0036 0.0048 0.0064 0.0084 0.0110 0.0143 0.0183 0.0233 0.0294 0.0367 0.0455 0.0560 0.0680 0.0820 0.0980 0.1170 0.1380 0.1610 0.1870 0.2150 0.2450 0.2780 0.3120 0.3480 0.3859 0.4247 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.08 0.0010 0.0014 0.0020 0.0027 0.0037 0.0049 0.0066 0.0087 0.0113 0.0146 0.0188 0.0238 0.0301 0.0375 0.0465 0.0570 0.0690 0.0840 0.1000 0.1190 0.1400 0.1630 0.1890 0.2180 0.2480 0.2810 0.3160 0.3520 0.3897 0.4286 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.07 0.0011 0.0015 0.0021 0.0028 0.0038 0.0051 0.0068 0.0089 0.0116 0.0150 0.0192 0.0244 0.0307 0.0384 0.0475 0.0580 0.0710 0.0850 0.1020 0.1210 0.1420 0.1660 0.1920 0.2210 0.2510 0.2840 0.3190 0.3560 0.3936 0.4325 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.06 0.0011 0.0015 0.0021 0.0029 0.0039 0.0052 0.0069 0.0091 0.0119 0.0154 0.0197 0.0250 0.0314 0.0392 0.0485 0.0590 0.0720 0.0870 0.1040 0.1230 0.1450 0.1680 0.1950 0.2240 0.2550 0.2880 0.3230 0.3590 0.3974 0.4364 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.05 0.0011 0.0016 0.0022 0.0030 0.0040 0.0054 0.0071 0.0094 0.0122 0.0158 0.0202 0.0256 0.0322 0.0401 0.0495 0.0610 0.0740 0.0890 0.1060 0.1250 0.1470 0.1710 0.1980 0.2270 0.2580 0.2910 0.3260 0.3630 0.4013 0.4404 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 0.04 0.0012 0.0016 0.0023 0.0031 0.0041 0.0055 0.0073 0.0096 0.0125 0.0162 0.0207 0.0262 0.0329 0.0409 0.0505 0.0620 0.0750 0.0900 0.1070 0.1270 0.1490 0.1740 0.2000 0.2300 0.2610 0.2950 0.3300 0.3670 0.4052 0.4443 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.03 0.0012 0.0017 0.0023 0.0032 0.0043 0.0057 0.0075 0.0099 0.0129 0.0166 0.0212 0.0268 0.0336 0.0418 0.0520 0.0630 0.0760 0.0920 0.1090 0.1290 0.1520 0.1760 0.2030 0.2330 0.2640 0.2980 0.3340 0.3710 0.4009 0.4483 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.02 0.0013 0.0017 0.0024 0.0033 0.0044 0.0059 0.0078 0.0102 0.0132 0.0170 0.0217 0.0274 0.0344 0.0427 0.0530 0.0640 0.0780 0.0930 0.1110 0.1310 0.1540 0.1790 0.2060 0.2360 0.2680 0.3010 0.3370 0.3750 0.4129 0.4522 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.01 0.0013 0.0018 0.0025 0.0034 0.0045 0.0060 0.0080 0.0104 0.0135 0.0174 0.0222 0.0281 0.0350 0.0436 0.0540 0.0650 0.0790 0.0950 0.1130 0.1340 0.1560 0.1810 0.2090 0.2390 0.2710 0.3050 0.3410 0.3780 0.4168 0.4562 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 Z -3.0 -2.9 -2.8 -2.7 -2.6 -2.5 -2.4 -2.3 -2.2 -2.1 -2.0 -1.9 -1.8 -1.7 -1.6 -1.5 -1.4 -1.3 -1.2 -1.1 -1.0 -0.9 -0.8 -0.7 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 0.00 0.0013 0.0019 0.0026 0.0035 0.0046 0.0062 0.0082 0.0107 0.0139 0.0179 0.0227 0.0287 0.0359 0.0446 0.0550 0.0670 0.0810 0.0970 0.1150 0.1360 0.1590 0.1840 0.2120 0.2420 0.2740 0.3080 0.3450 0.3820 0.4207 0.4602 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 353 לוח התפלגות - tערכי tקריטיים Student t distribution – Critical Values of t df / 1 0.9995 636.578 31.600 12.924 8.610 6.869 5.959 5.408 0.995 63.656 9.925 5.841 4.604 4.032 3.707 3.499 0.99 31.821 6.965 4.541 3.747 3.365 3.143 2.998 0.975 12.706 4.303 3.182 2.776 2.571 2.447 2.365 0.95 6.314 2.920 2.353 2.132 2.015 1.943 1.895 0.9 3.078 1.886 1.638 1.533 1.476 1.440 1.415 0.75 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.6 0.325 0.289 0.277 0.271 0.267 0.265 0.263 1 2 3 4 5 6 7 5.041 4.781 4.587 4.437 4.318 4.221 4.140 4.073 4.015 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.690 0.262 0.261 0.260 0.260 0.259 0.259 0.258 0.258 0.258 8 9 10 11 12 13 14 15 16 3.965 3.922 3.883 3.850 3.819 3.792 3.768 3.745 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.257 0.257 0.257 0.257 0.257 0.256 0.256 0.256 17 18 19 20 21 22 23 24 3.725 3.707 3.689 3.674 3.660 3.646 3.551 3.460 2.787 2.779 2.771 2.763 2.756 2.750 2.704 2.660 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.390 2.060 2.056 2.052 2.048 2.045 2.042 2.021 2.000 1.708 1.706 1.703 1.701 1.699 1.697 1.684 1.671 1.316 1.315 1.314 1.313 1.311 1.310 1.303 1.296 0.684 0.684 0.684 0.683 0.683 0.683 0.681 0.679 0.256 0.256 0.256 0.256 0.256 0.256 0.255 0.254 25 26 27 28 29 30 40 60 3.373 3.291 2.617 2.576 2.358 2.326 1.980 1.960 1.658 1.645 1.289 1.282 0.677 0.674 0.254 0.253 120 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 354 התפלגות 2 0.995 7.8794 10.60 12.84 14.86 16.75 18.55 20.28 21.95 23.59 25.19 26.76 28.30 29.82 31.32 32.80 34.27 35.72 37.16 38.58 40.00 41.40 42.80 44.18 45.56 46.93 48.29 49.65 50.99 52.34 53.67 79.49 116.32 140.17 0.99 6.6349 9.21 11.34 13.28 15.09 16.81 18.48 20.09 21.67 23.21 24.73 26.22 27.69 29.14 30.58 32.00 33.41 34.81 36.19 37.57 38.93 40.29 41.64 42.98 44.31 45.64 46.96 48.28 49.59 50.89 76.15 112.33 135.81 0.975 5.0239 7.38 9.35 11.14 12.83 14.45 16.01 17.53 19.02 20.48 21.92 23.34 24.74 26.12 27.49 28.85 30.19 31.53 32.85 34.17 35.48 36.78 38.08 39.36 40.65 41.92 43.19 44.46 45.72 46.98 71.42 106.63 129.56 0.95 3.8415 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.68 25.00 26.30 27.59 28.87 30.14 31.41 32.67 33.92 35.17 36.42 37.65 38.89 40.11 41.34 42.56 43.77 67.50 101.88 124.34 0.9 2.7055 4.61 6.25 7.78 9.24 10.64 12.02 13.36 14.68 15.99 17.28 18.55 19.81 21.06 22.31 23.54 24.77 25.99 27.20 28.41 29.62 30.81 32.01 33.20 34.38 35.56 36.74 37.92 39.09 40.26 63.17 96.58 118.50 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2 -ערכים קריטיים Critical Values of 0.1 0.0158 0.21 0.58 1.06 1.61 2.20 2.83 3.49 4.17 4.87 5.58 6.30 7.04 7.79 8.55 9.31 10.09 10.86 11.65 12.44 13.24 14.04 14.85 15.66 16.47 17.29 18.11 18.94 19.77 20.60 37.69 64.28 82.36 0.05 0.0039 0.103 0.352 0.711 1.15 1.64 2.17 2.73 3.33 3.94 4.57 5.23 5.89 6.57 7.26 7.96 8.67 9.39 10.12 10.85 11.59 12.34 13.09 13.85 14.61 15.38 16.15 16.93 17.71 18.49 34.76 60.39 77.93 0.025 0.0010 0.0506 0.216 0.484 0.831 1.24 1.69 2.18 2.70 3.25 3.82 4.40 5.01 5.63 6.26 6.91 7.56 8.23 8.91 9.59 10.28 10.98 11.69 12.40 13.12 13.84 14.57 15.31 16.05 16.79 32.36 57.15 74.22 0.01 0.0002 0.0201 0.115 0.297 0.554 0.872 1.24 1.65 2.09 2.56 3.05 3.57 4.11 4.66 5.23 5.81 6.41 7.01 7.63 8.26 8.90 9.54 10.20 10.86 11.52 12.20 12.88 13.56 14.26 14.95 29.71 53.54 70.06 0.005 0.0000 0.0100 0.072 0.207 0.412 0.676 0.989 1.34 1.73 2.16 2.60 3.07 3.57 4.07 4.60 5.14 5.70 6.26 6.84 7.43 8.03 8.64 9.26 9.89 10.52 11.16 11.81 12.46 13.12 13.79 27.99 51.17 67.33 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 50 80 100 355 טבלת התפלגות Fעבור 0.05 INF 120 60 40 30 24 20 15 12 10 9 8 7 6 5 4 3 2 1 df2/df1 161.448 199.5 215.707 224.583 230.162 233.99 236.768 238.883 240.543 241.882 243.91 245.95 248.013 249.052 250.095 251.143 252.196 253.253 254.314 1 18.5128 19 19.1643 19.2468 19.2964 19.33 19.3532 19.371 19.3848 19.3959 19.413 19.4291 19.4458 19.4541 19.4624 19.4707 19.4791 19.4874 19.4957 2 8.572 10.128 9.552 9.2766 9.1172 9.0135 8.9406 8.8867 8.8452 8.8123 8.7855 8.7446 8.7029 8.6602 8.6385 8.6166 8.5944 3 5.6877 5.6581 5.6281 7.7086 6.944 6.5914 6.3882 6.2561 6.1631 6.0942 4 6.6079 5.786 5.4095 5.1922 5.0503 4.9503 4.8759 4.8183 4.7725 4.7351 4.6777 4.6188 4.5581 4.5272 4.4957 4.4638 4.4314 4.3985 5 5.9874 5.143 4.7571 4.5337 4.3874 4.2839 4.2067 4.1468 6 5.5914 4.737 4.3468 4.1203 3.9715 3.866 7 5.3177 4.459 4.0662 3.8379 3.6875 3.5806 3.5005 3.4381 3.3881 3.3472 3.2839 3.2184 3.1503 3.1152 3.0794 3.0428 3.0053 2.9669 2.9276 8 5.1174 4.257 3.8625 3.6331 3.4817 3.3738 3.2927 3.2296 3.1789 3.1373 3.0729 3.0061 2.9365 2.9005 2.8637 2.8259 2.7872 2.7475 2.7067 9 4.9646 4.103 3.7083 10 2.4045 2.448 2.5705 2.5309 2.4901 4.8443 3.982 3.5874 3.3567 3.2039 3.0946 3.0123 11 2.2962 2.341 4.7472 3.885 3.4903 3.2592 3.1059 2.9961 2.9134 2.8486 2.7964 2.7534 2.6866 2.6169 2.5436 2.5055 2.4663 2.4259 2.3842 12 4.6672 3.806 3.4105 3.1791 3.0254 2.9153 2.8321 2.7669 2.7144 13 4.6001 3.739 3.3439 3.1122 2.9582 2.8477 2.7642 2.6987 2.6458 2.6022 2.5342 2.463 14 4.5431 3.682 3.2874 3.0556 2.9013 2.7905 2.7066 2.6408 2.5876 2.5437 2.4753 2.4034 2.3275 2.2878 2.2468 2.2043 2.1601 2.1141 2.0658 15 8.5494 8.5264 4.365 5.717 5.9988 5.9644 5.9117 5.8578 5.8025 5.7744 5.7459 3.9999 3.9381 3.8742 3.8415 3.8082 3.7743 3.7398 3.7047 3.6689 4.06 4.099 6.041 3.7257 3.6767 3.6365 3.5747 3.5107 3.4445 3.4105 3.3758 3.3404 3.3043 3.2674 3.2298 2.7372 2.6996 2.6609 2.6211 2.5801 2.5379 2.609 2.774 2.845 3.3258 3.2172 3.1355 3.0717 3.0204 2.9782 2.913 2.8962 2.8536 2.7876 2.7186 2.6464 2.671 2.6037 2.5331 2.4589 2.4202 2.3803 2.3392 2.2966 2.2524 2.2064 2.3879 2.3487 2.3082 2.2664 2.2229 2.1778 2.1307 3.787 2.948 3.478 4.494 3.634 3.2389 3.0069 2.8524 2.7413 2.6572 2.5911 2.5377 2.4935 2.4247 2.3522 2.2756 2.2354 2.1938 2.1507 2.1058 2.0589 2.0096 16 4.4513 3.592 3.1968 2.9647 17 4.4139 3.555 3.1599 2.9277 2.7729 2.6613 2.5767 2.5102 2.4563 2.4117 2.3421 2.2686 2.1906 2.1497 2.1071 2.0629 2.0166 1.9681 1.9168 18 4.3807 3.522 3.1274 2.8951 2.7401 2.6283 2.5435 2.4768 2.4227 2.3779 2.308 2.2341 2.1555 2.1141 2.0712 2.0264 1.9795 1.9302 19 4.3512 3.493 3.0984 2.8661 2.7109 2.599 20 4.3248 3.467 3.0725 2.8401 2.6848 2.5727 2.4876 2.4205 21 4.3009 3.443 3.0491 2.8167 2.6613 2.5491 2.4638 2.3965 2.3419 2.2967 2.2258 2.1508 2.0707 2.0283 1.9842 22 4.2793 3.422 3.028 23 4.2597 3.403 3.0088 2.7763 2.6207 2.5082 2.4226 2.3551 2.3002 2.2547 2.1834 2.1077 2.0267 1.9838 24 4.2417 3.385 2.9912 2.7587 25 4.2252 3.369 2.9752 2.7426 2.5868 2.4741 2.3883 2.3205 2.2655 2.2197 2.1479 2.0716 1.9898 1.9464 26 2.0584 2.0107 1.9604 1.878 2.104 2.4943 2.4499 2.3807 2.3077 2.2304 2.1898 2.1477 2.548 2.4471 2.3928 2.3479 2.2776 2.2033 2.1242 2.0825 2.0391 1.9938 1.9464 1.8963 1.8432 2.0102 1.9645 1.9165 1.8657 1.8117 1.8894 1.938 2.054 2.096 2.321 2.2504 2.1757 2.366 2.6987 2.6143 2.514 2.81 1.7831 1.838 1.757 1.9605 1.9139 1.8648 1.8128 1.733 1.8424 1.7896 1.939 1.711 2.603 2.4904 2.4047 2.3371 2.2821 2.2365 2.1649 2.0889 2.0075 1.9643 1.9192 1.8718 1.8217 1.7684 1.892 1.8533 1.8027 1.7488 1.6906 1.901 2.005 2.5277 2.4422 2.3748 2.3201 2.2747 2.2036 2.1282 2.0476 2.64 2.7955 3.354 2.9604 2.7278 2.5719 2.4591 2.3732 2.3053 2.2501 2.2043 2.1323 2.0558 1.9736 1.9299 1.8842 1.8361 1.7851 1.7306 1.6717 4.21 27 3.34 2.9467 2.7141 2.5581 2.4453 2.3593 2.2913 4.196 28 4.183 3.328 2.934 29 4.1709 3.316 2.9223 2.6896 2.5336 2.4205 2.3343 2.2662 2.2107 2.1646 2.0921 2.0148 1.9317 1.8874 1.8409 1.7918 1.7396 1.6835 1.6223 30 2.124 2.1802 2.4495 2.3359 2.249 4.0847 3.232 2.8387 40 2.0401 1.9926 1.9174 1.8364 2.097 4.0012 3.15 2.7581 2.5252 2.3683 2.2541 2.1665 60 1.3519 1.2539 1.429 3.9201 3.072 2.6802 2.4472 2.2899 2.175 2.0868 2.0164 1.9588 1.9105 1.8337 1.7505 1.6587 1.6084 1.5543 1.4952 120 1.2214 1.318 3.8415 2.996 2.6049 2.3719 2.2141 2.0986 2.0096 1.9384 1.8799 1.8307 1.7522 1.6664 1.5705 1.5173 1.4591 inf 2.1179 2.0411 1.9586 1.9147 1.8687 1.8203 1.7689 1.7138 1.6541 2.19 2.236 2.7014 2.5454 2.4324 2.3463 2.2783 2.2229 2.1768 2.1045 2.0275 1.9446 1.9005 1.8543 1.8055 1.7537 1.6981 1.6376 2.0772 2.0035 1.9245 1.8389 1.7929 1.7444 1.6928 1.6373 1.5766 1.5089 1.7001 1.6491 1.5943 1.5343 1.4673 1.3893 1 1.394 1.748 © כל הזכויות שמורות למחבר – ד"ר אופיר ברנע 2.606 356 © ברנע כל הזכויות שמורות למחבר – ד"ר אופיר ברנע אופיר ברנע ד"ר אופיר ד"ר w ww ww w..oopphhiirrbbaarrnneeaa..ccoo..iill 357