- הצהרת הבעיה במבחן מאן-וויטני U
- משתנים איכותיים לעומת משתנים כמותיים
- מקרה רגיל
- מקרה עם טרנד לא נורמלי
- דוגמאות זוגות או לא מותאמים
- מאפייני מבחן מאן וויטני U
- נוסחת מאן - וויטני
- שלבים להחלת המבחן
- דוגמא ליישום מעשי
- - שלב 1
- - שלב 2
- אזור א
- אזור ב
- שלב 3
- שלב 4
- קריטריונים להשוואה
- מחשבונים מקוונים למבחן מאן - וויטני U
- הפניות
מבחן Mann-Whitney U מיושם לצורך השוואה בין שתי דגימות עצמאיות כאשר אין להם מעט נתונים או שאינם עוקבים אחר תפוצה רגילה. באופן זה היא נחשבת למבחן לא פרמטרי, בשונה ממבחן ה- t ההומולוגי של הסטודנטים, המשמש כאשר המדגם גדול מספיק ועוקב אחר התפלגות רגילה.
פרנק וילקוקסון הציע זאת לראשונה בשנת 1945, לדגימות בגדלים זהים, אך שנתיים לאחר מכן הוא הוארך למקרה של דגימות בגדלים שונים על ידי הנרי מאן וד"ר ויטני.
איור 1. מבחן Mann-Whitney U מיושם לצורך השוואה של דגימות עצמאיות. מקור: Pixabay.
המבחן מיושם לרוב בכדי לבדוק האם יש קשר בין משתנה איכותי ומשתני.
דוגמא להמחשה היא לקחת קבוצה של אנשים עם יתר לחץ דם ולחלץ שתי קבוצות, מהן נרשמים נתונים על לחץ דם יומי במשך חודש.
הטיפול A מיושם על קבוצה אחת והטיפול בקבוצה B. כאן לחץ הדם הוא המשתנה הכמותי וסוג הטיפול הוא האיכותי.
אנו רוצים לדעת אם החציון, ולא הממוצע של הערכים הנמדדים זהה סטטיסטית זהה או שונה, כדי לקבוע אם יש הבדל בין שני הטיפולים. כדי להשיג את התשובה, מיושם סטטיסטיקת Wilcoxon או מבחן Mann-Whitney U.
הצהרת הבעיה במבחן מאן-וויטני U
דוגמה נוספת בה ניתן ליישם את הבדיקה היא הבאה:
נניח שאתה רוצה לדעת אם צריכת המשקאות הקלים שונה באופן משמעותי בשני אזורי הארץ.
אחד מהם נקרא אזור A והאזור השני B. רישום של ליטרים שנצרכים מדי שבוע בשתי דגימות: אחד מתוך 10 אנשים לאזור A ושני של 5 אנשים עבור אזור B.
הנתונים הם כדלקמן:
אזור א : 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
אזור ב : 12,14, 11, 30, 10
נשאלת השאלה הבאה:
משתנים איכותיים לעומת משתנים כמותיים
משתנה איכותי X : אזור
משתנה איכותי Y : צריכת משקאות קלים
אם כמות ליטר הנצרכת זהה בשני האזורים, המסקנה תהיה כי אין תלות בין שני המשתנים. הדרך לברר היא להשוות את המגמה הממוצעת או החציונית לשני האזורים.
מקרה רגיל
אם הנתונים עוקבים אחר התפלגות רגילה, מוצעות שתי השערות: האפס H0 והחלופה H1 באמצעות השוואה בין האמצעים:
- H0 : אין הבדל בין הממוצע של שני האזורים.
- H1 : האמצעים של שני האזורים שונים.
מקרה עם טרנד לא נורמלי
נהפוך הוא, אם הנתונים אינם עוסקים בפיזור רגיל או שהמדגם פשוט קטן מכדי לדעת זאת, במקום להשוות את הממוצע, יש להשוות בין חציון שני האזורים.
- H0 : אין הבדל בין החציון של שני האזורים.
- H1 : החציונים של שני האזורים שונים זה מזה.
אם המדינים חופפים זה לזה, מתקיימת השערת האפס: אין קשר בין צריכת משקאות קלים לאזור.
ואם ההפך קורה, ההשערה האלטרנטיבית נכונה: יש קשר בין צריכה לאזור.
זה במקרים אלה שבהם מצוין מבחן מאן-וויטני U.
דוגמאות זוגות או לא מותאמים
השאלה החשובה הבאה בהחלטה אם להחיל את מבחן Mann Whitney U היא האם מספר הנתונים בשני הדגימות זהה, כלומר שהם נמצאים בשווי.
אם שתי הדגימות משויכות, גרסת Wilcoxon המקורית תחול. אבל אם לא, כמו שקורה בדוגמא, אז מיושם מבחן Wilcoxon המותאם, וזה בדיוק מבחן Mann Whitney U.
מאפייני מבחן מאן וויטני U
מבחן מאן-וויטני U הוא מבחן לא פרמטרי, החל על דגימות שאינן עוקבות אחר התפוצה הרגילה או עם מעט נתונים. יש לו את המאפיינים הבאים:
1.- השווה את המדדים
2.- זה עובד על טווחים שהוזמנו
3.- הוא פחות חזק, כלומר כוח הוא ההסתברות לדחות את השערת האפס כאשר היא שקרית.
אם לוקחים בחשבון מאפיינים אלה, מבחן מאן-וויטני U מיושם כאשר:
הנתונים אינם תלויים
-הם לא עוקבים אחר ההתפלגות הרגילה
-השערת האפס H0 מתקבלת אם החציונים של שתי הדגימות חופפים זה לזה: Ma = Mb
-ההשערה האלטרנטיבית H1 מתקבלת אם המדינים של שתי הדגימות נבדלים זה מזה: Ma ≠ Mb
נוסחת מאן - וויטני
המשתנה U הוא נתון הניגודיות ששימש במבחן מאן-וויטני ומוגדר כך:
משמעות הדבר היא ש- U הוא הקטן ביותר מבין הערכים בין UA ל- Ub, המיושם על כל קבוצה. בדוגמה שלנו זה יהיה לכל אזור: A או B.
המשתנים Ua ו- Ub מוגדרים ומחושבים לפי הנוסחה הבאה:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
כאן הערכים של Na ו- Nb הם הגדלים של הדגימות המתאימות לאזורים A ו- B בהתאמה, ומצדם, Ra ו- Rb הם סכומי הדירוג אותם נגדיר להלן.
שלבים להחלת המבחן
1.- הזמינו את הערכים של שתי הדגימות.
2.- הקצה דרגת הזמנה לכל ערך.
3.- תקן את הקשרים הקיימים בנתונים (ערכים חוזרים).
4.- חשב את Ra = סכום שורות המדגם A.
5.- מצא Rb = סכום דרגות המדגם B.
6.- קבע את הערך Ua ו- Ub, על פי הנוסחאות שניתנו בסעיף הקודם.
7.- השווה בין UA ו- Ub, והקטנה מבין השתיים מוקצית לנתון U הניסוי (כלומר של הנתונים) שמשווה לנתון U התיאורטי או הרגיל.
דוגמא ליישום מעשי
כעת אנו מיישמים את האמור לעיל על בעיית המשקאות הקלים שהועלו בעבר:
אזור A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
אזור B: 12,14, 11, 30, 10
תלוי אם האמצעים של שתי הדגימות הם סטטיסטיים זהים או שונים, השערת האפס מתקבלת או נדחית: אין קשר בין המשתנים Y ו- X, כלומר צריכת משקאות קלים אינה תלויה באזור:
H0: Ma = Mb
H1: Ma ≠ Mb
איור 2. נתוני צריכת המשקאות הקלים באזורים A ו- B. מקור: F. Zapata.
- שלב 1
אנו ממשיכים להזמין את הנתונים במשותף לשתי הדגימות, ומזמינים את הערכים מהנמוך ביותר לגבוהים:
שימו לב שהערך 11 מופיע פעמיים (פעם אחת בכל מדגם). במקור יש לו עמדות או טווחים 3 ו -4, אך כדי לא להפריז או להמעיט בערך זה או אחר, הערך הממוצע נבחר כטווח, כלומר 3.5.
באופן דומה, אנו ממשיכים עם הערך 12 שחוזר על עצמו שלוש פעמים בטווחים 5, 6 ו- 7.
ובכן, לערך 12 מוקצה הטווח הממוצע של 6 = (5 + 6 + 7) / 3. וזהה לערך 14, שיש לו ליגטורה (מופיע בשתי הדגימות) בעמדות 8 ו -9, מוקצה לו הטווח הממוצע 8.5 = (8 + 9) / 2.
- שלב 2
בשלב הבא, הנתונים לאזור A ו- B מופרדים שוב, אך כעת הטווחים התואמים שלהם מוקצים בשורה אחרת:
אזור א
אזור ב
הטווחים Ra ו- Rb מתקבלים מסכומי האלמנטים בשורה השנייה עבור כל מקרה ואזור.
שלב 3
ערכי ה- Ua וה- Ub בהתאמה מחושבים:
UA = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
ערך ניסוי U = דק '(19, 31) = 19
שלב 4
ההנחה היא כי ה- U התיאורטי עוקב אחר התפלגות נורמלית עם פרמטרים הניתנים באופן בלעדי בגודל הדגימות:
N ((na⋅nb) / 2, √)
על מנת להשוות את המשתנה U המתקבל בניסוי, עם U התיאורטי יש צורך לבצע שינוי משתנה. אנו עוברים מהמשתנה הניסוי לערך הסטנדרטי שלו, שייקרא Z, על מנת להיות מסוגלים לבצע את ההשוואה לזה של התפלגות נורמלית סטנדרטית.
שינוי המשתנה הוא כדלקמן:
Z = (U - na.nb / 2) / √
יש לציין כי לשינוי המשתנה נעשה שימוש בפרמטרים של התפלגות תיאורטית ל- U ואז משתנה המשתנה החדש Z, שהוא הכלאה בין U התיאורטי ל- U הניסוי, עם חלוקה נורמלית סטנדרטית N (0,1 ).
קריטריונים להשוואה
אם Z ≤ Zα ⇒ ההשערה האפסית H0 מתקבלת
אם Z> Zα ⇒ דוחים את השערת האפס H0
הערכים הקריטיים של ה- Zα תלויים ברמת הביטחון הנדרשת, לדוגמה, עבור רמת ביטחון α = 0.95 = 95%, שהוא הרגיל ביותר, הערך הקריטי Zα = 1.96 מתקבל.
לנתונים המוצגים כאן:
Z = (U - na nb / 2) / √ = -0.73
שהוא מתחת לערך הקריטי 1.96.
אז המסקנה הסופית היא שההשערה האפסית H0 מתקבלת:
מחשבונים מקוונים למבחן מאן - וויטני U
יש תוכניות ספציפיות לחישובים סטטיסטיים, כולל SPSS ו- MINITAB, אך תוכניות אלה משולמות והשימוש בהן לא תמיד קל. זה נובע מהעובדה שהם מספקים כל כך הרבה אפשרויות שהשימוש בהם שמור למעשה למומחים בסטטיסטיקה.
למרבה המזל, ישנן מספר תוכניות מקוונות מאוד מדויקות, חינמיות וקלות לשימוש המאפשרות לכם להריץ את מבחן Mann-Whitney U, בין היתר.
התוכניות הללו הן:
-סטטיסטיקה חברתית מדעית (socscistatistics.com), שיש לה גם את מבחן Mann-Whitney U וגם את מבחן Wilcoxon במקרה של דגימות מאוזנות או מזווגות.
-AI Therapy Statistics (ai-therapy.com), הכולל כמה מהבדיקות הרגילות לסטטיסטיקה התיאורית.
סטטיסטי לשימוש (physics.csbsju.edu/stats), אחד העתיקים ביותר, כך שהממשק שלו עשוי להיראות מיושן, אם כי בכל זאת מדובר בתוכנית חינמית יעילה מאוד.
הפניות
- דיטריסון. שיטות כמותיות: מבחן דירוג. התאושש מ: bookdown.org
- מדריך של SP Marin J P. SPSS: ניתוח ונהלים בבדיקות לא פרמטריות. התאושש מ: halweb.uc3m.es
- USOC MOOC. בדיקות לא-פרמטריות: מאן-וויטני U. התאושש מ-: youtube.com
- ויקיפדיה. מבחן מאן-וויטני U. התאושש מ: es.wikipedia.com
- XLSTAT. מרכז עזרה. הדרכה למבחן מאן - וויטני באקסל. התאושש מ: help.xlsat.com