- גודל המדגם
- מקרה 1: גודל האוכלוסייה אינו ידוע
- רמות אמון וערכי ה- Z המתאימים להם
- מקרה 2: ידוע גודל האוכלוסייה
- דוגמאות
- סקרים ושאלונים
- QA
- יתרון
- חסרונות
- התרגיל נפתר
- פִּתָרוֹן
- הפניות
הדגימה האקראית היא כיצד לבחור מדגם סטטיסטי מייצג של אוכלוסייה נתון. חלק מהעיקרון שלכל אלמנט במדגם חייב להיות אותו הסתברות להיבחר.
תיקו הוא דוגמה לדגימה אקראית, שבה לכל אחד מאוכלוסיית המשתתפים מוקצה מספר. כדי לבחור את המספרים התואמים את פרסי ההגרלה (המדגם) נעשה שימוש בטכניקה אקראית כלשהי, למשל לחילוץ מתיבת דואר את המספרים שנכתבו על כרטיסים זהים.
איור 1. בדגימה אקראית, המדגם נמשך מהאוכלוסיה באופן אקראי בטכניקה כלשהי שמבטיחה שלכל האלמנטים יש את אותה ההסתברות להיבחר. מקור: netquest.com.
בדגימה אקראית, חיוני לבחור את גודל המדגם באופן מתאים, מכיוון שמדגם לא מייצג של האוכלוסייה יכול להוביל למסקנות שגויות, בגלל תנודות סטטיסטיות.
גודל המדגם
ישנן נוסחאות לקביעת הגודל המתאים של המדגם. הגורם החשוב ביותר שיש לקחת בחשבון הוא האם ידוע גודל האוכלוסייה. בואו נסתכל על הנוסחאות לקביעת גודל המדגם:
מקרה 1: גודל האוכלוסייה אינו ידוע
כאשר גודל האוכלוסייה N אינו ידוע, ניתן לבחור מדגם בגודל n כדי לקבוע אם השערה מסוימת נכונה או שקרית.
לשם כך משתמשים בנוסחה הבאה:
איפה:
-p היא ההסתברות שההשערה נכונה.
-q הוא ההסתברות שזה לא, ולכן q = 1 - p.
-E הוא מרווח השגיאה היחסי, למשל לשגיאה של 5% יש מרווח של E = 0.05.
-Z קשורה לרמת הביטחון הנדרשת מהמחקר.
בהתפלגות נורמלית סטנדרטית (או מנוקדת), רמת ביטחון של 90% היא Z = 1,645, מכיוון שההסתברות שהתוצאה היא בין -1,645σ ל + 1,645σ היא 90%, כאשר σ היא סטיית התקן .
רמות אמון וערכי ה- Z המתאימים להם
1.- רמת ביטחון של 50% תואמת את Z = 0.675.
2.- 68.3% רמת ביטחון תואמת Z = 1.
3.- רמת ביטחון של 90% שווה ל- Z = 1,645.
4.- רמת ביטחון של 95% תואמת את Z = 1.96
5.- 95.5% רמת ביטחון תואמת Z = 2.
6.- 99.7% רמת ביטחון שווה ל- Z = 3.
דוגמא בה ניתן ליישם את הנוסחה הזו יכולה להיות במחקר לקביעת המשקל הממוצע של חלוקי נחל על חוף ים.
ברור שלא ניתן ללמוד ולשקול את כל חלוקי הנחל על החוף, ולכן רצוי להוציא מדגם כמה שיותר אקראי ועם מספר האלמנטים המתאים.
איור 2. כדי ללמוד את המאפיינים של חלוקי הנחל בחוף, יש צורך לבחור מדגם אקראי עם מספר מייצג מהם. (מקור: pixabay)
מקרה 2: ידוע גודל האוכלוסייה
כאשר ידוע מספר N של אלמנטים המרכיבים אוכלוסיה (או יקום) מסוימים, אם אנו רוצים לבחור מדגם משמעותי סטטיסטי בגודל n על ידי דגימה אקראית פשוטה, זו הנוסחה:
איפה:
-Z הוא המקדם הקשור ברמת הביטחון.
-p היא ההסתברות להצלחה של ההשערה.
-q הוא ההסתברות לכישלון בהשערה, p + q = 1.
-N הוא גודל האוכלוסייה הכוללת.
-E היא הטעות היחסית של תוצאת המחקר.
דוגמאות
המתודולוגיה לחילוץ הדגימות תלויה רבות בסוג המחקר שצריך לעשות. לכן, לדגימה אקראית יש מספר אינסופי של יישומים:
סקרים ושאלונים
לדוגמה, בסקרים טלפוניים, האנשים שאליהם ייעצו נבחרים באמצעות מחולל מספרים אקראיים, החל על האזור הנחקר.
אם ברצונך להחיל שאלון על עובדי חברה גדולה, אתה יכול לפנות לבחירת המשיבים באמצעות מספר העובדים שלהם, או מספר תעודת הזהות שלהם.
יש לבחור את המספר האמור גם באופן אקראי, בעזרת לדוגמא מחולל מספרים אקראיים.
איור 3. ניתן ליישם שאלון על ידי בחירה אקראית של המשתתפים. מקור: Pixabay.
QA
במקרה והמחקר הוא על חלקים המיוצרים על ידי מכונה, יש לבחור בחלקים באופן אקראי, אך מתוך קבוצות המיוצרות בשעות שונות של היום, או בימים או שבועות שונים.
יתרון
דגימה אקראית פשוטה:
- הוא מאפשר להפחית את עלויות המחקר הסטטיסטי, מכיוון שאין צורך לחקור את כלל האוכלוסייה כדי להשיג תוצאות אמינות סטטיסטית, עם רמות הביטחון הרצויות ורמת הטעות הנדרשת במחקר.
- הימנע מהטיה: מכיוון שהבחירה באלמנטים הנלמדים היא אקראית לחלוטין, המחקר משקף נאמנה את מאפייני האוכלוסייה, אם כי רק חלק ממנו נחקר.
חסרונות
- השיטה אינה מספקת במקרים בהם ברצונך לדעת את ההעדפות בקבוצות שונות או בשכבות אוכלוסיה שונות.
במקרה זה עדיף לקבוע בעבר את הקבוצות או המקטעים שעליהם יתבצע המחקר. לאחר שהוגדרו השכבות או הקבוצות, אם זה נוח לכל אחת מהן להחיל דגימה אקראית.
- לא סביר מאוד שיתקבל מידע על מגזרי מיעוט, שלעתים יש צורך לדעת את מאפייניהם.
לדוגמה, אם מדובר בקמפיין על מוצר יקר, יש לדעת את העדפותיהם של ענפי המיעוטים העשירים ביותר.
התרגיל נפתר
אנו מעוניינים לחקור את העדפת האוכלוסייה למשקה קולה מסוים, אך באוכלוסייה זו אין מחקר קודם, שגודלו אינו ידוע.
מצד שני, המדגם צריך להיות מייצג עם רמת ביטחון מינימלית של 90% והמסקנות חייבות להיות שגיאת אחוז של 2%.
כיצד לקבוע את גודל n של המדגם?
-מה יהיה גודל המדגם אם שולי הטעות מתגמשים ל -5%?
פִּתָרוֹן
מכיוון שגודל האוכלוסייה אינו ידוע, הנוסחה המוצגת לעיל משמשת לקביעת גודל המדגם:
n = (Z 2 p q) / (E 2 )
אנו מניחים כי קיימת סבירות שווה להעדפה (p) למותג המשקאות הקלים שלנו ביחס לאי העדפה (q), ולכן p = q = 0.5.
מצד שני, כתוצאה של המחקר חייבת להיות שגיאת אחוז הנמוכה מ -2%, אז השגיאה היחסית E תהיה 0.02.
לבסוף, ערך Z = 1,645 מייצר רמת ביטחון של 90%.
לסיכום, יש לנו את הערכים הבאים:
Z = 1,645
p = 0.5
ש = 0.5
E = 0.02
עם נתונים אלה מחושב גודל המדגם המינימלי:
n = (1.645 2 0.5 0.5) / (0.02 2 ) = 1691.3
משמעות הדבר היא שלמחקר עם מרווח הטעות הנדרש וברמת הביטחון שנבחר, צריך להיות מדגם של משיבים של לפחות 1692 אנשים שנבחרו על ידי דגימה אקראית פשוטה.
אם אתה עובר משולי שגיאה של 2% ל- 5%, גודל המדגם החדש הוא:
n = (1.645 2 0.5 0.5) / (0.05 2 ) = 271
שזה מספר נמוך יותר באופן משמעותי של פרטים. לסיכום, גודל המדגם רגיש מאוד לשולי הטעות הרצויה במחקר.
הפניות
- Berenson, M. 1985. סטטיסטיקה לניהול וכלכלה, מושגים ויישומים. Interamericana עריכה.
- סטָטִיסטִיקָה. דגימה אקראית. נלקח מ: encyclopediaeconomica.com.
- סטָטִיסטִיקָה. דְגִימָה. התאושש מ: Estadistica.mat.uson.mx.
- ניתן להסביר. דגימה אקראית. התאושש מ: explorable.com.
- מור, ד. 2005. סטטיסטיקה בסיסית יישומית. 2. מַהֲדוּרָה.
- Netquest. דגימה אקראית. התאושש מ: netquest.com.
- ויקיפדיה. דגימה סטטיסטית. התאושש מ: en.wikipedia.org