- שלבים לדגימה לפי מכסות
- שלב 1
- שלב 2
- שלב 3
- שלב 4
- שלב 5
- מקרה מעשי
- מכסה לשכבה
- תחול, יתרונות וחסרונות
- יתרון
- חסרונות
- דוגמא ליישום פשוט
- קביעת מכסות לפי גיל
- קביעת מכסות לפי גיל ומין
- יישום סקרים ומחקר התוצאות
- הבדל בדגימה אקראית מרובדת
- תרגיל מוצע
- הפניות
דגימת המכסה היא לא - דרך הסתברותית לקחת נתונים מתוך השכבות מדגם הקצאת מכסות. המכסות צריכות להיות פרופורציונאליות לשבר ששכבה זו מייצגת ביחס לכלל האוכלוסייה וסכום המכסות חייב להיות שווה לגודל המדגם.
החוקר הוא זה שמחליט אילו קבוצות או שכבות יהיו, למשל, הוא יכול לחלק אוכלוסיה לגברים ונשים. דוגמא נוספת לשכבות הם טווחי גילאים, למשל בין 18 ל 25, בין 26 ל 40 ומ 40 ואילך, אותם ניתן לתייג כך: צעירים, זקנים וישנים.
תרשים 1. מכסות הדגימה מפולחות לפי ההבדלים באוכלוסייה הכוללת. מקור: Pixabay.
נוח מאוד לדעת מראש איזה אחוז מכלל האוכלוסייה מייצג כל שכבה. ואז נבחר גודל מדגם מובהק סטטיסטית, ומכסות פרופורציות מוקצות לאחוז כל שכבה ביחס לכלל האוכלוסייה. סכום המכסות לשכבה חייב להיות שווה לגודל המדגם הכולל.
לבסוף נלקחים נתוני המכסות שהוקצו לכל שכבה, תוך בחירת האלמנטים הראשונים שמשלימים את המכסה.
דווקא בגלל דרך לא אקראית זו של בחירת האלמנטים, שיטת הדגימה הזו נחשבת ללא הסתברותית.
שלבים לדגימה לפי מכסות
שלב 1
פילחו את כלל האוכלוסייה לשכבות או קבוצות עם מאפיין משותף כלשהו. מאפיין זה יוחלט בעבר על ידי החוקר הסטטיסטי שערך המחקר.
שלב 2
קבע איזה אחוז מכלל האוכלוסייה מייצג כל אחת מהשכבות או הקבוצות שנבחרו בשלב הקודם.
שלב 3
הערך גודל מדגם מובהק סטטיסטית, על פי הקריטריונים והמתודולוגיות של המדע הסטטיסטי.
שלב 4
חשב את מספר האלמנטים או המכסות עבור כל שכבה, כך שהם יהיו פרופורציונאליים לאחוז אותו מייצג כל אחד ביחס לכלל האוכלוסייה ולגודל הכולל של המדגם.
שלב 5
קח את נתוני האלמנטים בכל שכבה עד השלמת המכסה המתאימה לכל שכבה.
מקרה מעשי
נניח שאתה רוצה לדעת את רמת שביעות הרצון משירות המטרו בעיר. מחקרים קודמים שנערכו על אוכלוסייה של 2000 איש קבעו כי 50% מהמשתמשים הם צעירים בני 16 עד 21, 40% הם מבוגרים בני 21 עד 55 ורק 10% מהמשתמשים הם בני יותר מ 55.
תוך ניצול תוצאות המחקר, הוא מפולח או מרובד בהתאם לגיל המשתמשים:
אנשים צעירים: 50%
מבוגרים: 40%
קשישים: 10%
מכיוון שיש תקציב מוגבל, יש ליישם את המחקר על מדגם קטן אך מובהק סטטיסטית. גודל מדגם של 200 נבחר, כלומר הסקר על רמת שביעות הרצון יוחל על 200 איש בסך הכל.
נותר כעת לקבוע את מכסת או מספר הסקרים עבור כל מקטע או שכבה, אשר חייבים להיות פרופורציונאליים לגודל המדגם ולאחוז לשכבה.
מכסה לשכבה
מכסת מספר הסקרים בשכבה היא כדלקמן:
נוער: 200 * 50% = 200 * (50/100) = 100 סקרים
מבוגרים: 200 * 40% = 200 * (40/100) = 80 סקרים
קשישים: 200 * 10% = 200 * (10/100) = 20 סקרים
איור 2. מכסות במדגם של 200 אנשים לפי שכבת הגיל. מקור: פ. זפטה.
שים לב שסכום העמלות צריך להיות שווה לגודל המדגם, כלומר שווה למספר הכולל של הסקרים שיוחלו. לאחר מכן מועברים הסקרים עד למילוי המכסות לכל שכבה.
חשוב לציין ששיטה זו טובה בהרבה מביצוע כל הסקרים והעברתם ל 200 האנשים הראשונים המופיעים, מכיוון שעל פי נתונים קודמים, סביר מאוד ששכבת המיעוט תישאר מחוץ למחקר.
תחול, יתרונות וחסרונות
בכדי שהשיטה תהיה מיושמת, נדרש קריטריון להיווצרות השכבות, התלוי במטרת המחקר.
דגימת מכסות מתאימה כשרוצים לדעת את ההעדפות, ההבדלים או המאפיינים לפי מגזרים כדי לכוון קמפיינים ספציפיים בהתאם לשכבה או לקטע.
השימוש בו מועיל גם כאשר מסיבה כלשהי מעניין לדעת את המאפיינים או האינטרסים של מגזרי המיעוט, או כאשר הם לא רוצים להשאיר אותם מחוץ למחקר.
כדי להחיל, יש לדעת על המשקל או המשמעות של כל שכבה ביחס לכלל האוכלוסייה. חשוב מאוד שידע זה יהיה אמין, אחרת יתקבלו תוצאות שגויות.
יתרון
הפחת את זמני הלימוד, מכיוון שהעמלות לשכבה הן בדרך כלל קטנות
מפשט את ניתוח הנתונים.
- ממזער עלויות מכיוון שהמחקר מיושם על דגימות קטנות אך מייצגות היטב של כלל האוכלוסייה.
חסרונות
ככל שהשכבות מוגדרות מראש, יתכן כי אזורים מסוימים באוכלוסייה נותרים מחוץ למחקר.
על ידי הקמת מספר מצומצם של שכבות, יתכן שאובדן הפרטים במחקר.
על ידי הימנעות משילוב או שילוב של שכבה כחלק ממחקר אחר, ניתן להסיק מסקנות שגויות במחקר.
זה לא מאפשר להעריך את שגיאת הדגימה המרבית.
דוגמא ליישום פשוט
אנו רוצים לעשות מחקר סטטיסטי על רמת החרדה בקרב אוכלוסייה של 2000 איש.
החוקר מכוון את אינטואיציות המחקר כי יש למצוא הבדלים בתוצאות בהתאם לגיל ומין. מסיבה זו הוא מחליט ליצור שלוש שכבות גיל שמצוינות כדלקמן: First_Age, Second_Age ו- Third_Age. לגבי פלח המין מוגדרים שני הסוגים הרגילים: זכר ונקבה.
First_Age מוגדר, כי בין 18 ל 25 שנים, Second_Age שבין גיל 26 ל 50 ולבסוף שלישית_ גיל זה בין גיל 50 ל 80.
ניתוח הנתונים של כלל האוכלוסייה יש צורך:
45% מהאוכלוסייה שייכים ל- First_Age.
40% נמצאים ב- Second_Age.
לבסוף, רק 15% מאוכלוסיית המחקר שייכת לגיל השלישי.
באמצעות מתודולוגיה מתאימה, שלא מפורטת כאן, נקבע כי מדגם של 300 איש הוא בעל משמעות סטטיסטית.
קביעת מכסות לפי גיל
השלב הבא יהיה למצוא את המכסות המתאימות לקטע גיל, שנעשה באופן הבא:
First_Age: 300 * 45% = 300 * 45/100 = 135
Second_Age: 300 * 40% = 300 * 40/100 = 120
שלישי_גיל: 300 * 15% = 300 * 15/100 = 45
מאומתים כי סכום המכסות נותן את הגודל הכולל של המדגם.
קביעת מכסות לפי גיל ומין
עד כה לא נלקח בחשבון פלח המין באוכלוסייה, שתי שכבות שכבר הוגדרו עבור פלח זה: נקבה וזכר. שוב עלינו לנתח את הנתונים של כלל האוכלוסייה, המניבים את המידע הבא:
-60% מכלל האוכלוסייה הן נשים.
-בינתיים 40% מהאוכלוסייה הנלמדת שייכים למין הגברי.
חשוב לציין כי האחוזים הקודמים ביחס להתפלגות האוכלוסייה לפי מין אינם לוקחים בחשבון גיל.
בהתחשב בכך שאין יותר מידע זמין, ההנחה תיעשה כי פרופורציות המין הללו מופצות באופן שווה בשכבות הגיל שהוגדרו למחקר זה. משיקולים אלה אנו ממשיכים לבסס את המכסות לפי גיל ומין, מה שאומר שכעת יהיו 6 שכבות משנה:
S1 = First_Age ונקבה: 135 * 60% = 135 * 60/100 = 81
S2 = First_Age וזכר: 135 * 40% = 135 * 40/100 = 54
S3 = Second_Age ונקבה: 120 * 60% = 120 * 60/100 = 72
S4 = Second_Age וזכר: 120 * 40% = 120 * 40/100 = 48
S5 = Third_Age ונקבה: 45 * 60% = 45 * 60/100 = 27
S6 = Third_Age וזכר: 45 * 40% = 45 * 40/100 = 18
יישום סקרים ומחקר התוצאות
לאחר קביעת ששת המגזרים (6) והמכסות המתאימות להם, נערכים 300 סקרים שיוחלו על פי המכסות שכבר חושבו.
הסקרים יושמו כדלקמן, 81 סקרים נלקחו ו -81 האנשים הראשונים שנמצאים בקטע S1 מתראיינים. ואז זה נעשה באותה צורה עם חמשת הקטעים הנותרים.
רצף המחקר הוא כדלקמן:
נתח את תוצאות הסקר, שנדונות לאחר מכן, ניתוח התוצאות לפי קטע.
ערוך השוואה בין התוצאות לפי מגזרים.
לפתח סוף סוף השערות המסבירות את הגורמים לתוצאות אלה.
הבדל בדגימה אקראית מרובדת
בדוגמה שלנו בה אנו מיישמים דגימה של מכסות, הדבר הראשון לעשות הוא לקבוע את המכסות ואז לבצע את המחקר. כמובן שמכסות אלה אינן גחמניות כלל, מכיוון שהן התבססו על מידע סטטיסטי קודם על כלל האוכלוסייה.
אם אין לך מידע מוקדם על אוכלוסיית המחקר, עדיף להפוך את הנוהל, כלומר הגדר תחילה את גודל המדגם וברגע שגודל המדגם נקבע, המשך ליישם את הסקר ב באופן אקראי.
אחת הדרכים להבטיח אקראיות היא להשתמש במחולל מספרים אקראיים ולעובדי סקר שמספר העובדים שלהם תואם למספר של הגנרטור האקראי.
ברגע שהנתונים זמינים, ומכיוון שמטרת המחקר היא לראות את רמות החרדה לפי שכבות הגיל ומין, הנתונים מופרדים על פי שש הקטגוריות שהגדרנו קודם. אך מבלי לקבוע שום תשלום מראש.
מסיבה זו, שיטת הדגימה האקראית המרובדת נחשבת לשיטה הסתברותית. ואילו הדגימה באמצעות מכסות שנקבעו בעבר אינה עושה זאת.
עם זאת, אם המכסות נקבעות עם מידע המבוסס על סטטיסטיקות אוכלוסייה, ניתן לומר כי שיטת הדגימה של המכסות היא בערך הסתברותית.
תרגיל מוצע
מוצע התרגיל הבא:
בבית ספר תיכון אתה רוצה לעשות סקר העדפה בין לימודי מדעים או לימוד מדעי הרוח.
נניח שבבית הספר יש בסך הכל 1000 תלמידים המקובצים לחמש דרגות בהתאם לשנת הלימודים. ידוע שיש 350 סטודנטים בשנה הראשונה, 300 בשנה השנייה, 200 בשלישית, 100 בשנה הרביעית ולבסוף 50 בשנה החמישית. ידוע גם כי 55% מתלמידי בית הספר הם בנים ו- 45% בנות.
קבעו את השכבות ואת המכסות לפי שכבה, בכדי לדעת את מספר הסקרים שיש ליישם בהתאם לשנת הלימודים ומקטעי המין. נניח עוד כי המדגם יהיה 10% מכלל אוכלוסיית הסטודנטים.
הפניות
- Berenson, M. 1985. סטטיסטיקה לניהול וכלכלה, מושגים ויישומים. Interamericana עריכה.
- סטָטִיסטִיקָה. דגימת מכסות. התאושש מ: encyclopediaeconomica.com.
- סטָטִיסטִיקָה. דְגִימָה. התאושש מ: Estadistica.mat.uson.mx.
- ניתן להסביר. דגימת מכסות. התאושש מ: explorable.com.
- מור, ד. 2005. סטטיסטיקה בסיסית יישומית. 2. מַהֲדוּרָה.
- Netquest. דגימה של הסתברות: דגימה מרובדת. התאושש מ: netquest.com.
- ויקיפדיה. דגימה סטטיסטית. התאושש מ: en.wikipedia.org