הכלל סטורג'ס הוא קריטריון המשמש לקביעת מספר הכיתות או הטווחים אשר נחוצים בקשירת סט של נתונים סטטיסטיים. כלל זה הוכרז בשנת 1926 על ידי המתמטיקאי הגרמני הרברט סטורגס.
Sturges הציע שיטה פשוטה, המבוססת על מספר הדגימות x שתאפשר לנו למצוא את מספר המחלקות ורוחב הטווח שלהן. הכלל של סטורגס נמצא בשימוש נרחב, במיוחד בתחום הסטטיסטיקות, במיוחד לבניית היסטוגרמות תדרים.
הֶסבֵּר
כלל Sturges הוא שיטה אמפירית הנמצאת בשימוש נרחב בסטטיסטיקה התיאורית כדי לקבוע את מספר הכיתות שחייבות להתקיים בהיסטוגרמה של תדרים, על מנת לסווג מערכת נתונים המייצגת מדגם או אוכלוסיה.
בעיקרון, כלל זה קובע את רוחב המיכלים הגרפיים, של היסטוגרמות התדרים.
כדי לבסס את שלטונו הרברט סטורגס נחשב לתרשים תדרים אידיאלי, המורכב מרווחי K, שבהם המרווח ה- i מכיל מספר מסוים של דגימות (i = 0, … k - 1), המיוצג כ:
מספר דגימות זה ניתן על ידי מספר הדרכים בהן ניתן לחלץ תת-קבוצה של סט; כלומר, על ידי המקדם הבינומי, הבא לידי ביטוי באופן הבא:
כדי לפשט את הביטוי, הוא החל את תכונות הלוגריתמים על שני חלקי המשוואה:
לפיכך, Sturges קבע כי המספר האופטימלי של מרווחי k ניתן על ידי הביטוי:
זה יכול לבוא לידי ביטוי גם כ:
בביטוי זה:
- k הוא מספר השיעורים.
- N הוא המספר הכולל של התצפיות במדגם.
- יומן הוא הלוגריתם הנפוץ של בסיס 10.
לדוגמה, לבניית היסטוגרמת תדרים המבטאת מדגם אקראי בגובה של 142 ילדים, מספר המרווחים או הכיתות שיהיו לפיזור הוא:
k = 1 + 3.322 * יומן 10 (N)
k = 1 + 3,322 * יומן (142)
k = 1 + 3.322 * 2.1523
k = 8.14 ≈ 8
לפיכך, ההתפלגות תהיה בשמונה מרווחים.
תמיד יש לייצג את מספר המרווחים על ידי מספרים שלמים. במקרים שבהם הערך הוא עשרוני, יש לבצע קירוב למספר השלם הקרוב ביותר.
יישומים
הכלל של Sturges מיושם בעיקר בסטטיסטיקה, מכיוון שהוא מאפשר לבצע חלוקת תדרים באמצעות חישוב מספר המחלקות (k), כמו גם האורך של כל אחד מאלו, המכונה גם משרעת.
המשרעת היא ההבדל בין הגבול העליון והתחתון של המחלקה, מחולק במספר הכיתות, והוא בא לידי ביטוי:
ישנם כללי אצבע רבים המאפשרים לבצע חלוקת תדרים. עם זאת, נהוג להשתמש בכללים של סטורג'ס מכיוון שהיא מתקרבת למספר הכיתות, שבדרך כלל נע בין 5 ל -15.
לפיכך, היא מחשיבה ערך שמייצג כראוי מדגם או אוכלוסיה; כלומר, הקירוב אינו מייצג קבוצות קיצוניות, והוא גם לא עובד עם מספר מוגזם של מעמדות שאינם מאפשרים לסכם את המדגם.
דוגמא
יש ליצור היסטוגרמת תדרים על פי הנתונים שנמסרו, התואמים לגילאים שהתקבלו בסקר בקרב גברים שמתעמלים בחדר כושר מקומי.
כדי לקבוע את המרווחים, יש לדעת את גודל המדגם או את מספר התצפיות; במקרה זה ישנם 30.
אז חל תקנתו של סטורגס:
k = 1 + 3.322 * יומן 10 (N)
k = 1 + 3,322 * יומן (30)
k = 1 + 3.322 * 1.4771
k = 5.90 ≈ 6 מרווחים.
ממספר המרווחים ניתן לחשב את המשרעת שתהיה לאלה; כלומר, רוחב כל סרגל המיוצג בהיסטוגרמת התדרים:
הגבול התחתון נחשב לערך הקטן ביותר של הנתונים, והגבול העליון הוא הערך הגדול ביותר. ההבדל בין הגבול העליון והתחתון נקרא הטווח או הטווח של המשתנה (R).
מהטבלה יש לנו שהגבול העליון הוא 46 והגבול התחתון הוא 13; לפיכך, המשרעת של כל כיתה תהיה:
המרווחים יהיו מורכבים מגבול עליון ותחתון. כדי לקבוע את המרווחים האלה, אנו מתחילים בספירה מהגבול התחתון, ומוסיפים לכך את המשרעת שנקבעה על ידי כלל (6), באופן הבא:
ואז מחושב התדר המוחלט כדי לקבוע את מספר הגברים המתאים לכל מרווח; במקרה זה זה:
- מרווח 1: 13 - 18 = 9
- מרווח 2: 19 - 24 = 9
- מרווח 3: 25 - 30 = 5
- מרווח 4: 31 - 36 = 2
- מרווח 5: 37 - 42 = 2
- מרווח 6: 43 - 48 = 3
כאשר מוסיפים את התדר המוחלט של כל מחלקה, זה חייב להיות שווה למספר הכולל של המדגם; במקרה זה, 30.
בהמשך מחושב התדר היחסי של כל מרווח, ומחלק את התדר המוחלט שלו במספר הכולל של תצפיות:
- מרווח 1: fi = 9 ÷ 30 = 0.30
- מרווח 2: fi = 9 ÷ 30 = 0.30
- מרווח 3: fi = 5 ÷ 30 = 0.1666
- מרווח 4: fi = 2 ÷ 30 = 0.0666
- מרווח 5: fi = 2 ÷ 30 = 0.0666
- מרווח 4: fi = 3 ÷ 30 = 0.10
לאחר מכן תוכלו להכין טבלה המשקפת את הנתונים, וגם את התרשים מהתדירות היחסית ביחס למרווחים המתקבלים, כפי שניתן לראות בתמונות הבאות:
באופן זה, כלל Sturges מאפשר לקבוע את מספר המחלקות או המרווחים בהם ניתן לחלק מדגם, על מנת לסכם מדגם נתונים באמצעות פירוט טבלאות ותרשימים.
הפניות
- Alfonso Urquía, MV (2013). דוגמנות והדמיה של אירועים בדידים. UNED,.
- אלטמן נעמי, ח"כ (2015). "רגרסיה לינארית פשוטה." שיטות טבע.
- אנטונז, RJ (2014). סטטיסטיקה בחינוך. יחידה דיגיטלית.
- Fox, J. (1997.). ניתוח רגרסיה יישומי, מודלים לינאריים ושיטות קשורות. פרסומי SAGE.
- Humberto Llinás Solano, CR (2005). סטטיסטיקה תיאורית והפצות הסתברות. האוניברסיטה הצפונית.
- Panteleeva, OV (2005). יסודות ההסתברות והסטטיסטיקה.
- O. Kuehl, MO (2001). תכנון ניסויים: עקרונות סטטיסטיים של תכנון וניתוח מחקרים. עורכי תומסון.