מדדי נטייה מרכזית של נתונים מקובצים משמשים בסטטיסטיקה לתאר התנהגויות מסוימות של קבוצת נתונים שסופקו, כגון מה הערך שהם קרובים, מה הוא ממוצע של הנתונים שנאספו, בין היתר.
כאשר לוקחים כמות גדולה של נתונים, כדאי לקבץ אותם לפי סדר טוב יותר שלהם וכך יוכלו לחשב מדדים מסוימים של נטייה מרכזית.
בין המדדים הנפוצים ביותר לנטייה מרכזית הם הממוצע האריתמטי, החציון והמצב. מספרים אלה מספרים איכויות מסוימות על הנתונים שנאספו בניסוי מסוים.
כדי להשתמש במדדים אלה, תחילה עליך לדעת לקבץ מערך נתונים.
נתונים מקובצים
כדי לקבץ נתונים, תחילה עליך לחשב את טווח הנתונים, המתקבל על ידי הפחתת הערך הגבוה ביותר מינוס הערך הנמוך ביותר של הנתונים.
ואז נבחר מספר "k", שהוא מספר הכיתות בהן אנו רוצים לקבץ את הנתונים.
הטווח מחולק על ידי "k" כדי להשיג את משרעת הכיתות שיש לקבץ. המספר הזה הוא C = R / k.
לבסוף מתחילה הקבוצתית, שבחרה נבחר מספר פחות מהערך הנמוך ביותר של הנתונים שהושגו.
המספר הזה יהיה הגבול התחתון של המחלקה הראשונה. לכך מתווסף C. הערך המתקבל יהיה הגבול העליון של המחלקה הראשונה.
לאחר מכן, C מתווסף לערך זה ומתקבל הגבול העליון של המחלקה השנייה. בדרך זו אנו ממשיכים להשיג את הגבול העליון של המעמד האחרון.
לאחר קיבוץ הנתונים ניתן לחשב את הממוצע, החציון ואת המצב.
כדי להמחיש כיצד מחשבים את הממוצע, החציון ואת המצב, נמשיך עם דוגמא.
דוגמא
לפיכך, בעת קיבוץ הנתונים, תתקבל טבלה כמו הטבלה הבאה:
שלושת המדדים העיקריים לנטייה מרכזית
כעת נמשיך בחישוב הממוצע החשבון, החציון והמצב. הדוגמה לעיל תשמש להמחשת נוהל זה.
1- ממוצע אריתמטי
הממוצע האריתמטי מורכב מכפלת כל תדר בממוצע המרווח. ואז כל התוצאות הללו מתווספות, ולבסוף היא מחולקת על ידי כל הנתונים.
בעזרת הדוגמה הקודמת ניתן היה להשיג כי הממוצע האריתמטי שווה ל:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
זה מצביע על כך שהערך הממוצע של הנתונים בטבלה הוא 5.11111.
2- בינונית
כדי לחשב את החציון של מערך נתונים, אנו מזמינים תחילה את כל הנתונים מהפחות לגדולים ביותר. שני מקרים יכולים להופיע:
- אם מספר הנתונים הוא מוזר, החציון הוא הנתונים שנמצאים במרכז.
- אם מספר הנתונים שווה, החציון הוא הממוצע של שני הנתונים שנמצאים במרכז.
כשמדובר בנתונים מקובצים, חישוב החציון נעשה כדלקמן:
- N / 2 מחושב, כאשר N הוא הנתונים הכוללים.
- מחפש את המרווח הראשון בו מתבצעת התדר המצטבר (סכום התדרים) גדול מ- N / 2, והגבול התחתון של מרווח זה נבחר, הנקרא Li.
החציון ניתן על ידי הנוסחה הבאה:
אני = Li + (Ls-Li) * (N / 2 - תדר מצטבר לפני Li) / תדר של [Li, Ls)
Ls הוא הגבול העליון של המרווח שהוזכר לעיל.
אם משתמשים בטבלת הנתונים הקודמת, N / 2 = 18/2 = 9. התדרים המצטברים הם 4, 8, 14 ו 18 (אחד לכל שורה בטבלה).
לכן, יש לבחור את המרווח השלישי, מכיוון שהתדר המצטבר גדול מ- N / 2 = 9.
אז Li = 5 ו- Ls = 7. החלת הנוסחה המתוארת לעיל עליכם:
אני = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.
3 - אופנה
המצב הוא הערך שיש לו את התדר הגבוה ביותר מבין כל הנתונים המקובצים; כלומר, זה הערך שחוזר על עצמו הכי הרבה פעמים בערכת הנתונים הראשונית.
כאשר יש לך כמות גדולה מאוד של נתונים, הנוסחה הבאה משמשת לחישוב מצב הנתונים המקובצים:
Mo = Li + (Ls-Li) * (תדר של Li - תדר של L (i-1)) / ((תדר של Li - תדר של L (i-1)) + (תדר של Li - תדר של L ( אני + 1)))
המרווח [Li, Ls) הוא המרווח בו נמצא התדר הגבוה ביותר. לדוגמה שנעשתה במאמר זה, המצב ניתן על ידי:
מו = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
נוסחה נוספת המשמשת להשגת ערך משוער למצב היא הבאה:
Mo = Li + (Ls-Li) * (תדר L (i + 1)) / (תדר L (i-1) + תדר L (i + 1)).
בנוסחה זו, החשבונות הם כדלקמן:
מו = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
הפניות
- בלהאוס, דר '(2011). אברהם דה מויברה: קביעת הבמה להסתברות קלאסית ויישומיה. לחץ על CRC.
- Cifuentes, JF (2002). מבוא לתורת ההסתברות. האוניברסיטה הלאומית של קולומביה.
- Daston, L. (1995). הסתברות קלאסית בהארה. הוצאת אוניברסיטת פרינסטון.
- Larson, HJ (1978). מבוא לתורת ההסתברות וההסיק הסטטיסטי. לימוזה עריכה.
- Martel, PJ, and Vegas, FJ (1996). הסתברות וסטטיסטיקה מתמטית: יישומים בפרקטיקה קלינית וניהול בריאות. מהדורות דיאז דה סנטוס.
- Vázquez, AL, & Ortiz, FJ (2005). שיטות סטטיסטיות למדידה, תיאור ובקרה של שונות. אוניברסיטת קנטבריה.
- Vázquez, SG (2009). מדריך למתמטיקה לגישה לאוניברסיטה. עריכה Centro de Estudios Ramon Areces SA.