- יתרונות וחסרונות
- חסרונות הטווח כמדד לפיזור
- טווח בין-רבעוני, רביעיות ודוגמא מעובדת
- - חישוב רביעיות
- הרבעון הראשון
- הרבעון השני או החציון
- הרבעון השלישי
- דוגמה מעובדת
- פתרון ל
- פיתרון ב
- פיתרון ג
- הפניות
טווח , טווח או משרעת, בסטטיסטיקה, ההבדל (חיסור) בין הערך המקסימלי ואת הערך המינימלי של קבוצה של נתונים ממדגם או אוכלוסיה. אם הטווח מיוצג על ידי האות R והנתונים מיוצגים על ידי x, הנוסחה לטווח היא פשוט:
R = x מקסימום - x דקות
כאשר x max הוא הערך המרבי של הנתונים ו- x min הוא המינימום.
איור 1. טווח הנתונים התואם את אוכלוסיית קדיז בשתי המאות האחרונות. מקור: Wikimedia Commons.
הרעיון שימושי מאוד כאמצעי פשוט לפיזור כדי להעריך במהירות את השונות של הנתונים, מכיוון שהוא מצביע על הארכה או אורך המרווח בו הם נמצאים.
לדוגמה, נניח שגובהם של קבוצה של 25 גברים סטודנטים להנדסה בשנה הראשונה באוניברסיטה נמדד. התלמיד הגבוה ביותר בקבוצה הוא 1.93 מ 'והקצר 1.67 מ'. אלה הם הערכים הקיצוניים של נתוני המדגם, ולכן דרכם היא:
R = 1.93 - 1.67 מ '= 0.26 מ' או 26 ס"מ.
גובה התלמידים בקבוצה זו מופץ לאורך טווח זה.
יתרונות וחסרונות
טווח הוא, כפי שאמרנו קודם, מדד לפיזור הנתונים. טווח קטן מצביע על כך שהנתונים קרובים פחות או יותר והפיזור נמוך. מצד שני, טווח גדול יותר מעיד על כך שהנתונים מפוזרים יותר.
היתרונות בחישוב הטווח ברורים: קל מאוד ומהיר למצוא אותו, מכיוון שהוא הבדל פשוט.
יש לו גם אותן יחידות כמו הנתונים איתם הוא עובד והמושג קל מאוד לפרש עבור כל מתבונן.
בדוגמה לגובה סטודנטים להנדסה, אם הטווח היה 5 ס"מ, היינו אומרים כי הסטודנטים כולם בערך באותו גודל. אבל עם טווח של 26 ס"מ, אנו מניחים מיד שישנם סטודנטים בכל גובה הביניים במדגם. האם הנחה זו תמיד נכונה?
חסרונות הטווח כמדד לפיזור
אם נסתכל היטב, יכול להיות שבמדגם שלנו מבין 25 סטודנטים להנדסה, רק אחד מהם מודד 1.93 ולשאר הנותרים יש גבהים קרובים ל 1.67 מ '.
ובכל זאת הטווח נשאר זהה, אם כי ההפך אפשרי בהחלט: שגובה הרוב הוא סביב 1.90 מ 'ורק אחד הוא 1.67 מ'.
בשני המקרים, התפלגות הנתונים שונה בתכלית.
החסרונות של הטווח כמדד לפיזור הם מכיוון שהוא משתמש רק בערכים קיצוניים ומתעלם מכל האחרים. מכיוון שרוב המידע אבוד, אין לך מושג כיצד מופצים נתוני המדגם.
מאפיין חשוב נוסף הוא שתחום המדגם לעולם לא פוחת. אם נוסיף מידע נוסף, כלומר אנו שוקלים יותר נתונים, הטווח גדל או נשאר זהה.
ובכל מקרה, זה שימושי רק בעבודה עם דגימות קטנות, השימוש היחיד בו כאמצעי לפיזור במדגמים גדולים אינו מומלץ.
מה שצריך לעשות הוא להשלים אותו עם חישוב מדדי פיזור אחרים אשר לוקחים בחשבון את המידע שמספק הנתונים הכוללים: טווח בין-רבעוני, שונות, סטיית תקן ומקדם שונות.
טווח בין-רבעוני, רביעיות ודוגמא מעובדת
הבנו שחולשת הטווח כמדד לפיזור היא שהוא עושה שימוש רק בערכים הקיצוניים של חלוקת הנתונים, תוך השמטת האחרים.
כדי למנוע אי הנוחות הזו משתמשים ברביעונים: שלושה ערכים הידועים כמדדי מיקום.
הם מפיצים את הנתונים הלא מקובצים לארבעה חלקים (מדדי מיקום אחרים הנמצאים בשימוש נרחב הם עשירונים ואחוזונים). אלה הם המאפיינים שלה:
-רבעון הראשון Q 1 הוא ערך הנתונים כך ש -25% מכולם פחותים מ- Q 1 .
-הרבעון השני Q 2 הוא החציון של ההתפלגות, כלומר מחצית (50%) מהנתונים פחות מערך זה.
-לבסוף, הרבעון השלישי של התפלגות ש 3 עולה כי 75% מן הנתונים הם פחות מ ש 3 .
לאחר מכן, טווח בין הרבעון או טווח הרבעון מוגדרים כהבדל בין הרבעון השלישי 3 לרביעייה הראשונה 1 של הנתונים:
טווח בין-רבעוני = R Q = Q 3 - Q 1
באופן זה, הערך של הטווח R Q אינו מושפע כל כך מערכים קיצוניים. מסיבה זו רצוי להשתמש בה כשמדובר בהתפלגויות מוטות, כמו התלמידים הגבוהים מאוד או הקצרים מאוד שתוארו לעיל.
- חישוב רביעיות
ישנן מספר דרכים לחישובן, כאן נציע אחת מהן, אך בכל מקרה יש לדעת את מספר ההזמנה "N o ", וזה המקום בו הרביעייה המתאימה תופסת בהתפלגות.
כלומר, אם למשל המונח התואם ל- Q 1 הוא השני, השלישי או הרביעי וכן הלאה של ההתפלגות.
הרבעון הראשון
N או (Q 1 ) = (N + 1) / 4
הרבעון השני או החציון
N או (Q 2 ) = (N + 1) / 2
הרבעון השלישי
N או (Q 3 ) = 3 (N + 1) / 4
כאשר N הוא מספר הנתונים.
החציון הוא הערך שנמצא באמצע ההתפלגות. אם מספר הנתונים הוא מוזר אין שום בעיה למצוא אותם, אך אם הם אחידים, אז הממוצע של שני הערכים המרכזיים יהפוך לאחד.
לאחר שחושב מספר ההזמנה, מתקיים אחד משלושת הכללים הבאים:
-אם אין עשרונים, החיפושים אחר הנתונים המצוינים בתפוצה וזו תהיה הרבעון המבוקש.
-כאשר מספר ההזמנה הוא באמצע הדרך בין שניים, אז הנתונים המוצגים על ידי החלק השלם ממוצעים עם הנתונים הבאים, והתוצאה היא הרבעון המקביל.
-בכל מקרה אחר, הוא מעוגל למספר השלישי הקרוב ביותר וזו תהיה מיקום הרבעון.
דוגמה מעובדת
בסולם של 0 עד 20, קיבלה קבוצה של 16 תלמידים במתמטיקה אני את הסימונים הבאים (נקודות) בבחינה של אמצע המשרה:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
למצוא:
א) טווח או טווח הנתונים.
ב) ערכי הרבעונים Q 1 ו- Q 3
ג) הטווח הבין רבעוני.
איור 2. האם יש לניקוד במבחן המתמטיקה הזה שונות כה רבה? מקור: Pixabay.
פתרון ל
הדבר הראשון שצריך לעשות כדי למצוא את המסלול הוא להזמין את הנתונים בסדר עולה או יורד. לדוגמה בסדר גובר שיש לך:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
בעזרת הנוסחה שניתנה בתחילת הדרך: R = x max - x min
R = 20 - 1 נקודות = 19 נקודות.
על פי התוצאה, לדירוגים אלה יש פיזור רב.
פיתרון ב
N = 16
N או (Q 1 ) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4.25
זהו מספר עם עשרונים, שחלקם המספר השלם הוא 4. ואז אנו עוברים להתפלגות, אנו מחפשים את הנתונים התופסים את המקום הרביעי וערכו ממוצע עם זה של המיקום החמישי. מכיוון ששניהם 9, הממוצע הוא גם 9 וכך:
שאלה 1 = 9
כעת אנו חוזרים על ההליך למציאת שאלה 3 :
N או (Q 3 ) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12.75
שוב זהו עשרוני, אך מכיוון שהוא אינו מחצית הדרך, הוא מעוגל ל 13. הרבעון המבוקש תופס את המיקום השלוש עשרה והוא:
שאלה 3 = 16
פיתרון ג
R Q = Q 3 - Q 1 = 16 - 9 = 7 נקודות.
כפי שאנו רואים, הוא קטן בהרבה מטווח הנתונים המחושב בסעיף א) מכיוון שציון המינימום היה נקודה אחת, ערך הרבה יותר רחוק מהשאר.
הפניות
- Berenson, M. 1985. סטטיסטיקה לניהול וכלכלה. Interamericana SA
- Canavos, G. 1988. הסתברות וסטטיסטיקה: יישומים ושיטות. מקגרו היל.
- Devore, J. 2012. הסתברות וסטטיסטיקה להנדסה ומדע. 8. מַהֲדוּרָה. Cengage.
- דוגמאות לרביעונים. התאושש מ: matematicas10.net.
- לוין, ר. 1988. סטטיסטיקה למנהלים. 2. מַהֲדוּרָה. אולם פרנטיס.
- Walpole, R. 2007. הסתברות וסטטיסטיקה להנדסה ומדעים. פירסון.