- כיצד לחשב את מקדם הקביעה?
- מקרה המחשה
- פרשנות
- דוגמאות
- - דוגמה 1
- פִּתָרוֹן
- - דוגמא 2
- פִּתָרוֹן
- - דוגמא 3
- פִּתָרוֹן
- השוואה מתאימה
- מסקנות
- הפניות
מקדם ההסבר הוא מספר בין 0 לבין 1, המייצג את החלק היחסי של נקודות (X, Y) כי פעל קו הרגרסיה של התאמה של קבוצת נתונים עם שני משתנים.
זה ידוע גם כטובות הכושר ומצוין על ידי R 2 . כדי לחשב אותו, נלקח המנה בין השונות של הנתונים Ŷi המוערך על ידי מודל הרגרסיה, לבין השונות של הנתונים Yi המתאימים לכל Xi של הנתונים.
R 2 = Sŷ / Sy
איור 1. מקדם מתאם לארבעה זוגות נתונים. מקור: פ. זפטה.
אם 100% מהנתונים נמצאים בקו פונקציית הרגרסיה, מקדם הקביעה יהיה 1.
נהפוך הוא, אם עבור קבוצת נתונים ופונקציית התאמה מסוימת, המקדם R 2 מתגלה כשווה ל 0.5, אז ניתן לומר שההתאמה היא 50% משביעת רצון או טובה.
באופן דומה, כאשר מודל הרגרסיה מניב ערכי R 2 הנמוכים מ 0.5, זה מצביע על כך שפונקציית ההתאמה שנבחרה לא מסתגלת באופן משביע רצון לנתונים, ולכן יש צורך לחפש פונקציית התאמה אחרת.
וכאשר הקוואריות או מקדם המתאם נוטים לאפס, אז המשתנים X ו- Y בנתונים אינם קשורים, ולכן גם R 2 נוטים לאפס.
כיצד לחשב את מקדם הקביעה?
בסעיף הקודם נאמר כי מקדם הקביעה מחושב על ידי מציאת הכמות בין השונות:
-מוערך על ידי פונקציית הרגרסיה של משתנה Y
-זה מהמשתנה Yi המתאים לכל אחד מהמשתנים Xi של זוגות הנתונים N.
אם נאמר במתמטיקה, זה נראה כך:
R 2 = Sŷ / Sy
מנוסחה זו יוצא כי R 2 מייצג את שיעור השונות שמוסבר על ידי מודל הרגרסיה. לחלופין, ניתן לחשב את R 2 באמצעות הנוסחה הבאה, השווה לחלוטין לקודמה:
R 2 = 1 - (Sε / Sy)
כאשר Sε מייצג את השונות של שאריות εi = Ŷi - Yi, ואילו Sy הוא השונות של מערכת ערכי ה- Y של הנתונים. כדי לקבוע את Ŷi מיושמת פונקציית הרגרסיה, כלומר לאשר ש Ŷi = f (Xi).
השונות של מערך הנתונים Yi, עם i מ 1 ל- N מחושבת באופן זה:
Sy =
ואז המשך בדרך דומה עבור Sŷ או Sε.
מקרה המחשה
על מנת להציג את הפרטים כיצד מתבצע החישוב של מקדם הקביעה, ניקח את הקבוצה הבאה של ארבעה זוגות נתונים:
(X, Y): {(1, 1); (2. 3); (3, 6) ו- (4, 7)}.
מוצע התאמת רגרסיה לינארית עבור מערך נתונים זה, המתקבל בשיטת הריבועים הכי פחותים:
f (x) = 2.1 x - 1
בהפעלת פונקציית התאמה זו מתקבלים המומנטים:
(X, Ŷ): {(1, 1.1); (2, 3.2); (3, 5.3) ו- (4, 7.4)}.
לאחר מכן אנו מחשבים את הממוצע החשבון עבור X ו- Y:
וריאנס Sy
Sy = / (4-1) =
= = 7,583
שונות Sŷ
Sŷ = / (4-1) =
= = 7.35
מקדם נחישות R 2
R 2 = Sŷ / Sy = 7.35 / 7.58 = 0.97
פרשנות
מקדם הקביעה למקרה הממחיש שנחשב בקטע הקודם התברר כ- 0.98. במילים אחרות, ההתאמה הקווית דרך הפונקציה:
f (x) = 2.1x - 1
זה אמין של 98% בהסבר הנתונים איתם הושג בשיטת הכי פחות ריבועים.
בנוסף למקדם הקביעה, קיים מקדם המתאם הליניארי או המכונה גם מקדם פירסון. מקדם זה, הנקרא r, מחושב על ידי הקשר הבא:
r = Sxy / (Sx Sy)
כאן המייצג מייצג את המשתנות בין משתנים X ו- Y, בעוד שהמכנה הוא תוצר של סטיית התקן עבור משתנה X וסטיית התקן עבור משתנה Y.
המקדם של פירסון יכול לקחת ערכים בין -1 ל- +1. כאשר מקדם זה נוטה ל- +1 יש מתאם לינארי ישיר בין X ל- Y. אם הוא נוטה -1 במקום זאת, יש מתאם לינארי, אך כאשר X גדל Y יורד. לבסוף, זה קרוב ל 0 אין קשר בין שני המשתנים.
יש לציין כי מקדם הנחישות עולה בקנה אחד עם ריבוע מקדם פירסון, רק כאשר הראשון חושב על פי התאמה לינארית, אולם שוויון זה אינו תקף עבור התאמות לא לינאריות אחרות.
דוגמאות
- דוגמה 1
קבוצה של תלמידי תיכון יצאה לקבוע חוק אמפירי לתקופת המטוטלת כפונקציה לאורכה. כדי להשיג מטרה זו הם מבצעים סדרה של מדידות בהן הם מודדים את זמן תנודת המטוטלת לאורכים שונים השגת את הערכים הבאים:
אורך (מ ') | תקופות |
---|---|
0.1 | 0.6 |
0.4 | 1.31 |
0.7 | 1.78 |
אחד | 1.93 |
1.3 | 2.19 |
1.6 | 2.66 |
1.9 | 2.77 |
3 | 3.62 |
הוא מתבקש לעלות עלילת הנתונים לפיזור ולבצע התאמה ליניארית דרך רגרסיה. כמו כן, הצג את משוואת הרגרסיה ואת מקדם הקביעה שלה.
פִּתָרוֹן
איור 2. תרשים הפתרונות לתרגיל 1. מקור: F. Zapata.
ניתן לראות מקדם נחישות גבוה למדי (95%), כך שניתן היה לחשוב שההתאמה הקווית היא אופטימלית. עם זאת, אם הנקודות נצפות יחד, נראה שיש להן נטייה להתעקם כלפי מטה. פרט זה אינו מוקרן במודל הליניארי.
- דוגמא 2
עבור אותם נתונים בדוגמה 1, צרו עלילת פיזור של הנתונים. בהזדמנות זו, שלא כמו בדוגמא 1, מתבקש התאמת רגרסיה באמצעות פונקציה פוטנציאלית.
איור 3. תרשים הפתרונות לתרגיל 2. מקור: F. Zapata.
הצג גם את פונקציית ההתאמה ומקדם הקביעה שלה R 2 .
פִּתָרוֹן
הפונקציה הפוטנציאלית היא של הצורה f (x) = גרזן B , כאשר A ו- B הם קבועים שנקבעים בשיטת הכי פחות ריבועים.
הנתון הקודם מציג את הפונקציה הפוטנציאלית ואת הפרמטרים שלה, כמו גם את מקדם הקביעה עם ערך גבוה מאוד של 99%. שימו לב כי הנתונים עוקבים אחר עקמומיות קו המגמה.
- דוגמא 3
באמצעות אותם נתונים מדוגמה 1 ומדוגמא 2, בצע התאמה פולינומית מדרגה שנייה. הצג את הגרף, את פולינום ההתאמה ואת מקדם הקביעה המקביל R 2 .
פִּתָרוֹן
איור 4. תרשים הפתרונות לתרגיל 3. מקור: F. Zapata.
עם ההתאמה הפולינומית של התואר השני תוכלו לראות קו מגמה שמתאים היטב לעקמת הנתונים. כמו כן, מקדם הקביעה הוא מעל ההתאמה הלינארית ומתחת להתאמה הפוטנציאלית.
השוואה מתאימה
מבין שלושת ההתאמות המוצגות, זה עם מקדם הקביעה הגבוה ביותר הוא ההתאמה הפוטנציאלית (דוגמא 2).
ההתאמה הפוטנציאלית עולה בקנה אחד עם התיאוריה הפיזיקלית של המטוטלת, שכידוע קובעת שתקופת המטוטלת היא פרופורציונלית לשורש הריבועי באורך שלה, קבוע המידתיות הוא 2π / √g כאשר g הוא תאוצה של כוח הכבידה.
סוג זה של התאמה פוטנציאלית לא רק שיש את מקדם הנחישות הגבוה ביותר, אלא שהמדיח והקבוע של המידתיות תואמים את המודל הפיזי.
מסקנות
-התאמת הרגרסיה קובעת את הפרמטרים של הפונקציה שמטרתה להסביר את הנתונים בשיטת הכי פחות ריבועים. שיטה זו מורכבת ממזעור סכום ההפרש בריבוע בין ערך Y של התאמה לערך Yi של הנתונים לערכי Xi של הנתונים. זה קובע את הפרמטרים של פונקציית הכוונון.
-כפי שראינו, פונקציית ההתאמה הנפוצה ביותר היא הקו, אך היא אינה היחידה, מכיוון שההתאמות יכולות להיות גם פולינומיות, פוטנציאליות, מעריכיות, לוגריתמיות ואחרות.
בכל מקרה, מקדם הקביעה תלוי בנתונים ובסוג ההתאמה והוא מהווה אינדיקציה לטובת ההתאמה המיושמת.
בסופו של דבר, מקדם הקביעה מציין את אחוז השונות הכולל בין ערך Y של הנתונים ביחס לערך of של ההתאמה ל- X הנתון.
הפניות
- González C. סטטיסטיקות כלליות. התאושש מ: tarwi.lamolina.edu.pe
- IACS. המכון למדעי הבריאות של אראגון. התאושש מ: ics-aragon.com
- Salazar C. ו- Castillo S. עקרונות בסיסיים לסטטיסטיקה. (2018). התאושש מ: dspace.uce.edu.ec
- סופר-פרופ. מקדם קביעה. התאושש מ: superprof.es
- ארה"ב. מדריך סטטיסטי תיאורי. (2011). התאושש מ: Statistics.ingenieria.usac.edu.gt.
- ויקיפדיה. מקדם קביעה. התאושש מ: es.wikipedia.com.