ההתפלגות נורמלי או הפצת גאוס היא התפלגות ההסתברות במשתנה רציפה, שבו פונקציית צפיפות הסתברות מתוארת על ידי פונקציה מעריכית של טיעון ריבועית ושלילי, אשר מולידה את צורת פעמון.
שם החלוקה הרגילה נובע מהעובדה שההפצה הזו היא זו שחלה על המספר הגדול ביותר של מצבים בהם משתנה אקראי מתמשך מעורב בקבוצה או אוכלוסייה מסוימים.
איור 1. התפלגות נורמלית N (x; μ, σ) וצפיפות ההסתברות שלה f (s; μ, σ). (פירוט משלו)
הדוגמאות בהן מיושמת ההתפלגות הרגילה הן: גובהם של גברים או נשים, וריאציות במידות בסדר גודל פיזי כלשהו או בתכונות פסיכולוגיות או סוציולוגיות מדידות, כגון המרכיב האינטלקטואלי או הרגלי הצריכה של מוצר מסוים.
מצד שני, זה נקרא תפוצה גאוסית או פעמון גאוסי, מכיוון שגאון מתמטי גרמני זה זוכה בזכות הגילוי שלו בגלל השימוש שהוא נתן לו כדי לתאר את השגיאה הסטטיסטית של מדידות אסטרונומיות בשנת 1800.
עם זאת נאמר כי התפלגות סטטיסטית זו פורסמה בעבר על ידי מתמטיקאי גדול אחר ממוצא צרפתי, כמו אברהם דה מויברה, עוד בשנת 1733.
נוּסחָה
פונקציית ההתפלגות הרגילה במשתנה הרציף x, עם הפרמטרים μ ו- σ, מסומנת על ידי:
N (x; μ, σ)
וזה כתוב במפורש כך:
N (x; μ, σ) = ∫ -∞ x f (s; μ, σ) ds
כאשר f (u; μ, σ) היא פונקציית צפיפות ההסתברות:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2 ))
הקבוע שמכפיל את הפונקציה האקספוננציאלית בפונקציית צפיפות ההסתברות נקרא קבוע הנורמליזציה והוא נבחר בצורה כזו:
N (+ ∞, μ, σ) = 1
הביטוי הקודם מבטיח שההסתברות שהמשתנה האקראי הוא בין -∞ ל + ∞ הוא 1, כלומר 100% הסתברות.
הפרמטר μ הוא הממוצע האריתמטי של המשתנה האקראי הרציף x σ סטיית התקן או שורש הריבוע של השונות של אותו משתנה. במקרה ש μ = 0 ו- σ = 1, יש לנו את ההתפלגות הרגילה הרגילה או את ההתפלגות הרגילה הרגילה:
N (x; μ = 0, σ = 1)
מאפייני ההתפלגות הרגילה
1- אם משתנה סטטיסטי אקראי עוקב אחר התפלגות נורמלית של צפיפות ההסתברות f (s; μ, σ), מרבית הנתונים מקובצים סביב הערך הממוצע μ והם מפוזרים סביבו באופן שמעט יותר מ ⅔ מהנתונים הם בין μ - σ ל- μ + σ.
2- סטיית התקן σ תמיד חיובית.
3 - צורת פונקציית הצפיפות f דומה לזו של פעמון, וזו הסיבה שפונקציה זו נקראת לעתים קרובות פעמון גאוסית או פונקציה גאוסית.
4- בחלוקה גאוסית הממוצע, החציון והמצב חופפים זה לזה.
5- נקודות הטיה של פונקציית צפיפות ההסתברות הן בדיוק ב- μ - σ ו- μ + σ.
6- הפונקציה f היא סימטרית ביחס לציר העובר בערך הממוצע μ ויש לו אפס אסימפטוטי עבור x ⟶ + ∞ ו- x ⟶ -∞.
7- ככל שערך σ גבוה יותר, כך הפיזור, הרעש או המרחק של הנתונים סביב הערך הממוצע גדול יותר. במילים אחרות, ככל שצורת הפעמון גבוהה יותר פתוחה יותר. לעומת זאת, σ קטן מצביע על כך שהקוביות קרובות לממוצע וצורת הפעמון סגורה או מחודדת יותר.
8- פונקציית החלוקה N (x; μ, σ) מציינת את ההסתברות שהמשתנה האקראי הוא פחות או שווה ל- x. לדוגמא, באיור 1 (למעלה) ההסתברות P כי המשתנה x פחות או שווה ל 1.5 הוא 84% ומתאים לשטח שמתחת לפונקצית צפיפות ההסתברות f (x; μ, σ) מ- -∞ עד x.
מרווחי אמון
9- אם הנתונים עוקבים אחר התפלגות נורמלית, 68.26% מתוכם הם בין μ - σ ל- μ + σ.
10- 95.44% מהנתונים העוקבים אחר התפלגות נורמלית הם בין μ - 2σ ו- μ + 2σ.
11- 99.74% מהנתונים העוקבים אחר התפלגות נורמלית הם בין μ - 3σ ל- μ + 3σ.
12- אם משתנה אקראי x עוקב אחר התפלגות N (x; μ, σ), אז המשתנה
z = (x - μ) / σ עוקב אחר ההתפלגות הרגילה הרגילה N (z; 0.1).
שינוי המשתנה x ל- z נקרא סטנדרטיזציה או הקלדה והוא שימושי מאוד בעת החלת הטבלאות של ההתפלגות הסטנדרטית על הנתונים העוקבים אחר תפוצה רגילה שאינה סטנדרטית.
יישומים של התפלגות רגילה
כדי ליישם את ההתפלגות הרגילה יש לעבור את חישוב אינטגרל של צפיפות ההסתברות, שמבחינה אנליטית לא קל ולא תמיד קיימת תוכנית מחשב המאפשרת את החישוב המספרי שלה. למטרה זו משתמשים בטבלאות עם ערכים מורמללים או סטנדרטיים, שהם לא יותר מההתפלגות הרגילה במקרה μ = 0 ו- σ = 1.
טבלת חלוקה רגילה סטנדרטית (חלק 1/2)
טבלת חלוקה רגילה סטנדרטית (חלק 2/2)
יש לציין כי טבלאות אלה אינן כוללות ערכים שליליים. עם זאת, באמצעות תכונות הסימטריה של פונקצית צפיפות ההסתברות הגאוסית ניתן לקבל את הערכים המתאימים. התרגיל הנפתר המוצג להלן מציין את השימוש בטבלה במקרים אלה.
דוגמא
נניח שיש לך סט של נתונים אקראיים x העוקבים אחר התפלגות נורמלית של ממוצע 10 וסטיית תקן 2. אתה מתבקש למצוא את ההסתברות ש:
א) המשתנה האקראי x פחות או שווה ל 8.
ב) הוא פחות או שווה ל 10.
ג) כי המשתנה x הוא מתחת ל 12.
ד) ההסתברות שערך x הוא בין 8 ל 12.
פִּתָרוֹן:
א) כדי לענות על השאלה הראשונה אתה פשוט צריך לחשב:
N (x; μ, σ)
עם x = 8, μ = 10 ו- σ = 2. אנו מבינים שזה אינטגרל שאין לו פיתרון אנליטי בפונקציות אלמנטריות, אך הפיתרון בא לידי ביטוי כפונקציה של פונקציית השגיאה erf (x).
מצד שני, ישנה אפשרות לפתור את האינטגרל בצורה מספרית, וזה מה שעושים הרבה מחשבונים, גיליונות אלקטרוניים ותוכנות מחשב כמו GeoGebra. באיור שלהלן מופיע הפיתרון המספרי המתאים למקרה הראשון:
איור 2. איור 2. צפיפות ההסתברות f (x; μ, σ). האזור המוצל מייצג P (x ≤ 8). (פירוט משלו)
והתשובה היא שההסתברות ש- x מתחת ל 8 היא:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0.1587
ב) במקרה זה, המטרה היא למצוא את ההסתברות שהמשתנה האקראי x נמצא מתחת לממוצע, שבמקרה זה שווה 10. התשובה אינה דורשת שום חישוב, מכיוון שאנחנו יודעים שחצי מהנתונים הם מתחת הממוצע והמחצית השנייה מעל הממוצע. לכן התשובה היא:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0.5
ג) כדי לענות על שאלה זו, עלינו לחשב N (x = 12; μ = 10, σ = 2), וניתן לעשות זאת באמצעות מחשבון שיש לו פונקציות סטטיסטיות או באמצעות תוכנה כמו GeoGebra:
איור 3. איור 3. צפיפות ההסתברות f (x; μ, σ). האזור המוצל מייצג P (x ≤ 12). (פירוט משלו)
התשובה לחלק ג ניתן לראות באיור 3 והיא:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0.8413.
ד) כדי למצוא את ההסתברות כי המשתנה האקראי x הוא בין 8 ל 12 אנו יכולים להשתמש בתוצאות של חלקים a ו- c כדלקמן:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0.8413 - 0.1587 = 0.6826 = 68.26%.
התרגיל נפתר
המחיר הממוצע של מניה של חברה הוא 25 $ עם סטיית תקן של 4 $. קבע את ההסתברות ש:
א) פעולה בעלות נמוכה מ- 20 $.
ב) זה עולה מעל 30 $.
ג) המחיר נע בין $ 20 ל $ 30.
השתמש בטבלאות ההתפלגות הרגילות הרגילות כדי למצוא את התשובות.
פִּתָרוֹן:
על מנת להשתמש בטבלאות, יש לעבור למשתנה z הנורמלי או שהוקלדו:
20 $ במשתנה הנורמלי שווה ל z = ($ 20 - $ 25) / $ 4 = -5/4 = -1.25 ו
30 $ במשתנה הנורמלי שווה ל z = ($ 30 - $ 25) / $ 4 = +5/4 = +1.25.
א) 20 $ שווים -1.25 במשתנה הנורמלי, אך בטבלה אין ערכים שליליים, אז אנו מציבים את הערך +1.25 שמניב את הערך של 0.8944.
אם מופחת 0.5 מערך זה, התוצאה תהיה האזור שבין 0 ל 1.25 שהוא, אגב, זהה (בסימטריה) לאזור שבין -1.25 ל 0. תוצאת החיסור היא 0.8944 - 0.5 = 0.3944 שזה האזור שבין -1.25 ל- 0.
אבל השטח מ- -∞ ל -1.25 מעניין, שיהיה 0.5 - 0.3944 = 0.1056. מסקנת אפוא שההסתברות שמניה מתחת ל 20 $ היא 10.56%.
b) $ 30 במשתנה שהוקלד הוא 1.25. עבור ערך זה, הטבלה מציגה את המספר 0.8944, התואם את האזור מ- -∞ ל +1.25. האזור בין +1.25 ל- + ∞ הוא (1 - 0.8944) = 0.1056. במילים אחרות, ההסתברות שמניה עולה יותר מ -30 דולר היא 10.56%.
ג) ההסתברות שלפעולה בעלות נע בין $ 20 ל $ 30 תחושב באופן הבא:
100% -10.56% - 10.56% = 78.88%
הפניות
- סטטיסטיקה והסתברות. התפלגות רגילה. התאושש מ: projectdescartes.org
- גאוגברה. גיאוגרפיה קלאסית, חשבון הסתברות. התאושש מ- geogebra.org
- מתמטיקה. תפוצה גאוסית. התאושש מ: es.mathworks.com
- Mendenhall, W. 1981. סטטיסטיקה לניהול וכלכלה. 3. מַהֲדוּרָה. Iberoamérica, עורכת גרופ.
- סטט טרק. למד את עצמך סטטיסטיקה. התפלגות פואסון. התאושש מ: stattrek.com,
- Triola, M. 2012. סטטיסטיקה אלמנטרית. י"א. חינוך עורכת דין פירסון.
- אוניברסיטת ויגו. התפלגויות עיקריות רצופות. התאושש מ: anapg.webs.uvigo.es
- ויקיפדיה. התפלגות רגילה. התאושש מ: es.wikipedia.org