- דוגמאות
- סיווג משתנים קטגוריים
- קטגוריות נומינליות
- קטגורי רגיל
- קטגוריות בינאריות
- סטטיסטיקות עם משתנים קטגוריים
- ייצוג גרפי של משתנים קטגוריים
- תרגילים שנפתרו
- תרגיל 1
- דוגמא 2
- דוגמא 3
- הפניות
המשתנה הקטגורי הוא אחד בשימוש בסטטיסטיקת להקצות מאפיין שאיננו מספרי או איכותי או רכוש לאובייקט כלשהו, בודד, יישות, מצב או הליך. אפשר להגדיר כל מיני משתנים קטגוריים לפי כל צורך.
דוגמאות למשתנים קטגוריים הם: צבע, מין, קבוצת דם, מצב משפחתי, סוג החומר, צורת התשלום או סוג חשבון הבנק, והם משמשים הרבה על בסיס יומי.
איור 1: צבע הוא משתנה קטגורי. מקור: pixabay
האמור לעיל הם המשתנים, אך הערכים האפשריים שלהם הם איכותיים, כלומר באיכות או במאפיין ולא במדידה מספרית. לדוגמה, הערכים האפשריים עבור המין המשתנה הם: זכר, חיבוק.
כאשר משתנה זה מאוחסן בתוכנית מחשב, ניתן להכריז עליו כמשתנה טקסט והערכים המקובלים היחידים יהיו אלה שכבר נקראו: זכר, נקבה.
עם זאת, ניתן להכריז ולאחסן את אותו מין משתנה כמספר שלם אם לזכר נקצה 1 ולנקבה מוקצה הערך 2. מסיבה זו מכנים לעתים משתנים קטגוריים כסוג של ספירה.
המאפיין העיקרי של משתנים קטגוריים הוא שבניגוד למשתנים אחרים, כמו משתנים רציפים ונבדלים, לא ניתן לעשות איתם חשבון. עם זאת, ניתן לעשות איתם סטטיסטיקות, כפי שנראה בהמשך.
דוגמאות
שימו לב לדוגמאות הבאות של משתנים קטגוריים וערכיהם האפשריים:
- Group_Sanguíneo, טווח הערכים: A, B, AB, O
- Civil_Status, ערכים קטגוריים: רווק (A), נשוי (B), אלמן (C), גרוש (D).
- Tipo_de_Material, קטגוריות או ערכים: 1 = עץ, 2 = מתכת, 3 = פלסטיק
- פורמה_מתשלום, ניירות ערך או קטגוריות: (1) מזומן, (2) חיוב, (3) העברה, (4) אשראי
בדוגמאות הקודמות, מספר נקשר לכל קטגוריה בצורה שרירותית לחלוטין.
ניתן לחשוב שאז הקשר המספרי השרירותי הזה הופך אותו לשווה ערך למשתנה כמותי נפרד, אך הוא אינו, מכיוון שלא ניתן לבצע פעולות חשבון עם מספרים אלה.
כדי להמחיש את הרעיון, במשתנה Form_of_Payment, פעולת הסכום אינה הגיונית:
(1) מזומן + (2) חיוב לעולם לא יהיה שווה (3) העברה
סיווג משתנים קטגוריים
הדירוג מבוסס על האם יש להם היררכיה מרומזת או לא, או שמספר התוצאות האפשריות הוא יותר משניים או שניים.
משתנה קטגורי עם תוצאה אפשרית אחת בלבד אינו משתנה, הוא קבוע קטגורי.
קטגוריות נומינליות
כאשר לא ניתן לייצג אותם על ידי מספר או לבצע סדר כלשהו. לדוגמא, המשתנה: Type_of_Material, יש ערכים נומינליים (עץ, מתכת, פלסטיק), אין להם היררכיה או סדר, אפילו כאשר מוקצה מספר שרירותי לכל תגובה או קטגוריה.
קטגורי רגיל
משתנה: ביצועים אקדמיים
ערכים נומינליים: גבוה, בינוני, נמוך
למרות שערכיו של משתנה זה אינם מספריים, יש להם סדר או היררכיה משתמעים.
קטגוריות בינאריות
אלה משתנים נומינליים עם שתי תשובות אפשריות, למשל:
משתנה: תגובה
-ערכים נומינליים: נכון, לא נכון
שימו לב כי למשתנה התגובה אין היררכיה מרומזת ויש לו רק שתי תוצאות אפשריות, ולכן מדובר במשתנה קטגורי בינארי.
יש מחברים שקוראים לסוג זה משתנה בינארי, ואינם רואים שהוא שייך למשתנים קטגוריים המוגבלים לאלה עם יותר משלוש קטגוריות אפשריות.
סטטיסטיקות עם משתנים קטגוריים
ניתן לעשות נתונים סטטיסטיים עם משתנים קטגוריים, למרות שאינם משתנים מספריים או כמותיים. לדוגמה, כדי לדעת את המגמה או הערך הסביר ביותר של משתנה קטגורי, המצב נלקח.
המצב הוא, במקרה זה, התוצאה או הערך החוזר ביותר של משתנה קטגורי. עבור משתנים קטגוריים, לא ניתן לחשב את הממוצע או את החציון.
לא ניתן לחשב את הממוצע מכיוון שאי אפשר לעשות חשבון עם משתנים קטגוריים. גם לא החציון, מכיוון שלמשתנים הכמותיים או הקטגוריים אין סדר או היררכיה, כך שלא ניתן לקבוע ערך מרכזי.
ייצוג גרפי של משתנים קטגוריים
בהתחשב במשתנה קטגורי מסוים, ניתן למצוא את התדירות או את מספר הפעמים בהן חוזרת תוצאה של משתנה זה. אם הדבר נעשה עבור כל תוצאה, ניתן ליצור גרף של התדירות כנגד כל קטגוריה או תוצאה.
להלן כמה דוגמאות כיצד ניתן לייצג גרפיקה משתנים קטגוריים.
תרגילים שנפתרו
תרגיל 1
לחברה יש רישומי נתונים של 170 עובדים. אחד המשתנים שנמצאים ברשומות אלה הוא: Estado_Civil. משתנה זה כולל ארבע קטגוריות או ערכים אפשריים:
רווק (א), נשוי (ב), אלמן (ג), גרוש (ד).
למרות שמדובר במשתנה שאינו מספרי, ניתן לדעת כמה מכלל הרשומות נמצאות בקטגוריה מסוימת ויוצגו בצורה של תרשים עמודות, כפי שמוצג באיור הבא:
תרשים 2. ייצוג תוצאות משתנה קטגורי. מקור: תוצרת עצמית
דוגמא 2
חנות נעליים עוקבת אחר מכירותיה. בין המשתנים המנהלים את הרשומות שלהם הוא צבע הנעל לכל דגם. המשתנה:
Color_Shoe_Model_AW3
זה מהסוג הקטגורי ויש לו חמש קטגוריות או ערכים אפשריים. לכל קטגוריה של משתנה זה מסתכמים מספר המכירות ואחוזן נקבע. התוצאות מוצגות בתרשים של הדמות הבאה:
איור 3. משתנה קטגורי צבע _גוון. במשתנה זה המצב הוא לבן. מקור: תוצרת עצמית.
ניתן לומר אז שמודל הנעל AW3 שנמצא באופנה, זה שנמכר בתדירות הגבוהה ביותר הוא לבן, ואחריו מקרוב Black.
ניתן גם לומר שסבירות של 70% הנעל הבאה שנמכרת מדגם זה תהיה לבנה או שחורה.
מידע זה יכול להיות שימושי עבור החנות בעת ביצוע הזמנות חדשות, או שהוא יכול אפילו להחיל הנחות על הצבעים הנמכרים ביותר בגלל עודף מלאי.
דוגמא 3
עבור אוכלוסייה מסוימת של תורמי דם, אתה רוצה לייצג את מספר האנשים השייכים לקבוצת דם מסוימת. דרך גרפית להמחיש את התוצאות היא באמצעות פיקטוגרמה, שבתחתית הטבלה.
העמודה הראשונה מייצגת את משתנה group_sanguíneo ואת התוצאות או הקטגוריות האפשריות שלו. לטור השני יש ייצוג בצורה איקונית או ציורית של מספר האנשים בכל קטגוריה. בדוגמה שלנו, טיפה אדומה משמשת כאייקון שכל אחד מהם מייצג 10 אנשים.
איור 4. פיקטוגרמה. מקור: תוצרת עצמית
הפניות
- האקדמיה לחאן. ניתוח נתונים קטגוריים. התאושש מ: khanacademy.org
- נוסחאות יקום. משתנה איכותי. התאושש מ: univesoformulas.com
- מיניטאב. שהם משתנים קטגוריים, בדידים ורציפים. התאושש מ: support.minitab.com
- הדרכה לאקסל. אפיון משתנים. התאושש מ: help.xlslat.com.
- ויקיפדיה. משתנה סטטיסטי. התאושש מ- wikipedia.com
- ויקיפדיה. משתנה קטגורי. התאושש מ- wikipedia.com
- ויקיפדיה. משתנה קטגורי. התאושש מ- wikipedia.com