רגרסיה ליניארית · רגרסיה ושיפור ביצועים
השאלה
מאמן כושר בדק את הקשר הליניארי בין מספר שעות האימון השבועיות (המשתנה $x$) לבין הירידה במשקל בקילוגרמים בתום חודש (המשתנה $y$). לפניכם נתונים של 8 מתאמנים שהשתתפו במחקר: שעות אימון שבועיות: 1, 1, 1, 1, 5, 5, 5, 5 ירידה במשקל בק"ג: 1, 2, 2, 3, 3, 4, 4, 5 א. חשבו את הממוצעים ($\bar{x}, \bar{y}$) ואת סטיות התקן ($s_x, s_y$) עבור שני המשתנים. ב. חשבו את מקדם המתאם $r$. הסבירו מה מעיד ערכו של $r$ על חוזק הקשר. ג. מצאו את משוואת ישר הרגרסיה לניבוי הירידה במשקל ($y$) על פי מספר שעות האימון ($x$). ד. מתאמן חדש מתאמן 3 שעות בשבוע. על פי ישר הרגרסיה, מהי הירידה הצפויה במשקלו? ה. בעקבות שינוי בתזונה, הירידה במשקל של כל אחד מהמתאמנים השתפרה ב-10% ($y_{new} = 1.1y$). קבעו עבור כל אחד מן המדדים הבאים האם ערכו יגדל, יקטן או לא ישתנה: (1) מקדם המתאם $r$ (2) הממוצע של המשתנה $y$ (3) שיפוע ישר הרגרסיה
הטיפ של עובד
חברים, שימו לב לטבלה: הנתונים מאוד סימטריים כדי להקל עליכם בחישוב הממוצעים. בסעיף ה', תזכרו את כלל הברזל של שיעור 9: הכפלה במספר חיובי מגדילה את הממוצע ואת השיפוע בדיוק באותו יחס, אבל היא 'עיוורת' למקדם המתאם. ה-$r$ הוא חבר נאמן שנשאר בדיוק באותו ערך כל עוד הכיוון לא משתנה!
פתרון מודרך, צעד אחר צעד
שלב 1: סעיף א': חישוב ממוצעים וסטיות תקן
ממוצע $x$: בטבלה 4 ערכים של 1 ו-4 ערכים של 5 \bar{x} = \frac{1 \cdot 4 + 5 \cdot 4}{8} = \frac{24}{8} = 3 s_x = \sqrt{\frac{4(1-3)^2 + 4(5-3)^2}{8}} = \sqrt{\frac{16+16}{8}} = 2 \bar{y} = \frac{1+2+2+3+3+4+4+5}{8} = \frac{24}{8} = 3 s_y = \sqrt{\frac{(1-3)^2 + 2(2-3)^2 + 2(3-3)^2 + 2(4-3)^2 + (5-3)^2}{8}} = \sqrt{1.5} \approx 1.22
מושגים: ממוצע, סטיית תקן, מדדי פיזור
שלב 2: סעיף ב': חישוב מקדם המתאם
חישוב השונות המשותפת על ידי סכום המכפלות $(x_i - \bar{x})(y_i - \bar{y})$ חלקי $n$ r = \frac{\text{Cov}(x,y)}{s_x \cdot s_y} \approx 0.816 ערך זה מעיד על קשר ליניארי חיובי חזק בין מספר שעות האימון להירידה במשקל. $r$ קרוב ל-1 מחוות על קשר חזק.
מושגים: מקדם מתאם, שונות משותפת, חוזק קשר
שלב 3: סעיף ג': משוואת ישר הרגרסיה
השיפוע של ישר הרגרסיה: b = r \cdot \frac{s_y}{s_x} = 0.816 \cdot \frac{1.22}{2} = 0.5 החיתוך בציר $y$ (intercept): a = \bar{y} - b \cdot \bar{x} = 3 - 0.5 \cdot 3 = 1.5 משוואת ישר הרגרסיה: y = 0.5x + 1.5
מושגים: ישר רגרסיה, שיפוע, חיתוך
שלב 4: סעיף ד': ניבוי ערך חדש
עבור מתאמן החדש המתאמן $x = 3$ שעות בשבוע, נציב בישר הרגרסיה: y = 0.5(3) + 1.5 = 1.5 + 1.5 = 3 הירידה הצפויה במשקל היא 3 ק"ג.
מושגים: ניבוי, הצבה בנוסחה, רגרסיה
שלב 5: סעיף ה': השפעת טרנספורמציה ליניארית (הכפלה ב-1.1)
(1) מקדם המתאם $r$: לא ישתנה. המתאם הוא מדד חסר יחידות הבודק את עוצמת הקשר הליניארי בלבד, ולא מושפע מהכפלה בקבוע חיובי. (2) הממוצע של המשתנה $y$: יגדל. $\bar{y}_{new} = 1.1 \cdot 3 = 3.3$ ק"ג (3) שיפוע ישר הרגרסיה: יגדל. $b_{new} = 1.1 \cdot 0.5 = 0.55$ וגם $a_{new} = 1.1 \cdot 1.5 = 1.65$, כך שהישר החדש הוא $y = 0.55x + 1.65$
מושגים: טרנספורמציה ליניארית, שמורות סטטיסטיות, מקדם מתאם
פוקוס המורה הפרטי
הבנת חישוב מקדמי רגרסיה ליניארית, השפעת טרנספורמציות ליניאריות על מדדים סטטיסטיים, וניבוי ערכים באמצעות ישר הרגרסיה