משתנים מתערבים – התת מודע של הנתונים

You are currently viewing משתנים מתערבים – התת מודע של הנתונים
Image by dric from Pixabay
נכתב על ידי יובל מרנין.
לחברות המעוניינות בשירותי פרילנס או סדנאות של אנליסט, ניתן לפנות אליי [email protected]

זיגמונד פרויד, אבי הפסיכואנליזה, טען שההתנהגות האנושית מושפעת מגורמים נעלמים שהאנשים עצמם אינם מכירים בהם ועל מנת לחשוף אותם יש לבצע פסיכואנליזה עמוקה כדי לחשוף את התת מודע של המטופל.

באופן מפתיע, הטענה של פרויד מתאימה גם לאנליזות של נתונים. גם הנתונים שאותם אנליסטים מנתחים, מושפעים מגורמים עלומים. אותם גורמים נקראים משתנים מתערבים וכדי להמחיש את הרעיון אשתמש בדוגמה הבאה:

בשנת 2002 פורסם מחקר מדעי הטוען שזרע של גברים יכול משמש כחומר אנטי דכאוני אצל נשים.
החוקרים לקחו 293 נשים וחילקו אותן ל-2 קבוצות. בקבוצה אחת היו נשים שהפרטנרים המיניים שלהם השתמשו בקונדום ובשניה לא. הממצאים הראו שנשים שהפרטנרים שלהם לא השתמשו בקונדום היו מאושרות יותר מהנשים בקבוצה השניה.

על פניו החוקרים צודקים. כשמסתכלים על הנתונים כמות שהם, מגלים קורלציה בין חשיפה לזרע של גברים ובין אושר אצל נשים.

אך האם זה באמת המצב? כנראה שלא…

החוקרים במחקר לא לקחו בחשבון שנשים שאינן בקשר זוגי נוטות יותר להשתמש בקונדומים לעומת נשים בזוגיות, ולכן כנראה שהקורלציה שמצאו החוקרים נובעת מההשפעה של הזוגיות על אושר. כלומר, נשים שנמצאות בזוגיות קבועה ויציבה נוטות להיות מאושרות יותר. 

המשתנה 'מצב הזוגיות' הוא משתנה מתערב והוא לא הופיע כלל במחקר אך ייתכן שהוא ההשפעה האמיתית על תוצאות המחקר.

משתנים מתערבים אינם משפיעים רק על מחקרים אקדמיים, הם יכולים להשפיע על כל אנליזה בכל תעשיה. בכל ניתוח של נתונים על הדאטה אנליסט לחשוד שהמסקנות שהוא הגיע עליהן נובעות ממשתנים עלומים שהוא אינו מודע להם.

דוגמה נוספת: ברשת אופנה גדולה, דאטה אנליסט יכול ליצור מודל שמעריך את מנהלי הסניפים על סמך סכום הקניה הממוצע של הלקוחות. מודל כזה יראה ככל הנראה, שהמנהל בסניף קניון רמת אביב יקבל את הציון הגובה ביותר, והסיבה לכך אינה בהכרח הכישרון של מנהל הסניף אלא, המצב הסוציואקונומי של הלקוחות המגיעים לקניון רמת אביב.

איך נמנע מהשפעתם של משתנים מתערבים?

לצערנו, אין דרך להימנע לחלוטין מההשפעה של משתנים מתערבים. משתנים מתערבים תמיד יכולים להשפיע ואנחנו לא נהיה מודעים להם.
אין אף מודל סטטיסטי שיכול לעזור לנו במקרה הזה כי הבעיה אינה במודלים אלא בפרשנות שלנו לנתונים.

ישנן מספר עצות שאנליסטים יכולים להיעזר בהן כדי להתמודד עם התופעה:

  • תבינו את העולם העסקי בו אתם פועלים – עסקים שפועלים במשך זמן רב יודעים ומכירים את העולם שבו הם פועלים גם ללא נתונים כלל. בהרבה מהמקרים המנהלים ידעו מייד להבחין במשתנה מתערב (גם אם הם לא ידעו לקרוא לו כך) ולכן, לפני ביצוע מחקרים כדאי מאד להתייעץ ולראיין את הגורמים המכירים היטב את העולם העסקי.
  • התעדכנו במה שקורה בעולם – לפעמים המשתנים המתערבים נובעים מדברים שאינם קשורים לסביבה העסקית באופן ישיר. לדוגמה, רעידת אדמה בצ'ילה יכולה להשפיע על המכירות בדרום אמריקה. סמארטפון מסוג חדש שיצא לאחרונה ומקל על הגלישה באתר ומשפר את כמות הרכישות במובייל. מחאת Black lives matter יכולה להגביר רכישת מוצרי הגנה עצמית בארצות הברית.
    לכל דבר שקורה בעולם יכולה להיות השפעה על הנתונים ועל הדאטה אנליסט להיות מעודכן כדי לבצע אנליזות טובות ומדויקות ככל שניתן.
  • היו ביקורתיים וענווים – גם אם אתם בטוחים בתוצאות המחקרים שלכם ולאחר שבדקתם שאין לכם שום טעות, משתנים מתערבים, בגלל האופי הלא מודע שלהם, עדיין יכולים לארוב לכם מעבר לפינה. על כן, תמיד תחשדו במסקנות שלכם, תמיד תניחו שעלולה להיות השפעה של משהו שאינכם מודעים אליו והציגו את הממצאים שלכם בענווה.
נכתב על ידי יובל מרנין.
לחברות המעוניינות בשירותי פרילנס או סדנאות של אנליסט, ניתן לפנות אליי [email protected]

Yuval Marnin

לחברות המעוניינות בשירותי פרילנס או מנטורינג של אנליסט, ניתן לפנות אליי ל[email protected]