למה כדאי לדאטה אנליסט להבין בשיטות דגימה?

מעשה שהיה כך היה:
בשנת 1936 ביצע המגזין Liberty Digest סקר עצום בגודלו כדי לנסות לחזות את תוצאות הבחירות הקרובות בארצות הברית. המגזין שלח ל- 10 מיליון אנשים סקר בחירות וקיבל בחזרה תשובות מ- 2.5 מיליון אנשים. ניתוח התשובות ניבא שאלפרד לנדון ינצח את פרנקלין רוזוולט בתוצאה של 57% לעומת 43%. להפתעתם של עורכי הסקר והקוראים, רוזוולט ניצח וקיבל 62% מהקולות.

האנליסטים שפיענחו את הסקר שגו בניתוח הנתונים כיוון שבחרו מדגם לא נכון להסתמך עליו ויצרו הטיות סטטיסטיות שלא איפשרו להכליל את התוצאות על כלל האוכלוסיה.

טעויות הדגימה שעלו בבחירת האוכלוסיה – לא בוצעה דגימה רנדומלית (כלומר, לא היה סיכוי שווה לכל פרט באוכלוסיה להיבחר למדגם) והוא נשלח רק לבעלי טלפונים (שהיו אז בעלי אוכלוסיה מהמעמד הגבוה), כמו כן, התוצאות הסתמכו על חלק מהמשיבים (25%) אשר היו מוכנים לענות על הסקר, ולכן היו בעלי מאפיינים פסיכולוגיים שונים מאשר אלו שלא ענו.

טעויות דגימה עלולות להתרחש בכל אנליזה. אם למשל דאטה אנליסט בוחר להריץ מבחני ab testing רק על סגמנט מצומצם של האוכלוסייה או לבצע אנליזה על תת אוכלוסיה שאינה מייצגת את כלל האוכלוסיה, עלולות להיווצר הטיות סטטיסטיות שיולידו אנליזות שגויות.

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Yuval Marnin

אולי תאהב/י גם

כיצד לגייס דאטה אנליסט – מאפייני המועמדים

כיצד לייצר דו"ח BI לכמות אדירה של נתונים

איזה כלי BI ישרדו את מבחן הזמן?

מהו כלי ה- BI שבו מרבית האנליסטים משתמשים? – ניתוח סקר 2024 – חלק ב

AutoML מערער את הגבולות המקצועיים של דאטה אנליסט ו דאטה סיינטיסט