המדריך נכתב על ידי יובל מרנין.
לחברות המעוניינות לשפר את משימות ניתוח הנתונים על ידי מנטור דאטה אנליסט מנוסה, ניתן לפנות אליי [email protected]
הקדמה
תחום הניתוח נתונים קיים מספר שנים ועדיין לא התגבשו נהלי עבודה מסודרים המקובלים על כלל האנליסטים כפי שקיים במקצועות ותיקים יותר כמו פיתוח תוכנה.
בעקבות זאת, בהרבה מהמקרים תהליכי הגיוס והחפיפה של דאטה אנליסטים חדשים על עבודות אנליזה קודמות הוא מסורבל ולוקה בחסר.
בנוסף על הקושי בביצוע חפיפה לעובדים חדשים, היעדר נהלי עבודה מסודרים פוגעים גם בביצועים של מחלקות האנליזה בחברה. אם כל אנליסט עובד באופן שנראה לו מתאים, שיתוף המידע בין האנליסטים נפגע וכאשר אנליסטים צריכים לגבות אחד את השני (למשל בעת חופשת לידה או מילואים) קשה להם להבין את העבודה של האנליסט השני והנתונים שיצאו עלולים להיות שגויים.
בפוסט הבא אתאר מספר המלצות של נהלי עבודה שכדאי לכל חברה לאמץ כדי לשפר את היעילות ושיתוף העבודה בין האנליסטים.
תיעוד שאילתות SQL
בכל משימה יש לדרוש מהאנליסטים לתעד ולהסביר מה קורה בשאילתות שלהם ומה היה קו המחשבה שהנחה אותם בכתיבת השאילתה.
אני יודע שתיעוד גוזל מהאנליסטים מעט זמן מביצוע האנליזה אך הוא מאפשר לשתף את המידע בין האנליסטים בקלות וגם מאפשר לאנליסטים שביצעו את המשימה להבין בקלות קוד שהם כתבו לפני תקופה ארוכה, ולכן תיעוד שאילתות יכול למנוע שגיאות ובזבוז של זמן רב בעתיד.
התיעוד צריך להיות תמציתי וברור ויכול להיות בקובץ ה- SQL עצמו.
סטנדרט של כתיבה בשאילתות SQL
סטנדרט של כתיבה הוא דבר חשוב מאד כאשר עובדים עם קוד ולכן בתחומי התוכנה התפתחו שיטות רבות איך לכתוב קוד קריא כדי שגם המתכנתים האחרים יוכלו להבין בנקל את הקוד.
סטנדרטים אלו עדיין לא התפתחו בנהלי העבודה של כתיבת שאילתות על ידי אנליסטים ולכן כדאי מאד לחברה לאמץ סטנדרט כתיבת שאילתות שהאנליסטים יעבוד לפיו.
לא אוכל להיכנס לעומק בפוסט זה על הנושא של סטנדרט כתיבה נכונה בשאילתות SQL אך אציין שבדרך כלל מומלץ לאחר כל ביטוי SQL לרדת לשורה חדשה ולעשות ident של מספר רווחים (אפשר להשתמש במקש TAB) כדי שתהיה הפרדה ברורה בין הבלוקים של הקוד.
קיבוץ פרטי אנליזה בספריית רשת יעודית
אנליזה היא תהליך המכיל פריטי מידע רבים, וכדי שיותר מאנליסט אחד יוכל לעבוד על האנליזה כדאי לאגד את כל פרטי המידע הללו בספריה ייעודית אחת. מומלץ שספריה כזאת תשב ברשת שיתופית שיש לה גיבוי. זה יכול להיות גוגל דוקס או ספריה ברשת הפנימית של החברה.
פריטים לדוגמה שיכולים להופיע בספריה – מייל שבו רשומה הדרישה מהגורם העסקי של האנליזה (או משימה ב- JIRA), קובץ עם שאילתת SQL, דו"ח של כלי BI , אקסל או גוגל שיט, קישור לעיצוב ב- Figma וכו'.
טיפ: ישנן תוכנות לכתיבת SQL שלהם אפשרות להתחבר לספריות (למשל DataGrip) ובמקרה זה ניתן לגשת לספריה ישירות מתוך התוכנה לקבצי הקוד של ה-SQL .
שימוש חוזר בקוד SQL
בכל חברה ישנן שליפות מורכבות החוזרות על עצמן בשינוי קל כמו בחירת תאריכים אחרים או סגמנט אחר. את השאילתות האלה ניתן לשמור במקום יעודי ונגיש לכל האנליסטים כדי שלא יצטרכו "לשבור את הראש" כדי לכתוב את השאילתה מהתחלה.
כמו כן, אם הדאטה-בייס שלכם תומך בשאילתות עם פרמטרים, ניתן להוסיף פרמטרים לשליפה ואז להתאים אותה בקלות לשליפה שתרצו לבצע.
המדריך נכתב על ידי יובל מרנין.
לחברות המעוניינות לשפר את משימות ניתוח הנתונים על ידי מנטור דאטה אנליסט מנוסה, ניתן לפנות אליי [email protected]