בואו נשים את זה על השולחן. יש ביקוש אדיר לאנליסטים ומומחי דאטה בתחום הדיגיטל. לגבי ההיצע – זה כבר סיפור מורכב. במאמר הזה אני אעשה קצת סדר לגבי שוק העבודה, הידע הנדרש ואיך מגיעים למיומנות הנדרשות, בין אם אתם אנשי שיווק, UX, מעצבים, מפרסמים, סטטיטיקאים, מקדמים או Whatever.
הצורך במאמר הזה נוצר בעיקר כי מגיעות אלי חברות עם דרישות גיוס שמערבבות דיסיפלינות מתחומים שונים ורוצים שהאדם שהם מחפשים ידע הכל. בדר"כ זה יוצר משרות עמוסות מיומנויות שאין ביניהן קשר, מכוונות לאדם שאינו קיים במציאות ובסופו של דבר לא פוגעות בשום דבר. משהו כמו "ללהקה וותיקה דרוש מתופף היודע לשיר אופרה עם נסיון של עשר שנים בלהקות רחוב צועניות. ידע בבניית מטבחים – יתרון".
דיסיפלינות הידע
הערה קטנה לפני שממשיכים. יש המון מונחים שמסתובבים בחוץ, עם המון פרשנויות שונות לכל Title וסוג תפקיד. הטרמינולוגיה השתנתה ומשתנה כל הזמן, אז אל לכם להיצמד ל"שמות התואר" אלא לנסות להבין את הצד העסקי של כל דיסיפלינה ומה היא תורמת לארגון ומה היא דורשת מבחינת ידע. מעבר לזה, אלו התפקידים המרכזיים וישנן עוד כל מיני תתי קבוצות ונישות שלא אכנס אליהם. ואם לסבך עוד את העניינים, הרבה חברות מדביקות את המונח Big Data איפה שאפשר, כאילו זה תבלין שתמיד צריך להוסיף לתבשיל אחרת לא יהיה לו טעם. אז לא (ואסביר בהמשך).
אנשי BI
תיאור התפקיד
אולי התפקיד הקלאסי והוותיק ביותר. דמיינו חברת תקשורת סלולארית גדולה. מסדי הנתונים מכילים מיליארדים של שורות בכל רגע נתון. כל שיחה, כל SMS כל פעם ששיחה נסגרת, מקפצת בין מתגים שונים, כל חיוב שבוצע, כל שיחת טלפון למוקדים – הכל נרשם ומתועד ב DB ענק ומורכב. אנשי ה BI (ראשי תיבות Business Intelligence) אמונים למעשה על ניתוח הנתונים הנצבר במאגר העצום הזה. חלקם עובד עם מערכות שתפקידן להתחבר למסד הנתונים הענק הזה, ולפשט את יכולת בניית הדוחות, כגון Business Object, Tableau דומיו. רובם צריכים לדעת SQL וייתכן אפילו שיידרשו להריץ שאילתות כאלה ישירות על מסדי הנתונים ללא שימוש בתוכנות עזר. הכל תלוי בנפח הנתונים ובמערך הנתונים של החברה. אנשי ה BI ואנליסטים אמונים על מתן תשובות לשאלות, שליפת מספרים, מורכבים ככל שיהיו, והגשה ללקוחות הפנימיים של הארגון. ואם זה נשמע לכם כמו אנליסטים לכל דבר – צדקתם, ואכן במקומות מסויימים שני התפקידים אפילו התמזגו לכדי תפקיד אחד וההבדלים כמעט טושטשו לגמרי.
יש עוד תפקיד שקרוי BI Engineer או BI Developer או Data-warehouse Engineer, שתפקידו הוא להכין את מסדי הנתונים ואת המבנה שלהם עבור אנשי ה BI. כלומר, הוא הארכיטקט שלוקח את מסדי הנתונים בפועל, בונה מעליהם שכבה נוחה ויעילה יותר לשליפת מידע (קרוי גם "קוביות") ומגיש לאיש ה BI סט של כלים לבצע שאילתות יעילות יותר. מעבר לזה, אלו האנשים שבונים את עולמות ה BI, מפתחים דשבורדים, והם בעיקר בצד הפיתוח ואוכלים לארוחת בוקר טכנולוגיות Big Data לאחסון וניהול מידע.
אגב, ברגע שעולם הדיגיטל הפך להיות מדיד וצמחו גם מערכות אנליטיקס שונות, חלקן מאפשרות חיבור מחוץ, כך שלעיתים חברות וארגונים שואבים את הנתונים ממערכו תאלו לתוך מסדי הנתונים הפניימיים של הארגון ולשיטה מרוכזת באמצעות מערכת ה BI.
שוב, המונח BI הוא רחב מאד אבל השימוש הצר והנפוץ שלו (בארץ בעיקר) מתייחס בדר"כ לניהול וניתוח מידע פנים ארגוני. אם אתם רוצים להיות דקדקניים בטרמינולוגיה, גם גוגל אנליטיקס הוא במובן מסויים מערכת BI.
ידע נדרש
אנליסט BI נדרש להיות שועל ב SQL ובעל יכולות אנליטיות גבוהות, כמו גם שליטה מופלאה באקסל והכרות עם כלי BI שונים. ידע בפיתוח – יתרון.
Data Scientist
אני לא יכול לכתוב על זה הסבר מפורט מבלי שמישהו יקפוץ ויגיד שזה כן נכון או לא נכון ומה פספסתי ומה חסר. התחום בתולי לגמרי וכולל ידע מדיסיפלינות שונות כך שאין באמת DS מסוג אחד כמו שאין מפתח תוכנה מסוג אחד. יש עשרות סוגים, וצריך למצוא את מה שמתאים לצרכים ולתשתיות שלנו.
אם אנשי ה BI עונים על תשובות לשאלות, הרי שה Data Scientist מנסה לברר את הסיבה שהמספרים נראים כמו שהם נראים, או בקצרה, אלו אנשי מחקר האמונים על ה"למה". ומכיוון שכך, האוריינטציה שלהם היא סטטיטיקה, המון מתמטיקה, בניית מודלים מתמטיים, פיתוח מודלים של Machine Learning וכו'.
מעבר לכך, אנשי ה DS אמונים בדר"כ גם על חיבור עולמות נתונים ממקורות שונים, טיוב וניקוי נתונים, ובניית תשתית שיכולה להחזיק עיבוד נתונים בכמויות אדירות.
ידע נדרש
עשיר ומפוצץ בתחומים ומאד תלוי בצורך, בתשתיות הקיימות ובסוג הפעילות. לדעתי זה המדרג אבל אפשר להתווכח (בתגובות). רשימה חלקית שעושה עוול לתחום, אבל חייבים לסיים מתישהו:
- סטטיסטיקה (הכי עמוק שאפשר..)
- מתמטיקה דיסקרטית (כולל אלגוריתמים)
- תורת המשחקים
- Data Mining tools – נתחיל מ SPSS או SAS
- Machine Learning
- (כל מה שלומדים במדעי המחשב – כולל תקשורת נתונים)
- שפות – Python, R, C++, Ruby
- טכנולוגיות כגון Ruby, Hadoop, Node
- DB – יש המון..Mongo DB, Casandra, Redshift.
מספר התחומים פה הוא עצום ואינסופי למען האמת ואין צורך לדעת את הכל משתי סיבות. הראשונה, זה בלתי אפשרי להיות מקצוען בהכל. השנייה, DS בדר"כ לא עובדים לבד ובצוותים של DS כל אחד תורם את חלקו.
מה שלא ציינתי ברשימה ומומלץ תמיד זה כמובן חוש עסקי. המחקר המבוצע מבוסס על הבנת המודל העסקי של החברה והמוצר, והבנה של האיזורים אותם יש לחקור והתרומה של המידע המתקבל לשיפור האקו-סיסטם כולו (ולשורת הרווח).
איך נהיים DS?
אי אפשר להתווכח עם העובדה ש Data Scientist זו המשרה המבוקשת ביותר כיום בעולם הטכנולוגיה והמוצרים. יותר אפילו ממפתחים מוכשרים. הבעיה היא שלא רק שההיצע קטן מהביקוש, אלא שההיצע לפעמים לא קיים. זה נובע מכמה סיבות. כמו שראיתם, תחומי הפעילות רבים. מפתח Ruby לא תמיד יודע Python ואלוף SQL לא יודע R. יש אלגוריתמאים וסטטיסטיקאיים מדהימים אבל רמת התכנות שלהם היא ברמת הפסאודו (כלומר קוד דמה שלא עובד באמת אלא רק מציג עקרון פעולה) והם זקוקים לגוף פיתוח שיעמוד מאחוריהם. כך או כך, קשה למצוא מישהו שעונה על כל הצרכים. ולכן, אם אתם רוצים להיות DS-ים מוצלחים ומבוקשים, הפשילו שרוולים ומעבר ללימודי הליבה שכמעט תמיד תצטרכו (מדעי המחשב, מתמטיקה וסטטיסטיקה) תצטרכו ללמוד שפות תכנות בכוחות עצמיכם. מבחינת Framework וטכנולוגיות – מומלץ להצטוות לפורומים, קבוצות ו Meetups של Big data העוסקים בנושא וללמוד משם. בסוף המאמר אנסה לפצח את עניין ה Big Data..
אנליסטים (Digital Analytics)
מסתובבים בשוק שני סוגי אנליסטים. האחד, שלא רלוונטי למאמר הזה, הוא אנליסט המבצע למשל איסוף מידע, מחקרי שוק, ניתוח פיננסי, ניתוח סיכונים וכן הלאה. אלו אנשים שעובדים בדר"כ בתוך חברות Retail או פיננסים, או בחברות ייעוץ ומחקר. הסוג השני, שיותר רלוונטי הוא אנליסט דיגיטל והוא רלוונטי לעניינו והסיבה שאנחנו כאן.
תחומי האחריות של האנליסט כוללים:
- הגדרת מה נדרש למדוד וסיוע או הטמעה בפועל של כלי המדידה (גוגל אנליטיקס ,מיקספאנל..לא חסרים כלים)
- ביצוע A/B Testing או Multi Variant Testing
- מחקר מתחרים
- ניתוח ביצועי קמפיינים פרסומיים
- ניתוח התנהגות גולשים באתר/אפליקציה
- UX Analysis
- להבין ולדבר שפת "מוצר"
- מתן המלצות לאופטימיזציה של האת/מוצר/תהליך/קמפיין מבוסס נתונים אמפיריים, יצירת נקודת ייחוס, מעקב לאחר השינוי וחוזר חלילה.
- ניתוחחים שוטפים, בניית דשבורדים ודוחות.
מה צריך לדעת ואיך לומדים?
בשוק הישראלי, על מנת להיות אנליסט או שועל CRO (שזה Conversion Rate Optimization) מוצלח, חייבים לכסות את הנושאים הבאים (על פי סדר עדיפות):
- להכיר את עולם הדיגיטל היטב. מאד קשה ללמוד אנליטיס ב"וואקום". עולם הדיגיטל והשיווק הדיגיטלי הוא בעל ז'רגון מיוחד וכל אנליסט חייב להבין מה זה SEO ואיך זה נעשה, ומה זה Inbound marketing ואיך עושים סושיאל ואיך בנוי קמפיין בגוגל או בפייסבוק וכו'. הדרך היחידה ללמוד את זה, היא לא רק קורסים אלא בעיקר התנסות בשטח, השתתפות פעילה בקבוצות ופורומים ולמידה אין קץ. אני שותף בעשרות קבוצות ופורומים החל מבניית אתרים, חווית משתמש, פרסום בגוגל, Growth Hacking, ניהול מוצר ונושאים רבים נוספים. זה למעשה היסוד הראשון המהותי לפעילות האנליטיקס. אתם יכולים להתחיל בהצטרפות לקבוצה שלנו בפייסבוק המונה מעל 1700 מקצועני אנליטיקס.
- לדבר "מוצר" – מה זה תהליך? מה זה לקוח? איך בונים דרישות, איך מאפיינים, מה זה חווית משתמש, כיצד מתנהל פיתוח של מוצר, כיצד מוצר נבנה ומנוהל והבנה של ה Business שעומד מאחוריו. זה היסוד השני. בלעדי שניהם, אתם עובדים בוואקום לא יעיל.
- גוגל אנליטיקס – לדעת הכל – מלמטה עד למעלה. יתרונות, חסרונות, אופן פעולה, "מאחורי הקלעים", יכולות איסוף נתונים, טכניקות ומתודולוגיות – כל מה שיש לכלי הזה להציע, החל מאופטימיזציה לקמפיינים, ניתוחי UX, ניתוח תעבורה, יצירת סגמנטים, הבנה של התנהגות הגולשים באתר ובכלל מהן יכולות הכלי. מי שרוצה ללמוד – אז את הבסיס בסיס, ממש למתחילים אפשר להתחיל ללמוד אצל גוגל כאן. אחרי המבט מלמעלה שזה יספק, מוזמנים גם לקורס שלי – הוותיק והמקיף בישראל.
- כלים נוספים – ידע בסטטיסטיקה, שליטה מוחלטת באקסל.
- כלי A/B Testing – שני כלים שאני אוהב לעבוד איתם Optimizely ו Visual Website Optimizer היודע בכינויו VWO. מומלץ להתמקצע באחד מהם וגם במתודולוגיה.
- הכרות טובה עם מערכת הפרסום Adwords ופייסבוק.
- Google Tag Manager – בונוס יעיל אבל מיועד בעיקר לאנליסטים עם אוריינטציה לפיתוח. לא יודעים על מה מדובר? מוזמנים לקורס למתחילים – כאן.
- מעקב וידאו – כלי Heatmaps או Video Tracking כגון Clicktale, Hotjar,CrazyEgg ודומיהם. מומלץ להכיר לפחות אחד אבל ממש טוב.
אז איך הופכים לאנליסטים בלי נסיון באתרים אמיתיים?
אכן בעיה שמשותפת כמעט לכל המקצועות והתשובה תמיד אותו הדבר והיא מתחלקת לשניים.
מעטים המעסיקים שמוכנים "לשלם" את זמן הלימוד עבור עובד שלא מכיר את החומר היטב ואין לו נסיון משמעותי. זה מהלך שטומן בחובו סיכון. אתה משקיע בעובד ומלמד אותו את מה שצריך וייתכן והוא יעזוב אותך אחרי כמה חודשים, והופך את המהלך ללא יעיל כלכלית. הפתרון לכך הוא בהסכמה על תקופת "התמחות". סטאז' אם תרצו. המעסיק יחשוף בפניכם את כל מה שצריך לדעת וישקיע בהדרכה וכו', ובתמורה תקבלו שכר נמוך משמעותית מהמקובל. זו הסיטואציה גם בתחומים אחרים אגב (כמו עריכת דין, ראיית חשבון וגם רפואה). רוצים מיומנות? שכר הלימוד חייב להיות מושת על שני הצדדים, כך המעסיק מקטין את הסיכון ואתם תחשפו למערכת מבפנים ותצברו נסיון.
האופציה השנייה פחות ידידותית אבל דורשת בעיקר תעוזה (זה לא באמת קשה כמו שזה נראה) – ללכת להיות עצמאיים. רגע רגע..אני לא מתכוון שאתם חייבים לרשום חברה בע"מ (אבל עוסק פטור או מורשה זו התחלה טובה) ולהתחיל לפרסם את עצמכם בגוגל. הציעו את עצמכם כנותני שירות קטנים עבור סוכנויות, בשכר מתלמד. משהו כמו:
"הי ושלום, שמי [..] ואני מתחיל ב Google Tag Manager, אוהב מאד את המערכת, למדתי אצל [..] וגם עשיתי קורס אונליין ב [.] וכבר עשיתי דברים מגניבים כמו […]. עם זאת, עדיין אין לי מספיק נסיון על מנת לעבוד כאנליסט בחברה כלשהי, ולכן אני מעוניין לסייע לכם במשימות קטנות כגון […] תמורות תעריף ידידותי מאד של [..]. לשעה. אתם יכולים לפנות לסוכנויות באופן ישיר, או לחברות, לפרסם בפורומים וכו' ולקוות שתפגעו באדם הנכון. בדר"כ זה פוגע.
עכשיו לעניין ה Big Data
ללא ספק, זהו ה Buzz Word הכי לעוס בשנים האחרונות שהייתי אומר אפילו שעושים לו Abuse במובן מסויים, אז בואו נעשה סדר. Big Data מתייחס לכל תורת הניהול של כמויות נתונים עצומות בארגון. כשאני מתכוון עצומות, אני לא מתכוון לאתר או אפליקציה עם מליון כניסות ביום, אלא יותר לכיוון ה 100 מליון Hits (יחידות מידע) ביום. לפחות. תחשבו בסדרי גודל של אינסטגרם, פייסבוק ורשתות אחרות (גפ Fiverr למשל)
ווליום כזה של נתונים מצריך מהארגון כמה דברים:
- תשתיות – שרתים וכו', בדרך שימוש מאסיבי בתשתיות בענן. אין מה לפרט יותר מדי.
- מסדי נתונים או סביבות שיכולים להחזיק כאלה סדרי גדול של נתונים במבנים המאפשרים ניתוח ועיבוד מהיר. ולא, DB של SQL למשל יהיה אחלה אבל שאילתות מעט מורכבות עלולות לארוך שלושה ימים. יש מסדי נתונים בעלי מבנה מיוחד או בעלי שכבת ניהול חכמה המאפשרת שליפה מהירה ויעילה של נתונים, כלומר, לא עוד מבנה טבלאי, אלא ממש מבנה מבוזר וייחודי של נתונים. בעולמות האלה ניתן לשמוע על RedShift (של אמאזון), Hadoop, MongoDB ועוד. רוב חברות הענק משקיעות מיליונים בפיתוח סביבות נתונים חדשניות (שאחר כך הופכות למוצרים רשמיים).
- שכבת ניהול ושליפת נתונים – אז איך עושים שאילתה על מאה מליון רשומות? איך בונים טבלה עם מאה עמודות? לשם כך, פותחו מערכות ניהול מידע שונות, המסוגלות לגשת למאגרי הנתונים ולבצע בהם פעולות באופן יעיל מבוסס אלגוריתמים מורכבים. שם תמצאו שמות כמו PIG, Splunk, Hive ורבים אחרים.
- ממשק עבודה – בסופו של דבר צריך מערכת שתציג את הנתונים, לא? אז על גבי הסביבות הנ"ל, הארגון מפתח לעצמו מערכות בקרה, דשבורדים וכלי ניתוח. לעיתים נעשה שימוש במוצרי מדף המתחברים למסדי הנתונים ולעיתים הארגון פשוט מעדיף לבנות אחד כזה לבד.
בין לבין, בחוץ מסתובבים מאות מוצרים וטכנולוגיות המייעלים את העבודה, פותרים כל מיני בעיות בניהול של Big Data ועושה רושם שאין יום שעובר בלי טכנולוגיית Big Data חדשה. התחום הזה מתפתח מאד מהר, ואפילו מהר מדי, וגורם להמון חברות לא מעט כאב ראש כאשר הן מגלות ששנה לאחר שהם אימצו את הטכנולוגיה הכי מגניבה, היוצר שלה מחליט שזה לא טוב וצריך לעבור לפלטפורמות אחרות.
אז איך קשור Big data לעניין האנליסטים?
גוגל אנליטיקס וחבריו אינם ערוכים לטפל במאסות אדירות של נתונים (גם גרסת הפרימיום של גוגל אנליטיקס לא ממש עונה על הצורך הזה). יתרה מכך, אלו כלים שלא ממש מתאימים ליצירת שאילתות מאד מורכבות המתאימות לצרכי החברה שמייצרת מיליוני יחידות מידע ליום. לכן, החברות פונות לפיתוח סביבות Big Data שתשרתנה אותם, אבל בסופו של דבר, נדרש אנליסט ו/או Data Scientist שיעבדו עליהם ויפיקו את המיטב מהנתונים. לרוב האנליסטים, אגב, אם המערכת מבוססת טכנולוגיות Big Data או לא, זה לא ממש משנה. זה שקוף להם. תנו ממשק ויכולת לנתח נתונים – והכל בסדר. אנשי ה DS, יצללו יותר פנימה אבל ישתמשו גם בשכבת הניהול של הנתונים להרצת שאילתות מורכבות. לשניהם אגב, אין שום חובה בלדעת האם מדובר ב Redshift או בתשתית Big Data אחרת. תעשו את ההפרדה בין התשתית, שכבת הניהול, ודרישות הניתוח.
אז איזה אנליסט אני?
היכרות עם הרבה מערכות זה אחלה. אנליסט טוב לא נמדד בכמות המערכות שהוא עבד בהם, אלא ביכולות האנליטיות שלו ובהבנת עולם האנליטיקס. מה אפשר למדוד, איזה ניתוחים אפשר לעשות, איפה צריך לחפור ואיפה יש סיכוי למצוא זהב. אצלנו למשל, יש פשוט אנליסטים טובים. לא משנה כמה הם אלופים ב Google Tag Manager או כמה קילומטרז' יש להם בעבודה עם R. את הכל אפשר ללמוד ודי בקלות. ההבדל הוא תמיד במה שיש בקודקוד ובהבנה של המתודולוגיה, ביסודיות, חריצות, חריפות וכן – נסיון בהרבה אתרים וגם "תחת".
אני מכיר Data Scientists שלמדו את עולם הדיגיטל והתמקצעו בגוגל אנליטיקס ומכיר שועלי גוגל אנליטיקס שלמדו R וסטטיסטיקה כדי להיות טובים יותר (וגם אני ביניהם).
מילה למפרסמי המשרות
מעבר לזה שההיצע בשוק הישראלי (ובכל העולם אגב) הוא קטן, לא מעט חברות נוקטות בגישת "תפסת מרובה" ומפרסמות משרה אחת, הכולל את כל התחומים שדיברתי עליהם כאן. אז בקשה למפרסמים – הקפידו בין דרישות חובה ל"יתרון". אל תגידו סתם Big Data מבלי להסביר מה עומד מאחורי זה וכמה זה רלוונטי למשרה.
בשורה התחתונה
אני מקווה שהשגתי את המטרה והסברתי שמדובר בתחום מרתק ומבוקש אבל עמוס בדיסאינפורמציה. לא התיימרתי לכסות את כל הוריאציות של המשרות וכל הטכנולוגיות שם בחוץ, אבל אני חושב שזו נקודת פתיחה טובה לדיון (