יום ראשון , אוקטובר 22 2017
מבזקים
דף הבית > נושאים בכותרות > אבטחה ו-Cyber > שולחן עגול : אנליטיקה תובנות חדשות

שולחן עגול : אנליטיקה תובנות חדשות

P1580892 

יהודה אלידע: התכנסנו לדון בהתפתחויות האחרונות שחלו בתחום הבינה העסקית, Business Intelligence, שזה שם גג לכל הטכנולוגיות שמטרתן להפוך נתונים גולמיים לתובנות תמציתיות אותן ניתן לנצל לשיפור תוצאות עסקיות באמצעות תהליכי קבלת החלטות מבוססי נתוני אמת. בשנה האחרונה, לאחר תקופה של "התפקחות" מצפיות מופרזות ומהאשליה, שעצם איסוף הנתונים וניתוחם בכלים סטטיסטיים יביא להבנה עמוקה של המכניזם הסמוי של השוק ("היד הנעלמה" של אדם סמית), החלה התעוררות מחודשת של השקעות בתחום האנליטי, כאשר הדגש הוא על יכולת "הוליסטית" להבין את המציאות באמצעות Big Data. התיאוריה מכוונת לכך, שהתהליך האנליטי צריך לקחת בחשבון לא רק נתונים "מובנים", כלומר כאלה שעברו מיון, סינון, קטגוריזציה, דירוג על סקאלה דיגיטלית וקידוד בערכים מוגדרים חד משמעותית, אלא גם מידע "עמום" שמקורותיו לא נבחנו כנגד סולמות כיול וערכיו לא תורגמו בטבלאות המבטיחות קונסיסטנטיות לוגית. למעשה, ההגיון מאחורי הטענה שיתכן מצב של Garbage In – Gold Out הוא, שכך אנו מתפקדים בעולם האמיתי, ובדרך כלל לא טועים יותר מדי. ההחלטות שלנו כמנהלי תהליכים עסקיים מושפעות מתובנות אינטואיטיביות שנוצרו תת-הכרתית מניתוח אסוציטיבי של כמות עצומות של נתוני רקע, רלוונטיים ולא רלוונטיים, שנצברו בזיכרון האפיזודי שלנו. מערכת Big Data היא ניסיון לשחזר אלמנטים של אנליזה "קוגניטיבית" על מדיום דיגיטלי, תוך עקיפת המעצורים של הצמדות לדיוק המוחלט של לוגיקה פורמלית.

לתחום הזה, שניתן לשייך אותו למכלול טכנולוגיות הבינה המלאכותית, Artificial Intelligence, יש בעית אמינות אינהרנטית משום שהוא בנוי על מודל פסיכולוגי שאנשים מהעולם הזה, מנהלים ביצועיסטיים, לא מאמינים בו. "אתה אומר לי, שהתוכנה שלך יכולה לנחש בדיוק כמה תרנגולות ימכרו בראש השנה הבאה, בכל אחת ממאות החנויות ברשת הארצית שלנו?" שואל המנכ"ל הסקפטי את "מדען הנתונים" הצעיר, "איך זה? אתה אפילו לא יודע כמה עולה קילו בשר וכמה ארוחות משפחתיות נחגגות בין ראש השנה לשמחת תורה!" "כל מה שצריך לדעת זה לנתח את הנתונים שכבר נמצאים במחסן הנתונים של החברה לאור מגמות שנחקרו ופורסמו באתרים של משרדי הממשלה ושל כלכלנים במגזר האקדמי…" מגמגם האנליטיקן הנבוך, שבאמת לא מסוגל לענות על שאלות מתחום "מדעי הצרכנות המעשית". מנהל המכירות נהנה מלסובב את הסכין ולראות את "החכמולוג" מאבד את שאריות ביטחון העצמי שלו, "אתה אומר שהחיזוי של המכונה יהיה יותר מדויק מהניחוש שלי, אחרי אסתכל שנה אחורה ואוסיף על מה שהיה אז עוד 2.5%? לניחוש שני יש לכל הפחות Track Record שהנוסחה עבדה לא רע ב-30 השנים האחרונות, פלוס מינוס 1.25 אחוז. מה יש לך להציע חוץ מתיאוריה שאף אחד אחר לא מבין?"

למדנו, שאנשים העוסקים יומיומית במציאות המחוספסת של חיי העסקים, מנהלים שההחלטות שלהם מתורגמות להנחת כסף על שולחן ההימורים בתנאי חוסר וודאות, לא אוהבים BI. למעשה, הם נעלבים פעמיים: אחד, כשאומרים להם שיש מישהו שיודע קצת יותר טוב ממה שהניסיון שלהם צבר. ודבר שני, הם נעלבים מזה שראשי ביצה אומרים להם איך מנהלים עסקים, למרות שהם חיים בעולם אחר, בספירה אחרת. ככה זה היה מאז שהתחום התחיל לצאת מבתי הספר למנהל עסקים לעולם האמיתי. הניתוח הצליח למעשה רק ב-Post Mortem, אחרי שהחולה מת, כשהם רצו לדעת למה הקמפיין האחרון לא הצליח? או איך קרה שכל מה שהבאנו לעונת הקיץ נשאר על המדפים? היום אנחנו אומרים, כדי לשרוד בעולם תחרותי לא

אופיר אייזיק

אופיר אייזיק

מספיק לערוך Post Mortem. כי זה אומר שכל החברה כבר מתה. היום, במרבית המגזרים, עובדים על שולי רווח כל כך דקים, שאם עשינו שתי החלטות לא נכונות אף אחד כבר לא יתעניין בשאלה "למה סגרנו את הבאסטה?". לכן, בזמן האחרון יש דגש על יכולות חיזוי, Predictive Analytics, אנחנו רוצים לדעת מראש. הדיון שלנו ממוקד בשאלה המעשית: איך נכנסים למצב שבו BI חוזר להיות גורם מרכזי בספרית האפליקציות הארגוניות? שאף החלטה לא מתקבלת ללא קבלת חיווי חיובי מבסיס הידע של הארגון? שכל מקבלי ההחלטות משתמשים בכלים האנליטיים בכל דילמה המונחת על שולחנם – בדיוק כפי שאף אחד לא מעז היום לעשות פרויקטים בלי תוכנת ניהול פרויקטים. כמו כל התהליכים שהנהלת הארגון צריכה לדאוג שיבוצעו בדיוק על פי דרישות הרגולטור, עליה לדאוג לכך שכל מקבלי החלטות לעתיד יקבלו המלצות ממקור מוסמך, בניסוח כמותי ברור ורציונליזציה מתועדת היטב. כמומחי BI מובילים בשוק הישראלי, איך אתם חיים במציאות המאתגרת הזאת? מי רוצה לענות?

אופיר אייזיק, QlikView Israel: המציאות בשוק אינה בדיוק כפי שאתה מתאר, משום שאנחנו לא מתיימרים להגיד לארגון שאנחנו יודעים יותר טוב ממנו את הביזנס שלו. כדי לנתח ולנסות לחזות את העתיד, אנחנו מוציאים מהמשוואה את ההבנה העסקית העמוקה שרק הארגונים יכולים להביא. לדוגמה, אם אנחנו רוצים לחזות נטישה. לקוח שלא דיבר בחברה סלולארית שלושה ימים, הוא כנראה נוטש, אבל אותו לקוח אם הוא לא נכנס לחנות בגדים במשך שלושה ימים, לא יתחילו לחשוב עליו בתור נוטש.

יהודה אלידע: זה פרמטר שאתה מכניס לאנליזה.

אופיר אייזיק, QlikView Israel: כן, זה פרמטר עסקי, חוכמה עסקית אותה הארגון יודע לתת. אנחנו ניקח את החכמה העסקית הזאת כפרמטרים במנועים סטטיסטיים מאוד מתקדמים עם הרבה יכולות אלגוריתמיות, ואז אנחנו יכולים לעשות את הקסם: להעריך מתי הוא ייטוש באחוזי דיוק גבוהים ורמת מהימנות גבוהה, להעריך מה יהיו המוצרים הבאים שהוא יקנה. להגדיר מה טווח ההנחה שתשאיר אותו אדיש לפיתוי, ולתת את התמונה הכוללת ברמת דיוק גבוהה מאוד.

עמית מנור

עמית מנור

יהודה אלידע: שכנעת אותי, אבל אתה גם יכול לשכנע את הלקוח?

אופיר אייזיק, QlikView Israel: אני לא צריך לשכנע אותו, כי קל לי להוכיח לו את זה. זה הדבר שהכי קל לעשות במנועים סטטיסטים – מבחני A/B Test. אני יכול להציע לו: "בוא נגדיר מי יהיו הלקוחות שיינטשו בשנה הבאה." ניקח את הנתונים של שנת 2014 ו-2015 וננסה לחזות על הנתונים של 2016. בתום ה-POC נוכל להשוות את הנתונים ולראות האם מי שחזינו שייטוש ב-2016 אכן נטש. האם אלה שנטשו בפועל אכן סומנו מראש כנוטשים בסבירות גבוהה? אם כן, אז כנראה שאני יודע משהו. צריך אולי לחדד את הקריטריונים? אפשר גם לחדד אחורה, כלומר לפתוח את המסננים, עד שמגיעים למפתח אופטימלי ואז רצים עם זה קדימה. אני אפעיל את המנועים הסטטיסטיים על נתונים היסטוריים, שמספקים לי בקרה מבוססת אירועי אמת, בהתחלה כדי לחזות מה יקרה בשנה שכבר עברה ומשם אלך כל שנה ואדייק את הניתוח שלי כדי לחזות את השנה שעוד לא הגיעה.

עמית מנור, Vertica: המתודה שאתה מעלה פה היא אכן תפיסה נכונה, למרות שבעבר לא הייתה לנו היכולת האלגוריתמית ואת מאגרי המידע הדרושים לנתח הרבה מאוד דאטה. בעבר, הרבה מאוד החלטות היו החלטות אינטואיטיביות. היום יש לנו את הכלים ללכת ולקחת נתונים מהרבה מאוד מקורות מידע שונים, לשים אותם במחסן Big Data ולבנות עבורם מודלים שמאפשרים חיזוי הלכה למעשה. אנחנו רואים היום ארגונים שלמים שאם תיקח להם את ה-Data הארגונים יחדלו מלהתקיים. ארגונים כמו Uber או פייסבוק, נתונים הם הנכס היחיד שלהם. כל המוניטיזציה של פייסבוק, כל הערך של המניה, מבוסס רק על דאטה. כך גם חברות פרסום ואפילו חברות Retail, שיש להן נכסי נדל"ן וסחורות במחסנים שורדות בעיקר על דאטה. זאת אומרת, שהמודלים של BI בסופו של דבר עובדים, אחרת החברות האלה לא היו קיימות. היום, כשיש לנו את הכלים ואת הגישה הנכונה לאנליזה אפשר להבטיח תוצאות. עובדה, ארגונים

יניב מאיר

יניב מאיר

שאמצו אסטרטגיית ביג דאטה וכלים אנליטיים מתאימים, בהחלט שיפרו את התוצאות  העסקיות שלהם. גם זו סטטיסטיקה שאפשר להוכיח אותה.

יניב מאיר, מלם: זה מבחן התוצאה. כשאתם שואלים את סמנכ"ל התפעול, מנהל המכירות או CFO, שלקחו בעבר החלטות כאלה על בסיס "ידע אישי" או אינטואיציה "מהבטן", איך הייתם מחליטים היום? מה אתם ממליצים למנהל שנמצא במקומי? אז קודם כל, הם אומרים כן ל-BI. למה?? כי רובד הנתונים רחב יותר מכל מה שהמנהל מסוגל להכיר לעומק, בעוד שהמערכות האלה יכולות לקחת בחשבון מגוון וכמות אדירה של מקורות מידע. הוא לא יכל לשקלל את כל הפרמטרים כפי שהמנוע האנליטי יכול.

יהודה אלידע: פעם היו לו אינטואיציות והוא החליט למרות שהוא בעצם לא ידע מה מפעיל אותן.

יניב מאיר, מלם: כיום יש כיוונים מבטיחים עם כלים של מחשוב קוגניטיבי, אבל גם מתודות סטטיסטיות קלאסיות ממשיכות לתת ערך. המערכות היום יכולות לעבד במנועים שלהן ובאלגוריתמים הסטטיסטיים, הרבה יותר יכולות ממה שיכול החכם במנהלים. נכון, יש סטיות אך אם מדובר בפרומילים, זה מספיק טוב . שלא לדבר על גורם הזמן כמה זמן לוקח לבן אדם לעשות את האנליזות הדרושות ולחזות התפתחויות אפילו בקירוב גס, אל מול היכולת לעשות את העבודה באמצעות כלים ממוחשבים ומערכות אנליטיות, כדי להגיע בצורה הרבה יותר מהירה לחיזוי הרבה יותר "מהודק".

מאיר עשת:     אני רוצה לזרוק לכם שאלה קונקרטית. נניח שאני סוכן נסיעות גדול, סיטונאי, שרוצה להתמקד בהבאת תיירים ממזרח אירופה לארץ. לפני ימים הודיע שר התחבורה שכוונתו להוריד את המס הנוסעים בנמל התעופה בעובדה, וזה בהחלט יכול להשפיע על כמות טיסות שכר שיגיעו לאילת. השינוי הולך להיות משהו משמעותי, אולי Game Changer. איפה זה בא לידי ביטוי? האם זה בכלל יכול לבוא לידי ביטוי?

אופיר אייזיק, QlikView Israel: כפי שאמרנו, נדרש לכך ידע עסקי שהארגון או השוק צריכים לספק אותו. המערכות לא ידעו לעבוד מול עובדות היפוטטיות שלא עברו מבחנים בעולם האמיתי. כל המערכות שמתימרות "לנבא", לעולם יטעו אם לא יכניסו לתוכן גרעין של חוכמה עסקית. בדוגמה שלנו, הידע העסקי שכאשר הורידו מסי נמל בסך 75 דולר בכל מדינה אחרת בעולם, זה הגדיל את התיירות הנכנסת ממדינות מזרח אירופה ב-X אחוזים.

יהודה אלידע: אתם לא צריכים דוגמה מופרכת כל כך. יש למשרד התחבורה מודל בכמה תגדל צפיפות התחבורה בתל אביב, כשסוגרים את תחנת הרכבת "השלום". בכמה הם פספסו? בכמה אחוזים, או קרוב יותר ל-400?

עמית מנור,Vertica : המודלים האלה לא מחליפים פה את הבנאדם, הכלים מאפשרים לך לבנות מודלים ולשכלל אותם, לבצע היזון חוזר של המודל ולראות את ההשפעה על התוצאות.

תומר שטיינברג

תומר שטיינברג

ואם המודל הנוכחי אינו נכון, יש עשרות אלגוריתמים להריץ כדי לשפר אבל, צריך אדם שישב ויבחן את זה. כיום מי שיושב על המערכות האלה הואData Scientist , מומחה שהשקיע זמן בלמידת המידע בארגון. דרך אגב, זה החלק הכי ארוך בפרויקט עצמו. לקחת את הנתונים מהמקורות וללמוד אותם, להבין אותם ולהתחיל להבין את הקשרים ביניהם. האנליטיקנים בונים קטיגוריות ומאפיינים פרופילים של נושאים ואל מול המודלים האלה מתחילים להצליב את הנתונים. זה תהליך למידה.

אופיר אייזיק, QlikView Israel: אותם data scientists שעמית מדבר עליהם ממלאים פונקציה שהיא אולי הכי מבוקשת היום בעולם, לא רק בישראל. אתם מחפשים מישהו שבנוסף ליכולתו כמתמטיקאי או סטטיסטיקאי, יש לו יכולות פיתוח יישומים מאוד מתקדמות, והוא מסוגל להבין את הביזנס, זו ההבנה המאוד עמוקה של המודל העסקי…

יניב מאיר, מלם: חצי סופרמן שכזה…

יהודה אלידע: מדען שיודע, ששווה להשקיע אינטלקט כדי לעשות כסף. תובנה מאוד נדירה אצל מתמטיקאים…

תומר שטינברג, SAP: בשנים האחרונות ישנה תופעה של דמוקרטיזציה של Predictive Analytics. מאחר ומדעני הנתונים הם פונקציה כל כך נדירה וכל כך עסוקה, ישנם פתרונות העוזרים לאנליסט עם ידע מתמטי בסיסי לפתח מודלים כאלו במהירות. SAP BusinessObjects Predictive Analytics הינו פתרון כזה. הוא בעצם עושה אוטומציה של כל תהליכי מידול הנתונים, הלמידה וההטמעה של מודל כזה בתהליך העסקי של הארגון. באופן כזה ארגונים מאפשרים לייצר הרבה מאד מודלים המביאים להם ערך, עם מספר Data Scientists  קטן יותר. ב- Mbank, שנחשב לאחד המודלים לבנקאות דיגיטלית אין אף מדען נתונים. כל מי שמייצר מודלים הינו אנליסט. דרך אגב, גם מדעני נתונים משתמשים בכלי הזה, על מנת לבנות מודלים מהירים ופשוטים ולהתמקד בבעיות מורכבות אותן לא תמיד ניתן לפתור באוטומציה. מגמה זו אמנם חדשה, אבל SAP מובילה את התחום הזה של אוטומציה מזה 15 שנים.

עמית מנור, Vertica: חברת Uber, שהיא אולי חברת התחבורה הגדולה ביותר בעולם, אחד הלקוחות הגדולים שאנחנו עובדים איתם, מעסיקה 1,500 Data Scientist שבונים מודל חיזוי לכל שוק ברמה של מענה לשינויים רגולטוריים, איפה לספק תחבורה? באיזה שעות? איך אני מגיב לדוגמה לשינוי של טיסות? Data Scientist הוא אחד המקצועות היותר סקסיים, P1580882כפי שאפשר להבין מהבדיחה המסתובבת בין העוסקים בכך: אתם יודעים מה ההבדל בין data scientist לבין סטטיסטיקאי? – עוד 10,000 דולר בחודש!

יהודה אלידע: האם המודלים הנכונים לא נוצרים על ידי פיתוח אבולוציוני? לוקחים מודל גנרי, מזיזים בו באופן די אקראי נקודה פה, נקודה שם, ורואים לאיזה כיוון זה עובד, ואז חוזרים ומשפרים. למעשה, פיתוח אבולוציוני יכול להתבצע באופן אוטומטי, ללא ידע מיוחד באספקט העסקי, משום שבכל מקרה נתוני העבר הם שקובעים את "הבררה האלגוריתמית"?

יניב מאיר, מלם: אנו במלם מערכות מציעים כיום פתרונות על בסיס מגוון מערכות פיתוח או כלים אנליטיים שעובדים כך. יש בהן מודלים די בסיסיים, שניתנים להעשרה באמצעות כל מיני פונקציות סטטיסטיות כאלה ואחרות. ה-Data Scientist צריך לדעת במה להשתמש. בתור גוף עסקי לא באמת מעניין אותך איך צריך לנתח את הנתונים – אתה רוצה להגיע לתוצאות, ומהר. כיום באמצעות כלים אוטומטיים הכינו לך "סטודיו גרפי לפיתוח יישומי אנליזה" שכל משתמש עסקי אחד יכול להתנסות בו. את הכלים האוטומטיים לא מעניין איזה נתונים של איזה ורטיקל אתה מנתח, מה שחשוב יוצר זה הבנת הנתונים העסקיים. באמצעות כלים האוטומטיים  לא צריך לכתוב קוד, כך מנהלי הביזנס העסקיים, האנשים שמכירים את הקשר בין הנתונים לעסק שלהם טוב יותר מכל אנליסט חיצוני, יכולים לעבוד ללא ידע באלגוריתמיקה ומבלי להזדקק לשירותי Data Scientist כדי להגיע לתוצאות. היום, אין פיתוח BI בלי להטמיע בפלטפורמה יכולות Self Service. וכך גם העבודה של ה-Data Scientist בעתיד תשתנה, הוא יתעסק יותר בשכלול המודלים עצמם ולא באופן הבאת הנתונים ובכתיבת הקוד עצמו.

אופיר אייזיק, QlikView Israel: תרשה לי לתקן – זה לא בעתיד. אנחנו עושים את זה  כבר היום… יש ל- QlikView Israel, יכולות להנגיש מנועים סטטיסטיים מאוד מתקדמים למשתמש עסקי שאינו מדען נתונים. הנגשנו מנוע סטטיסטי,  שנחשב מאוד מוכר בעולם, והכנסנו אותו בקרביים של Qlik Sense. אנחנו מאפשרים ללקוחות שלנו להכין תסריטים של חיזוי, בדיקות השוואתיות וכל מיני תרחישים סטטיסטיים שרוב הארגונים המסחריים מחפשים להם מענה יחסית זול, נגיש למשתמשים העסקיים ללא צורך באנליסטים מקצועיים. יש לנו P1580890כבר כמה לקוחות שעושים שימוש מאוד נרחב ביכולות האלה, הם מבינים שיש להם פה יכולת שלא הייתה קיימת קודם – קסם אמיתי, מבחינתם.

תומר שטינברג, SAP: אני מסכים עם אופיר. פתרונות החיזוי מנסים להגיע למצב שבו קל לשלב חיזוי ויכולות למידה באופן אוטומטי. מנוע האנליטיקה המתקדמת של SAP משולב כיום בפתרונות רבים של SAP, החל מענן השיווק שלנו (Hybris Marketing Cloud), בפתרון האחזקה שלנו בענן SAP Predictive Maintenance and Service המחבר נתוני IOT יחד עם נתוני אחזקה ומביא להפחתת עלויות האחזקה ובפתרונות נוספים של SAP בעולמות של הכספים, המכירות והלקוח. ישנם גם לא מעט חברות שבחרו בפלטפורמת החיזוי שלנו ושילבו אותה במוצר שלהם.

עמית מנור, Vertica: אני מיצג כאן את ורטיקה (Vertica), בסיס נתונים קלומונרי (Columnar) , פלטפורמה אנליטית שנבנתה מראש לאינטגרציה עם מנועי הסטטיסטיקה הסטנדרטיים בסביבות שפות פיתוח היישומים R ו-Python. וכמובן לכל כלי ה-BI המקובלים בשוק. היכולת שלנו לשלב את הפונקציות של לימוד מכונה (Machine Learning) בתוך המוצר. ורטיקה "אומרת" שלא צריך יותר לבנות את המודלים מחוץ לסביבת הפיתוח. היכולת של Machine Learning, פונקציות לוגיסטיות ורגרסיות למיניהן, כלי סגמנטציה חכמים, כל אלה מהווים חלק אינהרנטי מתוך ורטיקה. אני בהחלט מסכים שהנושא של Self Service הוא דרישה מקובלת, כמו גם יכולת לתת למשתמש רגיל לבנות יישומים מעל מסדSQL סטנדרטי. יש כמובן תמיכה בכלי Open Source מתקדמים.

אופיר אייזיק, QlikView Israel: אנחנו רואים יותר ויותר תרחישים של ביג דאטה, עם מגוון מאוד רחב של מקורות נתונים, לא רק כמויות של נתונים אלא גם סוגים של נתונים: למשל קליטת נתונים למרשתות חברתיות, נתונים ממקורות רשמיים חיצוניים, כמו מזג אויר ושערי חליפין למטבעות, וכל מיני תוצרי אלגוריתמיקה מתקדמת הנמכרים על ידי חברות שלמדו איך לעשות מוניטיזציה לנתונים קנייניים. קחו לדוגמה את עולם ה-IoT, את רשת הסנסורים. העולם הזה פותח לכם יכולת לאסוף מידע על כל לקוח פוטנציאלי, בכל מקום ובכל נקודת זמן כדי P1580941לדעת איך להגדיל את הערך הכספי של הלקוחות שלך, בהווה ובעתיד. לשם השוק הולך.

יניב מאיר, מלם:  כולנו צרכנים היום, גם למשתמשים הפרטיים, כולם צורכים אנליטיקה בלי שנדע, לפעמים מבלי שנרגיש. בכל אתר פרסומי שאנחנו נכנסים, ממליצים לנו על מוצרים אחרים דומים וכד'.., בהתאם לפרופיל הצרכני שלנו ושיוכו לסטריאוטיפ של קונים אחרים מאותה קבוצת צריכה. בסופו של דבר, מאחורי כל אתר שיווקי מוצלח יש אנליטיקה חכמה, שנותנת את ההמלצות איך להוביל אותי להגדלת הקניה (Upsale).

יהודה אלידע: האם האנליטיקה הזאת שמציצה מלמטה צריכה להיות מתוכנתת מראש באלגוריתם ליניארי, משהו בנוסח "תן לי את הנתונים ותצא לך תשובה מוכנה מראש", או שמדובר בקורלציות הנלמדות מתוך הריצה עצמה, תובנות שהתכניתנים אפילו לא יודעים מה הן משקפות, אבל ניתוח ביג דאטה חשף. למשל, שבימי שני, משום מה, מוכרים יותר חולצות לבנות משחורות, ההיפך ממה שקורה בימי חמישי?

עמית מנור, Vertica: באמריקה אומרים One Size Doesn’t Fit All, יש כל מיני גישות לאלגוריתמיקה. יש פתרונות Black Box, שאתה מכניס שאלה, מקבל תשובה ואף אחד לא יודע איך התוכנה הגיעה למסקנה הזאת ויכול להיות ההקשרים בין המשתנים תביא אותך לתוצאה נכונה. יש עשרות אלגוריתמים בשוק שמאפשרים לך לבדוק What If תחת הנחות שונות, אלגוריתמים שיתנו לך תוצאות שונות בדרגות אמינות שונות. ויש חברות כמו Tabula או Out-brain, שעושות המלצות תוכן, כדי שאתה תגיע ישירות ללקוח בלי לעבור דרך הקופסא השחורה. זה ה-IP שלהן, נכס שהשקיעו בו עשרות שנות אדם והפכו את ה-Big Data שלהן למנוע הכנסות. שתי הגישות האלה נכונות. רק צריך לבחון בכל מקרה מה הסצנריו שמתאים למטרה.

יניב מאיר, מלם: הזכרנו כאן במהלך הדיון את הדברים המסורתיים, את ה-BI הקלאסי שמיישמים אותו עם פתרון Data Warehouse, טכנולוגיה שקיימת כבר 20 שנה ועדיין היא טובה P1580950לצרכים מסוימים. מהצד השני, שאנחנו רואים דרישה לאזור ניסויים, "ארגז חול" לאנליסטים, שיוכלו לתחקר את הנתונים. קיים שוני מהותי בין המערכות האלה, בטכנולוגיות הבניה ובמודל הארכיטקטוני שלהם ולאיזה צרכני מידע מיועדים.

מאיר עשת:  עד כמה התוצר קרוב לדרישה הראשונית?

יניב מאיר, מלם: בסופו של דבר התוצר הראשוני היום די קרוב, אנו במלם מערכות עובדים בשיתוף צמוד למשתמשים, ומיצרים מודלי POC ראשוניים אשר תורמים לאפיון הדרישות ולמתווה המודל הקונספטואלי הראשוני ולצמצום הפערים בין דרישות הלקוח לפתרון. כשעובדים ביחד, המשתמש רואה תוצאות הרבה לפני שהמוצר התגבש סופית ונעשה יקר מדי לשינויים.

אופיר אייזיק, QlikView Israel: אני חושב שהיום אין משמעות לשאלה הזאת, מה ההבדל בין מה שתכננו לבין מה שפתחנו. כי עולם ה-BI היום מבוסס על Self Service, ואם אתה מקבל מוצר שלא מוצא חן בעיניך, ביכולתך לעשות את השינוי לבד, בערך בשניה וחצי. הכל מאוד קל, כי השינויים נעשים "על המסך", בשיטות גרפיות של גרירה והנחה של אובייקטים עסקיים וחיבורם בדיאגרמת זרימה. כל גישת הפיתוח החדשה היא יחסית מהירה מאוד. פרויקטים שלמים נגמרים בשבועות ספורים וכאשר אנו מגיעים ללקוח חודש או חודשיים אחרי מסירת המפתחות ואנו מגלים שהפרויקט הזה השתנה מקצה לקצה. הוא נראה אחרת לחלוטין בהשוואה לרגע העליה לאוויר.

יניב מאיר, מלם: הלקוח גדל לתוך היכולות, הוא מבין איך להוסיף פונקציונליות, והוא מעשיר את  המוצר בעוד תכנים וביכולות מעוד עולמות תוכן.

יהודה אלידע: ואי אפשר לעשות את תהליך האופטימיזציה הזה אוטומטית?           אחרי שבמהלך הפרויקט הכנסת למנוע נתונים מהשנתיים האחרונות, במהלך הריצה השוטפת התוכנה בודקת איך משפרים את המודל כדי שהשנה השלישית תתאים למציאות טוב יותר, ומשנה לשנה ההתאמה נעשית אוטומטית והתיקונים קטנים יותר.

אופיר אייזיק, QlikView Israel: כן, זה קורה באופן אוטומטי. אם אתה חוזר רגע למודלים הסטטיסטיים במטרה לדייק אותם, עליך לדעת שהסטטיסטיקה עובדת גם על נתונים שקרו רק לפני שעה. סיום הפיתוח לא מקפיא את המודל. כל פעם שנכנס נתון חדש הוא מחדד את המודל.

תומר שטינברג, SAP: אחת הבעיות שאנחנו רואים בארגונים שמיישמים מודלים כאלו הוא שאין להם כמעט יכולת להתאים את המודל למציאות בשוטף, משום שאז צריך אותו מדען נתונים לתחזק את המודל ידנית. הפתרון של SAP מאפשר לתחזק אלפי מודלים בצורה קלה ואוטומטית. המערכת אפילו מתריעה כאשר הנתונים הנוכחיים חריגים.

מאיר עשת: ארגון שאין לו  עוד מערכות אנליטיקה BI וההנהלה מודעת לכך שצריכים להתקדם, אבל לא יודעת איך לאכול את זה. השאלה היא, האם יש המלצות או אסטרטגיה לאן הולכים מכאן?

אופיר אייזיק, QlikView Israel:לQlik – יש גישת מכירה ייחודית, משהו שאנחנו קוראים לו SIB, קיצור של Seeing Is Believing. בגלל שהטמעת התוצרים שלנו היא יחסית מאוד מהירה, אנחנו אומרים ללקוח: בוא נעשה מבחן היתכנות. אני לא רוצה התחייבות שתקנה דווקא ממני, אני רוצה שתרגיש את הערך בעצמך, ואז תגיד לי אם זה עושה לך שכל. ב-POC הלקוח מקבל במיקרוקוסמוס הדגמה של מה שהוא יכול לקבל בגדול בעולם האמיתי, כשנכניס אליו את כל הנתונים.

עמית מנור, Vertica: בכל תעשיה שברצונך להתמודד על מקום בין ספקי ה-BI שלה, אתה צריך קודם כל להבין את המודל  העסקי שלה. אי אפשר לברוח מזה, גם לא באמצעות המודל האנליטי. נכון, שבסופו של דבר אנחנו רואים הרבה מאוד דמיון בין ניתוח נתונים בבנקים לבין BI בתעשיית הטלקו – ובין שניהם לקמעונאות – כי בסופו של דבר לקוח זה לקוח, זה לקוח. נטישה של לקוח בורטיקל אחד משקפת תסכולים ופיתויים כמו נטישה של לקוח בוורטיקל אחר. היום, אחרי שהכלים הטכנולוגיים שוכללו, הפרויקטים מאוד קצרים ואפשר לתקן תוך כדי ריצה. יש אפילו כלים שמאפשרים לך לזרוק הרבה מאוד דאטה, שתופסים מקום מיותר במערכת האחסון, ולרוץ מהר יותר. יש אחלה בשוק אחלה מסדי נתונים, Dashboards, ומנועי ATL, כך שהארגון צריך רק לשאול את עצמו מה המטרה העסקית? מה הוא רוצה לתחקר, ואיזה נתונים יכולים לספק את התובנה.

יהודה אלידע: אני קמעונאי פשוט, שרוצה לדעת דבר פשוט, כי אני לא כל כך מתוחכם. למשל, לדעת לשקלל מחיר מול איכות השירות ומול זמינות. השאלה, במה עדיף לי להשקיע: בהורדת מחירים, בשיפור חוויית הקונים בחנות, או לדאוג שיותר ספקים ימכרו לי?

עמית מנור, Vertica: אתה יכול לנסות את כל האפשרויות. יש היום כלים להריץ תסריטי What If  וירטואליים, לשחק ולראות מה התוצאות. גם כשירותי ענן. להריץ את השאילתות ולקבל את התוצאות בקליק. אתה יכול להריץ את השאילתות על הרבה מאוד נתונים ולשקלל הרבה מאוד מידע שפעם אפילו לא חשבת לאסוף אותו. כדאי להסביר לקוראים, מה זה מודל? ראשית, אנחנו מסתכלים על חוק שמתאים לרוב המצבים, לא בהכרח לכולם, ביחס של 70-30 או 80-20. אני לוקח שנה אחורנית, מנתח סטטיסטית רק 70% מהנתונים שיש לי, מהם אני בונה איזשהו מודל מתמטי, שהוא אוסף משוואות על יחסים בין המשתנים הרלוונטיים. מאמן את המודל (כלומר, גוזר מהנתונים מה צריכים להיות המקדמים באותן משוואות) ומשווה את החיזויים שלו לגבי שאר 30 האחוזים מול הביצועים בפועל. התהליכים האלה מאוד דינמיים, אבל גם הכלים מאוד קלים לתפעול. אני חושב שהטכנולוגיה העכשווית  מאפשרת לכל אחד לעשות את זה.

יניב מאיר, מלם: כפי שהזכרתי יש היום מערכות אנליטיקה אוטומטיות לחלוטין. המערכות האלה אגנוסטיות לחלוטין ביחס לסוג הנתונים ומה הם מיצגים בעולם האמיתי. המערכות האלה מגיעות עם מנועים סטטיסטיים בפנים, ואלגוריתמים שמחליטים לבד, על פי סוג השאילתה, מה הכי נכון לעשות כדי להפיק את הניבוי המבוקש. הם נותנים לך תוצאה "גנרית" תוך דקות. מפתחי המוצר חיכו את דרך החשיבה והחוכמה של Data Scientist בתוך כלי אוטומטי כדי לתת תגובות הרבה יותר מהירות מאלה שה- Data Scientist יצליח להפיק בבניה לבד. P1580966בבחינות השוואתיות, מודלים ש-Data Scientist מדופלמים פיתחו ידנית מול אלה שהפיקו מנועים אוטומטיים, הגיעו לתוצאות די מקביליות. פרומילים של אחוזים לכאן או לכאן – לא משהו שישנה את העובדה, שהמערכות יודעות ללמוד בעצמן. אגב, יש גם מערכות שעוזרות להרבה ארגונים גם לשאול את השאלות, כי יש ארגונים שלא יודעים איפה להתחיל ואיזה שאלות לשאול. מבחינה זו הטכנולוגיה מקדימה בהרבה את הארגונים. כאשר אנחנו במלם מערכות מגיעים לארגונים, אנו שמים את הטכנולוגיה בצד, וקודם כל מנסים להבין את הבעיה עסקית. לאחר מכאן מגיעים להחלטה, מה אפשר לעשות כדי לתת פתרון לבעיה, ורק אחרי זה נערכים להתאים את הטכנולוגיה לפתרון. בדרך כלל אין בעיה טכנולוגית, הבעיה היא לזהות את המיוחד מבחינת הצורך העסקי ואיזה ערך ניתן להפיק מהמידע. גם Big Data זה רק אמצעי, פלטפורמה עליה תרוץ האנליטיקה, כמו אוטוסטרדה עליה האנליטיקה תוכל לטוס. המטרה של הארגונים איננה לעשות ביג דאטה, המטרה היא להגיע לערך עסקי באמצעות הביג דאטה.

אופיר אייזיק, QlikView Israel: נכון. הרבה פעמים אנחנו באים לארגונים שמבינים שיש להם בעיה, אבל הם אפילו לא יודעים איך לגשת לפתרון. ופה האתגר לפעמים אפילו יותר גדול, כי בכלים יש עושר אינסופי של אפשרויות. אנחנו עוד לא מגרדים את קצה הקרחון של היכולות.

יניב מאיר, מלם: לדוגמה, באחת הרשויות המקומיות בארץ מלם מערכות הקימה מודל אנליטי של תביעות. למה הכוונה? אותה רשות תובעת את האזרחים בגין ארנונה שלא משולמת בזמן, רישיונות בניה ואגרות לעסקים, קנסות חניה ואגרות פיתוח. יש למחלקה המשפטית הרבה תיקים פתוחים והם לא יכולים להגיע לכל כמות התביעות שהם צריכים למצות בבית המשפט, כי אין מספיק אנשים לטפל בזה וגם עלויות הטיפול בהתאם. המחלקה משפטית שאלה אותנו, במה להתמקד ובמה לא? כל תביעה דורשת הקצאת משאבים ועלויות של המחלקה משפטית, שלא תמיד יוחזרו בחילוט הדין. אז באיזה תיקים כדאי לעירייה להשקיע את המאמץ? המודל האנאליטי שפותח המליץ לעירייה, במי מבין התיקים הקיימים צריך להתרכז

יהודה אלידע: ויש גם אספקט פוליטי לקבלת ההחלטה. יש אוכלוסיות שלא כדאי להתעסק איתן ויש תעשיות שהעירייה רוצה למשוך לאיזורי התעסוקה. אלה שיקולים לא רלוונטיים לאספקט הכספי, אבל חיוניים לראש העיר. אז מי מכניס את החוכמה הפוליטית הדרושה לתהליך? זאת השאלה.

אופיר אייזיק, QlikView Israel: זה חלק מאותם שירותי יעוץ שהלקוחות שלנו מצפים לקבל – ויש לנו 1000 לקוחות בישראל. כל אחד מהלקוחות האלה, שכמובן לקח אותנו בגלל טכנולוגיה מאוד טובה ומתקדמת, בסופו של דבר מקבל פתרון הוליסטי. אני לא אומר שזה משום שאנחנו חכמים יותר, אבל יש לנו יותר ניסיון ואם הוא עובד אצל עוד 1000 לקוחות אחרים, סביר שזה גם יעבוד אצל הלקוח הבא. ואנחנו יודעים גם להתאים את הפתרון לתפקיד של הלקוח, למשל, מה שמעניין מנהלי שיווק ב-retail, לא בהכרח מעניין את מנהלי HR במגזר המוניציפלי. ודברים שמעניינים את ורטיקל הבנקאות לא רלוונטיים בסקטור הבטחוני. הנסיון הספציפי שאנחנו יכולים להביא לשולחן, הוא חלק מהערך המוסף שהלקוחות קונים מאתנו.

יהודה אלידע: כלומר אני צריך להחזיק חכמולוג, שיגיד לי מה לשאול ומי ידע לענות לי?

אופיר אייזיק, QlikView Israel: לא, אם הנתונים שלך ידעו להחזיק את התשובה, אולי רק בצורה סמוייה שנדרשת אנליזה מתוחכמת כדי לחלץ אותה, אני אדע להציף אותה.

עמית מנור, Vertica: אם תספק נתוני זבל, אין ספק שהתשובה שתקבל היא לא תשובה נכונה. זה בדיוק השלב שבו המודל "מזייף" וכך תגלה איזה אנשים סיפקו לך מידע לא נכון ואותם כנראה תחריג מהמודל.

אופיר אייזיק, QlikView Israel: אני רוצה לקחת את זה למקום אחר, לעיין בדינמיקה שהפכה לטרנד עולמי, הבנה עסקית שהוטמעה בהרבה מאוד ארגונים: הכוח של הארגון לא מתרכז בקצה הפירמידה, ההצלחה תלויה במה שנמצא בבסיס הפירמידה ולכן חשוב להנחיל יכולות BI להמונים, למשל, הטלר בבנק שיושב מול הלקוח רואה על המסך שלו בתוך סביבת העבודה הבנקאית אלמנטים של Embedded Analytics, אובייקטים של BI, שמאפשרים לו לצרוך תוצרי BI בלי להיות משתמש פורמלי של תוכנת ה-BI. ההשפעה של התובנות האלה על ההחלטות של  מי שנמצא בתחתית הפירמידה, ודרכו על ההצלחה של הארגון, היא משמעותית יותר גבוהה מזו של תובנות המגיעות למנהלים בדיעבד, דרך דוחות של אנליטיקנים ויועצי ניהול. מדובר ביכולות BI פשוטות יחסית, שקל מאוד לנתח אותן וקל מאוד להבין אותן ועם זאת נותנות ערך גדול לטלר המתנהל מול הלקוח. דבר כזה יכול להשפיע על ההצלחה של הארגון בצורה דרמטית.

יהודה אלידע:  בזאת הגיע הדיון שלנו לסיומו. יש עוד הרבה שאלות שהדיון בהן נדחה למפגשים עתידיים, ובינתיים ברצוני להודות לכל משתתפי "השולחן העגול" על הזמן שהקדישו לנו ועל התובנות שהם חלקו איתנו מניסיונם העשיר. נתראה בקרוב על דפי IT מגזין, מוסף המחשבים של גלובס, עיתון העסקים של ישראל.

אודות מערכת ITNEWS מאיר עשת

מנהל/עורך אתר ITNEWS. בוגר כלכלה ומנה"ס באונ' בן גוריון ו- MBA בירושליים. בעבר: כהן כיועץ כלכלי מטעם המדינה בהולנד ובהודו. היה סמנכ"ל שיווק בברדר, משנה למנכ"ל בסטארטאפ TVNGO, מנהל IT מגזין של גלובס בשנתיים האחרונות.