תוכן שיווקי

כתבה זו נכתבה והופקה על ידי כותבי תוכן מקצועיים בשיתוף גורם מסחרי.

כתבות התוכן השיווקי בגלובס כוללות מידע ענייני בעל ערך מוסף לקורא, תוך שמירה על שקיפות מרבית כחלק מהקוד האתי של גלובס.

Big Data בעידן הענן: טובים השניים מהאחד

מתודת Big Data מחוללת מהפכה קונספטואלית בשאלה - איזה תשובות אפשר לקבל מניתוח נתונים שנאספו כמעט באקראי, במגרפה גסה, ללא מסננים, ללא הקפדה על מבנה מוגדר?

מיזוג עסקה /צלם:   thinkstock
מיזוג עסקה /צלם: thinkstock

מעולם לא הצליחו האנליסטים לבלבל את מקבלי ההחלטות כפי שקורה ממש עכשיו בנושא האופנתי של Big Data. לא ברור האם הקושי נובע מכך שעל הדרגים המקצועיים, המנמ"רים והאנליסטים גם יחד, לבצע פניית פרסה בכל מה שנחשב במשך שנים כתורה למשה מסיני. או שנבצר מהם להעביר את הרעיון המהפכני לדרגים העסקיים, להנהלה הכללית של הארגון, שיש מציאות חייה ונושפת מאחורי השקופיות המוקרנות במצגת בחדר ישיבות הבכירים.

פריצת חומות ה-BI

Big Data, כידוע לקוראינו הנאמנים (השאר יכולים למצוא הסברים נוספים במאמרים שונים בגיליון זה), היא גישה הפורצת מעברים בכל 4 החומות שמקיפות פתרונות BI מסורתיים (שרק לפני 5 שנים התייחסנו אליהם כפורצי דרך!):

  • הנתונים לא מגיעים בהכרח ממסדי הנתונים הפרטיים של הארגון. פעם האמינו שהכלל Garbage In-Garbage Out פוסל שימוש בכל מידע שלא עבר מירוק (Scrubbing), אימות (Validation) ודרוג ערכי (Valuation), אינו יכול להפיק תובנות אמינות ומוטב שלא לשתף אותו בין חומרי הגלם של ה-BI. היום מאמינים שהיתרון התחרותי יכול לבוא דווקא מיכולת (לא מפותחת עדיין, אבל בתהליך למידה מהיר) כן להבין את הרעשים שמגיעים מהעולם החיצוני.
  • הנתונים לא חייבים בהכרח להגיע בתבניות מוגדרות היטב. מערכות מסורתיות גוזרות את המשמעות של נתונים מהשדות שהם תופסים בתבניות קבועות ומוגדרות היטב. לדוגמה, בניתוח מסמך חשבונית לא יתכן לבלבל בין התאריך לסכום - אבל לא בטוח שאותה אבחנה חד-משמעית תתקיים ב-Post ששלח בלוגר נלהב, שלא מחויב להתנסח במגבלות תחביר תקני. מערכות Big Data מבוססות על התפיסה שלא כדאי להשקיע בהפרדת המוץ מהתבן כי אתם לא יודעים מראש למי מהם יש ערך תזונאי גבוה יותר.
  • "חלון הזמן" לנתונים המעובדים אינו סטטי ואנו מדברים על תובנות הנכונות לרגע זה. הדינמיקה של העולם הווירטואלי גורמת לנתונים להעלות עובש תוך ימים ספורים, לפעמים שעות. אין טעם לנתח נתונים מלפני חודשיים אם אתם רוצים להבין את הזירה התחרותית היום. הדרישות של הלקוחות נזילות ביותר, הנאמנות לא קיימת, המתחרים מסוגלים לשנות אסטרטגיה מעכשיו לעכשיו ושמועות מתפשטות במהירות האור. חלון זמן קצר, שזז על ציר הזמן בקצב השעון האמיתי, מאפשר גם להתמודד עם הכמויות. אנו לא צוברים מטען עודף שיפריע לנתח את מעט "המטען המשתלם".
  • ניתוח הנתונים לא חייב להיות ליניארי וסדרתי, אפשר ליישם אותו "במחשוב מקבילי מסיבי" (MPP). פירוש המושג ליניארי כאן הוא מתווה קוהרנטי שקושר כל פרט למרקם מאוחד. התובנה הקלאסית אמורה להגיע מראיית כל התמונה במבט על ולכן חייבים למקם כל פיסת מידע במקום הנקבע על ידי הפיסות הגובלות בה בפאזל. בתפיסת Big Data אנו פחות מעוניינים בפרטי הסצנה ויותר במסר הכולל של התמונה. במטפורה של פאזל אפשר לומר שלא מעניין אותנו מה בדיוק מצויר בתמונה ואפשר להסתפק בחילוץ תובנות פשוטות מניתוח הרכיבים אחד לאחד: זו תמונת נוף אידילי בסגנון המאה ה-19, עם נערות רוחצות בנחל ורועה וכלבו צופים בהן ממחבואם בין השיחים, החתימה נראית אותנטית והמסגרת מסוגננת בטעם וינאי. לא צריך להרכיב את הפאזל כדי להחליט אם הייתם תולים את התמונה אצלכם בסלון.

עיבוד מקבילי מסיבי מאוד

מאחר וניתוח Big Data אינו לינארי, הוא לא חייב להתבצע בסדרת צעדים עוקבים. אפשר לטפל בכל פיסת מידע (או במספר פיסות על פי דרגת הסיבוך) בתהליך נפרד, מה שנקרא בז'רגון Thread. מעבד PC שגרתי, מהסוג שתמצאו במרבית המחשבים שעל המדף בחנות פרובינציאלית, מסוגל לטפל ב-8 תהליכים כאלה במקביל. שרתי להב, הבנויים בתצורת "אשכול" (Cluster) ויכולים להכיל אלפי מעבדים, מסוגלים לעבד סימולטנית עשרות אלפי פיסות מידע ולתייג את הפאזל העסקי האופייני תוך שניות ספורות. מחשב העל Sequoia של IBM שכבש את הפסגה (Top 500) בחודש האחרון כולל למעלה מ-1.5 מיליון ליבות בארכיטקטורת Power! היכולת להשתמש בשפע כזה של משאבי עיבוד מותנית באסטרטגיה ניתוחית מותאמת לפלטפורמה - וזו תמצית תיאוריית ה- .Big Dataבמקרה של המחשב הזה, Blue Gene/Q המותקן במעבדות הלאומיות Lawrence Livermore בעברו המזרחי של מפרץ סן פרנסיסקו, לא ברור מה בדיוק עושים המדענים בעוצמה מדודה של 16.32 Petaflops/sec. הממשל קנה להם את הצעצוע היקר כדי להריץ סימולציות של התפוצצות פצצות גרעיניות, שההסכמים מהמאה שעברה אוסרים לנסות אותן "על אמת". שום ארגון או חברה בישראל לא יכולים אפילו לחלום על רכישת עוצמה דומה (למעט על ידי בנייה של המחשב בידע מקומי) ולא רק מטעם המחיר הסטרטוספרי. אסור לייצא מחשבי על לישראל, על פי החוק הפדרלי, משום שישראל מסרבת לחתום על האמנה למניעת הפצת נשק גרעיני. זה מחיר "העמימות הגרעינית" שמשרתת את המדיניות הישראלית לא רע כבר 45 שנה.

המחיר המזעזע של בסיס חומרה מתאים הוא הסיבה מדוע בתודעה של מנהלי טכנולוגיה רבים, לא רק ישראליים, המושג Big Data מחובר בעבותות של מצוקה כספית למחשוב ענן. אומנם, גם אם תניחו יד על כל המשאבים הזמינים ב-EC2 של אמזון, לא תצליחו לקבל היום בענן עוצמה דומה לזו שניתן להפיק ממחשב-על צמרתי, אבל אתם גם לא חייבים להריץ אנליזות של התכה גרעינית ננו-שנייה אחר ננו-שנייה בלי לאבד אף נויטרון בדרך. וגם לא מוכרחים לנתח בכלים הכבדים ביותר את מה שאפשר לפתור באמצעים מסורתיים. "לא צריך תותח לייזר כדי להרוג יתוש מעצבן", אומר סרגיי אברמוביץ, מתמטיקאי שעזב את Lawrence Livermore כדי ליישם את הידע שלו בניתוח מודלים מורכבים כשירות ענן לספקולנטים בשוק ההון. "מאז שנות ה-70', הטכנולוגיה האנליטית המקובלת בחברות הברוקרים מבוססת על מודלים פיזיקליים של התנהגות מערכות מרובות דרגות חופש על סף הכאוס", הוא מסביר. "התיאוריה אומרת שבתנאים אלה, למרות שאתם לא מסוגלים לנבא מה יעשה כל גוף בכל רגע נתון, אתם כן יכולים להגיע לתובנות לגבי ההתנהגות המערכתית, שנובעת (Emerging Behavior) ממאפיינים סטטיסטיים גלובליים. התיאוריה הזאת הייתה מספקת בזמן שנכון היה להתייחס לשחקנים בשוק ההון כמו למולקולות גז אידיאלי או גרגרי חול בערמה. בשנות ה-90', אחרי שכולם אימצו את הרעיון של "מסחר מונחה מחשבים", המודל הנאיבי קרס. הקורלציה שנוצרה בין הפעולות האוטומטיות של מערכות המסחר הממוחשב, הפועלות באותה צורה ממש, גרמה למצבי "רזוננס" באולמות המסחר. תנודתיות חסרת תקדים - וחסרת היגיון כלכלי - הביאה את האנליסטים לחפש כלים אחרים".

לרסן את הקלות הבלתי נסבלת של גלישה לכאוס

"אני בטוח שטכניקות Big Data חופשיות מהחסרונות של מודלים לינארים, המצטופפים בחוסר נוחות על ספר הכאוס", אומר סרגיי. "ידיעה של יותר פרטים בנוגע לכול שחקן מוסיפה 'מסה' ו'חיכוך' למודל, מרסנת את הקלות הבלתי נסבלת של גלישה לכאוס, ומדמה נכון יותר את העולם האמיתי. לדוגמה, שווקים מסורתיים בהם סוחרים קטנים מציעים מוצרים פיזיים, הקונים מתלבטים ממי לקנות והספקים מתחשבים בשווי שימור היחסים עם הלקוחות ליום המחר, אינם מפגינים התנהגות כאוטית. מדוע? כי אי אפשר להעביר טון עגבניות מדוכן אחד לשני בלחיצת עכבר. המסה הפיזית יוצרת מומנטום מרסן אימפולסיביות. ויש מחיר להתפרעות לא אחראית. חלק מהעגבניות ימעכו בדרך, הקונים הקבועים ירגישו מרומים, הספקים ישנו את אסטרטגית החלוקה - והרבה זמן יבוזבז על מהלכי סרק. השוק המסורתי מתנהג בהיגיון בדיוק מהסיבה שהוא לא "שוק משוכלל" על פי הגדרות הכלכלנים. טכנולוגית Big Data משחזרת את אותן מגבלות בתוך מודל השוק הווירטואלי ולכן היא הרבה יותר קרובה למציאות מהמודלים "המושלמים" של התנהגות שוק קלאסית, שלא כוללים מאפיינים פיזיקליים של מסה וחיכוך".

השיחה עם סרגיי התנהלה במשרד קטן בפאלו-אלטו, "מעבר לפינה" ממשרדי Google. ברקע אפשר לראות את המרחבים הירוקים של אוניברסיטת Stanford. הריהוט, כנראה, הוא ירושה של חברת סטארט-אפ ששרפה את מקורות המימון שלה מהר מדי: 4 שולחנות שמורכבים מלוח סיבית עבה ולא מעובד המונח ללא גינונים על שני ארונות תיוק מפח אפור ו-4 כסאות שנקנו, ללא ספק, ב-4 מכירות חיסול נפרדות. במהלך השיחה רק שתי עמדות עבודה היו מאוישות, של סרגיי אברמוביץ' ושל שותפו ריק גונזלס, שממונה על תרגום התיאוריה המתמטית למערכת תוכנה מתפקדת. שני העובדים החסרים הלכו לאכול צהריים בקפיטריה של האוניברסיטה, מקום נפלא לפגוש חברים מתקופת הלימודים ולהתעדכן בנעשה בחזית המחקר האקדמי. "אני עדיין נדהם שאנשים מוכשרים כל כך מחפשים עבודה בקליפורניה", ציין סרגיי. "שני החבר'ה האלה הם דוקטורים מדופלמים, פיזיקאים שעבדו עד לשנה האחרונה במאיץ החלקיקים הידוע SLAC. מאז שמוקד המחקר באנרגיות גבוהות עבר ל-CERN, המאיץ הגדול בשוויץ, אנשים כמותם מחפשים קריירה חדשה באמריקה. אף אחד כבר לא משלה את עצמו שהפוליטיקאים שלנו מוכנים לשלם את המחיר של מקום ראשון בחזית המדע. נדמה לי שגם אצלכם, בישראל, אין יותר מדי עבודה לפיזיקאים. כך לפחות מספרים לי חברים מתקופת הלימודים בלנינגרד שבחרו להגר לישראל. והם גם מספרים שבישראל, כמו באמריקה, מי שרוצה "להביא מכה" עובר הסבה לפיתוח תוכנה. מי היה מאמין!"

לחזות את הבלתי ניתן לחיזוי

סרגיי הזמין פיצה וקולה, הפק"ל של הגיקים מאז שהיולט ופאקרד פתחו משרד במוסך לא רחוק מכאן, והציע לריק להצטרף אלינו בדיון על הקשר בין הענן ל- .Big Data "החיבור הזה הוא צורך עסקי, לא טכני, ואני לא מבין כל כך בצד הכספי", התנצל ריק בלי שהתבקש. "אך ברור לכול שמעט חברות מסוגלות להקים מכון Big Data לצרכים פנימיים בלבד. אני מכיר רק שתיים שעשו זאת, כאן בקליפורניה. האחת היא חברה לחיפושי נפט שבנתה מרכז עיבוד נתונים סיסמיים מדהים. מאות המאיצים הגרפיים, במקרה זה, עושים עבודה לא פחות כבדה מהתפריט האופייני של מחשב על ולאחרונה הם למדו שניתן להשתמש בהם גם כדי להאיץ את האלגוריתמים של .Big Data החברה השנייה מספקת שירותי ניווט מעודכנים בזמן אמת - איך להימנע מעומסי תחבורה, דרכים פקוקות ותאונות דרכים - בכל האזור מהאוקיינוס השקט עד למיסיסיפי. הרעיון שלהם הוא להאזין לדיבורים של נהגי המשאיות ברדיו CB ולהבין מהקשקושים היכן צפויה התעבורה להתעכב בעוד רבע עד חצי שעה. עבור הנהגים המקצועיים שמסיעים מטענים מחוף לחוף בנהיגה בלתי פוסקת, המידע הזה שווה זהב. הם לא מסתפקים במידע על בעיות ברגע זה, משום שהם מקבלים התראות אלה ברדיו מהמשרד ומעמיתים. הם רוצים לקבל מידע על העתיד ואת זה רק Big Data מסוגלת לספק".

שאלתי את ריק איך הוא הגיע למיזם. "מלגת ה-Post Doc שלי בסטנפורד נגמרה ורמזו לי שאין כרגע סיכוי לפתיחת מסלול קביעות בתחום שלי. זה היה בימים שהשמרנים עדיין הכתיבו לנשיא בוש מדיניות המתנגדת לניסויים בתאי גזע אנושיים, התנגדות שהובילה לקיצוץ דרמטי בתקציבי המחקר הממשלתיים שמימנו את עבודתי עד אז. עברתי מאונס לתחום הביו-אינפורמטיקה, ניתוח נתונים ביולוגיים, שמתרכז בזיהוי תבניות מעניינות בקובצי DNA ענקיים. נהניתי מהטכנולוגיה והשתעממתי מהמדע. וכך מצאתי את עצמי יום אחד מאזין להפצרות של סרגיי להצטרף אליו במיזם של מיסחור הידע של שנינו. שמעתי, השתכנעתי, ואני עדיין ממתין לכסף הגדול".

ביג דאטה בביג פארמה

סרגיי שלח אליו מבט חד ועצבני, אבל ריק לא התכוון באמת להתלונן. זה לא באופי הלטיני שלו. שאלתי אותו האם הרקע שלו במדעי החיים מספק יתרון בתחום החדש אליו הוא נכנס."בוודאי, אפשר אפילו לומר שהביו-אינפורמטיקה מתפתחת מול עינינו ממש ונעשית נגזרת יישומית של מתודת Big Data", הוא ענה תוך ריקון שפופרת קטשופ שנייה על משולש הפיצה שלו. "גם המימון שלנו כאן מגיע מחברת תרופות ידועה, שמחפשת רמזים בעיתונות הרפואית מהם יתכן לגלות תרופות חדשות."

צריך להבין שהפרוצדורה הממוסדת לגילוי תרופות היא בלתי יעילה בעליל. החוקרים, למעשה, מגששים דרכם באפלה, בודקים אלפי תרכובות כימיות מול מאות נגעים אפשריים, ורק מפעם לפעם מבליחים סימנים של אפקטיביות מסוימת. אז מנסים לבודד את הגורם הפעיל, לזהות מה גורם לו להיות פעיל במקרים אלה, לנסות לחזק את האפקטיביות ולהקטין תגובות שליליות של הגוף. אופיינית, זו הצורה הפיזית של המולקולה, שבמקרה מתאימה לנעיצה בתוך גורם המחלה וכך לנטרל אותו. "תיאורטית לפחות, אפשר לפעמים להגיע לידיעה הזאת בדרך קצרה יותר, אם למזלנו נמצא בספרות המדעית איזושהי התייחסות רלוונטית למבנה אותה מולקולה במחקר שנעשה לצורך שונה. או שנגלה כי נקודת התורפה של הוירוס הזה תועדה בעבר, באיזה שהוא מאמר אקדמי נשכח. הבעיה היא, שכמות המחקרים הרלוונטיים היא עצומה, להערכתי מעל 100,000 מתווספים כול שנה, התוצאות ברוב המקרים מנוסחות בשפה "לא מובנית". יש מי שמנסה לקלוט את המידע הזה במסד נתונים קונבנציונלי, רלטיביסטי, אבל סיכויי ההצלחה נמוכים. כדי לפרמט את המידע שנוצר בשוטף, צריך להעסיק כ-500 ביולוגים בוגרי תואר שני לפחות. אני מנסה לקלוט את התכנים כפי שהם, טקסט חופשי, בסריקת מסמכים סטנדרטית (OCR) ולנתח אותם בשיטות Big Data. אני מוכן להתערב שננצח במרוץ הזה".

המרגלות חוזרות מהקפיטריה

המשרד התמלא לפני שנגמר בקבוק הדיאט קולה השלישי. להפתעתי התברר כי 2 השותפים הזוטרים במיזם הן בחורות. שלא להפתעתי מרכיב האטרקטיביות הנשית שיחק תפקיד במשימה שהן קיבלו לבצע בקפיטריה של סטנפורד. אף אחת מהן לא חיכתה יותר משתי דקות לפני שגברבר אדיב הציג את עצמו וביקש רשות לחבור לה במהלך הארוחה. מרי-אן ממוקדת בשוק הקמעונאי, Retail, שהוא אולי הפוטנציאל הגדול ביותר של BI בכלל ו-Big Data בפרט. קלאודיה מתעניינת ביישומי ביטוח. סרגיי הרשה להן לדבר חופשית בנוכחותי, כנראה שהוא הבין שאני לא מהווה מתחרה פוטנציאלי שצריך לפחד ממנו.

"הבחור שטחן לי את המוח במשך שעה, מתעניין באופנת נשים", הצהירה מרי-אן. "אני חושבת שהוא הומו - וזה דווקא מושך אותי. אבל אתכם יעניין יותר לדעת את נושא המחקר שלו. איך לנתח את כל מה שכתוב בעיתונות הנשים על מנת לנחש בדיוק את הדרישה לעונה הבאה. הוא לא מדבר על קווים כלליים והשערות אינטליגנטיות. הוא רוצה מספרים מדויקים ברמה של דגם ספציפי, בד ספציפי, צבע ספציפי, ומידות מבוקשות לכל אזור הפצה לחוד! כדאי שתבינו את כובד המשימה. בכל התחלת עונה בארה"ב פושטות 50 מיליון נשים על חנויות האופנה כדי לעדכן את הגרדרובה. בממוצע, כל אחת תרכוש 4 פריטים לפני שתבוא על סיפוקה, בסך הכל 200 מיליון פרטי אופנה שמחירם הכולל מעל 30 מיליארד דולר. את הפריטים האלה צריך להזמין כחצי שנה מראש מעשרות אלפי ספקים קטנים וגדולים. כל ספק מקבל הזמנה המפרטת בין 50 ל-500 מספרים קטלוגיים, כל אחד שונה בפרט כלשהו - דגם, צבע, מידה וכדומה. בנוסף מרכזי ההפצה צריכים לקבל רשימות מפורטות, איזה מספרים קטלוגיים אמורים להגיע לכול חנות באיזו כמות בכול שבוע. תאמינו או לא, היום עושים את העבודה המטורפת הזאת כמה אלפי "מומחים" שמתפרנסים מהמוניטין שלהם כמנחשים טובים. הבחור שדברתי איתו - לא אכפת לכם שנפגש גם לארוחת ערב, נכון? הוא הומו, אז לא צריך לדאוג לי - מאמין שאפשר לפתח פתרון "מדעי" לבעיית הניחוש האופנתי".

הפסיכולוגיה של האופנה

"הרעיון הוא למזג מידע מובנה מסורתי, כל מה שנאגר במחסני הנתונים על העדפות הלקוחות בעונות קודמות, עם מידע לא מובנה שמתפרסם בעיתונות. נקודת מוצא לעבודה הנוכחית היא תוצאה של מחקר שהוא השלים לפני שנה לתואר PhD בפסיכולוגיה. במחקר הזה התבררה ההשפעה הדרמטית של עיתונות הנשים, במיוחד עיתוני האופנה העילית, על ההחלטות של קונות בפרקי הזמן הקריטיים האלה, כאשר המוטיבציה לרכישה אינה צורך פשוט בבגד אלא צורך נפשי בהתעדכנות. הנשים, ברובן, פושטות על החנויות בלי שיהיה להן ברור איזה בגד יגרום להן לשלוף את כרטיס האשראי. העיתונים מובילי דעת האופנה מדווחים, בדרך כלל, על תצוגות אופנה של מעצבים מהצמרת העולמית, שגם אם חיקוים זולים שלהם יגיעו לעיירה הקטנה ב-Mid West אין סיכוי שהגברת הכפרית תעז לצאת לרחוב לבושה כך. אז איך יודעים לחזות את התנהגותה הצרכנית של אישה שלא יודעת בעצמה מה היא רוצה לקנות? תנו ל-Big Data לעבוד. הנתונים מהם אמורה לצוץ הנבואה מפוזרים בחלקים אחרים של העיתון. בעולם המושגים של כותבות אחרות, לא יועצות האופנה, במכתבים למערכת ובמודעות. במיוחד כאשר אתם נותנים משקל נכון לעיתונות המקומית שה"מבינים" (Mavens, באנגלית אידישאית) אוהבים לבזות אותה. אלה "האנשים האמיתיים", הרוב השקט שעושה את רוב הקניות. אתם יכולים לכלול אותי בתוכם".

עבור קלאודיה ארוחת הצהריים עברה עם פחות רומנטיקה אבל לא פחות הצלחה מודיעינית. "זה מחקר חשוב של פרופסור בכיר במחלקה למנהל עסקים", היא פתחה ברוב חשיבות. "המטרה, אקטואריה מדויקת יותר של סיכוני ביטוח, במיוחד תאונות דרכים. היום תעריפי פוליסות ביטוח רכב נגזרים ממספר לא גדול של פרמטרים, כמו גיל, וותק בנהיגה, היסטוריה של תביעות, מגדר, מקום מגורים וכדומה. יש הרבה ממדים נוספים להערכת הסיכונים אבל הרגולטור לא מרשה להתחשב בהם. החברות רוצות לבדוק האם מידע הנאסף ברשתות החברתיות יכול לשים את האצבע על נהגים מסוכנים. לפי מה שאומרים עליהם החברים, לפי נושא השיחות שלהם והציוצים ב-Twitter וכו'. לא רוצים לחדור למתחם הפרטי, רק לנצל טוב יותר את מה שקיים במתחם הציבורי והרגולטור עוד לא אסר. אפילו שיפור קטן ביכולת הניבוי של תאונות יכול להתבטא בתוספת הגונה לרווח השנתי, משום ששולי הרווח בין מחיר הפוליסה לעלות הכיסוי בפועל הוא קטן מאוד. לחברות הביטוח יש אינטרס להעלות את מחיר הפוליסה לנהגים מסוכנים ככל האפשר, בלי להרתיע את השפויים. לא מפחיד אותן "להפסיד" את 20 אחוזי הלקוחות שדורשים 80 אחוז מתשלומי הפיצויים".

מי באמת מומחה?

בנקודה זו עבר הדיון לשאלה באיזו מידה הענן חיוני למימוש הפוטנציאל של Big Data. הניסיון של סרגיי, שבה מהקהילה הסגורה של שומרי סודות הגרעין האמריקאי, אינה טובה. "במגזר הממשלתי אני הייתי מתרכז בשלטון המקומי ובאדמיניסטרציה של מדינות חלשות יחסית", הוא טען. "אלה גופים שנאבקים בעלויות הגוברות של מערכות התשתית והם רגילים להוציא כמעט כל שירות אפשרי למיקור חוץ. במיוחד הם מתקשים בהוצאות הוניות אותן עליהם לממן בהנפקת אגרות חוב - וזו אינה סחורה חמה באמריקה העכשווית. ראש העיריה או מושל מדינה, טיפוסית, משלם סכומי כסף גדולים שנה בשנה עבור ייעוץ בספקטרום רחב מאוד של נושאים. האם הוא מקבל תמורה הוגנת לכסף? אפילו הוא לא יודע. והספקות לגבי הערך של יועצים חיצוניים רק מגדיל את העלויות כי לפעמים מבקשים חוות דעת משתי חברות רק כדי לדעת האם הן מגיעות לאותן מסקנות ובאיזה נושאים אין קונצנזוס."

טכנולוגית Big Data יכולות להציל את המצב. ואם הפלטפורמה היא בענן ומשלמים רק לפי צריכה, אפילו האופוזיציה הקולנית ביותר לא תוכל למצוא בו דופי. "אם נסתכל צעד נוסף קדימה, לימים בהם Big Data יהיה יישום שגרתי ונוח לשימוש בידי אנשים שלא הוכשרו לכך במיוחד, ראש העיר יוכל כך לנצל עודפי כוח אדם שהצטברו במערכת בתפקידים שהתרוקנו מתוכנם", אומר סרגיי. "אבל הממשל הפדראלי המסואב יתרחק מכל דבר שמריח Off The Shelf, פתרון שכל אחד יכול להשתמש בו מסחרית. תזכרו איך הפקידים האלה הוציאו את הנשמה למנמ"ר הלאומי, שבסך הכול ניסה להקים פלטפורמת ענן שלטונית, שתהווה משאב SaaS פרטי לכל משרדי הממשלה. שלחו אותו לחפש משרה באזרחות".

הרגולטור כמשבית שמחות

הקושי שרואה ריק הוא רגולטורי. "על כל צעד שאנו עושים בייעול מערכת ניהול הבריאות, ברפואה הפרטית ובציבורית, הרגולטור לוקח אותנו שני צעדים לאחור בדרישות מתהדקות לשמירה על מה שנקרא "פרטיות החולה". לפי הבנת הגאונים על גבעת הקפיטול, להשכיב עשרה חולים בחדר אחד ולהסתפק במסך בד דקיק בזמן שהרופא בודק ומדבר עם החולה, זה בסדר. להלביש אותה פיג'מה פתוחה מאחור, זה בסדר, כי זה נוח לצוות. לדבר במסדרון עם האחיות אודות טיפולים אינטימיים, גם זה בסדר. רק לתת גישה נוחה לתיק הרפואי למי שאמור להגיש עזרה ראשונה במקום התאונה - פה כבר יש סכנה לפרטיות. אולי הפארמדיק מתחזה ובעצם זה בלש של חברת הביטוח, או עורך דין מתחום ההתמחות שמוכר בתואר Ambulance Chaser. שנתיים אנו מחכים שחוק הבריאות החדש, Obamacare, יאושרר סופית בבית המשפט העליון (האישור ניתן רק לקראת סוף יוני, כשהעיתון היה בדרכו למכונות הדפוס) ורק ב-2013 נתחיל לראות ניצני מימוש."

"כמה זמן לדעתכם יעבור עד שאפשר יהיה לנתח בצורה יצירתית את התיקים הרפואיים של כל אזרחי ארה"ב כדי לגלות, למשל, שיש קשר בין מוצא אתני לטיפול המועדף? כולם יודעים שיש הבדלים גנטיים בין קבוצות אוכלוסיה, המתבטאים ברגישות למחלות מסוימות, לתרופות מסוימות ולטיפולים בהקרנה. אבל אסור לפרסם מסדי נתונים רפואיים-אישיים, אפילו תחת הגנות דיגיטליות הגיוניות, מחשש שחברות הביטוח ישתמשו במידע כדי לתמחר ביטוחי בריאות בצורה לא שוויונית, בדיוק כפי שהן עושות בביטוחי רכוש ורכב. הפוליטיקאים מעדיפים לטמון ראש בחול ובלבד שלא יאשימו אותם בסיוע עקיף לאינטרס של החברות".

לעבור מצד לצד במשוואת המכירות

מרי-אן בטוחה שבענף ה-Retail לא יתגלו בעיות. "החברות המובילות כבר מזמן מכורות ל-BI", היא אומרת. "בשלוש השנים האחרונות לא ראיתי אף חברה בעלת פריסה ארצית שלא הטמיעה אנליטיקה מתקדמת כדי להבין את ההבדלים התרבותיים בין אזורים דמוגרפיים מובהקים. המוביליות של האוכלוסיה, במיוחד הגעה של מהגרים לטיניים לאזורים בהם האוכלוסיה הוותיקה היא WASP-ית למהדרין, מחייבת עדכונים רצופים של הפרופיל הצרכני בכול נקודת מכירה לחוד. ואם הניתוח של Big Data יכול לסגור את הפערים בין התחזיות להתממשות, מדובר בחיסכון אדיר."

"היום לא כדאי להעביר בגד מחנות בה הוא מיותר לחנות בה קיימת דרישה לשכמותו. זול יותר להוציא אותו למכירה בהנחה דרסטית ובלבד ש"לא לזרוק כסף טוב אחרי כסף רע". אתם רוצים לדעת כמה כסף אפשר לחסוך כך? אתן לכם אינדיקציה לא רעה. אפשר להעריך את הפסדי המיקום הגרוע על פי היחס שבין מכירות סוף העונה למחירים שאותה סחורה הייתה מקבלת, אילו החלוקה הראשונית הייתה מביאה למכירה במחיר מלא. המספר המתקבל כפול, בערך, מסך מכירות סוף העונה (בממוצע, המחיר במבצע יורד לשליש מהמחיר על התג). ברמת הענף (לא החנות הבודדת) ההפסד מסתכם במאות מיליארדים בשנה. כל שיפור, אפילו של אחוז יחיד, במעבר מצד לצד במשוואה הזאת, מסיכום מכירות סוף העונה לסיכום מכירות תחילת העונה, שווה מיליארדים. ואם הפתרון זמין כשירות ענן, מה טוב. אף אחת מהרשתות לא באמת מאוהבת ב- Datacenter שלה. אפשר בקלות לחשוב על שימוש טוב יותר בשטח היקר הזה."

קורבן למולך דעת הקהל

השאלה הרגולטורית מציקה גם לקלאודיה. "המחוקקים לא אוהבים את ההבחנות שהמבטחים כל כך מעוניינים לקדם. זו, כמובן, בעיה של "קול ההמון". אף סנטור לא איבד את כסאו משום שכלל המבטחים משלמים כול אחד מעט יותר כדי לכסות את המעטים שמנצלים את עיקרון השוויון. אבל הרבה סנטורים בטוחים כי הם לא יישרדו פוליטית אם הם יתנו יד למהלך כלשהו שיהיו לו גם תוצאות שליליות, אפילו שהן בשוליים ואפילו אם הנפגעים לא זוכים באמת באהדת הציבור. ריק הזכיר קודם את Obamacare וזו דוגמה רלוונטית. אתם זוכרים את המהומה שקמה בעקבות השמועות השקריות, שהחוק יביא להקמתן של וועדות בהן ידונו בכל מקרה רפואי לגופו, איזה טיפול כלול בביטוח הבריאות הממשלתי ואיזה לא? "וועדות המוות" צעקו הכותרות בעיתונות השמרנית. והאנשים שחושבים כי בהחלט יש מקום לקריטריונים מוסכמים בשאלה, "איזה טיפול רפואי שווה את הכסף ומה מהווה בזבוז כספי הציבור מובהק, כספים שיכולים להביא תועלת גדולה יותר בשימושים אחרים?" סתמו את הפה.

לא רציונלי להתעלם מכך שיש הבדלים ביחס עלות-תועלת של טיפולים רפואיים, במיוחד הניסויים, אבל אי אפשר בדמוקרטיה להימנע הקרבת משאבים למולך דעת הקהל. חברות הביטוח יצטרכו להתחייב להורדה משמעותית בתעריפים לנהגים רגילים, גם כאלה שהייתה להם תביעה קטנה על נזק פחחות לרכב, לפני שתיווצר דעת קהל התומכת בהקטנת מעורבות הרגולטור. אני מחכה לתוצאות המחקר של הפרופסור שלי לפני שאוכל לקבוע האם הורדה דרמטית, משנה פרדיגמות, באה בחשבון. ואם כן, אזי הפתרון יתממש, ברוב המקרים, בענן הפרטי של כל חברה".