ראש המוסד לשעבר: "אין איפה להתחבא - אנחנו עירומים"

שבתי שביט ופרופ' עמי מויאל שמפתח אלגוריתמים לזיהוי קולי מספקים הצצה אל תעשיית המודיעין הממוחשב ■ G בעקבות חשיפת מערכת הציתות הגלובלית

סיפור חשיפתה של מערכת הציתות הגלובלית בארה"ב - PRISM שמה - בנוי מכמה וכמה סיפורים. הוא מפנה זרקור אל שאלת מחויבותו של הפרט כלפי עצמו וכלפי האידיאולוגיה הפרטית שלו מול נאמנותו לקולקטיב שבקרבו הוא חי; הוא מעלה שאלות כבדות-משקל בנוגע לאיזון העדין במשטרים דמוקרטיים בין הרצון לשמור על חיי אזרחיהם לבין המוכנות לפגוע לשם כך בזכויותיהם הבסיסיות ביותר; הוא עוסק ביחסי הגומלין הנסתרים בין ממשלות לחברות מסחריות שחולקות אינטרסים משותפים, שעיקרם הרצון לדעת עליכם הכול; הוא משרטט את קווי המתאר של עתיד קרוב, שבו שאריות פרטיותו של האדם הפשוט יוקרבו למען מדיניות כזו או אחרת; והוא מספר את סיפור ההתפתחות המדעית-טכנולוגית המדהימה שעברה בעשור האחרון קהילת המודיעין הבינלאומית.

כמה קל להאזין?

טכנולוגית, שני כוחות מנוגדים השפיעו בשנים האחרונות על המאמצים המודיעיניים של מדינות המערב. מצד אחד, עליית האינטרנט יצרה תעבורת תקשורת אדירה, שטרם נראתה כמוה בהיסטוריה של המין האנושי. בעולם האינטרנט, התקשורת לא רק הפכה לזולה להפליא אלא גם לאנונימית.

טכנולוגיות הסתרה כאלה ואחרות גרמו לבלבול מפחיד: אימייל שלכאורה נשלח ממינסוטה, עשוי היה באמת להישלח מפקיסטן ושיחת סקייפ שלכאורה מתנהלת בין שני משתמשים ממוגדישו שבסומליה, עשויה במציאות להתנהל בין שכנים בפרבר של לונדון. בעולם מרכזיות הטלפונים של פעם, כל זה לא היה אפשרי, וארגוני הביון עמדו בפני בעיה שצריך היה לפתור.

מהצד השני, ההוזלה הניכרת בעלות האחסון, אפשרה לארגוני הביון לשמור אצלם כמויות לא נתפסות של מידע. המידע הושג באמצעות שיתוף-פעולה עם ענקיות הטכנולוגיה האמריקאיות, אבל מרגע שהגיע לידי ארגוני הביון נדרש היה לסנן ממנו את החומר בעל הערך המודיעיני.

רק כדי לסבר את האוזן, הנה כמה מספרים שהופיעו במסמכי ה-NSA שחשף אדוארד סנודן: ב-2011 עמדה תעבורת האינטרנט בין צפון אמריקה לאירופה על 4,972 גיגה-בייט לשנייה. בין צפון אמריקה לאסיה הוחלפו מדי שנייה 2,721 גיגה-בייט, ובין צפון אמריקה לדרומה טסו בכל שנייה נתונה כ-2,946 ג'יגה-בייטים. תעבורת המידע בין אירופה לאפריקה, למשל, נמוכה בהרבה ועמדה באותה שנה על כ-343 גיגה-בייט לשנייה.

הנתונים הללו כוללים את כל סוגי התקשורת המוכרים לנו: שיחות טלפון על גבי תשתית האינטרנט, אימיילים, צ'טים, שיחות קוליות בתוכנות כמו סקייפ, שיחות וידיאו בכל המסנג'רים למיניהם והעברות קבצים. כך או כך, מדובר בהיקף לא נתפס של מידע, שמאז 2011 רק הלך וגדל.

"בסביבה התקשורתית שאנו חיים בה יש התפוצצות של אינפורמציה", אומר ראש המוסד לשעבר שבתי שביט, שעומד כיום בראש חברת אתנה שמספקת שירותים ביטחוניים ומודיעיניים לגופים פרטיים ולממשלות. "אפילו הארגונים הגדולים ביותר והעשירים ביותר לא מסוגלים להעמיד את כוח-האדם שיוכל לכסות את כל התעבורה התקשורתית מצד אחד, ומצד שני ברור שגם אי-אפשר לחסום את התקשורת. לא טכנולוגית ולא מבחינת הנורמות הציבוריות. אז איך מתגברים על הכמות הזאת של האינפורמציה? התפקיד הראשון של הטכנולוגיה הוא לפתח תוכנות שיעשו את הסינון - להוציא את המוץ מהתבן".

התוכנות שאליהן מתכוון שביט, שעמד בראש ארגון הביון הישראלי בין 1989 ל-1996, עוסקות בפיענוח דיבור אנושי באמצעות זיהוי של מילות מפתח מסוימות. זה נשמע מסובך, אבל בפועל זה הרבה יותר מסובך.

כל מי שנתקל במערכות אוטומטיות לזיהוי דיבור שנפוצות כיום במגוון רחב של אפליקציות - מסירי של אפל ועד מוקדי הזמנות כרטיסים לקולנוע - יודע שהן רחוקות מלהיות מושלמות, ולא סתם: לאנשים שונים יש מבטאים שונים, אינטונציות שונות וכמובן שהם גם דוברים שפות שונות. השירותים האזרחיים שאנו חשופים אליהם מכירים מספר מוגבל של מילים שרלבנטיות לתחום העניין שלהן. ארגוני מודיעין, לעומת זאת, רוצים לנתח דיבור ספונטני.

"הרעיון של טכנולוגיית איתור מילות המפתח הוא להזין מילה אחת או מספר מילים או מספר משפטים למחשב, ואז לסרוק את האינפורמציה. אם המילים שחיפשת מופיעות בה, המערכת מוציאה את המידע לטיפול מיידי של אנליסטים אנושיים", מסביר שביט. טוב ויפה, אבל איך עושים את זה?

פרופסור עמי מויאל ממכללת אפקה להנדסה, הקדיש את כל חייו המקצועיים לתחום זיהוי הדיבור. הוא למד וחקר את התחום במסגרת שלושת התארים שעשה באוניברסיטת בן-גוריון, עבר לתעשיית ההיי-טק המקומית והתקדם בה מתפקיד כותב אלגוריתמים ועד למנכ"ל חברה. ב-3 השנים האחרונות הוא עומד בראש מרכז המחקר והפיתוח לזיהוי דיבור שהקים במכללה ונמצא בקשר הדוק עם חברות מקומיות ועם ארגוני המודיעין הישראלים: אמ"ן, השב"כ והמוסד.

"בער לי בעצמות להקים מרכז מו"פ בתחום, כיוון שהתחום הלך ודעך באקדמיה בארץ", מסביר מויאל את המעבר מהשוק הפרטי לאקדמיה. "כדי לבצע מחקר משמעותי בתחום הזה אתה צריך להקים קבוצה גדולה, כי זה תחום אינטרדיסציפלינרי - בעולם עובדים עם צוותים של עשרות אנשים.

"כשהייתי בתפקידי מחקר ופיתוח בשוק הפרטי, חיפשתי שותפים באקדמיה כדי לדאוג לפיתוחים לטווח הבינוני והארוך, ולא מצאתי. כשכבר מצאתי שותפים, המנגנונים של החתימה על זכויות קניין רוחני היו כאלה מורכבים, שאף פעם לא הצלחתי ליצור שיתוף-פעולה אמיתי".

את המשיכה לתחום מסביר מויאל בכך ש"יש בו שילוב בין תוכנה וביצוע סימולציות לבין שימוש באלגוריתמים מאוד-מאוד חכמים, שנושקים לתחומים של אינטליגנציה מלאכותית וחיפוש - תהליכים של מחשב שלומד לבד. זה קוסם לי כי אני נמשך מאוד לתחום של תקשורת אדם-מכונה. אני מאוד מאמין בהתפתחות של סוג התקשורת הזה.

"בחזון שלי אני אתקשר עם רובוטים כפי שאני מתקשר עם אנשים. הרובוט יזהה את הדיבור שלי, הוא יזהה את האינטונציה שלי, הוא יבין אם אני כועס או מתרגש. תהיה לו גם יכולת לדבר איתי. זה חזון שיתממש בצורה מדורגת. בעוד כמה שנים יהיה רובוט בכל בית עם פונקציונליות בסיסית. הבעיה תהיה תמחור ולא טכנולוגיה.

"בתכנון יפה, מערכת זיהוי קולי שתוכל לתת מענה מושלם למשל במוקד עירוני יכולה לעבוד כבר היום. אם תנתח את מוקד 106 תראה שלא צריך שם יותר מכמה אלפי מילים. במידה של חוסר זיהוי - של נניח 5% - השיחה תועבר למוקדן אנושי. זו לא בעיה".

מויאל מסביר כי מאז הימים שבהם טכנולוגיית זיהוי הדיבור הופיעה לראשונה בחיינו - מבטיחה אבל לא בשלה - חלו בה שינויים מרחיקי לכת. "התחום של זיהוי דיבור מאוד מורכב, ובעבר היו בו הרבה חטאים של שימוש", הוא אומר. "היו הרבה שירותים שהיו להם למשל ביצועים של 70% שנכנסו לשוק. בעבר ניסו לקחת את זה למערכות כמו How may I help you? בטלפון, וכולנו מכירים את זה מ'סיינפלד'", הוא צוחק.

כל זה השתנה בשנים האחרונות כדי לסייע לפתור בעיות שאיתן מתמודדות כמה וכמה תעשיות. "כולנו יודעים, למשל, שכיום אנחנו לא יכולים לחפש בווידיאו. תחשוב שיש לך, למשל, נאום של אובמה שנמשך 3 שעות, ואותך מעניינות רק הדקה וחצי שבהן הוא דיבר על הסכסוך הישראלי-פלסטיני. הגישה המקובלת היא לתמלל את הפסקול, ואז אתה יכול לעשות חיפוש בטקסט שיביא אותך למקטע הקטן של התוכן שרצית".

מויאל מסביר כי כדי שמחשב יוכל לזהות מילים מסוימות בשיחה, משתמשים בשיטה מסודרת למדי. "יש מכניזם אימון, כמו שלילד יש כשהוא לומד שפה. ההגדרה הייתה ליצור בסיס נתונים של לפחות 200 שעות מוקלטות של הרבה מאוד דוברים בתנאים שונים; מישהו שמע את כל ה-200 שעות ותמלל אותן ואז כל המידע הזה הוזן לאלגוריתם שניתח אותו".

עם זאת, אומר מויאל, הקמת בסיס נתונים נפרד וייחודי לכל שפה הוא עסק יקר ומורכב - לפחות 100 אלף דולר והרבה שעות אדם. וגם אז מדובר רק בשלבים הראשונים של לימוד המחשב.

שביט מספר שבנוסף לתחומים הקלאסיים שבהם עוסקת חברת אתנה שהקים, היא כוללת גם בית תוכנה עצמאי שפיתח מערכות העוסקות בניהול מידע. "בהתחלה הטכנולוגיה הייתה לביטחון ולמודיעין, והיום היא משרתת גם בנקים וגופי אכיפה. כמו כן, אנחנו משקיעים בפיתוח טכנולוגיה לזיהוי קול וזיהוי דובר, שזו למעשה הרחבה של טכנולוגיית זיהוי המילים.

,ףהמטרה היא שנדע להוציא מאוקיינוס האינפורמציה את המידע הרלבנטי לצרכים שלנו ושנדע לזהות קול ודובר. אני מאמין שזה יהיה אפשרי טכנולוגית תוך שנה עד שנה וחצי, והמשמעות היא קפיצה משמעותית מאוד באיכות המודיעין. בעולם הזה אין יותר איפה להתחבא. אנחנו עירומים".

הכתבה המלאה - במגזין G