האירוע שכל התעשייה חיכתה לו: אנבידיה מציגה את הדור הבא של הבינה המלאכותית

הכנס השנתי של החברה הלוהטת בעולם התקיים בסן חוזה וסיפק שורה של בשורות מרכזיות • מהדור הבא של שבבי הבינה המלאכותית, דרך שיתוף-פעולה עם אפל ועד לחידושים בענף הרכב • כל הפרטים מהאירוע השנתי של אנבידיה

ג׳נסן הואנג, מנכ''ל ומייסד אנבידיה / צילום: Reuters, Walid Berrazeg
ג׳נסן הואנג, מנכ''ל ומייסד אנבידיה / צילום: Reuters, Walid Berrazeg

סן חוזה. הכנס השנתי של אנבידיה, GTC 2024, נפתח בסן חוזה בקול תרועה גדול - בטיימינג שלא יכול היה להיות יותר טוב עבורה: רק לאחרונה נהנתה מטייטל חדש של החברה השלישית בגודלה מבחינת שווי השוק בוול סטריט.

באירוע המרכזי של הכנס, חשף המנכ"ל והמייסד ג'נסן הואנג כמה כותרות משמעותיות ביותר: הדור הבא של הבינה המלאכותית ויכולות עיבוד משופרות במיוחד, דמוקרטיזציה לתחום הבינה המלאכותית לכל החברות, גם קטנות ובינוניות, וגם - שיתופי-פעולה מעניינים.

ראיון | החברה שמשגעת את העולם עומדת לקנות אותם בעסקת ענק: הכירו את רונן דר ועמרי גלר 
אנבידיה במגעים לרכישת חברת בינה מלאכותית ישראלית

האירוע הנוכחי של אנבידיה התנהל כמו חגיגה אחת גדולה. הואנג, האיש שעומד בראש החברה הכי חמה בוול סטריט, הרגיש משוחרר, סיפר בדיחות על הבמה והתחכך בקהל.

"אפשר להתבלבל ולחשוב שאנחנו בהופעה, אבל למעשה אנחנו במסיבת עיתונאים", אמר המנכ"ל, ואחרי סרטון מוצלח הוא פלט "אלוהים, כמה אני אוהב את אנבידיה". ובכלל, לאורך כל האירוע הוא סיפר בדיחות ונראה היה שהוא נהנה מכל רגע.

הדור הבא של עיבוד בינה מלאכותית

ההכרזה המשמעותית ביותר של אנבידיה בתחום החומרה היא ארכיטקטורה חדשה שלפי החברה, "תניע את עידן המחשוב הבא". אנבידיה חשפה את NVIDIA Blackwell, ארכיטקטורה שתאפשר לארגונים בכל העולם לבנות ולהריץ בינה מלאכותית גנרטיבית בזמן אמת - עם מודלי שפה גדולים בעלי טריליוני פרמטרים וביעילות אנרגטית של פי 25 ביחס לדור הקודם, NVIDIA Hopper, שהושק לפני שנתיים. בין החברות שכבר אימצו את Blackwell נמצאות מיקרוסופט, מטא, גוגל, אמזון ו-OpenAI.

מנכ''ל אנבידיה, ג'נסן הואנג נואם באירוע GTC 2024 / צילום: נבו טרבלסי
 מנכ''ל אנבידיה, ג'נסן הואנג נואם באירוע GTC 2024 / צילום: נבו טרבלסי

במילים פשוטות, אם עד כה השבבים היו מחולקים לשני סוגים - שבבי אימון ושבבי יישום - הארכיטקטורה החדשה מאפשרת את שני החלקים באותו המעבד. "מדובר בשבב החזק ביותר שיש בעולם", אומר בתדריך כתבים עמית כץ, סמנכ"ל מוצרים באנבידיה. למעבד החדש יש 208 מיליארד טרנזיסטורים, ולדברי החברה יכולות המעבד מגיעות לפי 4 בתחום האימון, ולפי 30 בתחום היישום, וכל זה ביעילות אנרגטית.

בזמן הצגת הדור הבא של השבבים, התלוצץ המנכ"ל, ואמר - "it’s okay hopper", או בתרגום חופשי לעברית, "אל תבכה ילד" כלפי הדור הקודם של השבבים.

"אפשר לטעון שמדובר בדור הבא של המעבדים של החברה, אבל חייבים להסתכל על זה כקפיצה משמעותית במיוחד של החברה", אומר לגלובס בוב אודונול, מייסד ואנליסט ראשי של Technalysis Research. "תהליך עיצוב של שבבים לוקח שנים רבות. השבבים שהיום משמשים לבינה מלאכותית הם טובים, אבל לא עוצבו במיוחד לזה. אנבידיה משיקה כאן דור חדש של מעבדים שמיועדים ל־AI ועם היכולות המתאימות עבור בינה מלאכותית ויישומים רלוונטיים. זה מה שהופך את ההכרזה הזו למשמעותית".

פיתוחים כחול-לבן

בנוסף, שבבים אלו כוללים את הדור החמישי של טכנולוגיית NVLink - פרויקט דגל כיום של מרכז הפיתוח והמחקר הישראלי - כדי להאיץ את הביצועים של מודלי Mixture-of-Experts. הטכנולוגיה הזו מציעה רוחב פס של 1.8 טרה-בייט לשנייה על כל רכיב כזה, ומאפשר חיבור של עד ל-576 GPUs עבור מודלים מורכבים במיוחד.

המשמעות היא אדירה: העיבוד לא נעשה רק ברכיבי ה-GPUs עצמם, אלא גם בתווך בין המעבד לרכיבי התקשורת נעשה עיבוד, מה שמאפשר לפנות את הרכיבים להתעסק במשימות אחרות. משמע, הפחתת העומסים פה אדירה ומאפשרת עיבוד של פרמטרים רבים יותר.

קפיצת המדרגה הזו מגיעה גם לסופר שבב שנקרא NVIDIA GB200 Grace Blackwell. עבור חברות רבות שרוצות לבנות דאטה סנטרים, אין את הידע לעשות את זה - ולכן כאן אנבידיה נכנסת לתמונה. היא מאפשרת לחברות לרכוש מערכת שכזו, סוג של ארון שבבים. בעזרת חיבור יכולות של רכיבים שונים, הסופר שבב מציע שיפור של עד פי 30 בביצועים בהשוואה ל-NVIDIA H100 עבור הסקה במודלי שפה גדולים, וגם ביעילות אנרגטית של פי 25.

המערכת הזו כוללת בתוכה 72 שבבים מסוג בלאקוול שהוכרזו כעת ועוד 36 שבבי Grace CPU ובעזרת טכנולוגיית NVLink שפותחה בישראל. היכולות האלו משמעותיות כשרוצים להגיע לביצועים הטובים ביותר. המערכת כולה פועלת כ-GPU אחד ומספקת 1.4 אקסה-פלופס של ביצועי AI ועד ל-30 טרה-בייט של זיכרון מהיר.

המוצרים השונים האלו יהיו זמינים מאוחר יותר השנה כשחברות הענן הגדולות יהיו בין הראשונות להציע את שבבי הבלאקוול.

"חנות אפליקציות" של בינה מלאכותית

לאנבידיה חשוב להבהיר שהיא לא רק חברת חומרה של מעבדים, אלא גם חברת תוכנה. בחברה, כך מספרים, יש יותר מהנדסי תוכנה מאשר מהנדסי חומרה. לכן, הכרזה משמעותית נוספת שעשה הואנג, היא על NVIDIA NIM - קטלוג עשרות מיקרו-שירותים של בינה מלאכותית גנרטיבית מבית חברות שונות כמו מטא, מיקרוסופט ועוד. לאנבידיה יש את האפשרות לעשות זאת משום שהיא עובדת עם המון חברות והיא שחקן מפתח דומיננטי.

האינטרס של אנבידיה הוא להרחיב את השימוש בבינה מלאכותית, מה שמגביר את הדרישה למעבדים ולשירותים שלה. היא עושה "דמוקרטיזציה לבינה מלאכותית", ובה בעת גם מרוויחה בדרך הזו לא מעט. "אמנם כולם מתרכזים יותר במעבדים עצמם, אבל אני חושב שמבט הלאה, הסיפור של ה־NIM הוא המשמעותי יותר", אומר אודונול. "זה הופך את אנבידיה לחברת תוכנה ושירותים ולא רק חברת חומרה. זו הזדמנות כלכלית אדירה עבורה, וזה פותח צדדים חדשים בעסקיה שלה".

לדבריו, בכך התלות של התעשייה בענקית השבבים תגדל: "התעשייה תהפוך עוד יותר תלותית באנבידיה, והחברה שרוצה להיכנס לתחום ה־AI תהיה קשורה יותר לרכיבי ה־GPU של החברה". עם זאת, הוא סבור שבעתיד אנבידיה תתקשה לשמור על כך לאורך זמן ותאבד נתח שוק.

"אנבידיה מנסה להשיג יותר שליטה על האופן בו מודלים מיושמים ומותאמים לחומרה שלה", מוסיף אנשל סאג, אנליסט מחברת מור (Moore). "אני חושב שאנחנו רואים הרבה מהמודלים האלו כדרך לשפר ביצועים ולעמוד בציפיות של אנשים. אין ספק שהכרזה כזו היא טובה לתעשייה אבל זה גם טובה לאנבידיה. היא יכולה לסייע לה לשמור על מעמדה בתחום".

אירוע GTC 2024 של אנבידיה / צילום: באדיבות אנבידיה
 אירוע GTC 2024 של אנבידיה / צילום: באדיבות אנבידיה

המשמעות היא שעסקים שונים, גדולים, בינוניים וקטנים, יכולים לפתח בעזרת APIs של חברות רבות ושונות - בלי הצורך להעסיק דאטה סיינטנס או להיות באוריינטציה של בינה מלאכותית.

במילים פשוטות, מדובר בסוג של חנות אפליקציות כדוגמת אפסטור או גוגל פליי, רק עבור יישומי בינה מלאכותית. זה יאפשר לחברות להשיג את המודלים שהם צריכים כדי להתחיל ולפתח את היכולות הרצויים.

באנבידיה מנסים לענות על שלושה צרכים שעולים: הראשון, להתאים את המודל שיעבוד בכל מקום ושהמידע הקונקרטי של החברה יהיה שלה.

השני הוא יעילות - אין מספיק מהנדסי נתונים, וייקח זמן עד שהעולם יכשיר עוד אנשים. בשביל לענות על היעילות שכאן, אנבידיה מפתחת מערכת לסיוע לחברות.

הצורך השלישי הוא הערך. כחברה שבונה את המודל, יש ידע על הלקוחות ועל המתחרים. בכך, אפשר לקחת את הערך של החברה צעד אחד קדימה. כשהם מאפשרים גישה לחברות ומנגישים עבורן מודלים שונים, הם לוקחים את כל הידע שהצטבר ואורזים זאת בחבילת תוכנה עבור אנשי תוכנה "רגילים".

האפשרות החדשה מצטרפת לחבילת התוכנה Nvidia AI Enterprise של החברה. כלומרף לקוחות שכבר משלמים - 4,500 דולר לשנה עבור רכיב GPU (דולר לשעה על רכיב GPU), לא ייאלצו להוסיף תשלום.

בשורה התחתונה, אנבידיה יושבת על שיבר מרכזי. הטענה של החברה היא שיש כמה שחקנים שעושים את זה, ולמעט העובדה שהיא מתווכת לרכיבים נוספים, היא לא לוקחת עמלה. עם זאת, האינטרס של אנבידיה הוא שיעבדו יותר ויותר עם בינה מלאכותית, מה שמגביר את הדרישה למעבדים שלה ולשירותים שונים שהיא מציעה. היא עושה "דמוקרטיזציה לבינה מלאכותית" - אבל היא גם מרוויחה בדרך הזו לא מעט.

שיתוף-פעולה עם אפל

אמנם בשקט-בשקט, כמעט בלי רעש וצלצולים, הכריז הואנג על שיתוף-פעולה מאוד מעניין עם חברת אפל. לדבריו, API חדש של פלטפורמת Omniverse Cloud ייכנס לתוך קסדת המציאות המורחבת של אפל, Vision Pro. המשמעות היא שיהיה אפשר למפתחים לייצר תאומים דיגיטליים של מוצרים שונים במטא-וורס.

לדוגמה, ב"דמו" שהוצג - חברת רכב תרצה להראות לצרכן איך בדיוק ייראה הרכב שהם רוצים לרכוש. זה עדיין לא באמת משנה את התעשייה, כי עדיין לא אימצו באמת את הקסדה של אפל, אבל אין ספק שיש פה קריאת כיוון מעניינת במיוחד.

הבינה המלאכותית מגיעה לתעשיית הרכב

הכרזה נוספת של אנבידיה קשורה לענף הרכב. יצרניות מכוניות כמו BYD, GAC AION, Waabi, XPENG ישלבו בעתיד את המעבד, NVIDIA DRIVE Thor, מחשב מרכזי שמיועד לכלי רכב.

מדובר בפלטפורמת מחשוב ומספקת לנהגים יכולות של בינה מלאכותית גנרטיבית - לצד יכולות נהיגה אוטונומית בטוחה. הפלטפורמה קיבלה יכולות חדשות שמבוססות על ארכיטקטורת ה-GPU החדשה Blackwell שהוצגה. המשמעות היא יצירת עוזרים חכמים, כמו פרסונות דיגיטליות שישוחחו עם הנהגים כדי לסייע להם בזמן הנסיעה - הן מידע רלוונטי כמו חוקי התנועה המקומיים.