גלובס - עיתון העסקים של ישראלאתר נגיש

האם המודל החדש של ג'מיני מצדיק את ההתלהבות?

מודל הבינה המלאכותית החדש של גוגל, ג'מיני 3, מציע מספר מצבים - מהיר, חושב וקנבס - עולה 20 דולר בחודש ומהווה שדרוג משמעותי לעומת הדור הקודם ● עם זאת, גם כעת לא מומלץ לסמוך עליו בעיניים עצומות

ג'מיני 3 / צילום: Shutterstock
ג'מיני 3 / צילום: Shutterstock

בימים האחרונים ביצעה גוגל את קפיצת המדרגה המשמעותית שהיא הייתה צריכה - והשיקה את מודל הבינה המלאכותית החדש שלה, Gemini 3, שעליו תידרשו לשלם 20 דולר בחודש (כמקובל בשוק). החברה מתפארת בכך שעד כה יש לג'מיני יותר מ־650 מיליון משתמשים חודשיים, ועם השיפור הנוכחי, הצפי הוא לעלייה בכמות.

אחד האנליסטים המשפיעים בוול סטריט ממליץ על 10 מניות ומשוכנע: חברות ה־AI עוד יזנקו
מכוונת לבטן הרכה של אנבידיה: גוגל בדרך לשווי שוק של 4 טריליון דולר

מבחני ביצועים זריזים בשוק הכריזו על ג'מיני 3 כמודל הטוב ביותר שיש כיום בשוק, אך הם התבססו על ביצועים באנגלית. כאן נציג בדיקה שנעשתה ברובה בעברית, עם השוואות לביצועים באנגלית.

החידוש העיקרי: יכולות הסקה משופרות

בגוגל אומרים כי המודל החדש מוצלח יותר בכל הנוגע להסקה והיגיון, כך שהוא מבין בצורה טובה יותר ובפחות אינטראקציה את הפרומפטים שמבקשים ממנו. בעיקר ניתן לראות כיצד במצב שנקרא "חשיבה" (Thinking) הוא מפרק את השאלות לחלקים, ומתייחס לכל חלק בצורה ייעודית. כך הוא מגיע לתוצאות טובות יותר, גם אם זה לוקח קצת יותר זמן.

כדי לבדוק זאת, ניסינו מספר פרומפטים שדורשים חלוקה רחבה יחסית של משימות. למשל, שאלנו גם את ג'מיני וגם את ChatGPT מה צריך לעשות אם רוצים לארח קבוצת חברים לצפייה משותפת של משחק כדורגל. המודלים לא התבקשו לבצע רכיב אחד מתוך כל הערב, אלא לומר מה צריך להכין לקראתו.

שני המודלים נגעו פחות או יותר באותן הסוגיות. ג'מיני ירד לפרטים רבים יותר מאשר GPT שהיה יחסית כללי, ומנגד, GPT חשב על כמה חלופות לכל אפשרות - לדוגמה, לא להכין את האוכל אלא להזמין בחוץ. גם שאלת הפולואפ הייתה שונה אצל כל אחד: בעוד שג'מיני הציע מתכונים להכנה מהירה שמתאימים לערב צפייה במשחק, ב-ChatGPT הציעו להכין רשימת קניות ותפריט בכמות מדויקת למספר האנשים. התוצאות בשני המקרים היו טובות.

משימה נוספת שניתנה למודלים היא לפתור תרגיל מבגרות במתמטיקה של 5 יחידות בתיכון. בעוד שהמודל של גוגל הצליח לענות נכונה על השאלה, גם במודל המהיר וגם במודל החושב, ואף להסביר כל שלב בתרגיל, GPT עדיין חשב ולא הגיע לפתרון. גם כשהוא התחיל לפעול, הוא כתב את התשובה בצורה איטית, ולקח לו זמן להגיע לפתרון (שהיה נכון).

המודלים השונים עדיין עושים טעויות, גם עובדתיות וגם מהותיות. התוצרים שתקבלו ידרשו טיפול, ולא תמיד התוצאה הראשונה תעבוד - בין אם זו תמונה שלא תיראה טוב או טקסט לא נכון. לדוגמה, העלינו למודל קובץ וורד, וביקשנו לבצע שינויים אך לשמור על מספר המילים במסמך. המודל קבע שיש בקובץ 400 מילים, למרות שהיו בו 650. בעת התיקון, המודל התנצל ופעל כיאות. מדובר בדוגמה פעוטה, אך היא ממחישה שאי אפשר לסמוך על המודלים האלו בעיניים עצומות.

היתרון הבולט: Vibe Coding

לפי גוגל, המודל החדש הוא בעל יכולות רב-מודאליות טובות יותר. משמע, הוא מסוגל לעבד היטב קול, טקסט, תמונות וקוד. הוא גם יבחר מהי הדרך הטובה ביותר לענות על שאילתה, ובמקרים מסוימים יבחר להציג תמונה ולא טקסט. עם זאת, גם במודל המהיר וגם במודל החושב התוצאות תמיד היו טקסטואליות. עם זאת, ברגע שעוברים למצב Canvas, מגלים עולם אחר לחלוטין.

אנחנו, למשל, ניסינו ללמוד יותר על מערכת השמש, לבנות אפליקציה שמתאימה לטיול בן חמישה ימים בפריז עבור זוג צעירים, וגם ללמוד קצת יותר על מתקפת DDoS (מניעת שירות). בכל אחד מהמקרים סיפק המודל, בין אם לבד ובין אם ממש היינו צריכים להבהיר, מערכת ויזואלית רלוונטית.

האפליקציה חולקה לפי לו"ז וקישורים לגוגל מפות כדי לדעת לאן ללכת, מערכת השמש הסתובבה והיה ניתן ללחוץ על כל אחד מהכוכבים כדי ללמוד עליהם, ומתקפת הסייבר הראתה ממש ויזואליה של בקשות משתמשים ומה החשיבות של חומת אש.

אין ספק שזה שדרוג משמעותי, שכן גם התוצאות טובות יותר מסימולציות קודמות. המודל מצליח לספק מענה איכותי ונהדר, וזה מהיתרונות הבולטים שלו בפער ניכר.

חיבוריות: מהבשורות של גוגל

כשמדברים על ענקית הטכנולוגיה גוגל, חייבים להזכיר את האקוסיסטם שהיא בונה. ג'מיני נכנס לכלל השירותים של גוגל, כך שגם במייל שלכם, בלוח השנה, ביוטיוב ובדרייב המודל יכול לסייע. זה מה שגוגל מבטיחה, אבל למעשה, יש לה יתרון גדל יותר על השאר - המידע של המשתמשים. העובדה שגוגל יודעת עליהם כל כך הרבה, במיוחד ככל שהם ישתמשו יותר בבינה המלאכותית, תאפשר לה להפוך למפלצת של ממש.

לדוגמה, בעת הפעלת סוכן AI כדי להזמין את הפיצה לערב הכדורגל שהוזכר, במקום לשאול איזה פיצה ואיזו תוספת, המידע שכבר קיים אצל גוגל יאפשר לה להזמין את הפיצה אוטומטית. העובדה שהמידע של כולם נמצא אצל גוגל עשוי לאפשר לה בעתיד להציע מוצר בהתאמה אישית, בצורה טובה יותר מכל צ'אטבוט אחר.

ויזואליה: ננו בננה ו־Veo

המודל קיבל יכולות חדשות בכל הקשור לתמונות וסרטונים, ומרגישים את קפיצה המדרגה ביצירת התמונות במודל, מה שמוכר בשם Nano Banana. כאשר ביקשנו, למשל, ליצור תמונה שמורכבת ממותגים מוכרים, כמו הארי פוטר ו-Wicked, המודל הצליח לספק תמונות טובות. נציין כי זה תלוי גם במצב שבו פועלת המערכת: במודל ה-Fast התמונה הופקה מהר מאוד אך הייתה פחות איכותית, ובמודל ה-Thinking התוצאות היו הרבה יותר טובות, אך לקח יותר זמן.

בכל הנוגע לסרטונים, מה שאנחנו מכירים כ-Veo, עדיין יש מקום לשיפור. המודל אפשר לנו לבצע שלושה סרטונים ביום, ובעת בקשה מקבלים תוצר, כך שאין הרבה מקומות למשחק כמו בטקסטים או בתמונות. הסרטונים היו נחמדים, אבל לעומת מודלים מתחרים כמו זה של לייטריקס למשל, לגוגל יש עדיין עבודה. כשביקשנו ממנו לייצר פרסומת לעיתון גלובס, כמעט כל המילים נאמרו בהגייה לא נכונה, והעברית נשמעה 'שבורה' לחלוטין.

כשניסינו לבקש מהמודל לייצר סרטונים שכוללים פוליטיקאים המכריזים דברים שלא נאמרו מעולם, הוא בלם זאת. למעשה, הוא בלם כל סרטון שביקשנו עם דמות מוכרת אך שנויה במחלוקת בהיבטים פוליטיים - גם אם מדובר בסרטון של נפנוף לקהל.

למידה: השיפור ב-NotebookLM

בין הכלים הטובים ביותר של גוגל נמצא NotebookLM, הכלי שעוזר לסטודנטים ובכלל לכל מי שמעוניין לרדת לשורש של סוגיות שונות. איך זה עובד? מזינים למערכת את החומרים הנדרשים, ואז ניתן לבצע עליהם ניתוחים, תובנות ובעיקר לימודים. כך, לדוגמה, אפשר להעלות קבצים מהתואר בלימודים, ולקבל תרשימי זרימה, סרטון שמסכם את החומר, מצגת, בחנים, אינפוגרפיקה ועוד.

אמנם לא מדובר בכלי חדש, אבל בצל השיפורים האחרונים במודל, המערכת השתפרה פלאים, ואף התחילה לעבוד גם בעברית בצורה טובה. ככה אפשר ללמוד במהירות רבה יותר סוגיות שלמות, ולהיות הרבה יותר מוכן אליהם. בין קפיצות המדרגה המשמעותיות של גוגל, וכלי נהדר שעובד היטב רוב הזמן.

עוד כתבות

צילומים: גיא יחיאלי, Shutterstock

המבחן של הבורסה לא ייעצר בחברה אחת

בבורסה שמחים בהגעת פאלו אלטו ● הגילוי שמטיל כתם על פרויקטים ● והאם לציבור נותר רק לחסום כבישים ● זרקור על כמה עניינים שעל הפרק

צילומים: Shutterstock / עיבוד: טלי בוגדנובסקי

השוק מתחמם: המתחרות של אובר בוחנות כניסה לישראל

בזמן שהצעת החוק להסדרת שירותי הנסיעות השיתופיות כבר עברה קריאה ראשונה, חברות בינלאומיות ובהן בולט וליפט מקיימות גישושים ראשוניים עם משרד התחבורה ומתכננות ביקור בארץ ● לגלובס נודע שפנגו כבר בוחנת אפשרות לשיתופי פעולה ● במקביל היבואנים ממשיכים להוריד מחירים על רקע השקל המתחזק והדשדוש בביקושים ● השבוע בענף הרכב 

איתמר פורמן, מנכ''ל ישראכרט / צילום: ענבל מרמרי

אחרי שנכנס לתפקיד המנכ"ל: המינויים של איתמר פורמן בהנהלת ישראכרט

חברת האשראי הודיעה על מינויו של אייל בן-חיים, לשעבר ראש החטיבה הבנקאית בבנק לאומי, לתפקיד ראש חטיבת העסקים ● בנוסף, אדר גורן תקודם ותמונה לתפקיד סמנכ"לית דאטה, דיגיטל ושיווק

כוחות חי''ר של צה''ל בפעילות מבצעית בעזה / צילום: דובר צה''ל

הותר לפרסום: איש מילואים ואזרח נאשמים כי השתמשו במידע צה"לי להימורים באתר פולימרקט

כתב אישום הוגש השבוע נגד איש מילואים ואזרח בעבירות ביטחוניות חמורות, שוחד ושיבוש מהלכי משפט • החשד הוא שנעשה שימוש במידע מסווג מצה"ל לצורך ביצוע הימורים בפלטפורמה הדיגיטלית פולימרקט

תחבורה ציבורית / צילום: תמר מצפי

הצפת ערך ענקית בתחבורה: השליטה בדן צפויה להימכר לפי שווי של 2.8 מיליארד שקל

הרוכשים הם שותפות בראשה עומד מנכ"ל דן, אופיר קרני, כלל ביטוח וזרועות ההשקעה הריאליות של לאומי פרטנרס ומזרחי טפחות אינווסט ● בנוסף לפעילות התחבורה, הנכסים של דן גם כוללים גם זרוע נדל"נית שמקימה משרדים ומבני מגורים

מל''ט מסוג הרמס 900 / צילום: אלביט מערכות

השימוש המפתיע למל"ט של אלביט

סינגפור הציגה בסלון האווירי שקיימה מערכות מתוצרת אלביט שתשמש למניעת דיג בלתי חוקי ● טורקיה מרחיבה את פעילותה במזרח התיכון עם הקמת מספנות בערב הסעודית ● וגם: רוסיה נהנית מהביקושים הגדולים בעולם למוצרים ביטחוניים ● השבוע בתעשיות הביטחוניות

מטוס ארקיע / צילום: ארקיע

סומליה חזרה בה: ארקיע תוכל לטוס מעליה למרות הכרת ישראל בסומלילנד

חברת התעופה ארקיע הודיעה כי קיבלה אישור לשוב ולהפעיל את טיסותיה לתאילנד במסלול הרגיל והקצר, החוצה את המרחב האווירי של סומליה ● ההסדרה הושגה בעקבות מאמצים של משרדי הממשלה ורשות התעופה האזרחית, על רקע הסוגיה הרגישה של ההכרה הישראלית בסומלילנד

נתב''ג / אילוסטרציה: עידו וכטל, ארקיע

כך תוכלו להגיע לנתב״ג בשבת, ובלי מונית ספיישל

מיזם התחבורה של עיריית תל אביב נעים בסופ"ש מרחיב את פעילותו ומשיק קו אוטובוס שיהווה חיבור ישיר לנתב”ג במהלך סוף השבוע ● הקו שמחבר בין שוהם לתל אביב, יעבור דרך טרמינל 1 בשני הכיוונים ויאפשר לנוסעים הממריאים או נוחתים בשבת להגיע לשדה וממנו ללא תשלום

דוד צרויה, מנכ''ל פלוס500 / צילום: נתנאל טוביאס

שוקי החיזוי מגלגלים מיליארדים בניבוי העתיד, אך בישראל אין עליהם פיקוח

שוקי החיזוי דוהרים למחזור של טריליון דולר והופכים ללהיט התורן של עולם ההשקעות ● הכניסה של Plus500 הישראלית מעוררת את המשקיעים, אך בישראל הרגולציה נותרה מאחור

ז'נבה, שוויץ / צילום: Shutterstock

המדינה העשירה שלא רוצה יותר מ-10 מיליון תושבים בשטחה

משאל העם, שיתקיים בעוד מספר חודשים, ייקבע אם שווייץ תציב "חסם עליון" של 10 מיליון תושבים בעתיד ● הנימוקים לכך הם הרצון לדאוג לשירותים הציבוריים והחברתיים וכן חשש כי הגירה מוגברת תיצור עומס שלא יאפשר לאזרחים לקבל שירותים מספקים מהרשויות

הצ'אטבוט של קלוד / צילום: Shutterstock

אנתרופיק מגייסת 30 מיליארד דולר לפי שווי של 380 מיליארד דולר

החברה שמאחורי הצ'אטבוט קלוד מדווחת על קצב הכנסות שנתי של 14 מיליארד דולר ומושכת ענקיות השקעה לסבב הגיוס הגדול בתולדותיה ● לדברי החברה, יותר מ-500 ארגונים משלמים מעל מיליון דולר בשנה עבור שימוש במודלים ובמוצרים שלה

וול סטריט / צילום: ap, Mary Altaffer

נאסד"ק צנח בחדות בהובלת מניות הטכנולוגיה; הכסף נפל ביותר מ-10%

נאסד"ק ירד ב-2% ● פאלו אלטו החלה בפיטורים של מאות מעובדי CyberArk ● נובוקיור זינקה לאחר שמינהל המזון והתרופות האמריקאי אישר את מוצר Optune Pax ● קרוקס זינקה לאחר שחברת ההנעלה דיווחה על עונת חגים מוצלחת מהצפוי ● מחשש למיתון, ביקושים גבוהים במכירת אג"ח ל-30 שנה בהיקף של 25 מיליארד דולר

שריפה כתוצאה ממטח של חיזבאללה בכניסה לקריית שמונה (יולי 2024) / צילום: Reuters, Avi Ohayon

מצפון תיפתח הטובה: לא שוליים שצריך להציל, אלא מרכז שיש לבנות

חיזוק הצפון ושיקומו מנזקי המלחמה אינו משימה משנית אלא אתגר כלכלי־לאומי מהותי ● הצפון דורש מהלך עומק של חיזוק מבני וארוך־טווח, ולא מענה נקודתי ● בהקשר הזה תפקידו של המגזר העסקי הוא קריטי - וכאן יש צורך לא רק בסיוע, אלא בשותפות

ההנפקה של נובוקיור בנאסד''ק / צילום: Nasdaq OMX

נובוקיור הישראלית קיבלה אישור FDA, והמניה זינקה בחדות

מניית החברה נוסקת בוול סטריט בעקבות אישור שקיבלה חברת נובוקיור מה-FDA ● החברה פיתחה ומשווקת מוצר לטיפול לטיפול בסרטן הלבלב באמצעות שדות חשמליים

שילוט של פולימרקט לקראת הבחירות לראשות עיריית ניו יורק / צילום: ap, Olga Fedorova

"מכונת האמת" של פולימרקט: איך פלטפורמת ההימורים הפכה לענקית בשווי 9 מיליארד דולר

שיין קופלן, מייסד פלטפורמת ההימורים פולימרקט, הצליח להפוך מיזם קריפטו שנוי במחלוקת לאחד המדדים המשפיעים ביותר באמריקה ● בין הימורים על מלחמות לטענות על מניפולציות בפרסי נובל, הפלטפורמה שהוגדרה כ"מכונת אמת" כבשה את המיינסטרים והכניעה את הרגולטורים ● האם זהו עוד קזינו או עתיד המידע?

נוטרילון של חברת טבע / צילום: יח''צ

תינוק בן 4 שבועות נפטר. משרד הבריאות מקים ועדת בדיקה בנושא צריכת נוטרילון

תינוק מת מכשל נשימתי לאחר שצרך נוטרילון מאצווה שבוצע עליה ריקול; משרד הבריאות: לא רואים קשר, אך נמשיך לבדוק ● בתוך כך, 5,000 הורים דורשים ממשרד הבריאות ועדת בדיקה לפרשת הנוטרילון

דונלד טראמפ, בנימין נתניהו, עלי חמינאי / עיבוד: ap, Mark Schiefelbein

נתניהו במטוס לישראל: אני בספק, אבל אולי יהיה הסכם טוב

רויטרס: טראמפ עומד להודיע על תוכנית בשווי מיליארדי דולרים עבור עזה בפגישת מועצת השלום הראשונה בשבוע הבא ● כמעט שבוע אחרי הסבב הראשון של שיחות המו"מ בין ארה"ב לאיראן, והעמימות לגבי מה שנאמר בחדרים הסגורים ממשיכה להיות גבוהה ● על רקע החיסולים הממוקדים: "ארגוני הטרור בעזה הגבירו את רמת הכוננות" ● "תיק הראיות" שהציג נתניהו לטראמפ: איראן מהתלת בכם ● עדכונים שוטפים

ירושלים / צילום: Shutterstock

עקפה את תל אביב: העיר שהובילה בהיקף המכירות ב-2025, וגם במספר הדירות על המדף

שוק הדיור בשפל כבד: לפי הלמ"ס, ב-2025 בוצעו בישראל כ-91 אלף עסקאות נדל"ן - ירידה של כ-12% לעומת 2024 ● בעוד שמספר הדירות החדשות שנרכשו אשתקד היה נמוך ב-26% לעומת השנה הקודמת, הירידה ברכישת דירות יד שנייה הייתה מינורית ● ירושלים ות"א ריכזו כרבע מכלל היצע הדירות בארץ, כאשר בדצמבר ירושלים עקפה את ת"א בכמות הדירות החדשות הלא מכורות

מלחמה עם איראן? שיחת הטלפון שעשויה לשנות את הכל

גלובס מגיש מדי יום סקירה קצרה של ידיעות מעניינות מהתקשורת העולמית על ישראל • והפעם: הסיבה שמצרים הפכה מתווכת בין ארה"ב לאיראן, התרחישים האפשריים למחיר הנפט במקרה של הסלמה מול איראן, והתמיכה של אזרחים במדינות ערב בישראל נמצאת בשפל • כותרות העיתונים בעולם

משתתפי פגישת נתניהו-רוביו, אייזנברג שני מימין / צילום: אבי אוחיון לע״מ

המשקיע מייקל אייזנברג חוזר לייצג את הממשלה במשא ומתן מול האמריקאים

מייקל אייזנברג, שותף מייסד בקרן ההון סיכון אלף (Aleph) ומבכירי ההון סיכון בישראל, חוזר לעשייה הדיפלומטית ● לפי ההערכות, רה"מ נתניהו חיפש בכיר בעל שורשים אמריקאים עם אוריינטציה עסקית וכישורים פוליטיים ● וגם: הפריקט החדש בשדה דב שמשלם מאות אלפי שקלים למאיירת שעבדה עם פורשה, קרטייה ורוברטו קוואלי ● אירועים ומינויים