תמונה ש־ ChatGPT יצר על בסיס תצלום קיים, בסגנון ג'יבלי. טרנד ברשתות
שוק הבינה המלאכותית עולה שלב? כל חברה מנסה לגבור על המתחרות באמצעות פיתוחים חדשים, ובימים האחרונים, מודלים כמו ChatGPT של OpenAI, ג'מיני מבית גוגל ודיפסיק מקבלים עדכונים ופיצ'רים חדשים - כאלו שנועדו להבטיח את ההובלה העתידית שלהם. השאלה הגדולה - לאן המרוץ הזה הולך?
● "מזהים שיגור": העמודים בטלגרם שמתריעים חמש דקות לפני האזעקה
● בדיקה טכנולוגית | ההפתעה של אפל: בדקנו את המחשב הנייד החדש של החברה
לא חזתה את ההצלחה
בשבוע שעבר OpenAI חשפה כלי חדש שמסוגל ליצור תמונות מצילומים קיימים - וזאת בזכות מודל GPT-4o של החברה. הרשתות החברתיות הוצפו על ידי תמונות פרי יצירת המודל (ראו מסגרת) - שחזורים של אירועים היסטוריים, רגעים משמעותיים מהחיים, או סתם דיוקנים של חיות מחמד. תחילה תכננה OpenAI להציע את הפיצ'ר החדש בחינם, אך בשל ההצלחה הכבירה החליטו בחברה להגביל אותו למנויים משלמים בלבד.
אורי אליאבייב, יועץ בתחום הבינה המלאכותית ומנהל קהילת Machine and Deep Learning Israel, מסביר לגלובס כי "המודל התחדש בסט עדכונים שמאפשרים התנסחות משופרת ויכולת לייצר תמונות לפי סגנון. מה גם, שאפשר לדבר בשפה חופשית כדי לערוך את התמונה ולבקש שינויים".
אליאבייב מציין כי "הביקוש כל כך גדול, שאלטמן ממש אמר שהחזון של AGI (בינה מלאכותית כללית) עשוי להתממש מוקדם יותר אם אנשים יאטו את קצב השימוש ויפסיקו לג'נרט תמונות. המשמעות היא ש־OpenAI מתקשה לעמוד בעומס".
עד כמה החברה נתפסה לא מוכנה? ציוץ של סאם אלטמן העיד: "זה סופר כיף לראות אנשים אוהבים תמונות ב־ChatGPT, אבל רכיבי ה־GPU (יחידות עבוד גרפי) שלנו נמסים. אנחנו עומדים להגביל זמנית את השימוש בזמן שאנחנו עובדים על היעילות של המודל, מקווה שלא ייקח הרבה זמן", כתב. בציוץ אחר הוא כתב: "אתם יכולים בבקשה להירגע עם ייצור תמונות, זה משוגע, הצוותים שלנו צריכים ללכת לישון".
עוד דווח לאחרונה כי חברת OpenAI סגרה גיוס בהיקף של 10 מיליארד דולר בהובלת סופטבנק, עם אפשרות לקבלת תשלום של 30 מיליארד דולר נוספים עד סוף השנה, בתנאי שהחברה תהפוך לחברה למטרות רווח.
לא מוכנה להישאר מאחור
במהלך שאולי מנסה להתחרות בפריצת הדרך המשמעותית של OpenAI, גוגל השיקה בימים האחרונים גרסה ניסיונית של דגם ה-2.5 Pro שלה לכל משתמשים אפליקציית Gemini - משמע בחינם. מדובר במודל הבינה המלאכותית החכם והחזק ביותר של גוגל עד כה, ובשוק אוהבים אותו במיוחד. מדובר במודלי חשיבה, שמסוגלים לבצע Reasoning לפני שהם מגיבים, באופן שמשפר את הביצועים והדיוק שלהם. הוא מוביל במדדים של מתמטיקה ומדעים, ועובד על שיפורי ביצועי הקודינג שלה.
פלטפורמת LMArena, שמציעה סוג של בנצ'מרק בהשוואות בין מודלים, מאפשר למשתמשים להצביע על יכולות המודלים השונים. החברה מתפארת במעל למיליון הצבעות של משתמשים, ושם - במקום הראשון, ניצב המודל החזק של גוגל, Gemini 2.5 Pro. במקום השני נמצא ChatGPT 4o, ובמקום השלישי Grok 3 של טוויטר.
אליאבייב מסביר שזה אכן המודל הכי חזק של גוגל עד היום. "הוא מתעלה על כל המתחרים לפי שעה. גוגל עד עכשיו הזדנבה מאחור, וכעת היא טסה קדימה". לדבריו, גודל הקבצים והעובדה שגוגל מאפשרת עיבוד של מיליון טוקנים אפשריים, מעידים כי "היא מתחילה לצמצם את הפער". עם זאת, "עדיין לא רואים בשטח קצב אימוץ של מפתחי התוכנה. המודלים האחרים עדיין משמעותיים יותר".
גם המתחרים מסין, שזעזעו את השוק עם המודל הרזה שלהם, החליטו בימים האחרונים להרים את הראש. החברה הסינית דיפסיק השיקה גרסה מחודשת ל־V3, המודל שעורר סערה, ולדברי החברה מדובר במודל מהיר פי שלושה מהדור הקודם.