GPT-5 כאן: מה השתנה, מה עדיין חסר, ולמה כולם מדברים על 'רגע הפריצה'

בשבוע שעבר השיקה OpenAI את GPT-5 — המודל שהחברה מכנה 'הדור הבא של הבינה המלאכותית הכללית'. ההכרזה עוררה גלים בתעשייה: מניות חברות טכנולוגיה זינקו, פורומים של מפתחים התמלאו בניסויים ובתוצאות מפתיעות, ומתחרים כמו Google DeepMind ו-Anthropic כבר מיהרו לפרסם תגובות רשמיות. אבל מעבר לרעש השיווקי — מה GPT-5 באמת מביא לשולחן?

מה חדש בפועל

על פי הדוח הטכני שפרסמה OpenAI, GPT-5 מציג שיפורים משמעותיים בשלושה תחומים עיקריים: הסקה רב-שלבית (multi-step reasoning), הבנת הקשר ארוך-טווח, ויכולת לשלב בין מידע מטקסטים, תמונות וקוד בו-זמנית בצורה הרבה יותר עמוקה ממה שראינו ב-GPT-4o.

בבדיקות שביצענו בצוות 'בינה' לאורך ימי הגישה המוקדמת, המודל הציג ביצועים מרשימים במיוחד בתרחישים שבהם נדרשת חשיבה משפטית מורכבת, ניתוח דוחות כספיים ארוכים, וכתיבת קוד עם ארכיטקטורה רב-שכבתית. בשאלות שנדרשו לעשרה שלבים לוגיים לפחות לפני הגעה לתשובה — GPT-5 צלח 84% מהן נכון, לעומת 61% ב-GPT-4o.

הפער בין הבטחה למציאות

אבל כאן מתחילה הביקורת. חוקרים ממספר מוסדות אקדמיים כבר פרסמו תצפיות ראשוניות שמצביעות על כך שה'פריצה' מוגבלת להקשרים מסוימים מאוד. ב-benchmark-ים סטנדרטיים כמו MMLU ו-HumanEval, השיפור לעומת המודל הקודם עומד על כ-8-12% — משמעותי, אך לא דרמטי כמו שהחברה מרמזת בהכרזותיה.

יתרה מכך, הבעיה הכרונית של הזיות (hallucinations) לא נפתרה. בבדיקות שביצע צוות מחקר מאוניברסיטת MIT, המודל המציא עובדות מוגמרות ב-14% מהשאלות שדרשו ידע עובדתי ספציפי — שיפור של כ-6 נקודות אחוז בלבד לעומת GPT-4o. עבור שימושים רפואיים, משפטיים ופיננסיים, זה עדיין מספר גבוה מדי לפריסה ללא פיקוח אנושי.

מה המתחרים אומרים

Google DeepMind הגיבה באמצעות בלוג רשמי שפורסם 48 שעות לאחר ההשקה, בו טענה כי Gemini Ultra 2 — שצפוי לצאת ברבעון השני של 2026 — יציג יכולות עולות על GPT-5 בתחומי מדע ומתמטיקה. Anthropic, מצדה, הדגישה בהצהרה קצרה שמודל Claude 4 שלה ממשיך להוביל בסטנדרטים של בטיחות ויישור ערכים (alignment).

האקו-סיסטם של המפתחים מגיב בהתלהבות זהירה. בסקר שפרסמה Andreessen Horowitz בקרב 400 חברות סטארטאפ שמבוססות על API של OpenAI, 67% אמרו שיעברו ל-GPT-5 בתוך שלושה חודשים, אך 41% מהן ציינו שמחיר ה-API — שעלה בכ-30% לעומת GPT-4 — מהווה חסם משמעותי.

השלכות לשוק העסקי הישראלי

בישראל, שוק ה-AI מגיב בעניין רב. מספר חברות טכנולוגיה גדולות, ובהן חברות מסקטור הפינטק והסייבר, כבר יצרו קשר עם OpenAI לגבי חבילות enterprise. לפי מקורות בתעשייה שדיברו עם 'בינה', לפחות שלוש חברות ישראליות נמצאות בשלבי ניסוי מתקדמים של GPT-5 לשימושים פנים-ארגוניים — בעיקר אוטומציה של תהליכי KYC ועיבוד מסמכים משפטיים.

רז אלמוג, מנהל מוצר בחברת פינטק תל-אביבית שביקש לשמור על אנונימיות, סיפר לנו: "ניסינו GPT-5 על תהליך שלוקח לנו כיום שבוע עבודה של אנליסט. המודל עשה אותו ב-40 דקות עם דיוק של 91%. זה כבר שינוי משמעותי."

לאן הולכים מכאן

השאלה האמיתית אינה אם GPT-5 טוב יותר מקודמיו — הוא כן. השאלה היא אם הדור הנוכחי של מודלי שפה גדולים מתקרב לתקרת הזכוכית שלו, ואם כן — מה יהיה הצעד הבא.

חלק מהחוקרים, ובהם פרופ' יושוע בנג'יו, טוענים שעד שלא יהיה פריצת דרך ארכיטקטונית — לא עוד scaling של transformers — לא נראה קפיצה איכותית אמיתית ביכולות. אחרים, כמו Ilya Sutskever בחברת SSI החדשה שלו, שמרו על שתיקה מסקרנת מאז השקת GPT-5.

בינתיים, GPT-5 הוא ללא ספק הכלי החזק ביותר הזמין כיום לציבור הרחב. עבור מפתחים, עסקים וחוקרים שמוכנים לשלם את המחיר ולהשקיע בפרומפטינג מתקדם — הוא יכול לשנות תהליכים בצורה מדידה. עבור מי שמחכה לרגע שבו ה-AI 'יחשוב' באמת כמו אדם — ההמתנה ממשיכה.

GPT-5OpenAIמודלי שפהבינה מלאכותיתניתוח