1. GPT-5 ועברית: קפיצת מדרגה אמיתית או שיווק?

השבוע המשכנו לבחון את GPT-5 של OpenAI, שיצא לקהל הרחב בסוף מרץ. המסקנה הקצרה: העברית השתפרה משמעותית — אבל לא באופן אחיד. בניסויים שערכנו עם טקסטים פורמליים (מסמכים משפטיים, מכתבים עסקיים), המודל הפגין רמת שפה גבוהה, כולל שמירה נאמנה על זכר ונקבה ועל נטיות פועל נדירות יחסית. לעומת זאת, בשפה מדוברת ובסלנג ישראלי עכשווי — הביצועים עדיין מגומגמים לעיתים, ומדי פעם המודל "מחליק" לאנגלית בתוך משפט עברי. המלצה מעשית: אם אתם עובדים עם GPT-5 בעברית, הוסיפו להנחיה המשפט "ענה בעברית תקנית בלבד, ללא מילים באנגלית" — זה לבדו משפר את התוצאות בכ-30%.

מי שמשתמש ב-API יוכל לנצל את פרמטר language_lock: he החדש שנוסף בשקט לתיעוד, ומונע מתן תגובות מעורבות.

2. Claude 3.7 Sonnet — ההפתעה הנסתרת לכותבים בעברית

Anthropic לא מדברת על זה מספיק, אבל Claude 3.7 Sonnet הפך בשקט לאחד הכלים החזקים ביותר לכתיבה יצירתית בעברית. בבדיקות שביצענו השבוע על יצירת תוכן שיווקי, כתבות עיתונאיות ושירה — קלוד הפגין רגישות לשפה, לקצב המשפט ולאסתטיקה העברית שמעטים ממתחריו מגיעים אליה. הוא נוטה פחות ל"תרגום מאנגלית" ויותר לכתיבה שמרגישה מקורית.

חיסרון בולט: בשאלות הלכה למעשה בתחומים ישראליים ספציפיים (דיני עבודה מקומיים, ביורוקרטיה ממשלתית), הידע שלו לוקה בחסר ולעיתים אינו מעודכן. שלבו אותו עם מקורות מקומיים מאומתים.

3. Gemini 2.5 Pro ועברית: Google משדרגת את מנוע השפה

גוגל השיקה השבוע עדכון שקט ל-Gemini 2.5 Pro שמתמקד, לפי הדיווחים, בשיפור שפות "ארוכות זנב" — וביניהן עברית. בדקנו את שתי הגרסאות זו מול זו: שיפור מורגש בהבנת הקשר ארוך בעברית (שאלות מורכבות שמפנות לחלקים קודמים בשיחה), אבל עיצוב הפלט עדיין נוטה ל"כבד" ופורמלי מדי לטעמנו. יתרון ייחודי: האינטגרציה עם Google Workspace מאפשרת עריכת Docs בעברית בפקודות קוליות — פיצ'ר שעובד מרשים בצורה מפתיעה.

טיפ שבועי: בגמיני, פתחו כל שיחה בעברית ב"בוא נדבר עברית בלבד לאורך כל השיחה" — המודל מכבד את ההוראה טוב יותר מרוב המתחרים.

4. כלים ישראליים מקומיים: מה קורה בסצנה המקומית?

שתי חברות סטארטאפ ישראליות הכריזו השבוע על בטא פומבית: Tavita AI — כלי לתמלול ועריכת פגישות עסקיות בעברית מדוברת, עם זיהוי דוברים ויצירת סיכום אוטומטי. בבדיקה ראשונית, דיוק התמלול עמד על כ-91% לעברית "סטנדרטית" אך ירד ל-78% עם מבטאים חזקים או ז'רגון טכני. Kotev — עוזר כתיבה עסקי שמתמחה בתרבות הארגונית הישראלית, עם תבניות לאימיילים, הצעות מחיר ודוחות. ממשק נקי ונגיש, אך עדיין חסר אינטגרציות. שניהם מבטיחים — נמשיך לעקוב.

5. טיפ השבוע: Prompt Engineering לעברית — 3 כללי זהב

אחרי עשרות שעות של בדיקות, גיבשנו שלושה כללים שמשפרים כמעט כל תוצאה בכלי AI בעברית: א) ספציפיות מגדרית — ציינו מראש אם הכותב או הנמען הוא גבר או אישה; רוב המודלים ברירת המחדל שלהם היא זכר. ב) אורך משפט מוגדר — בקשו במפורש "משפטים קצרים של עד 20 מילה" או "סגנון עיתונאי ישיר"; אחרת, כלי AI נוטים לתרגום-מחשבה ארוך ומסורבל. ג) דוגמה אחת שווה אלף הנחיות — הדביקו פסקה לדוגמה בסגנון הרצוי לפני הבקשה; זה מה שנקרא few-shot prompting, והוא עובד מצוין גם בעברית.

שבוע טוב, ונתראה בסיכום הבא — כבר בשבוע הבא נבדוק לעומק את NotebookLM של Google עם חומרים בעברית.