בינואר 2025 המניות של Nvidia צנחו 17% ביום אחד. הסיבה: חברה סינית קטנה יחסית בשם DeepSeek פרסמה מודל שמתחרה ב-ChatGPT — ויוצר בשבריר מהעלות. העולם התעורר לסכנה: אמריקה לא בהכרח מובילה במרוץ ה-AI.
מה זה DeepSeek ומי בנה אותו?
DeepSeek היא חברת AI סינית שנוסדה ב-2023 על ידי High-Flyer Quant — קרן השקעות כמותית (quant hedge fund). החברה ממוקמת בהאנגג'ואו, סין, ומונה פחות מ-200 עובדים.
מה שהפתיע: DeepSeek-R1 ו-R2 הושגו בשבריר מהתקציב שהשקיעו OpenAI ו-Google. DeepSeek R1 אומן ב-$6 מיליון לפי הדיווחים — לעומת מאות מיליונים שהשקיעו המתחרים האמריקאים.
פרסומת
DeepSeek R2 — מה מיוחד בו?
DeepSeek R2 (ידוע גם כ-DeepSeek-V3) מביא כמה חידושים טכניים:
- Mixture of Experts (MoE): הפעלת רק חלק מהמודל לכל שאלה — יעילות עצומה
- Multi-head Latent Attention: ארכיטקטורה חדשה שחוסכת זיכרון
- אימון יעיל: 2.788 מיליון GPU-hours — נמוך ב-90% מהמתחרים
- קוד פתוח: המשקלים זמינים להורדה חינם
בנצ'מארקים — ביצועים אמיתיים
| Benchmark | DeepSeek R2 | GPT-4o | Claude 3.5 |
|---|---|---|---|
| MMLU (ידע כללי) | 88.5% | 87.2% | 88.7% |
| HumanEval (קוד) | 90.2% | 90.2% | 92.0% |
| MATH | 84.0% | 76.6% | 78.3% |
| GPQA (מדע) | 59.1% | 53.6% | 65.0% |
המסקנה: DeepSeek R2 תחרותי לחלוטין עם GPT-4o ב-MATH ובידע כללי — ולפעמים עדיף. Claude 3.5 עדיין מוביל במדע ובקוד.
פרסומת
חששות פרטיות — חברה סינית
זה הנושא הרגיש ביותר. יש מספר חששות לגיטימיים:
- שמירת נתונים בסין: DeepSeek שומרת נתוני משתמשים על שרתים בסין, כפופים לחוק הסיבר הסיני
- גישה ממשלתית: חוק 2017 בסין מחייב חברות לשתף מידע עם הממשל על פי דרישה
- צנזורה: DeepSeek מסרב לדון בנושאים רגישים פוליטית (טיאנמן, טייוואן)
- GDPR: מדינות אירופיות חוסמות DeepSeek — איטליה, צרפת, אוסטריה
כיצד להשתמש ב-DeepSeek
יש שלוש דרכים:
- chat.deepseek.com: ממשק ישיר — אבל נתונים בסין
- API: DeepSeek מציע API זול מאוד (~$0.27 למיליון tokens)
- Ollama (מומלץ לפרטיות): הורידו את המודל מקומית
ollama pull deepseek-r1:7b
פרסומת
האם כדאי לעבור מ-ChatGPT ל-DeepSeek?
כן, אם:
- אתם מריצים מקומית דרך Ollama — אז פרטיות לא בעיה
- אתם מחפשים API זול לפרויקטים לא-רגישים
- אתם מפתחים שרוצים לבדוק ארכיטקטורה חדשנית
לא, אם:
- אתם עובדים עם מידע עסקי רגיש
- אתם נמצאים בתחומים מוסדרים (רפואה, משפטים, ממשל)
- הפרטיות חשובה לכם
DeepSeek R3 — מה מחכה?
DeepSeek הכריזה שהם עובדים על הדור הבא. המתחרים כבר מודאגים: אם R2 הושג ב-$6M, R3 יכול להיות בעל יכולות GPT-5 ב-$20M. המשחק הגיאופוליטי של AI רק מתחיל.