
Deepseek AI – השובר שוק הסיני שאתם חייבים להכיר
סטארטאפ סיני קטן פיתח מודל AI ברמת GPT בפחות מעשירית מהעלות ושחרר אותו בקוד פתוח — והפך את כל מאזן הכוחות בעולם הבינה המלאכותית.
הפרק מנתח את Deepseek, סטארטאפ סיני שקם ב-2023 ושחרר בינואר 2025 את המודל R1 שאומן בכ-5.6 מיליון דולר בלבד — פער עצום מול עשרות מיליוני הדולרים שעלה אימון GPT. המנחים, אליה עוסר ודודי, מסבירים איך המודל הפך לאחת האפליקציות המובילות באפסטור, מדוע הוא זול פי עשרה בתפעול, ואיך שחרורו בקוד פתוח ברישיון MIT מאפשר לכל סטארטאפ להוריד, להריץ לוקלית ולבנות עליו בלי תקציבי ענק. הם סוקרים את השימושים המעשיים (פיתוח קוד, ניתוח אנליטי, חינוך, כתיבת תוכן, סיכום מסמכים), את המגבלות (קריסות שרתים, חששות פרטיות סביב שרתים בסין ורגולציה סינית) ואת המשמעות הגיאופוליטית כמלחמת מעצמות בין ארה"ב לסין. הפרק מתאים בעיקר ליזמי סטארטאפ, מפתחים ואנשי הייטק שרוצים להבין כלי AI חדש ולמתי כדאי להשתמש בו.
תובנות מרכזיות
- Deepseek R1 אומן בכ-5.6 מיליון דולר בלבד, לעומת עשרות מיליונים (סדר גודל של 40-80 מיליון) לאימון GPT — וגם עלות התפעול שלו נמוכה פי עשרה ממודלים כמו GPT וקלוד.
- ההישג הטכנולוגי נובע מאילוץ: בגלל החרם האמריקאי על צ'יפים מתקדמים (Nvidia), הסינים אימנו את המודל בשיטת reinforcement learning — למידת חיזוקים שמתאימה למשאבים מצומצמים — במקום fine-tuning קלאסי.
- המודל פתוח בקוד פתוח ברישיון MIT, מה שמאפשר הורדה, הרצה מקומית ושינוי — פתרון אידיאלי לסטארטאפים שבונים MVP ורוצים פרטיות בלי לשתף את המודל בענן, ומאיים על המונופול של OpenAI וגוגל.
- החסרונות: השרתים קורסים תחת עומס כי לחברה אין תשתית ענק כמו לאופן AI, המודל פחות יצירתי מ-GPT, והשרתים בסין מעוררים חששות פרטיות בכפוף לרגולציה הסינית — מה שכבר הוביל בארה"ב לחוק שמגביל שימוש בו במוסדות ממשלתיים.
- התגובה בענף הייתה מיידית: גם מטא נכנסה ל'חמ"ל' לחשיבה מחדש על אסטרטגיית הפיתוח שלה, וההשוואה לטיקטוק ממחישה את המתח סביב כמות הדאטה שמודל סיני יכול לאסוף.
רגע, מה סין מנסה להשיג כאן? התשובה: לשבור את השוק — להראות לארה"ב ולאופן AI שאפשר להגיע לרמת ביצועים דומה עם פחות משאבים, ולשחרר את זה חינם בקוד פתוח.