GPT-5.6: שלושה מודלים (Sol, Terra, Luna) — וגם עליהם הממשל הטיל מגבלות
OpenAI שחררה משפחה חדשה של שלושה מודלים בתצוגה מקדימה מוגבלת — ושוב, דווקא החזק שבהם פתוח רק ל-20 חברות שהממשל אישר. בואו נפרק את זה.
מאת Yuval Avidaniקריאה בת 5 דק׳
"מסתבר שאת הבלמים הכי חזקים שמים דווקא על המנועים הכי חזקים." ככה הייתי מסכם את ההשקה של GPT-5.6, המשפחה החדשה של OpenAI שיצאה ב-26 ביוני 2026. שלושה מודלים, שמות קוד שמיימיים, ושוב הסיפור האמיתי הוא לא רק הביצועים — אלא מי בכלל מקבל גישה.
בואו נפרק את זה לאט, בלי באז, ועם הרבה אנלוגיות מהיומיום.
אז מה בעצם יצא כאן
GPT-5.6 הוא לא מודל אחד, אלא משפחה של שלושה. OpenAI מתארת אותו כמודל החכם והאינטואיטיבי ביותר שלה עד כה — כזה שמבין מהר יותר מה אנחנו מנסים לעשות, ולוקח על עצמו יותר מהעבודה. תחשבו על זה כמו ההבדל בין עוזר שצריך הוראות מדויקות לכל צעד, לבין עוזר ותיק שמספיק לרמוז לו ו"הוא כבר מבין לבד".
הקטע המדליק הוא שזו לא גרסה אחת אלא שלוש, כל אחת לתפקיד אחר. וזה בעיניי השינוי החשוב יותר מהמספר אחרי הנקודה. במקום "מודל אחד גדול לכולם", מקבלים תפריט.
לפני שנצלול לשמות — מילה אחת שתחזור פה הרבה: limited preview (תצוגה מקדימה מוגבלת). זה אומר שהמודל קיים, עובד, אבל לא פתוח לכולם — רק קבוצה מצומצמת יכולה לגעת בו בשלב הזה. תחשבו על זה כמו הקרנת טרום-בכורה של סרט: הסרט מוכן, אבל נכנסים רק מוזמנים. השחרור הכללי, לפי OpenAI, אמור להגיע בשבועות הקרובים.
שלושה שמות שמיימיים — וכל אחד לתפקיד אחר
השמות פה הם שמות קוד (code names) — כינויים פנימיים שחברות נותנות לפרויקטים, פה כולם בנושא שמיימי. נפרק:
Sol (השמש) — זה הדגל, המודל הכי חזק במשפחה. כאן יושבים השיפורים הכבדים.
Terra (כדור הארץ) — המודל המאוזן ליומיום. לפי OpenAI הוא נותן ביצועים תחרותיים ל-GPT-5.5 — אבל בחצי מהמחיר. זו הנקודה הכי פרקטית בעיניי: אותה רמה, חצי עלות.
Luna (הירח) — המהיר והזול ביותר. למשימות קלות שצריך הרבה מהן ובמהירות.
בעיניי Terra הוא הסיפור השקט פה: אותם ביצועים כמו הדור הקודם, בחצי מהמחיר. כי בעולם האמיתי, רוב מה שאנחנו מריצים לא דורש את המודל הכי חכם בעולם — הוא דורש מודל מספיק טוב, מהיר וזול. ירידת מחיר של פי שתיים על אותה איכות זה דבר ששווה הרבה כסף לכל מי שמריץ הרבה בקשות.
השוואה
Sol מול Terra מול Luna — מי לאיזה תפקיד
למה דווקא Sol מקבל זרקור — ובלמים
עכשיו לחלק שגרם לי לעצור. Sol הוא לא רק "החזק יותר" באופן כללי. OpenAI מציינת שני תחומים ספציפיים שבהם הוא קופץ מדרגה:
הראשון הוא ביולוגיה. Sol משפר באופן רחב זרימות עבודה (workflows) בתחום, עם תוצאות חזקות יותר ב-GeneBench v1 — ותוך שימוש בפחות טוקנים. רגע, שני מונחים:
GeneBench הוא בנצ'מארק (benchmark) — מבחן סטנדרטי שמודדים בו מודלים על משימות בתחום הגנטיקה והביולוגיה. תחשבו על זה כמו מבחן בגרות אחיד: כולם נבחנים על אותו דבר, ואז אפשר להשוות ציונים בצורה הוגנת.
פחות טוקנים זה אומר שהוא מגיע לאותה תוצאה (או טובה יותר) עם פחות "מילים" של חישוב. טוקן הוא פיסת טקסט קטנה שהמודל קורא וכותב — בערך מילה או חלק ממילה. פחות טוקנים = פחות עבודה = פחות זמן ופחות כסף. אז Sol גם חכם יותר בביולוגיה וגם חסכוני יותר. יפה.
התחום השני הוא סייבר. וכאן מתחילה הרגישות. OpenAI אומרת ש-Sol הוא המודל הכי מסוגל שלהם למשימות אבטחה — הוא מזיז את גבול היעילות במשימות אבטחה ארוכות-טווח, כולל מחקר ניצול חולשות (vulnerability research & exploitation).
בדיוק היכולת הזו היא חרב פיפיות: אותו כלי שמוצא חולשות כדי לתקן אותן — יכול למצוא חולשות כדי לנצל אותן.
זה מביא אותנו למילה המרכזית בכל הסיפור הזה.
Dual-use: אותו כלי, לטוב ולרע
Dual-use (טכנולוגיה דו-שימושית) הוא מצב שבו אותה יכולת בדיוק משרתת גם מטרה לגיטימית וגם מטרה מסוכנת, בלי שום הבדל בכלי עצמו. תחשבו על זה כמו פטיש: אותו פטיש בונה בית — ויכול לשבור חלון. ההבדל הוא לא בפטיש, אלא במי שמחזיק אותו ולמה.
מחקר חולשות הוא הדוגמה המושלמת. חוקר אבטחה לגיטימי מחפש חולשות כדי לסגור אותן לפני שהרעים מגיעים. תוקף מחפש בדיוק את אותן חולשות כדי להיכנס פנימה. אותה משימה, אותו מודל, כוונה הפוכה. ובביולוגיה זה אפילו רגיש יותר — אותו ידע שמאיץ תרופות יכול, בידיים הלא נכונות, להאיץ דברים אחרים לגמרי.
ולכן, ההגבלה. OpenAI מגבילה את הגישה לכל שלושת הווריאנטים לבקשת הממשל האמריקאי — זמין כרגע לכ-20 חברות שהשתתפותן אושרה. זו נקודה שצריך לקרוא לאט: לא רק Sol החזק מוגבל — אלא כל המשפחה, גם Terra וגם Luna, ברשימה הסגורה הזו בשלב התצוגה המקדימה.
בדקו את עצמכם
למה OpenAI הגבילה את הגישה דווקא למשפחה החזקה הזו?
הקשר הגדול: הגל של "בלמים על המנועים החזקים"
מי שעוקב אחרי החדר חדשות שלנו זוכר שכבר ראינו את הדפוס הזה. כשיצא Fable 5, גם אז ראינו הגבלות גישה דווקא על היכולות הכי חזקות. אז זו לא אנקדוטה בודדת — זה הופך לדפוס.
מה הדפוס? ככל שמודל נעשה מסוגל יותר במשימות dual-use, כך עולה הסיכוי שמישהו — לרוב הממשל — יבקש לשים עליו ברז, לפחות בהתחלה. וזה הגיוני אם חושבים על זה: היכולת שהופכת מודל ל"שימושי במיוחד" לחוקר אבטחה היא בדיוק היכולת שהופכת אותו למסוכן במיוחד בידיים אחרות. ההגבלה היא בעצם הכרה גלויה: "המנוע הזה חזק מדי כדי לחלק אותו לכולם ביום הראשון."
אני רוצה להיות הוגן כאן. גישה של "תצוגה מקדימה סגורה לפי אישור ממשל" היא רק גישה אחת מתוך כמה. יש חברות שבוחרות בדרך אחרת — שחרור open-weights (אופן-וייטס: פרסום המשקלים של המודל באופן פתוח כך שכל אחד יכול להריץ אותו אצלו) ולתת לקהילה לבדוק ולבקר. כל גישה והטרייד-אוף שלה: פתיחות מול שליטה, מהירות מול זהירות. אין כאן "נכון" אחד מוחלט, ואני לא חושב שמי שבוחר אחרת בהכרח טועה.
צעד אחר צעד
איך לחשוב על מודל dual-use לפני שמתלהבים
1
שאלו מה היכולת הכי חזקה
כאן זה מחקר חולשות וזרימות ביולוגיה — בדיוק היכולות הרגישות.
1 / 4
שורה תחתונה — בעיניי
בעיניי, הסיפור של GPT-5.6 הוא לא "מודל חדש יצא". הסיפור הוא שהתעשייה מתבגרת לתוך מצב שבו עוצמה והגבלה הולכות יד ביד — וזה כנראה יישאר ככה לזמן מה. Terra בחצי מחיר זה החדשות הטובות לכיס שלנו. Sol עם קפיצה בביולוגיה ובסייבר זה החדשות המרגשות — ובדיוק בגללן הוא גם החדשות הזהירות.
חשוב לי לסייג: כל מה שכתבתי כאן מבוסס על ההכרזה של OpenAI עצמה. בנצ'מארק אחד (GeneBench v1) הוא לא העולם כולו, ו"limited preview" אומר שעוד לא ראינו את המודל הזה בעבודה רחבה ובידיים של הקהילה. צריך לראות איך הוא מתנהג כשהוא יוצא לאוויר העולם, ולא רק בדף ההשקה. וכמובן — זו לא המלצת השקעה ולא ייעוץ פיננסי, רק פירוק של מה שיצא.
אז אני שואל אתכם: כשהמודלים הכי חזקים יוצאים מאחורי ברז של 20 חברות מאושרות — זה הופך את ה-AI לבטוח יותר, או פשוט מרכז את העוצמה בידיים של מעטים?
אמ;לק
5 הדברים שצריך לדעת
GPT-5.6 יצא ב-26.6.2026 בתצוגה מקדימה מוגבלת עם שלושה וריאנטים: Sol (דגל), Terra (מאוזן, חצי מחיר של GPT-5.5 על ביצועים תחרותיים) ו-Luna (מהיר וזול ביותר).
תוצאות חזקות יותר ב-GeneBench v1 עם פחות טוקנים, והמודל הכי מסוגל של OpenAI למשימות אבטחה ארוכות-טווח כולל מחקר ניצול חולשות.
OpenAI מגבילה את הגישה לכל שלושת הווריאנטים לבקשת הממשל האמריקאי — זמין כרגע רק לכ-20 חברות מאושרות.
אותה יכולת שמוצאת חולשות כדי לתקן יכולה למצוא חולשות כדי לנצל. בדיוק היכולת הזו מובילה להגבלה.
כמו ב-Fable 5 — ככל שמודל מסוגל יותר במשימות דו-שימושיות, כך עולה הסיכוי שיקבל בלמים, לפחות בהתחלה.