הדרכות

Unsloth Studio: לאמן מודל שפה בבית, בלי קוד ובלי ענן

הכלי שהפך לנשק הסוד של מי שמכוונן מודלים קיבל ממשק ווב מקומי. במרץ 2026 יצא בבטא Unsloth Studio: אימון, הרצה וייצוא של מודלים פתוחים, 100% אופליין, בלי לכתוב שורת קוד.

מאת Yuval Avidani1 ביולי 2026קריאה בת 4 דק׳

שיתוף

Unsloth Studio: לאמן מודל שפה בבית, בלי קוד ובלי ענן

אמ;לק

5 הדברים שצריך לדעת

Unsloth Studio הוא ממשק ווב בקוד פתוח שמאמן, מריץ ומייצא מודלים פתוחים, הכל בממשק מקומי אחד בדפדפן, בלי לכתוב פייתון.

רץ מקומית על מק, ווינדוס, לינוקס ו-WSL, בכתובת http://127.0.0.1:8888 עם סיסמה. שום דבר לא יוצא לענן, בלי תשלום פר-טוקן.

פיצ'ר Data Recipes יוצר דאטהסט אימון אוטומטית מקבצי PDF, CSV, JSON, DOCX ו-TXT.

אימון של 500 ומעלה מודלים פי 2 מהר עם בערך 70% פחות VRAM, בלי איבוד דיוק, בזכות קרנלים ב-Triton וקוונטיזציה דינמית.

עדיין בטא (יצא 17 במרץ 2026). הספרייה תחת Apache 2.0, אבל ה-Studio UI תחת AGPL-3.0, לשים לב לשימוש מסחרי.

מסתבר שאחד הכלים הכי אהובים על מי שמכוונן מודלים בבית קיבל עכשיו ממשק גרפי, ופתאום אימון של מודל שפה מפסיק להיות משהו שרק אנשים עם טרמינל פתוח ו-GPU בענן יכולים לגעת בו. אנחנו מדברים על Unsloth Studio, שיצא בבטא ב-17 במרץ 2026.

בואו נפרק את זה לאט, כי כאן מתחבאות שתי בשורות נפרדות: אחת על הספרייה עצמה, ואחת על הממשק החדש שיושב מעליה.

מה זה בכלל Unsloth, ולמה כולם מדברים עליו

נתחיל מהבסיס. Unsloth היא ספריית קוד פתוח שמייעלת את התהליך שנקרא fine-tuning, כלומר כיוונון של מודל שפה קיים על הדאטה שלכם. תחשבו על זה ככה: יש לכם מודל חכם וכללי, ואתם רוצים ללמד אותו לדבר בשפה של העסק שלכם, של הקוד שלכם, של הנתונים שלכם. זה ה-fine-tuning. הבעיה שזה תהליך שאוכל המון זיכרון וידאו (VRAM, הזיכרון של כרטיס המסך) ולוקח המון זמן.

וכאן נכנס Unsloth. לפי התיעוד הרשמי וה-GitHub, הוא עושה את הכיוונון בערך פי 2 יותר מהר ועם בערך 70% פחות VRAM, ובלי לאבד דיוק. Unsloth עושה את הכיוונון פי 2 יותר מהר ועם בערך 70% פחות זיכרון וידאו, בלי לאבד דיוק. היסטורית הם ניסחו את זה כ"80% פחות זיכרון", אבל הרעיון זהה: אותה עבודה, הרבה פחות ברזל.

איך זה עובד מתחת למכסה המנוע? שלושה דברים לפי התיעוד: קרנלים כתובים ביד ב-Triton (קוד נמוך-רמה שרץ ישירות על ה-GPU, במקום להשאיר את הספרייה להחליט לבד), מנוע backprop ידני (החלק שמלמד את המודל מהטעויות שלו), וקוונטיזציה דינמית ב-4 ביט (שיטה לדחוס את המספרים של המודל לגרסה קטנה יותר בזיכרון). בעיניי, החלק החשוב הוא לא הטכניקה עצמה אלא התוצאה: פחות זיכרון ופחות זמן משמעו שהחומרה שכבר יש לכם בבית מספיקה.

והספרייה לא צעצוע. היא תומכת ב-500 ומעלה מודלים, גם להרצה וגם לאימון: טקסט, ראייה ומולטימודאל, TTS ואודיו, embedding, וגם RL בשיטת GRPO. היא תומכת בכיוונון מלא, ב-pre-training, ובאימון ב-4 ביט, 16 ביט ו-FP8. ולפי Unsloth, הם עובדים ישירות מול הצוותים שמאחורי gpt-oss, Qwen3, Llama 4, Mistral, Gemma ו-Phi-4. הריפו הראשי, github.com/unslothai/unsloth, יושב על בערך 67-68 אלף כוכבים. זה לא ניסוי אקדמי, זה כלי שאנשים באמת מריצים.

המכשול: עד עכשיו היה צריך לכתוב קוד

עכשיו, כל היופי הזה היה נעול מאחורי מחסום אחד: קוד. כדי להשתמש ב-Unsloth היית צריך לכתוב פייתון, להבין מה זה דאטהסט, לסדר את הקבצים בפורמט הנכון, ולהריץ סקריפטים. מי שלא מפתח, נשאר בחוץ. וגם מי שכן מפתח, לפעמים סתם רוצה לאמן מודל מהר בלי לבנות פרויקט שלם.

זה בדיוק המקום שבו נכנס Unsloth Studio. חשוב להבין שזה מוצר נפרד מהספרייה: Unsloth Studio הוא ממשק ווב בקוד פתוח וללא קוד, שמאמן, מריץ ומייצא מודלים פתוחים, הכל בממשק מקומי אחד. במקום לכתוב סקריפט, אתם פותחים דפדפן ולוחצים על כפתורים.

המענה: אימון בדפדפן, 100% על המחשב שלכם

בואו נדבר על מה שבאמת חשוב לי בסיפור הזה: זה רץ אצלכם, לא בענן. Unsloth Studio רץ 100% אופליין ומקומי על מק, ווינדוס, לינוקס ו-WSL. אתם ניגשים אליו בדפדפן בכתובת http://127.0.0.1:8888, עם סיסמה שאתם מגדירים בהרצה הראשונה. 127.0.0.1 זו הכתובת של "המחשב שלי עצמי", כלומר שום דבר לא יוצא החוצה. אין העלאה לענן, אין תשלום פר-טוקן, אין דליפת דאטה.

צעד אחר צעד

מ-Unsloth Studio לאימון מקומי: הזרימה

1 / 5

והחלק שהכי מפתיע אותי: הדאטהסט. בדרך כלל הכנת דאטהסט לאימון היא החלק הכי מייגע. Studio מביא פיצ'ר שנקרא Data Recipes, שיוצר דאטהסט אימון אוטומטית מקבצי PDF, CSV, JSON, DOCX ו-TXT. כלומר אתם זורקים פנימה מסמכים שכבר יש לכם, והוא בונה מהם את חומר הלימוד. תחשבו על זה כמו מורה שלוקח את הספרים שלכם והופך אותם לבד למבחני תרגול.

מעבר לאימון, Studio מריץ מודלים בפורמט GGUF ו-safetensor מקומית, ומייצא ל-GGUF ול-safetensors ב-16 ביט, כדי שתוכלו להריץ את התוצאה ב-llama.cpp, vLLM, Ollama או LM Studio. יש גם תוספות: self-healing tool calling (המודל מתקן לבד קריאות לכלים שנכשלו), חיפוש ברשת, השוואה של מודלים זה לצד זה, והרצת קוד Bash ו-Python בארגז חול מבודד. הביצועים המוצהרים של האימון ב-Studio זהים לספרייה: "אימון של 500 ומעלה מודלים פי 2 מהר עם 70% פחות VRAM, בלי איבוד דיוק".

לגבי חומרה, כדאי לשים לב לפרטים. תמיכת ה-GPU משתרעת על NVIDIA RTX מדור 30, 40 ו-50 (Blackwell) ועל Intel. AMD, לעומת זאת, נתמך רק לצ'אט (הרצה), ואימון על AMD דורש את Unsloth Core. אז אם יש לכם כרטיס AMD ורציתם לאמן, זה משהו לבדוק לפני שמתלהבים.

השוואה

Unsloth (הספרייה) מול Unsloth Studio

שורה תחתונה, וההסתייגות ההוגנת

בעיניי, זה בדיוק בכיוון שאני אוהב: להריץ הכל מקומי, בלי ענן ובלי לשלם על API, ולתת גם למי שלא מפתח לגעת באימון מודלים. זו דמוקרטיזציה אמיתית של תחום שהיה שמור למעטים, וזה משתלב יפה בסטאק המקומי לצד כלים כמו llama.cpp ו-Ollama.

אבל אני חייב להיות הוגן, ויש כאן שתי הסתייגויות אמיתיות. ראשית, זו עדיין בטא. בטא זה לא מוצר סופי, זה גרסה מוקדמת שאפשר להיתקל בה בבאגים ובשינויים. שנית, ואולי החשוב יותר, הרישוי מפוצל: הספרייה הבסיסית של Unsloth היא תחת Apache 2.0 (רישיון פתוח וסלחני), אבל ה-Studio UI הוא תחת AGPL-3.0. הספרייה תחת Apache 2.0 הפתוח, אבל ה-Studio UI תחת AGPL-3.0, וזה הבדל שחשוב למי שחושב על שימוש מסחרי. AGPL הוא רישיון "מדבק" יותר, ואם אתם חושבים על שימוש מסחרי או על הטמעה במוצר שלכם, זה משהו שחייבים לבדוק לפני, לא אחרי.

אז הנה השאלה שאני משאיר איתכם: אם אימון מודל שפה על המחשב שבבית שלכם, בלי קוד ובלי ענן, הופך למשהו שכל אחד יכול לעשות בערב אחד, מה הדבר הראשון שתלמדו את המודל שלכם?