HyperFrames הוא פריימוורק קוד-פתוח שבו סוכן AI כותב HTML ומקבל MP4. לא האווטאר של HeyGen, כלי נפרד שמתחרה ב-Remotion.
מאת Yuval Avidaniקריאה בת 5 דק׳
שיתוף
אמ;לק
4 הדברים שצריך לדעת
HyperFrames הוא פריימוורק קוד-פתוח מ-HeyGen שבו סוכן AI כותב HTML, CSS ו-JS ומקבל בסוף קובץ MP4.
כרום שרץ ברקע קופץ לכל פריים בצורה דטרמיניסטית, ו-FFmpeg מקודד את הפריימים ל-MP4. לווידאו קיים, FFmpeg מפרק מראש לפריימי JPEG.
רישיון Apache 2.0, בלי קרדיטי רינדור, בלי הגבלת מושבים ובלי תשלום פר-רינדור. הכל רץ אצלכם על המחשב.
זה פריימוורק נפרד ממוצר האווטארים של HeyGen, ומתחרה ב-Remotion. הריפו עם כ-32.5 אלף כוכבים, גרסה 0.7.22 מ-30 ביוני 2026.
מסתבר ש-HeyGen, החברה שכולם מכירים בזכות האווטארים המדברים, פתחה בשקט כלי שלם אחר: כלי שמייצר וידאו מקוד HTML. קוראים לו HyperFrames, והוא לא האווטאר. HyperFrames הוא פריימוורק קוד-פתוח שבו סוכן AI כותב HTML, CSS ו-JavaScript, ומקבל בסוף קובץ MP4 מוגמר. בעיניי זה אחד הדברים הכי מעניינים שיצאו לאחרונה, כי זו בדיוק צורת העבודה שלי כבר תקופה: אני כותב עמוד אינטרנט, ומקבל סרטון.
בואו נפרק את זה לאט, כי יש פה כמה שכבות שכדאי להבין.
מה זה בכלל וידאו-מקוד, ולמה זה חשוב לנו
תחשבו על איך שאתם בונים סרטון היום. אנחנו פותחים תוכנת עריכה, גוררים קליפים על ציר זמן, מכוונים כל אלמנט ידנית עם העכבר. זה ציר זמן חזותי, וזה עובד יופי בשביל בני אדם. אבל מודל שפה, ה-LLM שמייצר לנו את התוכן, לא רואה עכבר ולא רואה ציר זמן. הוא רואה טקסט, והוא ממש טוב בלכתוב טקסט: הוא כותב קוד כל היום.
וזה בדיוק הרעיון מאחורי HyperFrames. הקומפוזיציה, כלומר הסרטון עצמו, היא סתם קובץ index.html רגיל. אין ריאקט, אין ציר זמן קנייני, אין פורמט סודי שרק החברה מבינה. יש עמוד HTML, ובתוכו אלמנטים עם שני מאפיינים פשוטים: data-start שאומר מתי אלמנט מופיע, ו-data-duration שאומר כמה זמן הוא נשאר. זהו. הכל בקוד, הכל טקסט, הכל דבר שמודל שפה יודע לייצר בצורה טבעית.
הקטע המדליק הוא שזו בדיוק הסיבה שזה מתאים לעבודה עם סוכני AI. סוכן לא צריך "להבין" תוכנה עם מאה כפתורים, הוא פשוט כותב HTML כמו שהוא כותב כל דבר אחר.
צעד אחר צעד
מקוד HTML לקובץ MP4
1
1 / 4
איך עמוד HTML הופך לקובץ וידאו
עכשיו לחלק שנשמע קסם, אבל הוא פשוט מאוד ברגע שמבינים אותו. איך לוקחים עמוד אינטרנט, שהוא דבר חי ומתנועע, והופכים אותו לקובץ MP4 יציב?
הנה התהליך: כרום רץ ברקע (headless Chrome), קופץ לכל פריים בנפרד בצורה דטרמיניסטית, ואז FFmpeg מקודד את הפריימים לקובץ MP4. בואו נפרק את המילים האלה, כי כל אחת חשובה.
"Headless Chrome" הוא פשוט דפדפן כרום שרץ בלי חלון, בלי מסך. תחשבו על זה כמו כרום שעובד מאחורי הקלעים ומצלם צילומי מסך לפי פקודה. במקום שאתם תסתכלו על העמוד, הוא מסתכל בשבילכם ומצלם.
"דטרמיניסטי" זו מילה חשובה. זה אומר שאם תריצו את אותו קוד פעמיים, תקבלו בדיוק אותו סרטון, פריים-פריים. אין הפתעות, אין רנדומליות. תחשבו על זה כמו מתכון: אותם מרכיבים, אותו סדר, בדיוק אותה עוגה בכל פעם. זה קריטי כשעובדים עם סוכנים, כי אנחנו רוצים תוצאה צפויה ולא הגרלה.
"FFmpeg" זה הכלי הוותיק והחינמי שכולם בעולם הווידאו מכירים, זה מה שלוקח ערימת תמונות ותופר אותן לקובץ וידאו אחד.
יש פה עוד פיצ'ר חכם ששווה לעצור עליו. כשמכניסים וידאו קיים לתוך הקומפוזיציה, FFmpeg מפרק מראש את הקליפ לפריימים בפורמט JPEG ומזריק אותם כאלמנטי img, ובכך עוקף את מפענח הווידאו של כרום. למה זה חשוב לנו? כי מפענח הווידאו של דפדפן הוא בדיוק המקום שבו דברים משתבשים: תזמון שקופץ, פריים שחסר, סנכרון שהולך לאיבוד. במקום להסתמך עליו, הופכים כל שנייה של וידאו לרצף של תמונות סטילס, וכל תמונה יושבת בדיוק במקום שלה. זה מה שנותן את היציבות.
מה אפשר לבנות בפועל
השאלה המתבקשת: אם זה רק HTML, זה לא מוגבל לטקסט וריבועים? ממש לא. HyperFrames תומך ב-GSAP כברירת מחדל, ובנוסף ב-Lottie, באנימציות CSS, ב-Three.js וב-Anime.js. בואו נעשה סדר במילים האלה, כי מי שלא מהתחום מתבלבל.
GSAP היא ספריית האנימציה הכי נפוצה באינטרנט, זה מה שמזיז אלמנטים בצורה חלקה. Lottie הן אנימציות וקטוריות קלות משקל, בדיוק כמו אלה שאני משלב בכתבות שלי כאן. Three.js זו ספרייה לתלת-ממד בדפדפן, כלומר אפשר לבנות סצנות תלת-ממד אמיתיות. Anime.js היא עוד ספריית אנימציה. השורה התחתונה: כל מה שדפדפן מודרני יודע לצייר, הפריימוורק הזה יודע להפוך לווידאו.
מבחינת דרישות, זה גם לא מסובך. צריך Node.js בגרסה 22 ומעלה, וצריך FFmpeg מותקן. שאר העבודה נעשית דרך ממשק שורת פקודה פשוט עם שלוש פקודות מרכזיות: hyperframes init כדי לפתוח פרויקט, preview כדי לראות תצוגה מקדימה, ו-render כדי לייצר את הווידאו הסופי.
השוואה
HyperFrames מול מוצר האווטארים של HeyGen
למה זה לא האווטאר, ולמה בכל זאת מעניין
חשוב לי לחדד נקודה שקל להתבלבל בה. HyperFrames הוא פריימוורק נפרד ממוצר האווטארים של HeyGen. זה לא ראש מדבר שמייצר לכם וידאו של מנחה וירטואלי. זה כלי הנדסי שלוקח קוד ומוציא MP4. שני דברים שונים לגמרי מאותה חברה.
ומה שהופך את הסיפור למעניין הוא הרישיון והמספרים. הכלי משוחרר תחת רישיון Apache 2.0, בלי קרדיטים לרינדור, בלי הגבלת מושבים, בלי מדרגות מסחריות ובלי תשלום פר-רינדור. בואו נסביר למה זה גדול. הרבה כלי וידאו-בענן גובים כסף על כל דקה שאתם מרנדרים, או מגבילים כמה משתמשים יכולים לגעת בפרויקט. פה, אתם מריצים הכל אצלכם על המחשב, וזה חינם וקוד פתוח. Apache 2.0 זה רישיון מתירני שמאפשר גם שימוש מסחרי, כלומר אתם יכולים לבנות על זה מוצר בלי לפחד.
הפרויקט מגיע עם 19 סקילים לסוכנים, כלומר יכולות מובנות שמלמדות את הסוכן איך לבנות דברים ספציפיים. הריפו עומד על בערך 32.5 אלף כוכבים בגיטהאב, והגרסה האחרונה, 0.7.22, יצאה ב-30 ביוני 2026. מבחינת מיצוב בשוק, HyperFrames מתחרה ב-Remotion, שהוא פריימוורק ותיק להפקת וידאו מקוד. אני לא אגיד שאחד טוב מהשני, זו פשוט גישה אחרת לאותה בעיה.
שורה תחתונה, בעיניי
בעיניי הסיפור פה הוא לא עוד כלי וידאו. הסיפור הוא שיטת עבודה שמתאימה לאיך שמודלים חושבים. אני עובד ככה כבר תקופה, גם בכתבות שאתם קוראים כאן, גם בטיזרים וגם במצגות: אני מתאר בטקסט מה אני רוצה, נכתב קוד HTML, ויוצא סרטון. זה מרגיש טבעי כי זה משתמש בשפה שגם אני וגם המודל שולטים בה, במקום להילחם עם ממשק גרפי.
עם זאת, בואו לא נתלהב יתר על המידה. זה כלי למי שנוח לו עם קוד ועם שורת פקודה, זה לא אפליקציה עם כפתור אדום גדול. צריך Node ו-FFmpeg מותקנים, וצריך לחשוב על סרטון כמו על עמוד אינטרנט, וזו קפיצה תודעתית שלא לכולם מתאימה. וגם, נכון לעכשיו זו גרסה 0.7, כלומר לפני 1.0, אז יש עוד דרך.
הדבר שהכי מסקרן אותי הוא לא מה שהכלי עושה היום, אלא מה שהוא מסמן: כשווידאו הופך לקוד, פתאום סוכן AI יכול לבנות אותו מקצה לקצה בלי יד אנושית על העכבר. השאלה שנשארת איתי היא, אם מחר כל סרטון יכול להיכתב בקוד על ידי סוכן, מה זה אומר על מי שעורך וידאו בעכבר כל היום?