שיתוף | מה חדש בבינה מלאכותית - מתעדכן
-
Google · Gemma 4 MTP
חברת Google מכריזה על המודלים החדשים: Gemma 4 MTP.
למעשה, לא מדובר במודלים רגילים, אלא במודלי טיוטה, המשמשים לפיענוח ספקולטיבי עבור המודלים המרכזיים של Gemma 4.
הסבר על אופן הפעולה של פיענוח ספקולטיבי ניתן למצוא במדריך המפורט שכתבתי למודלי AI מקומיים.
בשתי מילים, מדובר במודלים קטנים ויעילים, החולקים את אותו אוצר המילים כמו המודלים הגדולים, וחוזים קדימה מספר מסוים של טוקנים, לדוגמא 5, ולאחר מכן המודל הגדול מאשר את הטוקנים שהמודל הקטן כתב ומוסיף עוד טוקן משלו, ואם הוא מחליט שהפלט לא טוב מספיק - הוא מתקן אותו ומחזיר את המושכות למודל הקטן. מכיוון שפעולת "אישור" של מספר טוקנים במקביל מהירה בהרבה מחיזוי של הטוקנים אחד-אחד בדרך הרגילה, מתקבל פלט עם אותה איכות בדיוק, רק במהירות גבוהה פי 3, מאחר ובדרך כלל רוב הטוקנים בפלט הם די צפויים ומסתבר שהמודל הקטן לא יטעה בחיזויים, לדוגמא הכי מסתבר שאחרי המילה "בינה" תבוא המילה "מלאכותית".
פיענוח ספקולטיבי נתמך ב-LM Studio.Google משחררת סדרת מודלי טיוטה, עבור כל אחד מהמודלים הגדולים של Gemma 4:
- Gemma 4 31B מקבל מודל טיוטה של 0.5B פרמטרים.
- Gemma 4 26B A4B מקבל מודל טיוטה של 0.4B פרמטרים.
- Gemma 4 E4B מקבל מודל טיוטה של 79M פרמטרים.
- Gemma 4 E2B מקבל מודל טיוטה של 78M פרמטרים (ייתכן ומדובר באותו מודל כמו הקודם).
המודלים מזוהים תחת השמות "google/gemma-4-31B-it-assistant" (בהתאמה לשם המודל המקורי).
לכאורה המודלים מתאימים גם להרצה עצמאית, ואם כן קיבלנו סדרת מודלים זעירים במיוחד של Gemma 4. אני מנסה להמיר אותם ל-GGUF כדי לבדוק. בעז"ה אעדכן בתוצאות.
עדכון: בשונה ממודלי טיוטה רגילים, שהם בעצם מודלים רגילים לכל דבר שניתן להריץ אותם עצמאית, מודלי הטיוטה של Gemma 4 בנויים בארכיטקטורה חדשנית שממקסמת את יתרונות הפיענוח הספקולטיבי, באמצעות הסתמכות של מודלי הטיוטה על המודלים הגדולים בטבלת ההטמעות, המטמון של הקשר השיחה, ומנגנון כוונון דינמי שמשנה את מספר הטוקנים שמודל הטיוטה חוזה בכל פעם בהתאם לאחוז האישור של המודל הגדול, מה שאומר שהם אינם מתאימים להרצה עצמאית.עדכון 2: לעת עתה ניתן להתנסות בטכנולוגיה החדשנית למחצה הזו, באפליקציית Google AI Edge Gallery (מי שכבר משתמש בה נדרש לעדכן את מודלי Gemma 4).
מהתנסות שלי המהירות מטורפת, כמה עשרות טוקנים לשנייה במודל E4B.עדכון חשוב:
לאחר שסוף-סוף llama.cpp הטמיעו תמיכה ב-MTP (פיענוח ספקולטיבי, ניתן לראות את הפוסט המצוטט להסבר) בשבוע שעבר, היום LM Studio (המבוססת על llama.cpp) שחררו גרסה חדשה התומכת גם היא ב-MTP - גרסה 0.4.14 Build 3. כדי לקבל את הגרסה החדשה יש לעבור לערוץ עדכוני בטא בהגדרות, במקום הערוץ היציב.
כדי להשתמש ב-MTP, יש להוריד מודל תואם מסדרת Gemma 4 MTP או Qwen 3.5 MTP, ולהפעיל MTP בהגדרות הטעינה של המודל.
השימוש ב-MTP עשוי להאיץ את הרצת המודל עד פי 3 מהרצה רגילה. -
א אברהם גלסר התייחס לנושא זה
-
טוב.
לא יודע עד כמה זה קשור לעדכונים.
אבל זה דבר אדיר! -חובה לשתף-
https://github.com/rohitg00/ai-engineering-from-scratch
מאגר של AI.
זה לא עוד קורס Prompt Engineering רגיל אלא
roadmap ענקי שבונה AI Engineer מאפס:
• Math foundations
• Deep Learning
• Transformers
• LLM Internals
• RAG
• MCP
• Agents
• Multi-Agent Systems
• Production AI Infrastructure
בקיצור הכל!
לא מבין איך לא ראיתי את זה קודם.
מה שמעניין במיוחד:
כל lesson בונה משהו אמיתי - tools, agents, servers ו־workflows.
מטורף.
למרות שזה קצת מאוחר (הריפו נפתח לפני חודש חודשיים,) זה עדיין מטורף. -
-
-
עוד קצת מידע על הסדרה החדשה של Qwen
היכולות העיקריות:- כתיבת קוד
- תיקון באגים
- עבודה על כמה קבצים
- refactoring
- פרויקטים גדולים
- SWE agents
- long-horizon coding
- autonomous workflows
הוא בנוי לעבוד עם:
- MCP
- כלים חיצוניים
- Agents frameworks
(כולל) - Claude Code
- OpenClaw
- Qwen Code
חריג ביותר:
Alibaba טוענת שהוא הצליח לעבוד 35 שעות רצוף לבצע מעל 1000 tool calls
לבצע optimization לקרנל באופן אוטונומיהוזכר Qwen3.7-Plus אבל עדיין לא פורסם
-
מודל עריכת הוידאו החדש של גוגל, Gemini Omni, זמין מעכשיו לכווולם בתוך Google Flow!!
המודל מאפשר לערוך ולשנות סרטונים פשוט באמצעות פקודות טקסט בשפה חופשית.
גוגל פותחת את הגישה גם למשתמשים במסלול החינמי, שיכולים מהיום ליצור שני סרטוני Omni בחינם בכל יום, בלי צורך במנוי בתשלום.
איך מוציאים את המקסימום ממודל הווידאו החדש של גוגל, Gemini Omni? הנה המדריך המלא לכתיבת פרומפטים.
ככל שתהיו יותר ממוקדים, התוצאה תהיה קרובה יותר למה שדמיינתם. הנה עקרונות העבודה המרכזיים:
הבסיס לכל שוט
תחשבו כמו במאים. כשאתם כותבים פרומפט, כדאי להגדיר את האלמנטים הבאים:תנועת מצלמה וזווית: תקריב (Close-up), זווית רחבה, צילום סטטי או מצלמה בתנועה מהירה.
סגנון ותאורה: קולנועי, מציאותי, תאורת שקיעה חמה או אורות ניאון דרמטיים.
מיקום ופעולה: איפה זה קורה ומה הדמויות עושות. לא צריך לפרט כל גרגיר אבק – המודל מבין הקשר כללי.
עריכה שיחתית בשלבים
אפשר לערוך את הווידאו תוך כדי שיחה, בלי לכתוב הכל מחדש. יצרתם וידאו של פרפר? פשוט תכתבו "תחליף את הפרפר לדבורה", והוא ישמור על שאר הסרטון. אפשר גם לשנות רק את זווית המצלמה באותה שיטה.מונחי מצלמה מתקדמים
המודל מבין מושגים מקצועיים מהקולנוע. אתם יכולים לבקש שוט רציף (Oner), מצלמה נייחת (Locked off), או תנועות כמו Push in ו-Dolly zoom. אפשר גם לבקש טקסטורות ספציפיות כמו "צילום סמארטפון" או "מצלמת פילם".ידע כללי מובנה
בניגוד למודלים אחרים שדורשים תיאור פיזי מדויק של כל אובייקט, Omni נשען על ידע בעולם. אפשר לבקש ממנו משהו מופשט כמו "תראה לי את ההבדל בין מחשב רגיל למחשב קוונטי בסגנון מינימליסטי", והוא כבר ידע איך לתרגם את זה לוויזואליה.שילוב קבצים ושמירה על עקביות
ערבוב מדיות: אפשר לשלב וידאו, תמונה וסאונד בפרומפט אחד. למשל: "קח את הציפורים מהווידאו הזה, תסדר אותן לפי הצורה שבתמונה הזו, ושיזוזו לפי הקצב של קובץ האודיו".סטוריבורד: אפשר להעלות ציורי סקיצה (סטוריבורד) ולבקש מהמודל להנפיש אותם לפי הסדר.
שמירה על דמות: רוצים שהדמות שלכם תופיע בכמה סצנות שונות? פשוט תעלו תמונת רפרנס (אפשר אפילו כזו שיצרתם במודל התמונות של גוגל או ChatGPT) והוא ישמור על המראה שלה עקבי גם כשהרקע והתאורה משתנים.
טקסט ואנימציה מסונכרנת
ה-Omni יודע לרנדר טקסט מדויק בתוך הווידאו (בעברית עדיין לא משהו). אפשר להגדיר לו איזה פונט, לבקש שמילים יופיעו אחת אחרי השנייה, ואפילו לסנכרן תנועות במרחב (כמו אורות שנדלקים) בדיוק לפי קצב המוזיקה שהעליתם.טיפ קטן לסיום: לפני שאתם מייצרים את הווידאו, אפשר פשוט להיכנס לצ'אט הרגיל של ג'מיני, לזרוק לו את הרעיון הכללי שלכם ולבקש ממנו לנסח עבורכם את הפרומפט המלא והעשיר ביותר.
-
אפשר ליצור בגוגל AI סטודיו אפליקציות לאנדרואיד

-
אפשרות חדשה בגוגל AI סטודיו ליצא את הקוד של האתר שאתם בונים אל Google Antigravity עם ההקשר שיחה שלכם במהלך בניית האתר

-
חברת Anysphere מפתחת הכלי קורסור שיחררה את הגירסה השלישית לתוכנה.
הגירסה מביאה שינוי עיצוב ענק, שכולל שינוי לגמרי מהתדמית של פורק לוי אס קוד.
וכעת זה משהו שונה לגמרי, כמו"כ נוספו האופציות:
לבדיקות מקומיות על פרוייקטים,
ניתן לבצע שיוניים במקביל על מספר מאגרים,
ניתן להריץ עד שמונה סוכני AI במקביל.
יש עוד הרבה מאוד פיצ'רים (וזה בלי להזכיר את מודל Composer 2.5 החדש של החברה..)
זה כל מה שראיתי בנתיים - מוזמנים להוסיף. -
הודעה חשובה מאוד בענין אשכול זה:
נכון שהרבה פעמים מובאים כאן עדכונים של פיצ'רים וחדשות שכבר לא ממש חדשות..
ואז ממהרים לתייג שכאן זה לא המקום והמקום הוא באשכול הנפרד שנפתח עבור זה
אך נא ונא, ולו מנסיוני האישי, לפני כל עדכון שלך, תעשה בדיקה קצרה האם מדובר במשהו חדשני באמת שעדיין לא נכתב עליו כאן באשכול, וכך גם כל התגובות לתגובות לתגובות והתיוגים יחסכו לחלוטין...
אם כולם יתנהלו כך, האשכול יהיה הרבה יותר מעניין ריאלי ומשמעותי.
לטובת כולנו!
ושוב תודה לכל המעדכנים היקרים!
[ובמיוחד ל @שניאור-שמח שמקפיד לשמור על הצביון..] -
-
ראיתי שלא הוזכר משהו פסיכי של גוגל שיצא, אז אני עכשיו מפרסם..
יצירת אווטר שלך כולל הדמות והקול!
זה פשוט פסיכי!
אפשר ליצור עם זה סרטונים שלך עם הדמות והקול שלך שיוצא כמעט 100% אתה!!!יצרתי עם זה סרטונים שלי וזה יצא ברמה גבוהה מאוד, ואני מאמין שאפשר להוציא מזה הרבה יותר!
בשביל שיהיה אפשר להשתמש בזה, צריך שהאתר/אפליקציה תיהיה באנגלית, ואז בתפריט הצד לוחצים על ׳אווטר׳ ואז זה מביא ליצירת אווטר שלך, אתה צריך להקריא כמה מספרים באנגלית, ואז להסתובב קצת כדי שיראו את הפנים, כמה דקות והאווטר שלכם מוכן!
אציין שזה זמין כנראה רק למנויים בתשלום לפחות בממשק ג׳ימני, ושם אפשר ליצור עד שלושה סרטונים
ובפלאו (ככה רושמים את זה @המלאך?) אפשר ליצור הרבה יותרבשביל שתצא תוצאה טובה, צריך להשקיע בהנחייה טובה..
נ.ב הייתי רוצה לעלות דוגמה אבל…
-
ע עידו300 התייחס לנושא זה







