שיתוף | מה חדש בבינה מלאכותית - מתעדכן

יוסף מאיר וייס

ויש גם דף עם מכסות שימוש בג'ימני

צול גאה

פוסט זה נמחק!

יוסף מאיר וייס

הושק Gemini 3.5 Flash
והוא כבר זמין בGoogle AI Studio

עריכה 23.02: זמין כבר באתר ג'ימני

קרדיט ל@שניאור-שמח

יענקיH

במקביל הושק
Gemini Omni
מסוגל לקבל כל סוג של קלט. תמונה, סרטון קיים, אודיו וטקסט, ולהפוך אותו לסרטון חדש.
מודל הפרו יושק בחודש הבא

יענקיH

גוגל טיפלו סופסוף בבעיות בסביבת הקידוד אנטיגרביטי והוסיפו את המודל החדש

CUBASE

סיכום החלק הראשון של כנס ה I/O של גוגל

הישגי ה-AI של גוגל: סונדאר פיצ'אי פתח וציין את הצמיחה העצומה בשימוש בבינה המלאכותית, עם למעלה מ-3.2 קוודריליון (אלף טריליונים) "אסימוני" מידע (Tokens) המעובדים בחודש. כיום לגוגל יש 13 מוצרים עם מעל למיליארד משתמשים

שבבי TPU חדשים: גוגל הציגה את הדור השמיני של שבבי העיבוד שלה, ה-TPU 8t ו-8i. השבבים החדשים מאפשרים אימון מודלים מהיר מאי פעם ועיבוד נתונים בקצב של כ-1,500 טוקנים בשנייה תוך חיסכון ניכר באנרגיה

1. מודלי בינה מלאכותית חדשים

Gemini Omni: מודל "עולם" (World Model) חדש של גוגל שמסוגל לא רק ליצור טקסט, אלא לדמות את המציאות הפיזית (למשל, להבין כוח משיכה ואנרגיה קינטית). המודל מאפשר יצירה ועריכה טבעית של סרטוני וידאו מציאותיים באמצעות פקודות טקסט פשוטות, תוך שמירה על עקביות פיזיקלית
Gemini 3.5 Flash: מודל מתקדם, מהיר במיוחד וזול משמעותית, אשר תוכנן במיוחד כדי להפעיל סוכני AI (Agents) ולבצע משימות קידוד ותכנות ארוכות

2. מהפכת ה"סוכנים" (AI Agents)

Antigravity 2.0: סביבת פיתוח מהפכנית המבוססת על סוכני AI. בהדגמה מדהימה, צוות של סוכני AI הצליח לכתוב ולבנות מערכת הפעלה שלמה (OS) מאפס בתוך 12 שעות בלבד
Gemini Spark: סוכן אישי שפועל 24/7 בענן מטעם המשתמש. הסוכן מסוגל לארגן אירועים, לאסוף נתונים על פני מספר אפליקציות (Docs, Gmail, Calendar), לנסח מיילים, ליצור מסמכים מעוצבים ולתכנן לוחות זמנים – והכל מתנהל ברקע בזמן שאתם פנויים לדברים אחרים

3. חידושים במנוע החיפוש ובקניות

חיפוש מבוסס סוכנים (Search Agents): חיפוש גוגל שודרג למודל 3.5 עם תיבת חיפוש אינטראקטיבית. כעת ניתן "לשכור" סוכני חיפוש שיעבדו ברקע ויעדכנו אתכם באופן שוטף בנושאים מורכבים, כמו מעקב אחר מניות ספציפיות או חיפוש דירות
Agentic Coding בחיפוש: החיפוש יכול כעת לכתוב קוד בזמן אמת כדי ליצור עבורכם גרפים אינטראקטיביים או לבנות מיני-אפליקציות בהתאמה אישית (כמו מתכנן סופי שבוע למשפחה שמוסיף הכל ישירות ליומן)
Agentic Commerce: מהפכה בקניות דרך רשת שלמה של פרוטוקולים המאפשרים לסוכנים לרכוש דברים עבורכם באבטחה מלאה. גוגל הציגה את ה-"Universal Cart" (עגלת קניות אוניברסלית) שמוצאת חיסכון, מבצעת קופונים באופן אוטומטי, ובודקת האם חלקים שאתם קונים תואמים אחד לשני (למשל בהרכבת מחשב)

4. שילוב AI במוצרי היום-יום

שדרוג אפליקציית Gemini: האפליקציה זכתה לעיצוב מחדש, תמיכה בניבים אזוריים קוליים שונים, ו"עדכון יומי" שמסכם את האימיילים, הפגישות והמשימות שלכם על הבוקר. בנוסף, הודגם שילוב מתקדם של המערכת ב-Mac OS המאפשר הפקת טבלאות ממסמכים וקבלות דרך קול בלבד
Ask YouTube: תכונה חדשה המאפשרת למשתמשים לשאול שאלות על סרטונים ארוכים ולקבל סיכום או קפיצה בדיוק לשנייה הרלוונטית שמסבירה את התשובה בסרטון
Docs Live: יצירה, עריכה ועיצוב של מסמכים בצורה מלאה רק דרך פקודות קוליות רציפות של המשתמש

5. כלי יצירה ועיצוב

Google Pics & Stitch: כלים חדשים ליצירת ועריכת תמונות, ולבניית ממשקי משתמש (UI) לאתרים ואפליקציות דרך הנחיות טקסט ודיבור
Google Flow & Flow Music: פלטפורמות ליצירה מתקדמת של וידאו קולנועי (עם אפשרות לשנות זוויות צילום וזמן ביום על ידי פקודות) ולביצוע או הפקה של רצועות מוזיקה מורכבות

6. משקפיים חכמים (Intelligent Eyewear)

גוגל חשפה משקפי שמע חכמים (ללא מסך ויזואלי מובנה) בשיתוף פעולה עם סמסונג, Warby Parker ו-Gentle Monster. המשקפיים, שיושקו בסתיו הקרוב, מחוברים ל-Gemini ומאפשרים לבקש הנחיות ניווט בזמן אמת, להזמין אוכל, לסכם הודעות טקסט ולצלם תמונות של מה שקורה מולכם, כל זאת ללא צורך להוציא את הטלפון מהכיס

7. שקיפות, בטיחות ומדע

זיהוי תוכן בינה מלאכותית: הרחבת כלי ה-SynthID (סימון מים דיגיטלי נסתר) לדפדפן Chrome ולמנוע החיפוש, על מנת לסייע למשתמשים לזהות בקלות תמונות וסרטונים מזויפים (Deepfakes), בשיתוף עם חברות כמו OpenAI ואינבידיה
Gemini for Science: שימוש בבינה מלאכותית לפתרון בעיות מורכבות במדע – החל ממודלים פורצי דרך לחיזוי מדויק ומהיר של מזג אוויר וסופות הוריקן (WeatherNext), ועד להאצת תהליכי הפיתוח של תרופות וטיפולים למחלות חשוכות מרפא

קרדיט

אברהם גלסר

--------------------------------------------
https://www.youtube.com/shorts/4iiveOmCzT4

nazyoda267

גימיני עשו עידכון!

לשכת הרב

עדכון: גמיני עשו עדכונים ושיפורים אך הורידו חלק מהפונקציות

הוסיפו הרבה בעיקר בעיצוב, מאמין שכבר כתבו כאן.

אבל, הורידו כמה דברים, לדוגמא, הורידו את האופציה שכשמבקשים קובץ או קוד, היה אפשרות להוריד קובץ שלם ולא רק להעתיק את הקוד. וכעת השמיטו את האופציה הזו

עריכה: גוגל החזירו את אופציית הורדה כקובץ

א.מ.ד.

עדכון חשוב:
לאחר שסוף-סוף llama.cpp הטמיעו תמיכה ב-MTP (פיענוח ספקולטיבי, ניתן לראות את הפוסט המצוטט להסבר) בשבוע שעבר, היום LM Studio (המבוססת על llama.cpp) שחררו גרסה חדשה התומכת גם היא ב-MTP - גרסה 0.4.14 Build 3. כדי לקבל את הגרסה החדשה יש לעבור לערוץ עדכוני בטא בהגדרות, במקום הערוץ היציב.
כדי להשתמש ב-MTP, יש להוריד מודל תואם מסדרת Gemma 4 MTP או Qwen 3.5 MTP, ולהפעיל MTP בהגדרות הטעינה של המודל.
השימוש ב-MTP עשוי להאיץ את הרצת המודל עד פי 3 מהרצה רגילה.

היפ הופ

בלי להרחיב יותר מידי

ג'ימיני, בדרייב, נוסף לו המון שדרוגים קטנים וחשובים
חיפוש מקורות כללים
חיפוש (בטא) במייל,

ועוד שמירת שיחות וכו וכו, למי שיש פרו בג'ימיני שיחפור ויראה לבד..

המלאך

חברים.
צר לי לאכזב אותכם.
אבל שנת השפע של גוגל נגמרה.
גוגל מסירה את 1000 הקרדיטים החופשיים למנוי הפרו.
כמו"כ המגבלה אינה רק שבועית אלא לפי חלון זמן של חמש שעות.

מקור.

המלאך

טוב.
לא יודע עד כמה זה קשור לעדכונים.
אבל זה דבר אדיר! -חובה לשתף-
https://github.com/rohitg00/ai-engineering-from-scratch
מאגר של AI.
זה לא עוד קורס Prompt Engineering רגיל אלא
roadmap ענקי שבונה AI Engineer מאפס:
• Math foundations
• Deep Learning
• Transformers
• LLM Internals
• RAG
• MCP
• Agents
• Multi-Agent Systems
• Production AI Infrastructure
בקיצור הכל!
לא מבין איך לא ראיתי את זה קודם.
מה שמעניין במיוחד:
כל lesson בונה משהו אמיתי - tools, agents, servers ו־workflows.
מטורף.
למרות שזה קצת מאוחר (הריפו נפתח לפני חודש חודשיים,) זה עדיין מטורף.

@א.מ.ד. @י.-פל. @עידו300 נראה לי תהנו מזה.

יודע ספר

@לשכת-הרב כעת ניתן כבר להוריד, גוגל עדכנו

CSS 0

לא יודע איך לא כתבו כבר (אולי כבר כתבו אני בדקתי עד 10 ימים אחרונה שזה זמן ההשקה)

חברת Qwen השיקה את הסדרת המודלים: Qwen3.7-Max

עוד לא פתוח אלא מונגש רק דרך Alibaba Cloud Model Studio

חלון הקשר של 1M טוקנים
מודל reasoning/agent
טקסט בלבד
API-only כרגע

CSS 0

עוד קצת מידע על הסדרה החדשה של Qwen
היכולות העיקריות:

כתיבת קוד
תיקון באגים
עבודה על כמה קבצים
refactoring
פרויקטים גדולים
SWE agents
long-horizon coding
autonomous workflows

הוא בנוי לעבוד עם:

MCP
כלים חיצוניים
Agents frameworks
(כולל)
Claude Code
OpenClaw
Qwen Code

חריג ביותר:
Alibaba טוענת שהוא הצליח לעבוד 35 שעות רצוף לבצע מעל 1000 tool calls
לבצע optimization לקרנל באופן אוטונומי

הוזכר Qwen3.7-Plus אבל עדיין לא פורסם

CUBASE

מודל עריכת הוידאו החדש של גוגל, Gemini Omni, זמין מעכשיו לכווולם בתוך Google Flow!!

המודל מאפשר לערוך ולשנות סרטונים פשוט באמצעות פקודות טקסט בשפה חופשית.

גוגל פותחת את הגישה גם למשתמשים במסלול החינמי, שיכולים מהיום ליצור שני סרטוני Omni בחינם בכל יום, בלי צורך במנוי בתשלום.

איך מוציאים את המקסימום ממודל הווידאו החדש של גוגל, Gemini Omni? הנה המדריך המלא לכתיבת פרומפטים.

ככל שתהיו יותר ממוקדים, התוצאה תהיה קרובה יותר למה שדמיינתם. הנה עקרונות העבודה המרכזיים:

הבסיס לכל שוט
תחשבו כמו במאים. כשאתם כותבים פרומפט, כדאי להגדיר את האלמנטים הבאים:

תנועת מצלמה וזווית: תקריב (Close-up), זווית רחבה, צילום סטטי או מצלמה בתנועה מהירה.

סגנון ותאורה: קולנועי, מציאותי, תאורת שקיעה חמה או אורות ניאון דרמטיים.

מיקום ופעולה: איפה זה קורה ומה הדמויות עושות. לא צריך לפרט כל גרגיר אבק – המודל מבין הקשר כללי.

עריכה שיחתית בשלבים
אפשר לערוך את הווידאו תוך כדי שיחה, בלי לכתוב הכל מחדש. יצרתם וידאו של פרפר? פשוט תכתבו "תחליף את הפרפר לדבורה", והוא ישמור על שאר הסרטון. אפשר גם לשנות רק את זווית המצלמה באותה שיטה.

מונחי מצלמה מתקדמים
המודל מבין מושגים מקצועיים מהקולנוע. אתם יכולים לבקש שוט רציף (Oner), מצלמה נייחת (Locked off), או תנועות כמו Push in ו-Dolly zoom. אפשר גם לבקש טקסטורות ספציפיות כמו "צילום סמארטפון" או "מצלמת פילם".

ידע כללי מובנה
בניגוד למודלים אחרים שדורשים תיאור פיזי מדויק של כל אובייקט, Omni נשען על ידע בעולם. אפשר לבקש ממנו משהו מופשט כמו "תראה לי את ההבדל בין מחשב רגיל למחשב קוונטי בסגנון מינימליסטי", והוא כבר ידע איך לתרגם את זה לוויזואליה.

שילוב קבצים ושמירה על עקביות
ערבוב מדיות: אפשר לשלב וידאו, תמונה וסאונד בפרומפט אחד. למשל: "קח את הציפורים מהווידאו הזה, תסדר אותן לפי הצורה שבתמונה הזו, ושיזוזו לפי הקצב של קובץ האודיו".

סטוריבורד: אפשר להעלות ציורי סקיצה (סטוריבורד) ולבקש מהמודל להנפיש אותם לפי הסדר.

שמירה על דמות: רוצים שהדמות שלכם תופיע בכמה סצנות שונות? פשוט תעלו תמונת רפרנס (אפשר אפילו כזו שיצרתם במודל התמונות של גוגל או ChatGPT) והוא ישמור על המראה שלה עקבי גם כשהרקע והתאורה משתנים.

טקסט ואנימציה מסונכרנת
ה-Omni יודע לרנדר טקסט מדויק בתוך הווידאו (בעברית עדיין לא משהו). אפשר להגדיר לו איזה פונט, לבקש שמילים יופיעו אחת אחרי השנייה, ואפילו לסנכרן תנועות במרחב (כמו אורות שנדלקים) בדיוק לפי קצב המוזיקה שהעליתם.

טיפ קטן לסיום: לפני שאתם מייצרים את הווידאו, אפשר פשוט להיכנס לצ'אט הרגיל של ג'מיני, לזרוק לו את הרעיון הכללי שלכם ולבקש ממנו לנסח עבורכם את הפרומפט המלא והעשיר ביותר.

מייבין במקצת

אפשר ליצור בגוגל AI סטודיו אפליקציות לאנדרואיד

מקור

yehokarpel

אפשרות חדשה בגוגל AI סטודיו ליצא את הקוד של האתר שאתם בונים אל Google Antigravity עם ההקשר שיחה שלכם במהלך בניית האתר

המלאך

חברת Anysphere מפתחת הכלי קורסור שיחררה את הגירסה השלישית לתוכנה.
הגירסה מביאה שינוי עיצוב ענק, שכולל שינוי לגמרי מהתדמית של פורק לוי אס קוד.
וכעת זה משהו שונה לגמרי, כמו"כ נוספו האופציות:
לבדיקות מקומיות על פרוייקטים,
ניתן לבצע שיוניים במקביל על מספר מאגרים,
ניתן להריץ עד שמונה סוכני AI במקביל.
יש עוד הרבה מאוד פיצ'רים (וזה בלי להזכיר את מודל Composer 2.5 החדש של החברה..)
זה כל מה שראיתי בנתיים - מוזמנים להוסיף.

שיתוף | מה חדש בבינה מלאכותית - מתעדכן

גוגל שינו את העיצוב של ג'מיני לגמרי.

תמונות:

סיכום החלק הראשון של כנס ה I/O של גוגל

סיכום החלק הראשון של כנס ה I/O של גוגל

עדכון: גמיני עשו עדכונים ושיפורים אך הורידו חלק מהפונקציות

Google · Gemma 4 MTP

עדכון: גמיני עשו עדכונים ושיפורים אך הורידו חלק מהפונקציות

חברת Qwen השיקה את הסדרת המודלים: Qwen3.7-Max

חברת Qwen השיקה את הסדרת המודלים: Qwen3.7-Max