שיתוף | מה חדש בבינה מלאכותית - מתעדכן
-
ויש גם דף עם מכסות שימוש בג'ימני


-
ויש גם דף עם מכסות שימוש בג'ימני


-
ויש גם דף עם מכסות שימוש בג'ימני






הושק Gemini 3.5 Flash
והוא כבר זמין בGoogle AI Studioעריכה 23.02: זמין כבר באתר ג'ימני
קרדיט ל@שניאור-שמח
-
סיכום החלק הראשון של כנס ה I/O של גוגל
הישגי ה-AI של גוגל: סונדאר פיצ'אי פתח וציין את הצמיחה העצומה בשימוש בבינה המלאכותית, עם למעלה מ-3.2 קוודריליון (אלף טריליונים) "אסימוני" מידע (Tokens) המעובדים בחודש. כיום לגוגל יש 13 מוצרים עם מעל למיליארד משתמשים- שבבי TPU חדשים: גוגל הציגה את הדור השמיני של שבבי העיבוד שלה, ה-TPU 8t ו-8i. השבבים החדשים מאפשרים אימון מודלים מהיר מאי פעם ועיבוד נתונים בקצב של כ-1,500 טוקנים בשנייה תוך חיסכון ניכר באנרגיה
1. מודלי בינה מלאכותית חדשים
-
Gemini Omni: מודל "עולם" (World Model) חדש של גוגל שמסוגל לא רק ליצור טקסט, אלא לדמות את המציאות הפיזית (למשל, להבין כוח משיכה ואנרגיה קינטית). המודל מאפשר יצירה ועריכה טבעית של סרטוני וידאו מציאותיים באמצעות פקודות טקסט פשוטות, תוך שמירה על עקביות פיזיקלית
-
Gemini 3.5 Flash: מודל מתקדם, מהיר במיוחד וזול משמעותית, אשר תוכנן במיוחד כדי להפעיל סוכני AI (Agents) ולבצע משימות קידוד ותכנות ארוכות
2. מהפכת ה"סוכנים" (AI Agents)
-
Antigravity 2.0: סביבת פיתוח מהפכנית המבוססת על סוכני AI. בהדגמה מדהימה, צוות של סוכני AI הצליח לכתוב ולבנות מערכת הפעלה שלמה (OS) מאפס בתוך 12 שעות בלבד
-
Gemini Spark: סוכן אישי שפועל 24/7 בענן מטעם המשתמש. הסוכן מסוגל לארגן אירועים, לאסוף נתונים על פני מספר אפליקציות (Docs, Gmail, Calendar), לנסח מיילים, ליצור מסמכים מעוצבים ולתכנן לוחות זמנים – והכל מתנהל ברקע בזמן שאתם פנויים לדברים אחרים
3. חידושים במנוע החיפוש ובקניות
-
חיפוש מבוסס סוכנים (Search Agents): חיפוש גוגל שודרג למודל 3.5 עם תיבת חיפוש אינטראקטיבית. כעת ניתן "לשכור" סוכני חיפוש שיעבדו ברקע ויעדכנו אתכם באופן שוטף בנושאים מורכבים, כמו מעקב אחר מניות ספציפיות או חיפוש דירות
-
Agentic Coding בחיפוש: החיפוש יכול כעת לכתוב קוד בזמן אמת כדי ליצור עבורכם גרפים אינטראקטיביים או לבנות מיני-אפליקציות בהתאמה אישית (כמו מתכנן סופי שבוע למשפחה שמוסיף הכל ישירות ליומן)
-
Agentic Commerce: מהפכה בקניות דרך רשת שלמה של פרוטוקולים המאפשרים לסוכנים לרכוש דברים עבורכם באבטחה מלאה. גוגל הציגה את ה-"Universal Cart" (עגלת קניות אוניברסלית) שמוצאת חיסכון, מבצעת קופונים באופן אוטומטי, ובודקת האם חלקים שאתם קונים תואמים אחד לשני (למשל בהרכבת מחשב)
4. שילוב AI במוצרי היום-יום
- שדרוג אפליקציית Gemini: האפליקציה זכתה לעיצוב מחדש, תמיכה בניבים אזוריים קוליים שונים, ו"עדכון יומי" שמסכם את האימיילים, הפגישות והמשימות שלכם על הבוקר. בנוסף, הודגם שילוב מתקדם של המערכת ב-Mac OS המאפשר הפקת טבלאות ממסמכים וקבלות דרך קול בלבד
- Ask YouTube: תכונה חדשה המאפשרת למשתמשים לשאול שאלות על סרטונים ארוכים ולקבל סיכום או קפיצה בדיוק לשנייה הרלוונטית שמסבירה את התשובה בסרטון
- Docs Live: יצירה, עריכה ועיצוב של מסמכים בצורה מלאה רק דרך פקודות קוליות רציפות של המשתמש
5. כלי יצירה ועיצוב
- Google Pics & Stitch: כלים חדשים ליצירת ועריכת תמונות, ולבניית ממשקי משתמש (UI) לאתרים ואפליקציות דרך הנחיות טקסט ודיבור
- Google Flow & Flow Music: פלטפורמות ליצירה מתקדמת של וידאו קולנועי (עם אפשרות לשנות זוויות צילום וזמן ביום על ידי פקודות) ולביצוע או הפקה של רצועות מוזיקה מורכבות
6. משקפיים חכמים (Intelligent Eyewear)
- גוגל חשפה משקפי שמע חכמים (ללא מסך ויזואלי מובנה) בשיתוף פעולה עם סמסונג, Warby Parker ו-Gentle Monster. המשקפיים, שיושקו בסתיו הקרוב, מחוברים ל-Gemini ומאפשרים לבקש הנחיות ניווט בזמן אמת, להזמין אוכל, לסכם הודעות טקסט ולצלם תמונות של מה שקורה מולכם, כל זאת ללא צורך להוציא את הטלפון מהכיס
7. שקיפות, בטיחות ומדע
-
זיהוי תוכן בינה מלאכותית: הרחבת כלי ה-SynthID (סימון מים דיגיטלי נסתר) לדפדפן Chrome ולמנוע החיפוש, על מנת לסייע למשתמשים לזהות בקלות תמונות וסרטונים מזויפים (Deepfakes), בשיתוף עם חברות כמו OpenAI ואינבידיה
-
Gemini for Science: שימוש בבינה מלאכותית לפתרון בעיות מורכבות במדע – החל ממודלים פורצי דרך לחיזוי מדויק ומהיר של מזג אוויר וסופות הוריקן (WeatherNext), ועד להאצת תהליכי הפיתוח של תרופות וטיפולים למחלות חשוכות מרפא
-
סיכום החלק הראשון של כנס ה I/O של גוגל
הישגי ה-AI של גוגל: סונדאר פיצ'אי פתח וציין את הצמיחה העצומה בשימוש בבינה המלאכותית, עם למעלה מ-3.2 קוודריליון (אלף טריליונים) "אסימוני" מידע (Tokens) המעובדים בחודש. כיום לגוגל יש 13 מוצרים עם מעל למיליארד משתמשים- שבבי TPU חדשים: גוגל הציגה את הדור השמיני של שבבי העיבוד שלה, ה-TPU 8t ו-8i. השבבים החדשים מאפשרים אימון מודלים מהיר מאי פעם ועיבוד נתונים בקצב של כ-1,500 טוקנים בשנייה תוך חיסכון ניכר באנרגיה
1. מודלי בינה מלאכותית חדשים
-
Gemini Omni: מודל "עולם" (World Model) חדש של גוגל שמסוגל לא רק ליצור טקסט, אלא לדמות את המציאות הפיזית (למשל, להבין כוח משיכה ואנרגיה קינטית). המודל מאפשר יצירה ועריכה טבעית של סרטוני וידאו מציאותיים באמצעות פקודות טקסט פשוטות, תוך שמירה על עקביות פיזיקלית
-
Gemini 3.5 Flash: מודל מתקדם, מהיר במיוחד וזול משמעותית, אשר תוכנן במיוחד כדי להפעיל סוכני AI (Agents) ולבצע משימות קידוד ותכנות ארוכות
2. מהפכת ה"סוכנים" (AI Agents)
-
Antigravity 2.0: סביבת פיתוח מהפכנית המבוססת על סוכני AI. בהדגמה מדהימה, צוות של סוכני AI הצליח לכתוב ולבנות מערכת הפעלה שלמה (OS) מאפס בתוך 12 שעות בלבד
-
Gemini Spark: סוכן אישי שפועל 24/7 בענן מטעם המשתמש. הסוכן מסוגל לארגן אירועים, לאסוף נתונים על פני מספר אפליקציות (Docs, Gmail, Calendar), לנסח מיילים, ליצור מסמכים מעוצבים ולתכנן לוחות זמנים – והכל מתנהל ברקע בזמן שאתם פנויים לדברים אחרים
3. חידושים במנוע החיפוש ובקניות
-
חיפוש מבוסס סוכנים (Search Agents): חיפוש גוגל שודרג למודל 3.5 עם תיבת חיפוש אינטראקטיבית. כעת ניתן "לשכור" סוכני חיפוש שיעבדו ברקע ויעדכנו אתכם באופן שוטף בנושאים מורכבים, כמו מעקב אחר מניות ספציפיות או חיפוש דירות
-
Agentic Coding בחיפוש: החיפוש יכול כעת לכתוב קוד בזמן אמת כדי ליצור עבורכם גרפים אינטראקטיביים או לבנות מיני-אפליקציות בהתאמה אישית (כמו מתכנן סופי שבוע למשפחה שמוסיף הכל ישירות ליומן)
-
Agentic Commerce: מהפכה בקניות דרך רשת שלמה של פרוטוקולים המאפשרים לסוכנים לרכוש דברים עבורכם באבטחה מלאה. גוגל הציגה את ה-"Universal Cart" (עגלת קניות אוניברסלית) שמוצאת חיסכון, מבצעת קופונים באופן אוטומטי, ובודקת האם חלקים שאתם קונים תואמים אחד לשני (למשל בהרכבת מחשב)
4. שילוב AI במוצרי היום-יום
- שדרוג אפליקציית Gemini: האפליקציה זכתה לעיצוב מחדש, תמיכה בניבים אזוריים קוליים שונים, ו"עדכון יומי" שמסכם את האימיילים, הפגישות והמשימות שלכם על הבוקר. בנוסף, הודגם שילוב מתקדם של המערכת ב-Mac OS המאפשר הפקת טבלאות ממסמכים וקבלות דרך קול בלבד
- Ask YouTube: תכונה חדשה המאפשרת למשתמשים לשאול שאלות על סרטונים ארוכים ולקבל סיכום או קפיצה בדיוק לשנייה הרלוונטית שמסבירה את התשובה בסרטון
- Docs Live: יצירה, עריכה ועיצוב של מסמכים בצורה מלאה רק דרך פקודות קוליות רציפות של המשתמש
5. כלי יצירה ועיצוב
- Google Pics & Stitch: כלים חדשים ליצירת ועריכת תמונות, ולבניית ממשקי משתמש (UI) לאתרים ואפליקציות דרך הנחיות טקסט ודיבור
- Google Flow & Flow Music: פלטפורמות ליצירה מתקדמת של וידאו קולנועי (עם אפשרות לשנות זוויות צילום וזמן ביום על ידי פקודות) ולביצוע או הפקה של רצועות מוזיקה מורכבות
6. משקפיים חכמים (Intelligent Eyewear)
- גוגל חשפה משקפי שמע חכמים (ללא מסך ויזואלי מובנה) בשיתוף פעולה עם סמסונג, Warby Parker ו-Gentle Monster. המשקפיים, שיושקו בסתיו הקרוב, מחוברים ל-Gemini ומאפשרים לבקש הנחיות ניווט בזמן אמת, להזמין אוכל, לסכם הודעות טקסט ולצלם תמונות של מה שקורה מולכם, כל זאת ללא צורך להוציא את הטלפון מהכיס
7. שקיפות, בטיחות ומדע
-
זיהוי תוכן בינה מלאכותית: הרחבת כלי ה-SynthID (סימון מים דיגיטלי נסתר) לדפדפן Chrome ולמנוע החיפוש, על מנת לסייע למשתמשים לזהות בקלות תמונות וסרטונים מזויפים (Deepfakes), בשיתוף עם חברות כמו OpenAI ואינבידיה
-
Gemini for Science: שימוש בבינה מלאכותית לפתרון בעיות מורכבות במדע – החל ממודלים פורצי דרך לחיזוי מדויק ומהיר של מזג אוויר וסופות הוריקן (WeatherNext), ועד להאצת תהליכי הפיתוח של תרופות וטיפולים למחלות חשוכות מרפא
--------------------


------------------------
https://www.youtube.com/shorts/4iiveOmCzT4 -
גימיני עשו עידכון!
-
-
Google · Gemma 4 MTP
חברת Google מכריזה על המודלים החדשים: Gemma 4 MTP.
למעשה, לא מדובר במודלים רגילים, אלא במודלי טיוטה, המשמשים לפיענוח ספקולטיבי עבור המודלים המרכזיים של Gemma 4.
הסבר על אופן הפעולה של פיענוח ספקולטיבי ניתן למצוא במדריך המפורט שכתבתי למודלי AI מקומיים.
בשתי מילים, מדובר במודלים קטנים ויעילים, החולקים את אותו אוצר המילים כמו המודלים הגדולים, וחוזים קדימה מספר מסוים של טוקנים, לדוגמא 5, ולאחר מכן המודל הגדול מאשר את הטוקנים שהמודל הקטן כתב ומוסיף עוד טוקן משלו, ואם הוא מחליט שהפלט לא טוב מספיק - הוא מתקן אותו ומחזיר את המושכות למודל הקטן. מכיוון שפעולת "אישור" של מספר טוקנים במקביל מהירה בהרבה מחיזוי של הטוקנים אחד-אחד בדרך הרגילה, מתקבל פלט עם אותה איכות בדיוק, רק במהירות גבוהה פי 3, מאחר ובדרך כלל רוב הטוקנים בפלט הם די צפויים ומסתבר שהמודל הקטן לא יטעה בחיזויים, לדוגמא הכי מסתבר שאחרי המילה "בינה" תבוא המילה "מלאכותית".
פיענוח ספקולטיבי נתמך ב-LM Studio.Google משחררת סדרת מודלי טיוטה, עבור כל אחד מהמודלים הגדולים של Gemma 4:
- Gemma 4 31B מקבל מודל טיוטה של 0.5B פרמטרים.
- Gemma 4 26B A4B מקבל מודל טיוטה של 0.4B פרמטרים.
- Gemma 4 E4B מקבל מודל טיוטה של 79M פרמטרים.
- Gemma 4 E2B מקבל מודל טיוטה של 78M פרמטרים (ייתכן ומדובר באותו מודל כמו הקודם).
המודלים מזוהים תחת השמות "google/gemma-4-31B-it-assistant" (בהתאמה לשם המודל המקורי).
לכאורה המודלים מתאימים גם להרצה עצמאית, ואם כן קיבלנו סדרת מודלים זעירים במיוחד של Gemma 4. אני מנסה להמיר אותם ל-GGUF כדי לבדוק. בעז"ה אעדכן בתוצאות.
עדכון: בשונה ממודלי טיוטה רגילים, שהם בעצם מודלים רגילים לכל דבר שניתן להריץ אותם עצמאית, מודלי הטיוטה של Gemma 4 בנויים בארכיטקטורה חדשנית שממקסמת את יתרונות הפיענוח הספקולטיבי, באמצעות הסתמכות של מודלי הטיוטה על המודלים הגדולים בטבלת ההטמעות, המטמון של הקשר השיחה, ומנגנון כוונון דינמי שמשנה את מספר הטוקנים שמודל הטיוטה חוזה בכל פעם בהתאם לאחוז האישור של המודל הגדול, מה שאומר שהם אינם מתאימים להרצה עצמאית.עדכון 2: לעת עתה ניתן להתנסות בטכנולוגיה החדשנית למחצה הזו, באפליקציית Google AI Edge Gallery (מי שכבר משתמש בה נדרש לעדכן את מודלי Gemma 4).
מהתנסות שלי המהירות מטורפת, כמה עשרות טוקנים לשנייה במודל E4B.עדכון חשוב:
לאחר שסוף-סוף llama.cpp הטמיעו תמיכה ב-MTP (פיענוח ספקולטיבי, ניתן לראות את הפוסט המצוטט להסבר) בשבוע שעבר, היום LM Studio (המבוססת על llama.cpp) שחררו גרסה חדשה התומכת גם היא ב-MTP - גרסה 0.4.14 Build 3. כדי לקבל את הגרסה החדשה יש לעבור לערוץ עדכוני בטא בהגדרות, במקום הערוץ היציב.
כדי להשתמש ב-MTP, יש להוריד מודל תואם מסדרת Gemma 4 MTP או Qwen 3.5 MTP, ולהפעיל MTP בהגדרות הטעינה של המודל.
השימוש ב-MTP עשוי להאיץ את הרצת המודל עד פי 3 מהרצה רגילה. -
א אברהם גלסר התייחס לנושא זה





