שיתוף | מה חדש בבינה מלאכותית - מתעדכן
-
Zai - GLM 5.2
חברת Zai הסינית משחררת את המודל החדש שלה, GLM 5.2.
GLM 5.2 הוא מודל הפתוח הטוב ביותר עד כה, עם יכולות מטורפות בקידוד.
מדובר במודל הראשון שעובר את ה-80% במבחן Terminal-Bench, לפני Gemini 3.1 Pro!

גם בשאר המדדים, נראה שהוא ממש קרוב למודלי החזית:

בקוד-ארנה הוא הגיע למקום השני אחרי Claude Fable 5:

למודל החדש יש 753B פרמטרים וחלון הקשר של 1M טוקנים. -
Zai - GLM 5.2
חברת Zai הסינית משחררת את המודל החדש שלה, GLM 5.2.
GLM 5.2 הוא מודל הפתוח הטוב ביותר עד כה, עם יכולות מטורפות בקידוד.
מדובר במודל הראשון שעובר את ה-80% במבחן Terminal-Bench, לפני Gemini 3.1 Pro!

גם בשאר המדדים, נראה שהוא ממש קרוב למודלי החזית:

בקוד-ארנה הוא הגיע למקום השני אחרי Claude Fable 5:

למודל החדש יש 753B פרמטרים וחלון הקשר של 1M טוקנים.חברת xAI משחררת את Grok Imagine Video 1.5 ליצירת וידאו מתמונה.
המודל החדש מציג איכות ריאליסטית יותר ופיזיקה מדויקת יותר, אבל הבשורה העיקרית היא המהירות. גרסת ה-Fast שזמינה כעת למשתמשים חותכת את זמן ההמתנה כמעט בחצי – סרטון של 720p ייווצר ב-25 שניות בלבד, לעומת למעלה מ-40 שניות במודל הקודם (המודל זמין גם ב-API למפתחים).

-
חברת xAI משחררת את Grok Imagine Video 1.5 ליצירת וידאו מתמונה.
המודל החדש מציג איכות ריאליסטית יותר ופיזיקה מדויקת יותר, אבל הבשורה העיקרית היא המהירות. גרסת ה-Fast שזמינה כעת למשתמשים חותכת את זמן ההמתנה כמעט בחצי – סרטון של 720p ייווצר ב-25 שניות בלבד, לעומת למעלה מ-40 שניות במודל הקודם (המודל זמין גם ב-API למפתחים).

-
אנת'רופיק התחרטה בדקה ה-90 ולא תצטרכו לשלם יותר
ב-Anthropic טענו שהמינויים של Claude לא נבנו לעידן ה-AI Agents, ורצו לגרום לכם לשלם הרבה יותר עליהם, אבל נראה שהזעם עשה את שלו.
הכל החל בתחילת השנה, כאשר OpenClaw (אז עוד Clawdbot) הפך למה שנראה כמו האייג'נט המיינסטרימי הראשון. כדי להשתמש בו, באייג'נטים אחרים ובפיתוחים נוספים – המשתמשים היו מחברים אותם לחשבון שלהם ומשתמשים במכסת המינוי ל-Claude. באפריל נראה שנמאס לאנת'רופיק, והיא החליטה שהיא רוצה נתח מהחגיגה. החברה הודיעה על שינוי משמעותי: מנויים משלמים יצטרכו לשלם בנפרד על נפח השימוש שלהם. כך, אפילו משתמש Max שמשלם 100 דולר בחודש, נדרש לשלם אקסטרה על שימוש שמתבצע דרך Claude Agent SDK.
יוצר OpenClaw, פיטר סטיינברגר שכיום עובד ב-OpenAI, טען שניסה לדבר לליבה של אנת'רופיק אך נפל על אוזניים ערלות: "הסברנו לאנת'רופיק שיש לנו משתמשים רבים שרכשו את המינוי שלהם רק בגלל OpenClaw, והם יפסידו אם הם יבטלו אותו". ברמת העיקרון, שימוש בכלים של צד ג' דרך Claude אסור על פי תנאי השימוש, והחברה פשוט החלה לאכוף זאת אקטיבית. כדי להרגיע את הרוחות, הציעה החברה קרדיט חד פעמי לשימוש ב-API, אך המשתמשים עדיין זעמו – בעיקר כי כלים כמו OpenClaw מסוגלים לזלול טוקנים בקצב גבוה, מה שעלול להקפיץ את עלויות השימוש ללא שליטה.
נראה שהזעם עשה את שלו. ביום שבו השינויים היו אמורים להיכנס לתוקף, אנת'רופיק חזרה בה. כעת, משתמשי Agent SDK יוכלו להמשיך להשתמש במכסות המינוי שלהם ל-Claude גם עם אפליקציות צד ג'. עמוד התמיכה של החברה עודכן וכולל כעת הודעה על "הקפאה של השינויים", ובה צוין כי "נכון לעכשיו, שום דבר לא משתנה" ושהחברה "פועלת לעדכון התוכנית כדי לתמוך בצורה טובה יותר באופן הבנייה של המשתמשים עם מינוי Claude".
במקביל, חלק מהמשתמשים קיבלו מייל המדווח על הקפאת התהליך, ובו אושר כי Agent SDK, claude -p ואפליקציות צד ג' ימשיכו להיתמך על ידי המינוי הקיים בדיוק כמו בעבר. החברה אף הוסיפה: "כשיהיה לנו עדכון, נשתף אותו עמכם מראש".
מקור: גיקטיים
-
-
WeiboAI - VibeThinker 3B: מודל 3B שעוקף את המודלים הגדולים ביותר במדדי הביצועים!!!
WeiboAI, צוות מומחי AI משחרר את VibeThinker-3B, מודל מחקרי, המתמקד במשימות חשיבה מאתגרות עם תוצאות הניתנות לאימות (כלומר משימות שקל למדוד את תוצאותיהן), כגון מתמטיקה, קידוד תחרותי ו-STEM.
על ידי אופטימיזציה שיטתית של צינור האימון לאחר ה-SSP (Speculum-to-Signal Principle) שהוצג ב-VibeThinker 1.5B - הגרסה הקטנה והישנה יותר, VibeThinker 3B מצליח להשיג ביצועים חזקים במדדי AIME, HMMT, IMO-AnswerBench, LiveCodeBench, ובתחרויות LeetCode האחרונות, ומגיע לטווח הביצועים של מודלי חשיבה מובילים, כולל Qwen3.6 Plus, Gemini 3 Pro, GLM-5 ו-Kimi K2.5, על מדדי חשיבה הניתנים לאימות.מטרת המודל היא לא להוות תחליף למודלים הגדולים, אלא להראות שמודלים קטנים הם לא פשרה מאילוצי חומרה אלא במקרים מסויימים הם משתווים למודלי החזית כשממקדים אותם במשימות ספציפיות.
המודל לא מתאים למשימות של קידוד סוכני כמו להרים פרוייקטים ומאגרים שלמים, אלא עבור פיתרון בעיות קידוד, ומתמטיקה והיגיון בסגנון תחרותי.
האמת שבאופן אישי הייתי די סקפטי לגבי המדדים שפורסמו, אבל כשבדקתי את המודל על סט הבדיקות שאני מריץ על כל מודל, הופתעתי לחלוטין. הוא פתר בקלות בעיות שמודלים גדולים ממנו בהרבה הסתבכו בהן. ממליץ פשוט לנסות ולראות!הנה מדדי הביצועים הרשמיים שפורסמו ע"י מפתחי המודל:

-
מאחר ובכל פעם שיוצא מודל או כלי AI חדש, או עדכון כלשהו למודל קיים מייד תוך כמה שעות מישהו ידאג להעלות נושא חדש עם ציטוט ארוך מאתר טכנולוגיה מזדמן המבשר באריכות על השקת המודל ויכולותיו, חשבתי פשוט ליצור נושא מתעדכן שבו יוכלו המשתמשים להעלות פוסטים קצרים ומתומצתים אודות המודלים החדשים והעדכונים, כך שכל המידע יהיה מרוכז במקום אחד, בקצרה ללא צורך לצטט כתבות שלמות כדי להצדיק פתיחת נושא חדש, ובכך למנוע הספמה של הפורום, כשלעיתים נפתחים במקביל 3 ויותר נושאים המבשרים על השקת מודל חדש...
נא לא להגיב על פוסטים אלא להעלות אך ורק עדכוני AI על מודלים וכלים חדשים וכדומה, בניסוח אנושי ומתומצת בלבד, בלי לפתוח דיונים.
מומלץ להגדיר את הנושא "במעקב" כדי להתעדכן מייד על כל פוסט שעולה.אם אין דעת מנהלי הפורום נוחה מכך, הודיעוני ואמחק את הנושא.
פוסט זה נמחק! -
פוסט זה נמחק!
-
גוגל משחררת שדרוג משמעותי ל-NotebookLM, שהופך אותו לכלי מחקר חכם ועצמאי בהרבה. העדכון מביא איתו את מודל Gemini 3.5 ויכולת להריץ קוד בענן. המערכת יכולה עכשיו לנתח נתונים מורכבים ולייצר ישירות בצ'אט תרשימים, טבלאות אקסל ומצגות.
שלום! נראה שהשיחה הזו מעניינת אותך, אבל עדיין אין לך חשבון.
נמאס לכם לגלול בין אותם הפוסטים בכל ביקור? כשנרשמים לחשבון, תמיד תחזרו בדיוק למקום שבו הייתם קודם, ותוכלו לבחור לקבל התראות על תגובות חדשות (בין אם במייל, ובין אם בהתראת פוש). תוכלו גם לשמור סימניות ולפרגן ב-upvote לפוסטים כדי להביע הערכה לחברי קהילה אחרים.
בעזרת התרומה שלך, הפוסט הזה יכול להיות אפילו טוב יותר 💗
הרשמה התחברות
