שיתוף | מה חדש בבינה מלאכותית - מתעדכן
-
פוסט זה נמחק!
-
@יודע-ספר זה כבר שווה נושא חדש לדעתי.
פוסט זה נמחק! -
סיידאנס (Seedance) משחררת גרסה קטנה ומהירה יותר של מודל הווידאו שלה – Seedance 2.0 Mini.
הגרסה החדשה מתמקדת בעיקר במהירות ויעילות, ומאפשרת לייצר סרטוני AI בתוך שניות בודדות ובעלות נמוכה משמעותית, תוך שמירה על רמת פירוט גבוהה ותנועה טבעית.Telegram_Video_1781614155049.mp4
-
סיידאנס (Seedance) משחררת גרסה קטנה ומהירה יותר של מודל הווידאו שלה – Seedance 2.0 Mini.
הגרסה החדשה מתמקדת בעיקר במהירות ויעילות, ומאפשרת לייצר סרטוני AI בתוך שניות בודדות ובעלות נמוכה משמעותית, תוך שמירה על רמת פירוט גבוהה ותנועה טבעית.Telegram_Video_1781614155049.mp4
סוכן ה-AI העצמאי של מיקרוסופט, Copilot Cowork, יוצא מגרסת הבטא וזמין מעכשיו לכל משתמשי Microsoft 365.
במקום רק לענות על שאלות, Cowork הופך את קופיילוט לעובד וירטואלי שמבצע משימות שלמות ברקע. אתם מגדירים לו מטרה, והוא יודע למשוך נתונים מאקסל, לבנות מצגת בפאוורפוינט, לנסח אימייל לצוות ולקבוע פגישות ביומן – הכל לגמרי לבד ועל פני כמה אפליקציות במקביל.

-
רשמית: אילון מאסק רוכש את Cursor ב-60 מיליארד דולר
אחרי ההנפקה המוצלחת על פי שווי של 2 טריליון דולר, SpaceX מודיעה רשמית על רכישת כלי כתיבת הקוד בעזרת AI
בסוף השבוע רשם אילון מאסק שני הישגים בולטים, עם ההנפקה של SpaceX – חברת החלל והבינה המלאכותית שלו – וההפיכה שלו לטריליונר. כעת, אחרי ששווי החברה כבר הספיק לזנק מעל 2 טריליון דולר, הוא משלים מהלך נוסף שעליו עבד עוד לפני ההנפקה.
הרכישה שתקרב את מאסק ל-Claude Code
SpaceX הודיעה לרשות ניירות ערך בארצות הברית, SEC, כי היא מתכננת לרכוש את Anysphere, סטארטאפ המפתח את סביבת הפיתוח הפופולרית Cursor. חברתו של מאסק תרכוש את הכלי בעסקה של 60 מיליארד דולר, שנחשפה לראשונה לפני כחודשיים. העסקה צפויה להיסגר ברבעון השלישי של השנה, משמע עד ספטמבר לכל המאוחר.
בחודש אפריל האחרון נחשפה הכוונה של חברת הענק לקצר את הפער מול שחקניות כמו Anthropic ו-OpenAI בתחום כתיבת הקוד מבוססת AI – תחום שבו היא נמצאת בפיגור מסוים, בדומה לגוגל. רק בשבועות האחרונים הציגה SpaceX, דרך xAI שאותה רכשה, את Grok Build, ניסיון להתחרות ב-Claude Code ו-Codex שלא ממש צבר תאוצה. זאת, בין השאר, מכיוון שהיה מוגבל רק למנויים המשלמים מאות דולרים בחודש.
היתרון המשמעותי עבור Cursor, שפועל כיום לרוב בעזרת מודלים של חברות אחרות לצד מודלים "בפיתוח עצמי" שהם בבסיסם מודלי קוד פתוח מסין, הוא היכולת לקבל מודל עצמאי – ובכך לייתר אולי את הצורך בחברות חיצוניות. בנוסף, Cursor יוכל ליהנות מכוח המחשוב הנרחב של SpaceX – משאב שיש לה בשפע, עד כדי כך שהחלה להשכיר אותו לחברות כמו Anthropic וגוגל. עבור Cursor, גישה לכוח מחשוב כזה היא קריטית לפיתוח מודלים וכלים עתידיים באופן עצמאי, ללא תלות בגורמים זרים.
מקור: גיקטיים
-
Zai - GLM 5.2
חברת Zai הסינית משחררת את המודל החדש שלה, GLM 5.2.
GLM 5.2 הוא מודל הפתוח הטוב ביותר עד כה, עם יכולות מטורפות בקידוד.
מדובר במודל הראשון שעובר את ה-80% במבחן Terminal-Bench, לפני Gemini 3.1 Pro!

גם בשאר המדדים, נראה שהוא ממש קרוב למודלי החזית:

בקוד-ארנה הוא הגיע למקום השני אחרי Claude Fable 5:

למודל החדש יש 753B פרמטרים וחלון הקשר של 1M טוקנים. -
Zai - GLM 5.2
חברת Zai הסינית משחררת את המודל החדש שלה, GLM 5.2.
GLM 5.2 הוא מודל הפתוח הטוב ביותר עד כה, עם יכולות מטורפות בקידוד.
מדובר במודל הראשון שעובר את ה-80% במבחן Terminal-Bench, לפני Gemini 3.1 Pro!

גם בשאר המדדים, נראה שהוא ממש קרוב למודלי החזית:

בקוד-ארנה הוא הגיע למקום השני אחרי Claude Fable 5:

למודל החדש יש 753B פרמטרים וחלון הקשר של 1M טוקנים.חברת xAI משחררת את Grok Imagine Video 1.5 ליצירת וידאו מתמונה.
המודל החדש מציג איכות ריאליסטית יותר ופיזיקה מדויקת יותר, אבל הבשורה העיקרית היא המהירות. גרסת ה-Fast שזמינה כעת למשתמשים חותכת את זמן ההמתנה כמעט בחצי – סרטון של 720p ייווצר ב-25 שניות בלבד, לעומת למעלה מ-40 שניות במודל הקודם (המודל זמין גם ב-API למפתחים).

-
חברת xAI משחררת את Grok Imagine Video 1.5 ליצירת וידאו מתמונה.
המודל החדש מציג איכות ריאליסטית יותר ופיזיקה מדויקת יותר, אבל הבשורה העיקרית היא המהירות. גרסת ה-Fast שזמינה כעת למשתמשים חותכת את זמן ההמתנה כמעט בחצי – סרטון של 720p ייווצר ב-25 שניות בלבד, לעומת למעלה מ-40 שניות במודל הקודם (המודל זמין גם ב-API למפתחים).

-
אנת'רופיק התחרטה בדקה ה-90 ולא תצטרכו לשלם יותר
ב-Anthropic טענו שהמינויים של Claude לא נבנו לעידן ה-AI Agents, ורצו לגרום לכם לשלם הרבה יותר עליהם, אבל נראה שהזעם עשה את שלו.
הכל החל בתחילת השנה, כאשר OpenClaw (אז עוד Clawdbot) הפך למה שנראה כמו האייג'נט המיינסטרימי הראשון. כדי להשתמש בו, באייג'נטים אחרים ובפיתוחים נוספים – המשתמשים היו מחברים אותם לחשבון שלהם ומשתמשים במכסת המינוי ל-Claude. באפריל נראה שנמאס לאנת'רופיק, והיא החליטה שהיא רוצה נתח מהחגיגה. החברה הודיעה על שינוי משמעותי: מנויים משלמים יצטרכו לשלם בנפרד על נפח השימוש שלהם. כך, אפילו משתמש Max שמשלם 100 דולר בחודש, נדרש לשלם אקסטרה על שימוש שמתבצע דרך Claude Agent SDK.
יוצר OpenClaw, פיטר סטיינברגר שכיום עובד ב-OpenAI, טען שניסה לדבר לליבה של אנת'רופיק אך נפל על אוזניים ערלות: "הסברנו לאנת'רופיק שיש לנו משתמשים רבים שרכשו את המינוי שלהם רק בגלל OpenClaw, והם יפסידו אם הם יבטלו אותו". ברמת העיקרון, שימוש בכלים של צד ג' דרך Claude אסור על פי תנאי השימוש, והחברה פשוט החלה לאכוף זאת אקטיבית. כדי להרגיע את הרוחות, הציעה החברה קרדיט חד פעמי לשימוש ב-API, אך המשתמשים עדיין זעמו – בעיקר כי כלים כמו OpenClaw מסוגלים לזלול טוקנים בקצב גבוה, מה שעלול להקפיץ את עלויות השימוש ללא שליטה.
נראה שהזעם עשה את שלו. ביום שבו השינויים היו אמורים להיכנס לתוקף, אנת'רופיק חזרה בה. כעת, משתמשי Agent SDK יוכלו להמשיך להשתמש במכסות המינוי שלהם ל-Claude גם עם אפליקציות צד ג'. עמוד התמיכה של החברה עודכן וכולל כעת הודעה על "הקפאה של השינויים", ובה צוין כי "נכון לעכשיו, שום דבר לא משתנה" ושהחברה "פועלת לעדכון התוכנית כדי לתמוך בצורה טובה יותר באופן הבנייה של המשתמשים עם מינוי Claude".
במקביל, חלק מהמשתמשים קיבלו מייל המדווח על הקפאת התהליך, ובו אושר כי Agent SDK, claude -p ואפליקציות צד ג' ימשיכו להיתמך על ידי המינוי הקיים בדיוק כמו בעבר. החברה אף הוסיפה: "כשיהיה לנו עדכון, נשתף אותו עמכם מראש".
מקור: גיקטיים
-
-
WeiboAI - VibeThinker 3B: מודל 3B שעוקף את המודלים הגדולים ביותר במדדי הביצועים!!!
WeiboAI, צוות מומחי AI משחרר את VibeThinker-3B, מודל מחקרי, המתמקד במשימות חשיבה מאתגרות עם תוצאות הניתנות לאימות (כלומר משימות שקל למדוד את תוצאותיהן), כגון מתמטיקה, קידוד תחרותי ו-STEM.
על ידי אופטימיזציה שיטתית של צינור האימון לאחר ה-SSP (Speculum-to-Signal Principle) שהוצג ב-VibeThinker 1.5B - הגרסה הקטנה והישנה יותר, VibeThinker 3B מצליח להשיג ביצועים חזקים במדדי AIME, HMMT, IMO-AnswerBench, LiveCodeBench, ובתחרויות LeetCode האחרונות, ומגיע לטווח הביצועים של מודלי חשיבה מובילים, כולל Qwen3.6 Plus, Gemini 3 Pro, GLM-5 ו-Kimi K2.5, על מדדי חשיבה הניתנים לאימות.מטרת המודל היא לא להוות תחליף למודלים הגדולים, אלא להראות שמודלים קטנים הם לא פשרה מאילוצי חומרה אלא במקרים מסויימים הם משתווים למודלי החזית כשממקדים אותם במשימות ספציפיות.
המודל לא מתאים למשימות של קידוד סוכני כמו להרים פרוייקטים ומאגרים שלמים, אלא עבור פיתרון בעיות קידוד, ומתמטיקה והיגיון בסגנון תחרותי.
האמת שבאופן אישי הייתי די סקפטי לגבי המדדים שפורסמו, אבל כשבדקתי את המודל על סט הבדיקות שאני מריץ על כל מודל, הופתעתי לחלוטין. הוא פתר בקלות בעיות שמודלים גדולים ממנו בהרבה הסתבכו בהן. ממליץ פשוט לנסות ולראות!הנה מדדי הביצועים הרשמיים שפורסמו ע"י מפתחי המודל:

שלום! נראה שהשיחה הזו מעניינת אותך, אבל עדיין אין לך חשבון.
נמאס לכם לגלול בין אותם הפוסטים בכל ביקור? כשנרשמים לחשבון, תמיד תחזרו בדיוק למקום שבו הייתם קודם, ותוכלו לבחור לקבל התראות על תגובות חדשות (בין אם במייל, ובין אם בהתראת פוש). תוכלו גם לשמור סימניות ולפרגן ב-upvote לפוסטים כדי להביע הערכה לחברי קהילה אחרים.
בעזרת התרומה שלך, הפוסט הזה יכול להיות אפילו טוב יותר 💗
הרשמה התחברות



