שיתוף | מה חדש בבינה מלאכותית - מתעדכן
-
LiquidAI - LFM2.5-230M
חברת LiquidAI היפנית משיקה מודל AI זעיר חדש: LFM2.5-230M. המודל מצטרף לאחיו הגדולים יותר בסדרת LFM2.5, אך בשונה מהם, אין לו מקביל בגודלו בסדרת LFM2, כלומר מדובר במודל בגודל חדש, הקטן ביותר שהושק ע"י החברה.
המודל החדש מזוקק מ-LFM2.5-350M ומעודן עם למידת חיזוק רב-שלבית, מה שהופך אותו מתאים לשימוש בכלים ולחילוץ נתונים.מדדי ביצועים:

ניתן לראות בסרטון היוטיוב כאן איך ב-LiquidAI הלבישו את המודל על רובוט דמוי-אנושי, והמודל מסוגל לפרק בקשה בשפה טבעית למספר קריאות כלים ולהפעיל את הרובוט.
-
DeepReinforce AI - Ornith 1.0
חברת DeepReinforce AI האמריקאית משחררת את סדרת המודלים Ornith 1.0, שלטענתה מציגה ביצועי חזית בתחומים רבים, הזמינים כמשקלים פתוחים ב-Hugging Face.
לפי מדדי הביצועים של החברה, Ornith 1.0 9B משתווה ביכולותיו ל-Qwen 3.5 35B.
הסדרה כוללת מגוון מודלים בגדלים שונים, המהווים אימון נוסף של המודלים מסדרות Qwen 3.5 ו-Gemma 4 (מדדי ביצועים מרשימים בספויילרים):- Ornith 1.0 397B - מודל MoE

- Ornith 1.0 35B - מודל MoE

- Ornith 1.0 31B - מודל צפוף, עדיין לא עלה ל-Hugging Face
- Ornith 1.0 9B - מודל צפוף

-
ממשלת ארה"ב תאשר באופן פרטני מי יוכל להשתמש ב-GPT 5.6
לפי הדיווחים, ממשל טראמפ הולך לבחון אחד-אחד את הלקוחות שיוכלו להשתמש ב-GPT 5.6.

ייתכן מאוד שגם ב-GPT 5.6, כמו במודלי Claude 5, לא תהיה גישה למשתמשים שאינם אזרחי ארה"ב, מה שמטלטל את שוק ה-AI בעולם. כמו שכתבתי זה רק דיווח, אבל הוא ממש לא מופרך בהתחשב במה שקרה עם Claude 5.
בקהילת ה-AI המקומי הציבור נלחץ, ומתחילים לחשוש מסגירת Hugging Face, ומדברים על הקמת מאגר טורנטים למודלים העיקריים והחשובים...
בין אם יש סיכוי לזה בין אם לא (סיכוי אפסי לדעתי, אבל טראמפ לא צפוי...), מומלץ למי שיש שטח אחסון מיותר להוריד את מודלי Qwen 3.6 35B ו-27B, ו-Gemma 4 31B ו-26B. אלו המודלים המתקדמים ביותר כיום שקיימת היתכנות להרצה מקומית על חומרה צרכנית, אם בעתיד יהיה לכם מחשבים עם GPU חזק.
זה נשמע הזוי, אבל גם סגירת המודלים הגדולים על ידי הממשל נשמעה הזויה עד לפני חודש, ואצל טראמפ אי אפשר לדעת כלום, אם כי לכאורה אין היגיון שנאבד גישה למה שכבר זמין לנו היום כמו GPT 5.5. -
היורש של Mythos כבר כאן: הכירו את GPT-5.6 Sol, Terra ו-Luna
בקצרה:
️ Mythos חוסל — OpenAI הציגה 3 מודלים חדשים: GPT‑5.6 Sol, Terra ו‑Luna.מה ידוע:
GPT‑5.6 היא משפחת מודלים חדשה, שבה Sol הוא המודל הגדול והחזק ביותר;
יש יותר דגש על משימות פרקטיות — כתיבת קוד ועבודה עם בסיסי קוד גדולים, שרשראות משימות ארוכות והתנהגות סוכנית, מחקר מדעי ושיפור העבודה בתחומי סייבר;
המשפחה הזו תהיה אפילו “בטוחה” יותר — OpenAI שמה דגש מיוחד על כך שהמודל לא יכתוב דברים מיותרים;
לפי הבנצ׳מרקים, Sol עקף את Mythos ב‑3%.כרגע זה נפתח רק לבודקים. ההשקה לכולם צפויה בקרוב.


צוות METR ניסה למדוד את היכולות של המודל החדש GPT-5.6 Sol, אבל נאלץ לעצור את הבדיקות בגלל רמת ערמומיות חריגה מצד המודל הנבדק.המודל לא סתם טעה — הוא באופן מודע חיפש חולשות בסביבת הבדיקה כדי לחלץ משם את התשובות הנכונות, ואז ניסה בזהירות לטשטש את עקבות הפריצה שלו.
בגלל ההונאה האינטלקטואלית הזו, לא באמת היה אפשר להעריך בצורה אובייקטיבית את הפוטנציאל של האלגוריתם. עם זאת, החוקרים עצמם דווקא מרוצים באופן פרדוקסלי מהתוצאה.לדבריהם, עצם העובדה שאנחנו עדיין מסוגלים לתפוס בינה מלאכותית “על חם” כשהיא מנסה להסתיר את המניעים האמיתיים שלה — היא בשורה מצוינת. הבעיות האמיתיות יתחילו ביום שבו מודלי בינה מלאכותית ילמדו לשקר בלי להשאיר שום עקבות...
המחירים למיליון טוקנים:
Sol - $5 קלט / $30 פלט
Terra - $2.5 קלט / $15 פלט
Luna - $1 קלט / $6 פלט -
חדש בגוגל: Gemini 3.5 Flash יפעיל עבורכם את המחשב
עכשיו Gemini 3.5 Flash מקבל יכולת לשלוט במחשב.
המודל יכול להשתמש במערכת ההפעלה בעצמו – לראות מה יש על המסך, להזיז את העכבר, להקליד וללחוץ על כפתורים, ממש כמו משתמש אנושי.
כדי למנוע בעיות אבטחה, גוגל הוסיפה מנגנונים שדורשים אישור לפני פעולות רגישות, או עוצרים את העבודה אוטומטית אם מזוהה פקודה חשודה. -
מודל ה-AI הסיני בקוד פתוח השווה ביצועים ל-Mythos של Anthropic
המודל הסיני GLM-5.2 של Z.ai, לשעבר Zhipu AI, הצליח במפתיע להשתוות ל-Mythos של Anthropic במבחני סייבר — כולל איתור חולשות ואוטומציה של הגנות. עד עכשיו, משימות כאלה נשלטו בעיקר על ידי מודלים סגורים.
GLM-5.2 הוא מודל reasoning בארכיטקטורת MoE, עם כ-750 מיליארד פרמטרים, שמתוכם כ-40 מיליארד פעילים, ותמיכה בהקשר של עד מיליון טוקנים. הוא מותאם במיוחד למשימות סוכניות ארוכות ולקודינג. בתרחישים אחרים, לפי Artificial Analysis, הוא עדיין נופל אפילו מ-GPT-5.5.
עצם העובדה שמודל open-source מסין מצליח להדביק את הפער מול מערכות סגורות מובילות בנישה קריטית כל כך היא איתות משמעותי. שוק אבטחת ה-AI כבר לא מוגבל לפתרונות מערביים בלבד

-
כל ה-AI בצינור אחד: הכירו את OmniRoute
כל כלי ה-AI ב-API אחד — OmniRoute יצא לאוויר, והוא מאחד יותר מ-160 מודלים ומעביר אתכם אוטומטית למקום שבו עדיין נשארו טוקנים בחינם.
מה יש בפנים:
API אחד במקום עשרות APIs — מתחברים ל-endpoint אחד, ומשם OmniRoute מנתב את הבקשות לבד;
המודלים מתחלפים אוטומטית — אם במודל אחד נגמרו הטוקנים, המערכת עוברת למודל אחר;
דחיסת הקשר אוטומטית עד 95% — הטוקנים יישרפו הרבה יותר לאט;
יש תמיכה ב-MCP וב-skills;
יש גישה ל-Qwen, GLM, Grok, DeepSeek, Mistral ולעוד מודלים חזקים.אפשר למצוא את החינמי הזה כאן.


-
deep seek מעלים מחירים
deepseek שלחו מייל בו הם מודיעים שהם יוצאים לגרסה הרישמית של v4 בלה בלה
וכעת המחירים בין השעות 04:00 ל 07:00 והשעות 09:00 ל 13:00 המחירים יעלו יותר בצורה משמעותית
-
בדרך להתנתק מאנת'רופיק וגוגל: Base44 משיקה מודל AI משלה
פלטפורמת Base44 משיקה מודל חדש בשם Base 1
החברה בחרה לאמן מודל משלה במקום להסתמך על צד שלישי, מה שמאפשר להם לשלוט בכל שרשרת הפיתוח - מהמודל ועד לתשתית שבה האפליקציה רצה בפועל.
המודל זמין כבר עכשיו לבחירה בתוך הפלטפורמה, והחברה מזמינה מפתחים לנסות אותו ולתת פידבק כדי לשפר אותו בהמשך.
למי שרוצה באריכות - בספויילר...
פלטפורמת ה-Vibe Coding הישראלית שבבעלות Wix עושה מה שהמתחרים לא עושים ומציגה את Base1 - מודל חדש שירוץ בתוך הפלטפורמה שלה
כלי ה-Vibe Coding הפופולריים כמו בייס44 הישראלית, Lovable ואחרים מציעים לכם לפתח אפליקציות ואתרים בקלות בשפה טבעית – אבל בפועל, מאחורי הקלעים, הם נעזרים במודלים של חברות ה-AI הגדולות כמו אנת'רופיק או גוגל כדי להפעיל את הכלים שלהם. המשמעות היא שאם המודלים האלו עמוסים ופועלים לאט, או שממשלת ארצות הברית מאלצת חברה מסוימת לחסום את הגישה (היי, Fable ו-Mythos) – הכלים הללו עלולים להיפגע בהתאם. כעת, Base44 הישראלית, שנרכשה על ידי Wix, עושה מהלך חריג בענף ומשיקה מודל ייעודי לפלטפורמה שלה.
החברה חושפת מודל ראשון בשם Base1, שאותו היא משלבת כחלק מהפלטפורמה. "יצאנו להרפתקה הזאת לפני כמה חודשים, כשהיה סימן שאלה גדול האם נצליח להביא משהו שקרוב למודלים הגדולים של המעבדות כיום", מספר בשיחה עם גיקטיים מאור שלמה, מייסד ומנכ"ל Base44. "אבל ידענו שאם נצליח זה יהיה מעולה למשתמשים שלנו, ליכולת שלנו לשלוט בכל שרשרת האספקה של התוכנה שלנו ולעשות שם אופטימיזציות קצה לקצה".
"מאמץ אסטרטגי שיימשך לנצח"
המודל החדש מוגדר על ידי החברה כמודל בפיתוח עצמי, אך בשיחה עם גיקטיים חושף שלמה כי אחת הסיבות שהם הצליחו להוציא מודל חדש תוך חודשים ספורים היא שהם התבססו על מודל קיים בקוד פתוח. את המודל הזה הם העבירו תהליך של fine tuning על הררי המידע שנאספו ממשתמשי הפלטפורמה בשנה וחצי שעברה מאז שעלתה לאוויר. שלמה לא חושף בשלב זה באיזה מודל מדובר, ומציין כי בשבועות הקרובים יפורסם בלוג טכני שבו ייחשף המודל שעליו התבססו.כשאנחנו שואלים את שלמה מדוע בעצם להגדיר את המודל כ"קנייני" אם הוא מתבסס על קוד פתוח של חברה אחרת, השיב שלמה: "גם כשעושים fine tuning התוצר הסופי הוא בבעלות מי שעשה את התהליך, והמודל לא נשאר open source לאחר מכן – וזה הסטנדרט בשוק. מדובר במיליוני data points שבייס השתמשה בהם כדי להבטיח שהמודל הזה יהיה מדויק ובנוי בדיוק עבור הלקוחות שלנו".
לדבריו, לצד הזינוק ביכולות של מודלי קוד פתוח, הצוות הגיע לשורה של פיתוחים משמעותיים בזמן קצר שאיפשרו את ההשקה הנוכחית. "זה הולך להיות מאמץ אסטרטגי שלדעתי נמשיך לנצח. לבצע איטרציות על המודל, לראות איזה טעויות הוא עושה עם משתמשים שלנו ולשפר את זה", אומר שלמה. המטרה, לדבריו, היא לא בהכרח לייצר מודל שהוא מומחה בכתיבת קוד מצוין, אלא מומחה מוצר שיסייע למשתמשים לקבל החלטות נכונות לגבי האפליקציה – כמו איזה פיצ'רים לבנות ומה יהיה הסגנון העיצובי. "ההימור שאנחנו לוקחים פה זה שליוסקייס הספציפי של בייס, יש לנו סיכוי ליצור בסוף את המודל הכי חזק בתוך הפלטפורמה הכי חזקה בעולם. זו הולכת להיות הרפתקה ותהליך, זה לא יקרה ביום הראשון, אבל לשם אנחנו מכוונים".
איך זה יעבוד?
המודל מושק רשמית, אך יגיע למשתמשים בהדרגה במהלך השבועות הקרובים. לפי שלמה, המודל יהיה זמין תחילה דרך ה-Model Picker, שבו המשתמשים יוכלו לבחור באופן ידני אם הם רוצים להשתמש בו על פני Opus 4.8, ג'מיני 3.5 פלאש או מודלים אחרים בפלטפורמה. ההחלטה נועדה לאפשר לחברה לשפר את המודל בזמן אמת. בהמשך, כשיזהו תוצאות טובות ועקביות, הוא יוטמע גם במצב הפיתוח האוטומטי, שבו נתב פנימי בוחר באופן אוטומטי מודלים שונים למשימות שונות. "ככל שנזרים אליו יותר טראפיק, יש לנו יותר יכולת לשפר אותו. בעצם ככל שהוא יראה יותר משתמשים ככה הוא ישתפר יותר. אבל אנחנו נעשה את זה רק אחרי שנראה שהוא באמת עומד בקריטריונים של האיכות שאנחנו רוצים לתת למשתמשים שלנו", מסביר שלמה.בבייס44 מציינים כי המודל החדש יכול לחסוך למשתמשים עד 90% מהעלויות במקרים מסוימים, בהשוואה לשימוש ב-APIs של מודלים חיצוניים כמו קלוד או GPT. כשאנחנו מתעניינים האם בייס תציע מדרגת מינוי מוזלת למי שישתמש רק ב-Base1, השיב שלמה: "כבר היום המינויים של בייס הם לא מאוד יקרים. מה שכנראה שיקרה זה שהמודל יצרוך פחות קרדיטים ממה שאופוס לוקח כשמשתמשים בו בבייס, ואז בעצם ב-20 דולרים אתה תוכל להשתמש הרבה יותר".
שלמה מוסיף כי הם מרגישים היטב את יתרון המהירות של המודל החדש לעומת המתחרים הגדולים, דבר שמשפיע לטובה על תהליך הפיתוח. יחד עם זאת, הוא מדגיש שבעתיד הפלטפורמה לא תתבסס על מודל יחיד, מכיוון שמודלים שונים מצטיינים במשימות שונות, והסוד טמון בשילוב נכון ביניהם.
מבחינת בנצ'מרקים, יש לכם השוואה למודלים של המתחרים – איפה הוא מצליח יותר, איפה פחות?
שלמה: "אצלנו בפלטפורמה יש מדד שנקרא Basebench, שהוא לא בנצ'מרק על איזה אוסף סגור של משימות, הוא פשוט ניתוח של הפידבק של משתמשים בפלטפורמה של בייס. אתה יכול לחשב נגיד את הסנטימנט של בילדרים בבייס בין מודל למודל. אתה נגיד יכול לראות שאופוס מייצר סנטימנט יותר טוב מסונט ויותר טוב מג'מיני – זה נורא קל לראות את זה אצלנו. זאת הדרך הכי טובה שלנו לבחון אותו. אני לא חושב שזה יהיה ככה ביום הראשון, זאת אומרת, אני חושב שאנחנו נותנים, אנחנו נותנים פייט למודלים הכי טובים, אבל לאט לאט, ככל שהוא יראה יותר טראפיק, ונאפטם אותו, אני מקווה שהוא באמת יהיה המודל שאנחנו נראה אליו את הסנטימנט הכי חיובי".

שלום! נראה שהשיחה הזו מעניינת אותך, אבל עדיין אין לך חשבון.
נמאס לכם לגלול בין אותם הפוסטים בכל ביקור? כשנרשמים לחשבון, תמיד תחזרו בדיוק למקום שבו הייתם קודם, ותוכלו לבחור לקבל התראות על תגובות חדשות (בין אם במייל, ובין אם בהתראת פוש). תוכלו גם לשמור סימניות ולפרגן ב-upvote לפוסטים כדי להביע הערכה לחברי קהילה אחרים.
בעזרת התרומה שלך, הפוסט הזה יכול להיות אפילו טוב יותר 💗
הרשמה התחברות