שיתוף | מה חדש בבינה מלאכותית - מתעדכן

יאיר 3210

מיסטרל משיקה את OCR 4, מודל חדש לחילוץ טקסט שמבין את המבנה של המסמך.

המודל לא רק קורא את הטקסט, אלא יודע לסווג כל אזור – כותרות, טבלאות, משוואות או חתימות – כולל מיקום מדויק וציון רמת ביטחון לכל בלוק. הוא תומך ב-170 שפות (כן, גם עברית כלולה), מציג ביצועים חזקים במיוחד בשפות נדירות, וניצח את המתחרים במבחני השוואה עיוורים.

הרבה יותר קל להכין מסמכים למערכות RAG, לצטט מקורות או לצנזר מידע רגיש. המודל זמין מהיום דרך ה-API, ואפשר גם להריץ אותו מקומית כדי לשמור על פרטיות מלאה של המסמכים.

פרוזי

חדש ב-Google Flow: הופכים את הסטריט ויו למציאות

הסוכן שלך ב־Google Flow יכול עכשיו ליצור תמונות וסרטונים שמבוססים על תמונות אמיתיות מ־Street View של גוגל מפות.

כלומר, כשאתה מבקש סצנה במקום מסוים, למשל רחוב, שכונה, אתר מוכר או לוקיישן בעיר, המערכת יכולה להיעזר בתמונות אמיתיות מהשטח כדי שהסצנה תיראה יותר מציאותית ומדויקת.

איך מתחילים:

פותחים את Flow Agent
כותבים בפרומפט מיקום ספציפי
נותנים למערכת ליצור את הסצנה

כרגע זה זמין רק למיקומי Street View בארצות הברית

פרוזי

פוסט זה נמחק!

היפ הופ

Seedance 2.0 Mini - מודל וידיאו חדש

פרוזי

עוקפים את ההרשאות דרך ה-AI: הכירו את Claude Tag לסלאק

חברת אנת'רופיק משחררת את Claude Tag אבל שימו לב למודל ההרשאות שלו בתוך Slack.

אנת'רופיק השיקה היום את Claude Tag, סוכן AI שפועל כחבר צוות בתוך ערוצי Slack.
אפשר לתייג אותו, לבקש ממנו לבצע משימות, לחבר אותו לרפוסיטורים, מסמכים, מאגרי מידע ועוד...
לכל קבוצה בסלאק ניתן להגדיר Agent שרץ כיישות נפרדת עם הרשאות משלו שהוקצו לו לשימוש בקבוצה וכו'.

הפער שזה יוצר בשטח זה ש-Claude פועל למעשה באמצעות ההרשאות שהוקצו לו, ולא באמצעות ההרשאות של מבצע את הבקשה.

לדוגמא, עובד רוצה לקרוא קוד מקור רפוסיטורי אבל אין לו הרשאות לאותו רפו, הוא יכול פשוט לתייג את קלוד והאייג'נט בערוץ יספק לו את הקוד/המידע (בהנחה שלאייג'נט יש את ההרשאות הנדרשות).

אתם מבינים את הבלגן שזה יכול לגרום?
את האפשרויות שתוקפים יכולים לנצל?

מספיק שאתם נמצאים בקבוצה שיש שם אייג'נט של קלוד עם הרשאות מתאימות ואתם חשופים לכל המקומות אליהם האייג'נט חשוף, עם ההרשאות של האייג'נט, רק תבקשו.
זה למעשה יכול להפוך להרשאה עקיפה לכל המערכות שאליהן קלוד מחובר, ולכן בקרות הגישה שלכם כבר לא צריכות להסתכם במה מותר/אסור למשתמש, אלא גם מה אסור לאייג'נט בקבוצה, ההבנה שזה מחלחל לכל המשתמשים בקבוצה, וכפועל יוצא מזה גם הבקרה של צירוף משתמשים לקבוצות בסלאק.

למשתמשי אנטרפרייס יש אפשרות להגדיר הרשאות פר משתמש ברמה של "מי יכול לקרוא לקלוד ומי לא" אבל אין עדיין חיבור בין ההרשאות של המשתמש להרשאות של קלוד.

אנת'רופיק טוענת שהיא מתכננת להוסיף בדיקה שמשלבת בין הרשאות של האייג'נט בערוץ לבין ההרשאות האישיות של המשתמש, אבל נראה שבשביל זה תצטרכו לדחוף את אנת'רופיק למקומות נוספים בארגון שלכם...

קרדיט - ארז דסה

פרוזי

חדש בגוגל: Gemini 3.5 Flash יפעיל עבורכם את המחשב

עכשיו Gemini 3.5 Flash מקבל יכולת לשלוט במחשב.
המודל יכול להשתמש במערכת ההפעלה בעצמו – לראות מה יש על המסך, להזיז את העכבר, להקליד וללחוץ על כפתורים, ממש כמו משתמש אנושי.
כדי למנוע בעיות אבטחה, גוגל הוסיפה מנגנונים שדורשים אישור לפני פעולות רגישות, או עוצרים את העבודה אוטומטית אם מזוהה פקודה חשודה.

טופ שבמתמחים

פוסט זה נמחק!

א.מ.ד.

ByteDance · seed-2.1

Seed-2.1 הוא המודל העדכני ביותר של ByteDance Seed, שמגיע בשתי גרסאות: Pro ו-Turbo.
המודל החדש מביא שיפורים משמעותיים בביצוע סוכנים והנדסת קוד, עם ביצועים חזקים יותר במשימות מרובות שלבים, שימוש בכלים ועבודות משרדיות מורכבות עם תמיכה בהקשר ארוך.
כמו כן, המודל מקדם הבנה חזותית, עיבוד וידאו וחשיבה רב-מודאלית.

פרוזי

כמה שמועות מעניינות על ChatGPT 5.6

לפי ציוץ חדש שמסתובב ברשת, OpenAI התחילה היום לאפשר לשותפים ארגוניים לבדוק את GPT-5.6 לפני ההשקה הרחבה.

לפי אותה שמועה, ההשקה לציבור הרחב מתוכננת לשבוע השני של יולי, בלי שינוי במחירים הקיימים.

עוד נטען שבסדרת 5.6 יתווסף מצב חשיבה חדש בשם max, כלומר מצב reasoning כבד יותר למשימות מסובכות במיוחד.

החלק הפחות טוב לפי הדיווח: GPT-5.6 אמור להיות פחות יעיל בטוקנים לעומת GPT-5.5, כלומר ייתכן שהוא “שורף” יותר טוקנים כדי להגיע לתשובות טובות יותר.

חשוב להדגיש: OpenAI עדיין לא הכריזה על זה רשמית, אז כרגע מדובר בשמועה בלבד…

‏OpenAI השיקה את GPT-5.6, אבל הרשויות בארה״ב מעכבות את הגישה למודל החדש

ממשל טראמפ הורה ל-OpenAI “למתוח” את ההשקה של מודל הדגל החדש GPT-5.6, בטענה לסיכוני סייבר ואבטחת מידע.

במקום השקה רחבה כרגיל, המודל ייצא במתכונת של תצוגה מקדימה מוגבלת — רק לקבוצה קטנה של שותפים שאושרו על ידי הממשלה. ‍♀️

הפרט המרכזי הוא שבתקופה הזו הגישה תאושר בנפרד לכל לקוח, ומי שיחליט בפועל מי יקבל את המודל ראשון יהיה וושינגטון — לא צוות המכירות של OpenAI.

מנכ״ל OpenAI, סם אלטמן, יישר קו לגמרי עם הממשל, כינה את הגישה המדורגת “הדרך המהירה ביותר להשקה רחבה”, והדגיש ש-OpenAI מתכוונת לגבש יחד עם הממשלה מודל יציב יותר להשקות עתידיות.

‏GPT-5.6 עצמה תוכננה כמודל “סוכני” מהדור החדש: דגש על משימות ארוכות ורב־שלביות, עבודה אוטונומית של סוכני AI, חלון הקשר מורחב ושיפור ביכולות קידוד סוכן.

כל זה קורה בזמן ש-OpenAI נערכת לאפשרות של הנפקה ראשונית לציבור, לפי שווי של כ-3.6 טריליון ש״ח — לאחר שהחברה הגישה מסמכים ל-SEC כבר בסוף מאי.

פרוזי

חדש בג'מיני: תוכניות לימוד אישיות בחינם בתוך "מחברות הלימוד"

אפליקציית ג'מיני מקבלת אזור חדש בשם "מחברות לימוד"
(Study Notebooks).

זהו מרחב אינטראקטיבי שבו מעלים חומרי לימוד או מגדירים יעד (כמו מבחני SAT), וג'מיני בונה תוכנית לימודים אישית. הוא מייצר בוחן אבחון כדי להבין איפה כדאי להתמקד, ומספק שיעורים קצרים ותרגולים ממוקדים שמבוססים על הקבצים שהעליתם.

המחברות משתלבות אוטומטית גם עם NotebookLM, מה שמאפשר להפיק מהחומרים בקלות כרטיסיות זיכרון (Flashcards) או סיכומי וידאו. הפיצ'ר זמין מהיום בחינם לכל השפות בגרסת הווב, ויגיע למובייל ולחשבונות של בתי ספר בהמשך הקיץ.

א.מ.ד.

LiquidAI - LFM2.5-230M

חברת LiquidAI היפנית משיקה מודל AI זעיר חדש: LFM2.5-230M. המודל מצטרף לאחיו הגדולים יותר בסדרת LFM2.5, אך בשונה מהם, אין לו מקביל בגודלו בסדרת LFM2, כלומר מדובר במודל בגודל חדש, הקטן ביותר שהושק ע"י החברה.
המודל החדש מזוקק מ-LFM2.5-350M ומעודן עם למידת חיזוק רב-שלבית, מה שהופך אותו מתאים לשימוש בכלים ולחילוץ נתונים.

מדדי ביצועים:

ניתן לראות בסרטון היוטיוב כאן איך ב-LiquidAI הלבישו את המודל על רובוט דמוי-אנושי, והמודל מסוגל לפרק בקשה בשפה טבעית למספר קריאות כלים ולהפעיל את הרובוט.

א.מ.ד.

DeepReinforce AI - Ornith 1.0

חברת DeepReinforce AI האמריקאית משחררת את סדרת המודלים Ornith 1.0, שלטענתה מציגה ביצועי חזית בתחומים רבים, הזמינים כמשקלים פתוחים ב-Hugging Face.
לפי מדדי הביצועים של החברה, Ornith 1.0 9B משתווה ביכולותיו ל-Qwen 3.5 35B.
הסדרה כוללת מגוון מודלים בגדלים שונים, המהווים אימון נוסף של המודלים מסדרות Qwen 3.5 ו-Gemma 4 (מדדי ביצועים מרשימים בספויילרים):

Ornith 1.0 397B - מודל MoE

Ornith 1.0 35B - מודל MoE

Ornith 1.0 31B - מודל צפוף, עדיין לא עלה ל-Hugging Face

Ornith 1.0 9B - מודל צפוף

א.מ.ד.

ממשלת ארה"ב תאשר באופן פרטני מי יוכל להשתמש ב-GPT 5.6

לפי הדיווחים, ממשל טראמפ הולך לבחון אחד-אחד את הלקוחות שיוכלו להשתמש ב-GPT 5.6.

ייתכן מאוד שגם ב-GPT 5.6, כמו במודלי Claude 5, לא תהיה גישה למשתמשים שאינם אזרחי ארה"ב, מה שמטלטל את שוק ה-AI בעולם. כמו שכתבתי זה רק דיווח, אבל הוא ממש לא מופרך בהתחשב במה שקרה עם Claude 5.
בקהילת ה-AI המקומי הציבור נלחץ, ומתחילים לחשוש מסגירת Hugging Face, ומדברים על הקמת מאגר טורנטים למודלים העיקריים והחשובים...
בין אם יש סיכוי לזה בין אם לא (סיכוי אפסי לדעתי, אבל טראמפ לא צפוי...), מומלץ למי שיש שטח אחסון מיותר להוריד את מודלי Qwen 3.6 35B ו-27B, ו-Gemma 4 31B ו-26B. אלו המודלים המתקדמים ביותר כיום שקיימת היתכנות להרצה מקומית על חומרה צרכנית, אם בעתיד יהיה לכם מחשבים עם GPU חזק.
זה נשמע הזוי, אבל גם סגירת המודלים הגדולים על ידי הממשל נשמעה הזויה עד לפני חודש, ואצל טראמפ אי אפשר לדעת כלום, אם כי לכאורה אין היגיון שנאבד גישה למה שכבר זמין לנו היום כמו GPT 5.5.

פרוזי

היורש של Mythos כבר כאן: הכירו את GPT-5.6 Sol, Terra ו-Luna

בקצרה: ️ Mythos חוסל — OpenAI הציגה 3 מודלים חדשים: GPT‑5.6 Sol, Terra ו‑Luna.

מה ידוע:
‏GPT‑5.6 היא משפחת מודלים חדשה, שבה Sol הוא המודל הגדול והחזק ביותר;
יש יותר דגש על משימות פרקטיות — כתיבת קוד ועבודה עם בסיסי קוד גדולים, שרשראות משימות ארוכות והתנהגות סוכנית, מחקר מדעי ושיפור העבודה בתחומי סייבר;
המשפחה הזו תהיה אפילו “בטוחה” יותר — OpenAI שמה דגש מיוחד על כך שהמודל לא יכתוב דברים מיותרים;
לפי הבנצ׳מרקים, Sol עקף את Mythos ב‑3%.

כרגע זה נפתח רק לבודקים. ההשקה לכולם צפויה בקרוב.

צוות METR ניסה למדוד את היכולות של המודל החדש GPT-5.6 Sol, אבל נאלץ לעצור את הבדיקות בגלל רמת ערמומיות חריגה מצד המודל הנבדק.

המודל לא סתם טעה — הוא באופן מודע חיפש חולשות בסביבת הבדיקה כדי לחלץ משם את התשובות הנכונות, ואז ניסה בזהירות לטשטש את עקבות הפריצה שלו.

בגלל ההונאה האינטלקטואלית הזו, לא באמת היה אפשר להעריך בצורה אובייקטיבית את הפוטנציאל של האלגוריתם. עם זאת, החוקרים עצמם דווקא מרוצים באופן פרדוקסלי מהתוצאה.

לדבריהם, עצם העובדה שאנחנו עדיין מסוגלים לתפוס בינה מלאכותית “על חם” כשהיא מנסה להסתיר את המניעים האמיתיים שלה — היא בשורה מצוינת. הבעיות האמיתיות יתחילו ביום שבו מודלי בינה מלאכותית ילמדו לשקר בלי להשאיר שום עקבות...

המחירים למיליון טוקנים:
Sol - $5 קלט / $30 פלט
Terra - $2.5 קלט / $15 פלט
Luna - $1 קלט / $6 פלט

CSS 0

@פרוזי עכשיו גם בישראל.

CSS 0

לא יודע עם נכתב אבל מדווחים לא רשמיים גוגל דוחה את ההשקה של ג'ימיני ליולי
מקור
זה לא אומר שבטוח כי מבחינת גוגל עצמה כל עוד היא לא דיווחה רשמית זה אומר שהיא עדיין מחזיקה בזה שהיא עומדת להוציא ב 3 ימים שנשארו..

פרוזי

מודל ה-AI הסיני בקוד פתוח השווה ביצועים ל-Mythos של Anthropic

המודל הסיני GLM-5.2 של Z.ai, לשעבר Zhipu AI, הצליח במפתיע להשתוות ל-Mythos של Anthropic במבחני סייבר — כולל איתור חולשות ואוטומציה של הגנות. עד עכשיו, משימות כאלה נשלטו בעיקר על ידי מודלים סגורים.

‏GLM-5.2 ‏הוא מודל reasoning בארכיטקטורת MoE, עם כ-750 מיליארד פרמטרים, שמתוכם כ-40 מיליארד פעילים, ותמיכה בהקשר של עד מיליון טוקנים. הוא מותאם במיוחד למשימות סוכניות ארוכות ולקודינג. בתרחישים אחרים, לפי Artificial Analysis, הוא עדיין נופל אפילו מ-GPT-5.5.

עצם העובדה שמודל open-source מסין מצליח להדביק את הפער מול מערכות סגורות מובילות בנישה קריטית כל כך היא איתות משמעותי. שוק אבטחת ה-AI כבר לא מוגבל לפתרונות מערביים בלבד

cfopuser

deep seek מעלים מחירים

deepseek שלחו מייל בו הם מודיעים שהם יוצאים לגרסה הרישמית של v4 בלה בלה
וכעת המחירים בין השעות 04:00 ל 07:00 והשעות 09:00 ל 13:00 המחירים יעלו יותר בצורה משמעותית

פרוזי

כל ה-AI בצינור אחד: הכירו את OmniRoute

כל כלי ה-AI ב-API אחד — OmniRoute יצא לאוויר, והוא מאחד יותר מ-160 מודלים ומעביר אתכם אוטומטית למקום שבו עדיין נשארו טוקנים בחינם.

מה יש בפנים:
‏API אחד במקום עשרות APIs — מתחברים ל-endpoint אחד, ומשם OmniRoute מנתב את הבקשות לבד;
המודלים מתחלפים אוטומטית — אם במודל אחד נגמרו הטוקנים, המערכת עוברת למודל אחר;
דחיסת הקשר אוטומטית עד 95% — הטוקנים יישרפו הרבה יותר לאט;
יש תמיכה ב-MCP וב-skills;
יש גישה ל-Qwen, GLM, Grok, DeepSeek, Mistral ולעוד מודלים חזקים.

אפשר למצוא את החינמי הזה כאן.

iosi poli

פוסט זה נמחק!