שיתוף | מה חדש בבינה מלאכותית - מתעדכן
-
קלוד מצהירים שהם עלולים לבקש מידע אישי (צילו״מ של מייל שקיבלתי):

להרחבה:
https://www.geektime.co.il/url-anthropic-claude-biometric-id-verification/מיסטרל משיקה את OCR 4, מודל חדש לחילוץ טקסט שמבין את המבנה של המסמך.
המודל לא רק קורא את הטקסט, אלא יודע לסווג כל אזור – כותרות, טבלאות, משוואות או חתימות – כולל מיקום מדויק וציון רמת ביטחון לכל בלוק. הוא תומך ב-170 שפות (כן, גם עברית כלולה), מציג ביצועים חזקים במיוחד בשפות נדירות, וניצח את המתחרים במבחני השוואה עיוורים.
הרבה יותר קל להכין מסמכים למערכות RAG, לצטט מקורות או לצנזר מידע רגיש. המודל זמין מהיום דרך ה-API, ואפשר גם להריץ אותו מקומית כדי לשמור על פרטיות מלאה של המסמכים.
-
חדש ב-Google Flow: הופכים את הסטריט ויו למציאות
הסוכן שלך ב־Google Flow יכול עכשיו ליצור תמונות וסרטונים שמבוססים על תמונות אמיתיות מ־Street View של גוגל מפות.
כלומר, כשאתה מבקש סצנה במקום מסוים, למשל רחוב, שכונה, אתר מוכר או לוקיישן בעיר, המערכת יכולה להיעזר בתמונות אמיתיות מהשטח כדי שהסצנה תיראה יותר מציאותית ומדויקת.
איך מתחילים:
פותחים את Flow Agent
כותבים בפרומפט מיקום ספציפי
נותנים למערכת ליצור את הסצנה
כרגע זה זמין רק למיקומי Street View בארצות הברית
-
עוקפים את ההרשאות דרך ה-AI: הכירו את Claude Tag לסלאק
חברת אנת'רופיק משחררת את Claude Tag אבל שימו לב למודל ההרשאות שלו בתוך Slack.
אנת'רופיק השיקה היום את Claude Tag, סוכן AI שפועל כחבר צוות בתוך ערוצי Slack.
אפשר לתייג אותו, לבקש ממנו לבצע משימות, לחבר אותו לרפוסיטורים, מסמכים, מאגרי מידע ועוד...
לכל קבוצה בסלאק ניתן להגדיר Agent שרץ כיישות נפרדת עם הרשאות משלו שהוקצו לו לשימוש בקבוצה וכו'.הפער שזה יוצר בשטח זה ש-Claude פועל למעשה באמצעות ההרשאות שהוקצו לו, ולא באמצעות ההרשאות של מבצע את הבקשה.
לדוגמא, עובד רוצה לקרוא קוד מקור רפוסיטורי אבל אין לו הרשאות לאותו רפו, הוא יכול פשוט לתייג את קלוד והאייג'נט בערוץ יספק לו את הקוד/המידע (בהנחה שלאייג'נט יש את ההרשאות הנדרשות).
אתם מבינים את הבלגן שזה יכול לגרום?
את האפשרויות שתוקפים יכולים לנצל?מספיק שאתם נמצאים בקבוצה שיש שם אייג'נט של קלוד עם הרשאות מתאימות ואתם חשופים לכל המקומות אליהם האייג'נט חשוף, עם ההרשאות של האייג'נט, רק תבקשו.
זה למעשה יכול להפוך להרשאה עקיפה לכל המערכות שאליהן קלוד מחובר, ולכן בקרות הגישה שלכם כבר לא צריכות להסתכם במה מותר/אסור למשתמש, אלא גם מה אסור לאייג'נט בקבוצה, ההבנה שזה מחלחל לכל המשתמשים בקבוצה, וכפועל יוצא מזה גם הבקרה של צירוף משתמשים לקבוצות בסלאק.למשתמשי אנטרפרייס יש אפשרות להגדיר הרשאות פר משתמש ברמה של "מי יכול לקרוא לקלוד ומי לא" אבל אין עדיין חיבור בין ההרשאות של המשתמש להרשאות של קלוד.
אנת'רופיק טוענת שהיא מתכננת להוסיף בדיקה שמשלבת בין הרשאות של האייג'נט בערוץ לבין ההרשאות האישיות של המשתמש, אבל נראה שבשביל זה תצטרכו לדחוף את אנת'רופיק למקומות נוספים בארגון שלכם...
קרדיט - ארז דסה
-
חדש בגוגל: Gemini 3.5 Flash יפעיל עבורכם את המחשב
עכשיו Gemini 3.5 Flash מקבל יכולת לשלוט במחשב.
המודל יכול להשתמש במערכת ההפעלה בעצמו – לראות מה יש על המסך, להזיז את העכבר, להקליד וללחוץ על כפתורים, ממש כמו משתמש אנושי.
כדי למנוע בעיות אבטחה, גוגל הוסיפה מנגנונים שדורשים אישור לפני פעולות רגישות, או עוצרים את העבודה אוטומטית אם מזוהה פקודה חשודה. -
מאחר ובכל פעם שיוצא מודל או כלי AI חדש, או עדכון כלשהו למודל קיים מייד תוך כמה שעות מישהו ידאג להעלות נושא חדש עם ציטוט ארוך מאתר טכנולוגיה מזדמן המבשר באריכות על השקת המודל ויכולותיו, חשבתי פשוט ליצור נושא מתעדכן שבו יוכלו המשתמשים להעלות פוסטים קצרים ומתומצתים אודות המודלים החדשים והעדכונים, כך שכל המידע יהיה מרוכז במקום אחד, בקצרה ללא צורך לצטט כתבות שלמות כדי להצדיק פתיחת נושא חדש, ובכך למנוע הספמה של הפורום, כשלעיתים נפתחים במקביל 3 ויותר נושאים המבשרים על השקת מודל חדש...
נא לא להגיב על פוסטים אלא להעלות אך ורק עדכוני AI על מודלים וכלים חדשים וכדומה, בניסוח אנושי ומתומצת בלבד, בלי לפתוח דיונים.
מומלץ להגדיר את הנושא "במעקב" כדי להתעדכן מייד על כל פוסט שעולה.אם אין דעת מנהלי הפורום נוחה מכך, הודיעוני ואמחק את הנושא.
פוסט זה נמחק! -
ByteDance · seed-2.1
Seed-2.1 הוא המודל העדכני ביותר של ByteDance Seed, שמגיע בשתי גרסאות: Pro ו-Turbo.
המודל החדש מביא שיפורים משמעותיים בביצוע סוכנים והנדסת קוד, עם ביצועים חזקים יותר במשימות מרובות שלבים, שימוש בכלים ועבודות משרדיות מורכבות עם תמיכה בהקשר ארוך.
כמו כן, המודל מקדם הבנה חזותית, עיבוד וידאו וחשיבה רב-מודאלית. -
כמה שמועות מעניינות על ChatGPT 5.6
לפי ציוץ חדש שמסתובב ברשת, OpenAI התחילה היום לאפשר לשותפים ארגוניים לבדוק את GPT-5.6 לפני ההשקה הרחבה.
לפי אותה שמועה, ההשקה לציבור הרחב מתוכננת לשבוע השני של יולי, בלי שינוי במחירים הקיימים.
עוד נטען שבסדרת 5.6 יתווסף מצב חשיבה חדש בשם max, כלומר מצב reasoning כבד יותר למשימות מסובכות במיוחד.
החלק הפחות טוב לפי הדיווח: GPT-5.6 אמור להיות פחות יעיל בטוקנים לעומת GPT-5.5, כלומר ייתכן שהוא “שורף” יותר טוקנים כדי להגיע לתשובות טובות יותר.
חשוב להדגיש: OpenAI עדיין לא הכריזה על זה רשמית, אז כרגע מדובר בשמועה בלבד…

OpenAI השיקה את GPT-5.6, אבל הרשויות בארה״ב מעכבות את הגישה למודל החדשממשל טראמפ הורה ל-OpenAI “למתוח” את ההשקה של מודל הדגל החדש GPT-5.6, בטענה לסיכוני סייבר ואבטחת מידע.
במקום השקה רחבה כרגיל, המודל ייצא במתכונת של תצוגה מקדימה מוגבלת — רק לקבוצה קטנה של שותפים שאושרו על ידי הממשלה.

♀️הפרט המרכזי הוא שבתקופה הזו הגישה תאושר בנפרד לכל לקוח, ומי שיחליט בפועל מי יקבל את המודל ראשון יהיה וושינגטון — לא צוות המכירות של OpenAI.

מנכ״ל OpenAI, סם אלטמן, יישר קו לגמרי עם הממשל, כינה את הגישה המדורגת “הדרך המהירה ביותר להשקה רחבה”, והדגיש ש-OpenAI מתכוונת לגבש יחד עם הממשלה מודל יציב יותר להשקות עתידיות.
GPT-5.6 עצמה תוכננה כמודל “סוכני” מהדור החדש: דגש על משימות ארוכות ורב־שלביות, עבודה אוטונומית של סוכני AI, חלון הקשר מורחב ושיפור ביכולות קידוד סוכן.כל זה קורה בזמן ש-OpenAI נערכת לאפשרות של הנפקה ראשונית לציבור, לפי שווי של כ-3.6 טריליון ש״ח — לאחר שהחברה הגישה מסמכים ל-SEC כבר בסוף מאי.

-
חדש בג'מיני: תוכניות לימוד אישיות בחינם בתוך "מחברות הלימוד"
אפליקציית ג'מיני מקבלת אזור חדש בשם "מחברות לימוד"
(Study Notebooks).זהו מרחב אינטראקטיבי שבו מעלים חומרי לימוד או מגדירים יעד (כמו מבחני SAT), וג'מיני בונה תוכנית לימודים אישית. הוא מייצר בוחן אבחון כדי להבין איפה כדאי להתמקד, ומספק שיעורים קצרים ותרגולים ממוקדים שמבוססים על הקבצים שהעליתם.
המחברות משתלבות אוטומטית גם עם NotebookLM, מה שמאפשר להפיק מהחומרים בקלות כרטיסיות זיכרון (Flashcards) או סיכומי וידאו. הפיצ'ר זמין מהיום בחינם לכל השפות בגרסת הווב, ויגיע למובייל ולחשבונות של בתי ספר בהמשך הקיץ.
-
LiquidAI - LFM2.5-230M
חברת LiquidAI היפנית משיקה מודל AI זעיר חדש: LFM2.5-230M. המודל מצטרף לאחיו הגדולים יותר בסדרת LFM2.5, אך בשונה מהם, אין לו מקביל בגודלו בסדרת LFM2, כלומר מדובר במודל בגודל חדש, הקטן ביותר שהושק ע"י החברה.
המודל החדש מזוקק מ-LFM2.5-350M ומעודן עם למידת חיזוק רב-שלבית, מה שהופך אותו מתאים לשימוש בכלים ולחילוץ נתונים.מדדי ביצועים:

ניתן לראות בסרטון היוטיוב כאן איך ב-LiquidAI הלבישו את המודל על רובוט דמוי-אנושי, והמודל מסוגל לפרק בקשה בשפה טבעית למספר קריאות כלים ולהפעיל את הרובוט.
-
DeepReinforce AI - Ornith 1.0
חברת DeepReinforce AI האמריקאית משחררת את סדרת המודלים Ornith 1.0, שלטענתה מציגה ביצועי חזית בתחומים רבים, הזמינים כמשקלים פתוחים ב-Hugging Face.
לפי מדדי הביצועים של החברה, Ornith 1.0 9B משתווה ביכולותיו ל-Qwen 3.5 35B.
הסדרה כוללת מגוון מודלים בגדלים שונים, המהווים אימון נוסף של המודלים מסדרות Qwen 3.5 ו-Gemma 4 (מדדי ביצועים מרשימים בספויילרים):- Ornith 1.0 397B - מודל MoE

- Ornith 1.0 35B - מודל MoE

- Ornith 1.0 31B - מודל צפוף, עדיין לא עלה ל-Hugging Face
- Ornith 1.0 9B - מודל צפוף

-
ממשלת ארה"ב תאשר באופן פרטני מי יוכל להשתמש ב-GPT 5.6
לפי הדיווחים, ממשל טראמפ הולך לבחון אחד-אחד את הלקוחות שיוכלו להשתמש ב-GPT 5.6.

ייתכן מאוד שגם ב-GPT 5.6, כמו במודלי Claude 5, לא תהיה גישה למשתמשים שאינם אזרחי ארה"ב, מה שמטלטל את שוק ה-AI בעולם. כמו שכתבתי זה רק דיווח, אבל הוא ממש לא מופרך בהתחשב במה שקרה עם Claude 5.
בקהילת ה-AI המקומי הציבור נלחץ, ומתחילים לחשוש מסגירת Hugging Face, ומדברים על הקמת מאגר טורנטים למודלים העיקריים והחשובים...
בין אם יש סיכוי לזה בין אם לא (סיכוי אפסי לדעתי, אבל טראמפ לא צפוי...), מומלץ למי שיש שטח אחסון מיותר להוריד את מודלי Qwen 3.6 35B ו-27B, ו-Gemma 4 31B ו-26B. אלו המודלים המתקדמים ביותר כיום שקיימת היתכנות להרצה מקומית על חומרה צרכנית, אם בעתיד יהיה לכם מחשבים עם GPU חזק.
זה נשמע הזוי, אבל גם סגירת המודלים הגדולים על ידי הממשל נשמעה הזויה עד לפני חודש, ואצל טראמפ אי אפשר לדעת כלום, אם כי לכאורה אין היגיון שנאבד גישה למה שכבר זמין לנו היום כמו GPT 5.5. -
היורש של Mythos כבר כאן: הכירו את GPT-5.6 Sol, Terra ו-Luna
בקצרה:
️ Mythos חוסל — OpenAI הציגה 3 מודלים חדשים: GPT‑5.6 Sol, Terra ו‑Luna.מה ידוע:
GPT‑5.6 היא משפחת מודלים חדשה, שבה Sol הוא המודל הגדול והחזק ביותר;
יש יותר דגש על משימות פרקטיות — כתיבת קוד ועבודה עם בסיסי קוד גדולים, שרשראות משימות ארוכות והתנהגות סוכנית, מחקר מדעי ושיפור העבודה בתחומי סייבר;
המשפחה הזו תהיה אפילו “בטוחה” יותר — OpenAI שמה דגש מיוחד על כך שהמודל לא יכתוב דברים מיותרים;
לפי הבנצ׳מרקים, Sol עקף את Mythos ב‑3%.כרגע זה נפתח רק לבודקים. ההשקה לכולם צפויה בקרוב.


צוות METR ניסה למדוד את היכולות של המודל החדש GPT-5.6 Sol, אבל נאלץ לעצור את הבדיקות בגלל רמת ערמומיות חריגה מצד המודל הנבדק.המודל לא סתם טעה — הוא באופן מודע חיפש חולשות בסביבת הבדיקה כדי לחלץ משם את התשובות הנכונות, ואז ניסה בזהירות לטשטש את עקבות הפריצה שלו.
בגלל ההונאה האינטלקטואלית הזו, לא באמת היה אפשר להעריך בצורה אובייקטיבית את הפוטנציאל של האלגוריתם. עם זאת, החוקרים עצמם דווקא מרוצים באופן פרדוקסלי מהתוצאה.לדבריהם, עצם העובדה שאנחנו עדיין מסוגלים לתפוס בינה מלאכותית “על חם” כשהיא מנסה להסתיר את המניעים האמיתיים שלה — היא בשורה מצוינת. הבעיות האמיתיות יתחילו ביום שבו מודלי בינה מלאכותית ילמדו לשקר בלי להשאיר שום עקבות...
המחירים למיליון טוקנים:
Sol - $5 קלט / $30 פלט
Terra - $2.5 קלט / $15 פלט
Luna - $1 קלט / $6 פלט -
חדש בגוגל: Gemini 3.5 Flash יפעיל עבורכם את המחשב
עכשיו Gemini 3.5 Flash מקבל יכולת לשלוט במחשב.
המודל יכול להשתמש במערכת ההפעלה בעצמו – לראות מה יש על המסך, להזיז את העכבר, להקליד וללחוץ על כפתורים, ממש כמו משתמש אנושי.
כדי למנוע בעיות אבטחה, גוגל הוסיפה מנגנונים שדורשים אישור לפני פעולות רגישות, או עוצרים את העבודה אוטומטית אם מזוהה פקודה חשודה.
שלום! נראה שהשיחה הזו מעניינת אותך, אבל עדיין אין לך חשבון.
נמאס לכם לגלול בין אותם הפוסטים בכל ביקור? כשנרשמים לחשבון, תמיד תחזרו בדיוק למקום שבו הייתם קודם, ותוכלו לבחור לקבל התראות על תגובות חדשות (בין אם במייל, ובין אם בהתראת פוש). תוכלו גם לשמור סימניות ולפרגן ב-upvote לפוסטים כדי להביע הערכה לחברי קהילה אחרים.
בעזרת התרומה שלך, הפוסט הזה יכול להיות אפילו טוב יותר 💗
הרשמה התחברות
