שיתוף | מה חדש בבינה מלאכותית - מתעדכן
-
המודל שנוסף לפני כחודש לג'ימיני היוצר מוזיקה, שעד עכשיו היה מוגבל ל30 שניות...
מעכשיו אפשר ליצור טראקים מלאים באורך של עד שלוש דקות, עם הרבה יותר שליטה על הכיוון היצירתי של השיר.
(שם המודל החדש - Lyria 3 Pro)המודל נפתח עכשיו למנויים בתשלום באפליקציה של ג'מיני, ולמפתחים דרך ה-API ב-Google AI Studio.
אבל הבשורה האמיתית היא שזה נפתח גלובלית לכולם, גם למשתמשים חינמיים, דרך Producer AI - פלטפורמה ליצירת מוזיקה בבינה מלאכותית שהצטרפה לאחרונה למעבדות של גוגל (Google Labs).הבאסה... שזה חסום בנטפרי..
-
קאפקאט משנה לגמרי את היוצר ווידיאו - Seedance 2.0
במקום טיימליין הקלאסי שהיה עד היום,
יש קנבס חכם שבו הכל קורה ברצף אחד. אתה מתחיל מרעיון, ה-AI עוזר לבנות תסריט, ואז יוצר ויזואל ווידאו אוטומטית. עם Seedance 2.0
אפשר לשלוט בתנועה, זוויות מצלמה וסגנון, כך שכל התהליך קורה במקום אחד, בצורה מהירה, וזורמת יותר, בלי מעבר בין כלים. ובלי צורך אח"כ בעריכת סרטונים.. (פשוט מטורף!)ההודעה המלאה שפרסמו
קאפקאט הרגע החליטו להרוג את טיימליין העריכה המסורתי שאנחנו מכירים.
אחרי שדיברנו קודם על מודל הווידאו החדש שלהם (Seedance 2.0), בייטדאנס משיקים עכשיו את CapCut Video Studio בגרסת הוואב. במקום ציר הזמן הרגיל והמוכר, הם עברו לסביבת עבודה מבוססת קנבס אינסופי שנועדה לקחת אתכם מרעיון בסיסי ועד לסרטון גמור במקום אחד.
הרעיון הוא להפסיק לקפוץ בין כלי AI שונים, ולעשות את כל תהליך ההפקה על מסך אחד:
● סוכן בינה מלאכותית מובנה: עוזר לכם לזרוק רעיונות, לכתוב את התסריט ולבנות את המבנה של הסיפור.
● סטוריבורד: כלי שלוקח את העלילה שלכם ובונה לה סקיצות ויזואליות כדי שתבינו איך זה הולך להיראות.
● ג'ינרוט ישיר: יצירת התמונות וקטעי הווידאו עצמם באמצעות המודלים המתקדמים שלהם (כולל שליטה מדויקת עם רפרנסים).
● עריכה סופית: ארגז כלים מלא לליטוש של כל פריים לפני הייצוא.
הם מחלקים עכשיו קרדיטים בחינם למי שנכנס להתנסות, אבל יש קאץ' קטן ששווה לשים אליו לב: המודל החדש (Seedance 2.0) שוחרר כרגע רק באזורים ספציפיים כמו המזרח התיכון, אפריקה ואמריקה הלטינית. אם זה לא מופיע לכם, כנראה שתצטרכו לחכות קצת לגל השחרור הבא.
-
מוצלח לפסיכולוגים
|מטא חשפה הרגע את TRIBE v2 - מודל בינה מלאכותית שיודע לחזות בדיוק איך המוח שלנו יגיב לכל מה שאנחנו רואים או שומעים.
הם אימנו אותו על מאות שעות של סריקות מוח (fMRI), והוא מצליח לחזות פעילות עצבית של אנשים שהוא מעולם לא סרק, ברמת דיוק כפולה ומשולשת מכל מה שהכרנו.
מטא משחררת הכל בקוד פתוח (כולל המודל והמחקר) כדי לעזור לחוקרים לקדם אבחון מחלות נוירולוגיות, ועל הדרך ללמוד איך לבנות מודלי AI חכמים יותר שמבוססים על המוח האנושי -
פוסט זה נמחק!
-
פוסט זה נמחק!
@אברהם-גלסר @היפ-הופ כבר כתב את זה פה
-
קוהיר (Cohere) משחררת את Transcribe - מודל Speech-to-Text חדש בקוד פתוח.
זה המודל הראשון שלהם בתחום, והמטרה העיקרית היא לחבר אותו ל-North, פלטפורמת סוכני ה-AI שלהם, כדי לתת להם יכולות הבנה קולית.לא תומך בעברית

המספרים שלו מרשימים במיוחד:
● המודל כבש את פסגת טבלת המודלים הפתוחים ב-HuggingFace בדיוק בשפה האנגלית (עם אחוז שגיאה של 5.42% בלבד).
● הוא יודע להפוך דקות ארוכות של שמע לטקסט תוך שניות בודדות, מה שממש עוזר למוצרים ואוטומציות שעובדים בזמן אמת. (ומתחרה עם האתר של @ת-ת-ירוחם )
video_3055_1.mp4
video_3055_1.rar -
חברת Runway משיקה את Multi-Shot App שלוקח פרומפט פשוט והופך אותו לסצנה ערוכה ומוכנה במכה אחת.
במקום לג'נרט שוטים בנפרד ולשבור את הראש בעריכה, המערכת הזו פשוט עושה הכל יחד:
היא מייצרת וידאו שכולל דיאלוגים, אפקטים קוליים, חיתוכי מצלמה חכמים וזוויות סינמטיות. אפשר להתחיל מתמונת רפרנס או רק מטקסט. הכלי זמין באפליקציית הרשת. (זה ממש מטורף, חבל שאני לא יכול לעלות כאן לפורום את הסרטון של ההדרכה שהם פרסמו..)
-
קריאה (Krea) שחררה פיצ'ר חדש לעורך התמונות שלה בשם Annotations (הערות).
במקום לערוך תמונה שלב אחרי שלב, מעכשיו אפשר להשתמש בכמה פרומפטים שונים במקביל על אותה התמונה. פשוט מסמנים אזורים שונים, נותנים לכל אזור פקודה אחרת, והמודל עורך את הכל בבת אחת.
video_3057_1.mp4
video_3057_1.rar -
Google · Gemini 3.1 Flash Live
גוגל משחררים את Gemini 3.1 Flash Live - מודל לייב חדש שתוכנן במיוחד עבור סוכני קול וראיה ממוחשבת במהירות שיא.
- קיצוץ דרמטי בזמן ההשהיה.
- קפיצת מדרגה באיכות ואמינות.
- שוחרר אחרי השקעה של יותר משנה בשיפור המודל.
תודה ל-@היפ-הופ על הדיווח.
-
פוסט זה נמחק!
-
אנתרופיק · תיקון אוטומטי לקלוד
אנתרופיק משיקים פיצ’ר חדש: תיקון אוטומטי לקלוד - שמטפל אוטומטית בבקשות מיזוג (שילוב קוד).
מעקב אוטומטי אחרי בקשות מיזוג מהמחשב ומהנייד.
תיקון שגיאות בבדיקות באופן שוטף.
טיפול בהערות קוד ושמירה על בקשה תקינה.פותחים בקשה, יוצאים להפסקה — וחוזרים לקוד שמוכן לעלייה לשרת \ סקריפט.
video_3059_1.mp4 -
פשוט מטורף!!!
פיקה (Pika) הכריזה הרגע על בטא פתוחה ל-Pika AI Selves – הדרך שלכם לשכפל את עצמכם.
מעכשיו, כל אחד יכול ליצור לעצמו "תאום דיגיטלי" אוטונומי (Agentic extension). ה-AI Self שלכם לומד את הקול, הפנים וצורת החשיבה שלכם, ויכול לייצג אתכם באופן עצמאי ברשת – לענות להודעות, לנהל שיחות ולייצר תוכן גם כשאתם בכלל ישנים.
השירות זמין כבר עכשיו באתר (Pika.me) ובאפליקציית ה-iOS החדשה. -
הודעה חשובה - נפתח אשכול יעודי לעדכונים פחות משמעותיים ו(למי שממש חייב) לדיונים.
@א.מ.ד. אולי כדאי שתעדכן בפוסט הראשי. את ההודעה הזו אמחק בל"נ עוד מעט -
ח חובבן מקצועי התייחס לנושא זה
-
סונו (Suno) משחררת את גרסה 5.5 והופכת את היוצר המוזיקה לאישי יותר, עם 3 פיצ'רים חדשים:
1️⃣ אפשר סוף סוף להקליט את הקול שלכם ולתת למערכת לשיר איתו במקום להשתמש בקולות מובנים.
2️⃣ אימון מודל פרטי על סמך השירים הקודמים שלכם כדי לשמור על הסאונד הייחודי שלכם.
3️⃣ אלגוריתם שלומד את ההעדפות, הז'אנרים ומצבי הרוח שלכם לאורך זמן. -
גוגל משחררת פיצ'ר חדש - יבוא שיחות
גוגל שחררת עדכון חשוב.
אם עד היום לפתוח צ'אט חדש היה סיוט - כיום אפשר פשוט להעביר את השיחות מgpt ומקלאוד ישירות לתוך ג'מיני.
הכלי מופיע כדף מיוחד בגוגל, השיחות יופיעו בהיסטוריית השיחות עם סימון ייחודי.
פיצ'ר תומך בהעלאה של עד 5 ג'יגה בייט.
מוזמנים להתנסות - https://gemini.google.com/import -
סיכום שבועי
הכל בספויילר
השבוע - אופן איי סוגרת את סורה, קלוד מקבל את המפתחות למחשב שלנו, ואילון מאסק מתכנן שרתים בחלל.
חברת אופן איי (OpenAI)
חברה סגרה לחלוטין את מחולל הווידאו שלה עקב עלויות שרתים מטורפות וביטול עסקת ענק עם דיסני, כדי להתמקד בקוד ובעסקים.
דיווחים שהחברה תשיק סופר-אפליקציה למחשב (שתאחד צ'אט, קודקס ודפדפן), ומתכננת להכפיל את מצבת עובדיה ל-8,000 איש.
חברת אנתרופיק (Anthropic)
קלוד שולט כעת פיזית בעכבר ובמקלדת במחשבי מאק. נוסף מצב אוטומטי (Auto-mode) המאשר פקודות טרמינל בטוחות עצמאית, והסוכן מתקן שגיאות ב-PRs ברקע.
ניתן לשלוט בסשנים מקומיים דרך טלגרם/דיסקורד, להגדיר משימות מתוזמנות שירוצו בענן, ולבחור אלמנט מהמסך כדי שהמודל ישאב את קוד העיצוב סביבו.
כלי העבודה הגיעו לאפליקציית המובייל. פיצ'ר הפרויקטים ב-Cowork מרכז כעת קבצים והנחיות מקומית על המחשב.
חברת גוגל (Google)
הושק המודל Gemini 3.1 Flash Live, המיועד לסוכני קול וראייה בהשהייה כמעט אפסית.
מודל המוזיקה Lyria 3 Pro נפתח חינם לכולם דרך Producer AI. פרויקט Vibe Coding XR מאפשר לבנות אפליקציות מציאות רבודה מטקסט תוך דקה.
הושקו כלים לייבוא מהיר של היסטוריית השיחות והזיכרון מ-ChatGPT/קלוד לג'מיני. בנוסף, שוחרר סקיל רשמי שמלמד סוכני קוד להשתמש נכון ב-API של ג'מיני.
אפליקציית טרנסלייט מתרגמת כעת שיחות בזמן אמת דרך אוזניות.
חברת מיקרוסופט (Microsoft)
התיקון של ווינדוס 11: מיקרוסופט מפחיתה את ההתערבות האגרסיבית של קופיילוט ומרגיעה את קצב העדכונים
יצירה ועריכה: וידאו, סאונד ועיצוב
בייטדאנס השיקה סביבת עבודה אינסופית (Video Studio) העוקפת את הטיימליין המסורתי, והשיקה דרכה את מודל הווידאו Seedance 2.0 ואת מחולל התמונות Seedream 5.0 Lite.
חברת ElevenLabs פתחה חנות למכירת שירים שנוצרו ב-AI.
סונו 5.5 מאפשר כעת לאמן מודל שישיר בקול האישי שלכם.
חברת Runway השיקה את Multi-Shot App שהופך פרומפט לסצנה ערוכה במכה.
ו-Luma השיקה מודל (Uni-1) שחושב ומייצר פיקסלים בו-זמנית.
עורך Krea הוסיף כלי לעריכת אזורים שונים בתמונה במקביל.
פיקה הכריזה על בטא פתוחה ל-Pika AI Selves.
חברת Figma פתחה את הקנבס שלה לסוכני AI.
עוד...
הנשיא טראמפ מינה את מארק צוקרברג, ג'נסן הואנג וסרגיי ברין למועצה המייעצת למדע וטכנולוגיה.
מאסק מקים את TERAFAB (מפעל שבבים עצום) ומתכנן לשגר שרתים לחלל. במקביל, רמז על השקת "גרוק קומפיוטר" בקרוב.
חברת Base44 שחררה אפליקציה ב-ChatGPT לבניית אפליקציות מתוך השיחה.
ו-Lovable הוסיפה סריקות אבטחה אוטומטיות לפני פרסום קוד.
סמסונג הביאה את הדפדפן שלה לווינדוס עם סוכני פרפלקסיטי מובנים.
וואטסאפ עדכנה תמיכה בחשבון כפול באייפון והעברת צ'אטים חלקה.
מטא שחררה את TRIBE v2 החוזה פעילות מוחית (בקוד פתוח).
וישראל דורגה במקום ה-8 בעולם בדוח האושר השנתי.

-
סוף סוף זה קרה:
# Open ai שחררה רשמית את Model Specלמי שלא יודע, Model Specזה מסמך רשמי של Open ai, המסמך מגדיר היררכיית חוקים שמחייבים כל מודל ai שהיא ייצרה אי פעם.
המסמך מגדיר היררכיה כזו:-
בטיחות.
-
הוראות מערכת.
-
בקשת המשתמש.
הדבר המיוחד שיש בזה הוא,
א' ניתן לתכנן פרומפטים שיתאימו לזה.
ב' ניתן ליצור מערכות מעל המודל שלא יתנגשו עם המערכות של המודל.
המסמך זמין לצפייה באתר הרשמי של Open ai. -
-
ה המלאך התייחס לנושא זה