סטארט-אפ ממיאמי טוען שהצליח לאמן מודל LLM עם חלון הקשר של 12 מליון טוקנים, שהוא פי 52 מהיר יותר וזול פי 20 בהשוואה ל-Claude Opus 4.7 ול-GPT-5.5 עם ביצועים דומים.
לשם השוואה גוגל עם כל העוצמה שלהם מגיעה לחלון הקשר של שני מליון טוקנים ונחשבת לשיא.
כמו"כ זה עולה הרבה מאוד כסף.
הדבר החדשני הזה שקול לשבירת קופות של המודל הסיני הראשון!!!
הם טוענים שהוא יעיל באותה מידה כמו קלוד אופוס 4.7 וGPT 5.5!!!
אה.
שכחתי לציין הם טוענים שהמהירות גדולה יותר מהם.
בקיצור פריצת הדרך הגדולה ביותר בתולדות הAI?????
סליחה שפתחתי נושא חדש.
אבל זה ממש ראוי לזה.
זה פשוט מטורף!!!!!!
ולפרטים הענייניים.
מדובר פה ב https://subq.ai/ .
סטארטאפ חדש.
הוא טוען שהצליח לפתח כזה מודל.
יותר פרטים פה.
חוקרי Wiz חשפו את CVE-2026-3854 — פרצת RCE חריגה במיוחד, שלפי הדיווחים אפשרה, באמצעות git push בודד, להגיע להרצת קוד על תשתיות GitHub ולסכן גישה למיליוני repositories, כולל פרטיים!
WIZ השתמשה בקלוד קוד ובIDA MCP שניהם ביחד זיהו את הפירצה במנגנונים הפנימיים של גיטהאב במהירות חסרת תקדים.
הפירצה השתמשה בפקודת git push פשוטה כדי להשתלט על גיטהאב.קום ומשם להשתלט על גיטהאב GitHub Enterprise.
המשמעות לכך היא אוטומטית יכולת להזריק קוד לכל תוכנה שנמצאת במאגרים של גיטהאב!
ולא! לא רק למאגרים ציבוריים. אלא גם מאגרים פרטיים של חברות ענק!
כדי לסבר את האוזן גיטהאב תיקנה את הפירצה הזו בתוך כמה 75 דקות!
זה כפשוטו להעלות קובץ לדרייב ולקבל קובץ שיל של גוגל . קצת יותר מידע: כל משתמש יכל לבצע את הפירצה הזו. היא עבדה כך שהתו - ; היה תחילת הגדרת אבטחה, אבל המשתמש יכל להכניס את זה בהערות של כל קוד שהוא יעלה!
מסתמא כל מתכנת פה מכיר את הבעיה הזו.
רוצים להטמיע AI בתוכנה בלי תלות באינטרנט או בAPI לא חינמי. אבל להוריד מודל LLM/SLM שלם סוחט את המחשב ודורש משאבים גבוהים.
אז הנה הפיתרון.
מסתבר שלא צריך מודל LLM/SLM שלם.
כן. יש מודלים ייעודיים לזה.
מודלי חיפוש סמנטי בסיסיים. כל מה שהם עושים זה לזהות (בלי להצויא פלט) ומודלי RAG (עם פלט).
שלב א': התקנת הספריות.
הקלידו את הפקודה הזו:
pip install sentence-transformers
שימו לב שכדאי להוסיף faiss-cpu אם יש לכם מאגר גדול.
שלב ב': הורדת המודל.
למודל חיפוש סמנטי:
כנסו כאן להאגינג פייס והורידו את המודל. למודל חיפוש על בסיס ראג' וכדו':
כנסו לכאן בהאגינג פייס. הערה: המודלים עובדים בעברית.
לכל מודל יש דף ב-Hugging Face עם קוד מוכן לשימוש.
אין צורך להמציא קוד עם הAI - פשוט להיכנס לקישור ולהעתיק את הקטע תחת ‘Usage’.
בדרך כלל כל מודלי ההטמעה עובדים באותה צורה:
טוענים את המודל → נותנים טקסט → מקבלים וקטור (embedding).
בגדול הקוד אמור להראות כזה:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("כאן תכתבו את שם המודל")
embeddings = model.encode(["כאן תכתבו את הטקסט שתרצו שהוא יזהה לדוגמא קוגל"])
שימו לב. אם אין לכם כח להתעסק עם קוד מורכב - מומלץ ללכת על חיפוש סמנטי. הטמעה בקוד הרבה יותר פשוטה..
או בקיצור?
תיהיו מודעים שלא צריך לחנוק את המחשב של המשתמש רק כי הסטנדרט החדש זה AI.
יש עוד פיתרונות AI. לא רק QWEN וג'מאה.
דוגמא לקוד הטמעה שאני השתמשתי בו (המודל לא מעודכן מספיק כמדומני, כמו"כ תתעלמו מדאטה (איך ללמוד תכנות מהר? - לא אפשרי.. )
from sentence_transformers import SentenceTransformer, util
# טעינת המודל נמצאת כאן.
model = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
documents = [
"איך מתקנים מחשב",
"מתכון לפיצה איטלקית",
"מדריך לפתרון תקלות חומרה",
"איך ללמוד תכנות מהר"
]
doc_embeddings = model.encode(documents)
query = input("הכנס שאלה: ")
query_embedding = model.encode(query)
scores = util.cos_sim(query_embedding, doc_embeddings)[0]
best_index = scores.argmax()
print("\nהמסמך הכי מתאים שמצאתי:")
print(documents[best_index])
print(f"ציון התאמה: {scores[best_index]:.2f}")
הערה אחרונה: כלל המודלים לא בהכרח מומלצים על ידי. וייתכן ולחלקם יהיו כבר גירסאות טובות יותר. אלו מודלים שבהם השתמשתי.
אם יש טעות או עדכון חשוב למדריך - אשמח שתגיבו ותגידו לי!
אני עוד לא מלאך. למרות שזהו שמי.
תודה.
1 - איפה מנפיקים מפתח api,
תשובה: בגוגל ai סטודיו תחת אזור מפתח api. מנפיקים אותו בממשק בתוכנה.
2 - המפתח החזיר שגיאה.
דבר ראשון - בטיפול. @א.מ.ד. מתכנן לעשות תשובות מובנות יותר משגיאה 404 או כל מיני דברים כאלה.
דבר שני, זה יכול להיות או בעיות אינטרנט.
או נטפרי.
או יותר מדי בקשות לגוגל.
או שהגעתם למכסה היומית.
3 - איך מורידים.
פשוט מאוד כאן.
4 - איך עושים שהוא יחפש באינטרנט,
מנפיקים מפתח api חינמי מכאן.
5 - מה זה מחשב,
עיינו פה. יש לכם רעיון להוסיף לתוכנה? תפתחו בגיטהאב.
יעיל יותר מפה.
הרבה הצלחה חברים!
פוסט ההשקה של גוגל.
עכשיו תשאלו.
מה הפאנץ'? מה חסר בE4B הקיים?
החידוש הוא שזה הרבה יותר חכם ממנו.
הם טוענים שאין מקודדים! הכל מוזרם ישירות לLLM.
מה שאומר שהמהירות גבוהה יותר והגודל קטן יותר למרות היותו מודל מולטי מודליאלי חלקי.
הם גם טוענים שהוא קרוב לMoE ה26B שלהם..
בקיצור, חובה לנסות!
מסתמא @א.מ.ד. אתה כבר על זה..
אני הרבה זמן חשבתי על זה.
החלטתי להציג לחברי הפורום,
משום מה נראה כאילו יש דחייה כלפי המושג סקריפט.
אני מתכוון, ברוך ה' קהילה גדולה, יוצרים תוספים להרבה בעיות קטנות מתוך מטרה להקל על החיים..
אני לא מדבר על זה שיוצרים עם בינה.
אין לי בעיה עם זה.
אבל משום מה האנשים לא מבינים, אני [ואני חושב שעוד רבים כמוני] לא יתקינו כמויות של תוספים על הדפדפן, זה מכביד.
יש פיתרון פשוט מאוד.
ליצור סקריפט,
זה עם כל כך הרבה ייתרונות שאני לא מצליח להבין למה לא?
1 - קובץ 1 במקום 4 מינימום.
כן סקריפט זה ס"כ קובץ אחד.
2 - בתוסף יש לרוב הרשאות רחבות, דבר שמוביל לפרצות אבטחה בפרט בתוספים שנוצרו על ידי בינה.
בסקרפיט ההרשאה היא רק לדף הספציפי שבו הוא רץ, אני לא אומר שאין בעיות, אבל יש הרבה יותר טיפה.
3 - לקהל יותר נח להתקין הרבה סקרפיטים כי זה לא מכביד על הדפדפן מאשר הרבה תוספים.
4 - ההתקנה עצמה מהירה ופשוטה.
בתוסף זה מורכב.
5 - המהירות פיתוח של סקריפט הרבה יותר מהירה משל תוסף.
אז אני באמת שואל מחוסר הבנה.
למה לא בסקרפיט?
חשוב לציין.
זה ברור שיש דברים שבישבילם אי אפשר בסקרפיט וחייבים תוסף.
לוגיקה מורכבת או הרשאות רחבות.
אבל יש הרבה דברים שלא.
לא חבל? אני רוצה להשתמש אבל לא יכול, אני לא רוצה להעמיס על הדפדפן שלי..
או בקיצור: אני קורא מכאן לכל בעלי התוספים.
תתחשבו בנו.
תעשו גם סקרפיט.
גוגל מבקשת גישה לקוד של אפליקציות שזכו למליוני הורדות,
היא ביקשה זאת דרך המייל של המפתחים.
המטרה היא אימון המודלים שלה.
זה כולל גם אפליקציות לא ממומשות.
ושני הערות שלי על הנושא:
1 - זה אומר שהיא קלטה את טענתו של @י.-פל. שנים, שהקוד של ג'מיני שווה 0.00.
2 - זה אומר גם ששווה להיות בעל אפליקציה שירדה מהחנות מליוני פעמים ..
הנה עוד כמה דברים נוספים שקרו היום:
1 - נוטבוק אל אם (NotebookLM) קיבל אופציה של סקירת ווידאו, הפיצ'ר החדש כולל קרינות וסקירה וויזואלית,
שימו לב רק שהפיצ'ר זמין ללמשתמשי גוגל AI אולטרה, נכון לעכשיו.
2 - OpenAI מעדכנת את סביבת הפיתוח קודקס, המתחרה בקלוד קוד,
וכעת היא תיהיה זמינה גם לווינדוס, האפליקציה מסתנכרת עם גירסת הmacOS, והינה זמינה גם למשתמשים החינמיים.
3 - קלוד קוד מקבלת מצב קולי,
כך ניתן יהיה באמצעות המצב קולי להורות לסוכן על כתיבת קוד - בלי לגעת במקלדת.
גוגל שחררת עדכון חשוב.
אם עד היום לפתוח צ'אט חדש היה סיוט - כיום אפשר פשוט להעביר את השיחות מgpt ומקלאוד ישירות לתוך ג'מיני.
הכלי מופיע כדף מיוחד בגוגל, השיחות יופיעו בהיסטוריית השיחות עם סימון ייחודי.
פיצ'ר תומך בהעלאה של עד 5 ג'יגה בייט.
מוזמנים להתנסות - https://gemini.google.com/import
חברת אקס הא איי מוציאה סוכן שמתחרה בקלוד קוד.
הסוכן הינו כלי שורת פקודה [בcli] החידוש הוא שהמודל כולל מצב תכנון כך שאם תכנתתם משימות מורכבות - פשוט תתנו למודל לעשות את זה בשבילכם.
ועוד משהו.
אם זה משימה מורכבת מדי - הוא יוכל להריץ עשרות סוכנים אוטונומיים שמתמחים כל אחד בתחום ייעודי.
תמיכה בmpc ובפלאגינס [תוספים].
לקריאה נוספת. כאן.
שכחתי לציין. [תודה ל @י.-פל. שהזכיר לי]
שזה כיום רק למנויי פרו.
כך שלא יכולתי לבדוק אם זה באמת רמה גבוהה.
יש פה מנוי גרוק?
הי יש לי אפשרות ליצור תוכנה שתשתמש בבינה מלאכותית על מנת לעמד לבד רק על ידי הטקסט שלכם,
מה דעתכם?
הייתם משתמשים בזה?
הרעיון שלי בתוכנה הוא שבמקום להסתבך עם עימוד ובלאגן של פונטים וכדו' המשתמש יוכל פשוט לבקש מהתוכנה, לעשות לו לדוג' קונטרס עם פונט של קונטרסים וכדו' וכך התוכנה תעשה לו את זה בשניות,
התוכנה מיועדת גם לאנשים פרטיים וגם למעמדים כמו שכבר העיר פה @יוחנן-1 ,
אז מה דעתכם?
גוגל מכריזה על העדכון הכי גדול של Google Maps בעשור האחרון - שילוב מודלי ה-AI שלה (Gemini) לתוך אפליקציית המפות, עם שני חידושים מרכזיים:
Ask Maps: יצירת מסלולים בשפה חופשית, לדוגמא: "הסוללה שלי עומדת להיגמר - איפה אפשר להטעין את הטלפון בלי לעמוד בתור ארוך לקפה?", או "אני בדרך לגרנד קניון - יש עצירות מומלצות בדרך?". המערכת תנתח את הבקשה ותייצר עבורכם מפה מותאמת אישית עם התשובות.
Immersive Navigation: תצוגה תלת-ממדית של הבניינים, המחלפים והעצמים בדרך, כדי להבין טוב יותר את מקומכם ואת מיקומי הפניות, ועדי למצוא את היעד בקלות.
הפיצ'ר "Ask Maps" משתחרר כעת בארה"ב ובהודו לאנדרואיד ו-iOS (ובקרוב גם לדסקטופ), בעוד הניווט התלת-ממדי יתחיל את דרכו בארה"ב ויתרחב בחודשים הקרובים (כולל תמיכה מלאה ב-Apple CarPlay ו-Android Auto).
חברת Anthropic חשפה מודל AI חדש בשם Mythos, שמסוגל לזהות ואף לנצל פרצות אבטחה ברמה גבוהה במיוחד. המודל הצליח למצוא חולשות בכל מערכות ההפעלה והדפדפנים המרכזיים, כולל פרצות שלא התגלו במשך עשרות שנים, ואף להפוך רבות מהן לניצול בפועל באופן אוטונומי
בשל הסיכון, החברה לא שחררה אותו לציבור אלא רק לקבוצה מצומצמת של ארגוני אבטחה, מחשש שגורמים זדוניים ינצלו אותו. מצד שני, יש לו גם פוטנציאל עצום לשיפור ההגנה – הוא יכול לאתר חולשות בקנה מידה ומהירות שאדם לא מסוגל להגיע אליהם
ולמי שלא הבין החברה מגדירה אותו כיותר מבין ומתקדם מהמודל הכי מתקדם שלה - האופוס
חברים.
צר לי לאכזב אותכם.
אבל שנת השפע של גוגל נגמרה.
גוגל מסירה את 1000 הקרדיטים החופשיים למנוי הפרו.
כמו"כ המגבלה אינה רק שבועית אלא לפי חלון זמן של חמש שעות.
לא יודע מה איתכם.
אבל אצלי ג'מיני התחיל ממש עכשיו לחפש בגוגל באמת.
כולל הבאת קישורים תוך השיחה (דבר שהיה בGPT ובMODE AI של גוגל שנים..),
ולגופו של דבר.
הולכת לצאת באמת גירסה 15 של פייתון?