סקר | מהו הצ'אט AI המועדף עליך?

DHOC979

@המלאך קצת הצתה מאוחרת
אבל בחרתי גמיני מכיוון שנכון שקלוד הוא תותח וכו' וברור שאיתו אני כותב את הקודים אבל בתכלס כשאומרים תשאל את הAI הראשון שאני פותח זה ג'מיני
העברית שלו טובה, התשובות שלו לעניין, יש לו חוש הומור
וזו הייתה השאלה בסקר

@חובבן-מקצועי כתב בסקר | מהו הצ'אט AI המועדף עליך?:

מהו מודל ה-AI המועדף עליך (הסקר הוא בעבור צ'אט AI ולא למודל תמונות או סרטונים)

צמצם

@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

הרוב המוחלט מעדיפים את ג'מיני.
זה די מוזר.
מאוד אשמח אם מי שכתב ג'מיני יכתוב למה, קידוד, עברית (נוחות ממשק), ידע כללי וכו'.

גם קידוד (מצויין ממש בעיקר כמובן בגירסת הפרו), וגם עברית.

המלאך

@צמצם כתב בסקר | מהו הצ'אט AI המועדף עליך?:

גם קידוד (מצויין ממש בעיקר כמובן בגירסת הפרו)

בזה אני חייב לחלוק עליך.
ניסיתי אותו. הוא ממש גרוע בקידוד.
עיין לעיל בהודעות שלי.

י. פל.

@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

אבל פשוט אין!!! אין נתונים אנושיים בכמות מספקת!

@המלאך
@י.-פל.
זה עוד אחד מהדברים שהחליטו במערב בריבוע מוחלט, עד שהסינים הוכיחו שזה לא נכון וזינקו עוד קדימה.
זה נכון לגבי ההנחה שגודל = איכות, שאיכות דורשת השקעה של עשרות מיליארדים, ועוד דברים שנכונים כשלעצמם, אבל חייבים לפתוח את הראש בנוגע ליחסיות שלהם.

לפני הכל: אני לא מומחה ai.
אני לא באמת יודע... אני שומע המון תוכן, וקורא (אם כי לאחרונה אוצריא גונבת לי את כל זמן הקריאה...), וזה לכ מה שאני יודע.
אני לא יודע מהן מטריצות, וקטורים, קוונטיזציה וכולי.
לא תכננתי להגיב, אבל תייגת אותי, עניתי. אם דעתי חשובה לך (טעות שלך!) - תייג שוב.

אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.
לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית? שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???
כי הם מבוססי מודלים מערביים .

ולמי שכתב שג׳מיני או אנטיגרביטי שווים משהו בקוד - אז לא. כלום לא. לדעתי, גוגל הענקית שכרה כמה הודים שיקלידו מהר מהר, לא משנה מה, העיקר שיראה טוב...
שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות.

המלאך

@י.-פל. לגבי הסינים,
1 - OPEN AI היא פורצת דרך. כל המחקר זה בזבוז כסף שלא יחזור על עצמו. (לא שזה כל כך מתרץ).
2 -MoE. הסינים (ברוב) המודלים שלהם משתמשים בארכייקטורה הזו.
לגבי הפיגור:
1 - סנקציות של טראמפ על שבבים.
2 - הראיה הכי גדולה (לדעתי) להעתקה שלהם ממודלים מערביים זה שהם ממש לא יצירתיים.

א.מ.ד.

@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.

קודם כל היה באמצע את GPT 4 אבל זה לא חשוב עכשיו.
בכל מקרה, באמת אז הגיעו לתקרת הזכוכית מבחינת נתונים אנושיים, וזה בדיוק מחזק את מה שכתבתי - שמאז השימוש בנתונים סינטטיים תופס חלק גדול מאוד מנתוני האימון.
עניין מודלי החשיבה פחות רלוונטי, כי מדובר בסך הכל בכוונון לצ'אט. עיקר העבודה היא באימון המקדים. הנתונים המשמשים לאימון לצ'אט הם בערך 1% בלבד מסך הנתונים. השיפור במודלים החדשים הוא בעיקר באימון המקדים ופחות בצורת החשיבה, למרות שגם זה קצת משפיע, כך שעדיין זקוקים לנתונים סינטטיים רבים.

@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית?

הסינים מקבלים סיוע עצום מהממשלה הסינית, כוח העבודה זול בהרבה, והם גם מייעלים משמעותית את האימון. אין חולק על כך שהתרבות המערבית בזבזנית בהרבה בכל תחום. ע"ע סורה.

@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???

ברור שהם התקדמו. המודלים הסינים החדשים ביותר שווים לאופוס 4.6, כלומר פער של חודשים בודדים. אם כי סביר להניח שהם לא יכולים לעקוף כי הם מבוססים כמו שכתבת על המודלים המערביים (שוב - נתונים סינטטיים...).

@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות.

מעניין... אולי באמת בקידוד סוכני הוא פחות טוב, אבל באופן כללי הוא מעולה בקוד. אני משתמש בו לליווי צמוד של הפרוייקט שלי של סמארטי לווינדוס במשך בערך 10 שיחות (אני מבקש ממנו ליצור תיק חפיפה לשיחה הבאה כשמתמלא ההקשר).

א.מ.ד.

@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

2 -MoE. הסינים (ברוב) המודלים שלהם משתמשים בארכייקטורה הזו.

כל המודלים המערביים משתמשים ב-MoE.

@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

2 - הראיה הכי גדולה (לדעתי) להעתקה שלהם ממודלים מערביים זה שהם ממש לא יצירתיים.

חד משמעית. לדוגמא QWEN 3.5 מעולה בקידוד, אבל זה דבר מאוד טכני ויבש, שקל מאוד לזקק ממודל גדול יותר. ביצירתיות הם גרועים.

המלאך

@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

כל המודלים המערביים משתמשים ב-MoE.

כוונתי לסיבה שהם הפתיעו את המערביים בהתחלה. (הם אלו שהשתמשו בהתחלה בזה..).

המלאך

@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

מעניין... אולי באמת בקידוד סוכני הוא פחות טוב, אבל באופן כללי הוא מעולה בקוד. אני משתמש בו לליווי צמוד של הפרוייקט שלי של סמארטי לווינדוס במשך בערך 10 שיחות (אני מבקש ממנו ליצור תיק חפיפה לשיחה הבאה כשמתמלא ההקשר).

לא בהכרח קשור.
הוא יכול להיות טוב.
זה כלי שנמצא בגירסת בטא.

המלאך

@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

קודם כל היה באמצע את GPT 4 אבל זה לא חשוב עכשיו.
בכל מקרה, באמת אז הגיעו לתקרת הזכוכית מבחינת נתונים אנושיים, וזה בדיוק מחזק את מה שכתבתי - שמאז השימוש בנתונים סינטטיים תופס חלק גדול מאוד מנתוני האימון.
עניין מודלי החשיבה פחות רלוונטי, כי מדובר בסך הכל בכוונון לצ'אט. עיקר העבודה היא באימון המקדים. הנתונים המשמשים לאימון לצ'אט הם בערך 1% בלבד מסך הנתונים. השיפור במודלים החדשים הוא בעיקר באימון המקדים ופחות בצורת החשיבה, למרות שגם זה קצת משפיע, כך שעדיין זקוקים לנתונים סינטטיים רבים.

מודלי חשיבה שינו הרבה יותר מכיוונון בצאט.
הם שינו בScaling.
פרט לכך.
על אף שהPost-training קטנים. האיכות שלהם היא זו ש(לדעתי) מכפילה את החוכמה של המודל.
הוא כפשוטו נהפך מטיפש לחכם.
ממש לא נראה לי שזה רק יותר דאטה..

א.מ.ד.

@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

כוונתי לסיבה שהם הפתיעו את המערביים בהתחלה. (הם אלו שהשתמשו בהתחלה בזה..).

לא נכון. הראשונים שהשתמשו בזה הם המערב - מודל מיקסטרל של חברת מיסטרל הצרפתית, ומיד זה הפך לסטנדרט בתעשיית ה-AI. החברות הסגורות לא מנדבות מידע טכני על המודלים שלהם, אבל אפילו גרוק 2 המיושן ששוחרר בקוד פתוח כבר היה MoE.

@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

מודלי חשיבה שינו הרבה יותר מכיוונון בצאט.
הם שינו בScaling.
פרט לכך.
על אף שהPost-training קטנים. האיכות שלהם היא זו ש(לדעתי) מכפילה את החוכמה של המודל.
הוא כפשוטו נהפך מטיפש לחכם.
ממש לא נראה לי שזה רק יותר דאטה..

ברור שזה לא רק דאטה, אבל רוב השיפור נובע משיפור באימון המקדים, שמורכב מכמות גדולה של נתונים סינטטיים.
כיום חלק גדול מהאימון המקדים מתבצע כבר על זוגות של שאלות ותשובות בפורמט צ'אט עם חשיבה כמובן, שזה ודאי סינטטי.

י. פל.

@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

הסינים מקבלים סיוע עצום מהממשלה הסינית, כוח העבודה זול בהרבה

אין לי מה להגיב על מה שכתבת - למרות שתייגת... זה יחזור ע״ע בלופ.
אתה טוען שהשינוי באימון הוא הנתונים הסינטטיים. אני חושש שאתה טועה, אבל לא יודע לומר כלום בוודאות.

רק לגבי הפיסקה שציטטתי: בזה אתה טועה, העובדה היא עובדה, וניתנת שלחזור (כי הכל פתוח, גם מערכי הנתונים וגם קוד האימון וכולי): האימון שלהם זול מאוד, ללא קשר לממשל.

א.מ.ד.

@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

רק לגבי הפיסקה שציטטתי: בזה אתה טועה, העובדה היא עובדה, וניתנת שלחזור (כי הכל פתוח, גם מערכי הנתונים וגם קוד האימון וכולי): האימון שלהם זול מאוד, ללא קשר לממשל.

שום דבר לא פתוח חוץ מהמשקלים של המודל. אין איך לשחזר את העבודה שלהם.
ולגבי הסיוע מהממשל, הוא לא מתבטא רק בכסף פיזי אלא בסבסוד משמעותי בעלות המים והחשמל האדירה הנדרשת לקירור חוות השבבים שהמודלים מאומנים בהם. זה בהחלט מחושב בתוך עלות האימון, ואפילו זה כמעט כל העלות.

י. פל.

@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

שום דבר לא פתוח חוץ מהמשקלים של המודל. אין איך לשחזר את העבודה שלהם.

הכל שוחזר בhuggingface.

א.מ.ד.

@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

הכל שוחזר בhuggingface.

איך בדיוק? זה קוד סגור... רק המשקלים פתוחים... אין איך לשחזר אא"כ מישהו הדליף הכל מתוך החברה, שעל זה היינו שומעים...

י. פל.

@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

אין איך לשחזר

תחפש בבקשה Open-R1.
אין לי טעם להתווכח אתך: כנראה אתה יודע יותר ממני.
אבל אני חושב שאתה לא יודע הכל (לא שמישהו יודע...), ויתכן שאתה מפספס הרבה בדרך.
הראיה הגדולה, שאתה משתמש בג'מיני הטיפש לקוד
אגב, מוזר ש @sivan22 ו @nh.local לא הגיבו פה בכלל!!!

מתכנת חובב

@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

ברור שזה לא רק דאטה, אבל רוב השיפור נובע משיפור באימון המקדים, שמורכב מכמות גדולה של נתונים סינטטיים.
כיום חלק גדול מהאימון המקדים מתבצע כבר על זוגות של שאלות ותשובות בפורמט צ'אט עם חשיבה כמובן, שזה ודאי סינטטי.

אתה כנראה מתכוון למה שנקרא mid training
כי אימון מודל בסיס על נתונים סינטטיים יוביל למודל גרוע
בדיוק השבוע יצא לי לקרוא כמה מאמרים על זה
נושא מבלבל ממש

א.מ.ד.

@מתכנת-חובב צריך לשלב הרבה נתונים סינטטיים. לא הייתי קורא למודלי qwen 3.5 מודלים גרועים (למעשה הם הטובים ביותר במשקלים פתוחים), והם אומנו בעיקר על נתונים סינטטיים.
אימון אמצע מורכב בדרך כלל מנתונים סינטטיים, וזה מה שנותן להם את האיכות.
אין חולק שנתונים סינטטיים נחשבים איכותיים יותר. כל מי שמתעסק בתחום יודע את זה. אבל כמו כל דבר טוב, אי אפשר יותר מידי כי זה מזיק. לכן זה איפשהו באמצע - 50% מהנתונים בערך הם סינטטיים, ומשתמשים בהם בעיקר באימון האמצעי אבל לא רק.

א.מ.ד.

@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

תחפש בבקשה Open-R1.

אתה צוחק?
זה פרוייקט שמזקק נתונים מתוך דיפסיק R1 המקורי, ומנסה לשחזר את האימון לפי הדו"ח הטכנולוגי של דיפסיק...
אני לא יודע אם לקרוא לזה גימיק או קוריוז...
אתה יכול באותה מידה בדיוק "לשחזר" את אופוס 4.7...

מתכנת חובב

@א.מ.ד. גם בשלב ה pre training?
מוזר מאוד
אפשר מקורות?
באופן כללי מה שכתבת קצת מוזר
על פי מה שקראתי גם בשלב אימון האמצע לא משתמשים ביותר מידי נתונים סטטיסטיים אלא אם כן רוצים לחזק יכולות ספציפיות ותוך שימוש בשיטות מורכבות יחסית כמו שעשו ב phi4
בשלב אימון הבסיס אם משתמשים בנתונים סינטטיים זה מידע שעבר rephrasing ולא מידע שמקורו סינטטי
כמו כן למה אתה חושב שמידי סינטטי הוא טוב יותר? (אלא אם כן אתה מתכוון לעובדה שאפשר לייצר מידע סינטטי מסודר ובאיכות יחסית גם אם נגמרו מאגרי המידע האיכותי הלא סינטטי אבל אז זה לא שהוא איכותי אלא שהוא פשוט יותר טוב מכלום)