סקר | מהו הצ'אט AI המועדף עליך?
-
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
@א.מ.ד. זה רק אחרי שהוא אומן על טקסט אמיתי ואנושי.
כהשלמה בלבד.קודם כל על זה דובר, ב' כל הטקסט האנושי הוא חלק ממש קטן מנתוני האימון. כמו שכתבתי אין מספיק כזה כיום.
-
@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
ל הטקסט האנושי הוא חלק ממש קטן מנתוני האימון. כמו שכתבתי אין מספיק כזה כיום.
מה שגורם להחמרה בהזיות.
לתוכן גנרי ולעוד כמה דברים שאני משער שלא צריך להגיד לך.. -
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
מה שגורם להחמרה בהזיות.
לתוכן גנרי ולעוד כמה דברים שאני משער שלא צריך להגיד לך..תרשה לי לחלוק עליך. זו המציאות כיום...
-
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
@א.מ.ד. תכפיל פי שתים.
לא סתם 5.5 (GPT) אומן מחדש.
אין מה להוסיף. יש רק לשנות שיטת אימון.אני מנחש שפשוט על מערך נתונים סינטטי אחר...
@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אני מנחש שפשוט על מערך נתונים סינטטי אחר...
אני די בטוח שלא.
ג'י פי טי 5.5 ניהיה יותר טוב.
בשביל כזה שינוי חייבים שינוי יותר גדול ממערך נתונים.חוץ מזה תחשב כמה העלות של יצירת מערך נתונים חדש.
לא נראה לי שווה להם. -
@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אני מנחש שפשוט על מערך נתונים סינטטי אחר...
אני די בטוח שלא.
ג'י פי טי 5.5 ניהיה יותר טוב.
בשביל כזה שינוי חייבים שינוי יותר גדול ממערך נתונים.חוץ מזה תחשב כמה העלות של יצירת מערך נתונים חדש.
לא נראה לי שווה להם.@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אני די בטוח שלא.
ג'י פי טי 5.5 ניהיה יותר טוב.
בשביל כזה שינוי חייבים שינוי יותר גדול ממערך נתונים.אבל פשוט אין!!! אין נתונים אנושיים בכמות מספקת!
@המלאך
@י.-פל.
זה עוד אחד מהדברים שהחליטו במערב בריבוע מוחלט, עד שהסינים הוכיחו שזה לא נכון וזינקו עוד קדימה.
זה נכון לגבי ההנחה שגודל = איכות, שאיכות דורשת השקעה של עשרות מיליארדים, ועוד דברים שנכונים כשלעצמם, אבל חייבים לפתוח את הראש בנוגע ליחסיות שלהם. -
@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אני מנחש שפשוט על מערך נתונים סינטטי אחר...
אני די בטוח שלא.
ג'י פי טי 5.5 ניהיה יותר טוב.
בשביל כזה שינוי חייבים שינוי יותר גדול ממערך נתונים.חוץ מזה תחשב כמה העלות של יצירת מערך נתונים חדש.
לא נראה לי שווה להם. -
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אני די בטוח שלא.
ג'י פי טי 5.5 ניהיה יותר טוב.
בשביל כזה שינוי חייבים שינוי יותר גדול ממערך נתונים.אבל פשוט אין!!! אין נתונים אנושיים בכמות מספקת!
@המלאך
@י.-פל.
זה עוד אחד מהדברים שהחליטו במערב בריבוע מוחלט, עד שהסינים הוכיחו שזה לא נכון וזינקו עוד קדימה.
זה נכון לגבי ההנחה שגודל = איכות, שאיכות דורשת השקעה של עשרות מיליארדים, ועוד דברים שנכונים כשלעצמם, אבל חייבים לפתוח את הראש בנוגע ליחסיות שלהם.@א.מ.ד. נו באמת.
זה ברור שבאימון משתמשים במערך נתונים סינתטי. אבל זה ברור באותה מידה שלא בדרך שבה אתה מתאר את זה.
הם משלבים כמה דברים ביחד,
גם סינון של המודלים עצמם על הטקסט הסינתטי,
גם טקסט סינתטי מזוקק של תהליך חשיבה,
וכמובן שינוי בתפיסה. השינוי הוא יותר להראות להם וויזואליה ולא טקסט. במקום 1000 טקסטים שמסיבירים מה זה תפוח, 100 סרטונים שמראים, (לא באמת 1000 ו100
)
והכי חשוב: פידבק מהמשתמשים. -
טוב חייב לציין שזה ביזיון.
אחרי שעתיים ו42 עונים לסקר,
הרוב המוחלט מעדיפים את ג'מיני.
זה די מוזר.
מאוד אשמח אם מי שכתב ג'מיני יכתוב למה, קידוד, עברית (נוחות ממשק), ידע כללי וכו'.@המלאך קצת הצתה מאוחרת
אבל בחרתי גמיני מכיוון שנכון שקלוד הוא תותח וכו' וברור שאיתו אני כותב את הקודים אבל בתכלס כשאומרים תשאל את הAI הראשון שאני פותח זה ג'מיני
העברית שלו טובה, התשובות שלו לעניין, יש לו חוש הומור
וזו הייתה השאלה בסקר@חובבן-מקצועי כתב בסקר | מהו הצ'אט AI המועדף עליך?:
מהו מודל ה-AI המועדף עליך (הסקר הוא בעבור צ'אט AI ולא למודל תמונות או סרטונים)
-
טוב חייב לציין שזה ביזיון.
אחרי שעתיים ו42 עונים לסקר,
הרוב המוחלט מעדיפים את ג'מיני.
זה די מוזר.
מאוד אשמח אם מי שכתב ג'מיני יכתוב למה, קידוד, עברית (נוחות ממשק), ידע כללי וכו'. -
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
הרוב המוחלט מעדיפים את ג'מיני.
זה די מוזר.
מאוד אשמח אם מי שכתב ג'מיני יכתוב למה, קידוד, עברית (נוחות ממשק), ידע כללי וכו'.גם קידוד (מצויין ממש בעיקר כמובן בגירסת הפרו), וגם עברית.
-
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אני די בטוח שלא.
ג'י פי טי 5.5 ניהיה יותר טוב.
בשביל כזה שינוי חייבים שינוי יותר גדול ממערך נתונים.אבל פשוט אין!!! אין נתונים אנושיים בכמות מספקת!
@המלאך
@י.-פל.
זה עוד אחד מהדברים שהחליטו במערב בריבוע מוחלט, עד שהסינים הוכיחו שזה לא נכון וזינקו עוד קדימה.
זה נכון לגבי ההנחה שגודל = איכות, שאיכות דורשת השקעה של עשרות מיליארדים, ועוד דברים שנכונים כשלעצמם, אבל חייבים לפתוח את הראש בנוגע ליחסיות שלהם.@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אבל פשוט אין!!! אין נתונים אנושיים בכמות מספקת!
@המלאך
@י.-פל.
זה עוד אחד מהדברים שהחליטו במערב בריבוע מוחלט, עד שהסינים הוכיחו שזה לא נכון וזינקו עוד קדימה.
זה נכון לגבי ההנחה שגודל = איכות, שאיכות דורשת השקעה של עשרות מיליארדים, ועוד דברים שנכונים כשלעצמם, אבל חייבים לפתוח את הראש בנוגע ליחסיות שלהם.לפני הכל: אני לא מומחה ai.
אני לא באמת יודע... אני שומע המון תוכן, וקורא (אם כי לאחרונה אוצריא גונבת לי את כל זמן הקריאה...), וזה לכ מה שאני יודע.
אני לא יודע מהן מטריצות, וקטורים, קוונטיזציה וכולי.
לא תכננתי להגיב, אבל תייגת אותי, עניתי. אם דעתי חשובה לך (טעות שלך!) - תייג שוב.- אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.
- לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית? שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???
כי הם מבוססי מודלים מערביים
.
ולמי שכתב שג׳מיני או אנטיגרביטי שווים משהו בקוד - אז לא. כלום לא. לדעתי, גוגל הענקית שכרה כמה הודים שיקלידו מהר מהר, לא משנה מה, העיקר שיראה טוב...

שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות. -
@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אבל פשוט אין!!! אין נתונים אנושיים בכמות מספקת!
@המלאך
@י.-פל.
זה עוד אחד מהדברים שהחליטו במערב בריבוע מוחלט, עד שהסינים הוכיחו שזה לא נכון וזינקו עוד קדימה.
זה נכון לגבי ההנחה שגודל = איכות, שאיכות דורשת השקעה של עשרות מיליארדים, ועוד דברים שנכונים כשלעצמם, אבל חייבים לפתוח את הראש בנוגע ליחסיות שלהם.לפני הכל: אני לא מומחה ai.
אני לא באמת יודע... אני שומע המון תוכן, וקורא (אם כי לאחרונה אוצריא גונבת לי את כל זמן הקריאה...), וזה לכ מה שאני יודע.
אני לא יודע מהן מטריצות, וקטורים, קוונטיזציה וכולי.
לא תכננתי להגיב, אבל תייגת אותי, עניתי. אם דעתי חשובה לך (טעות שלך!) - תייג שוב.- אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.
- לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית? שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???
כי הם מבוססי מודלים מערביים
.
ולמי שכתב שג׳מיני או אנטיגרביטי שווים משהו בקוד - אז לא. כלום לא. לדעתי, גוגל הענקית שכרה כמה הודים שיקלידו מהר מהר, לא משנה מה, העיקר שיראה טוב...

שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות.@י.-פל. לגבי הסינים,
1 - OPEN AI היא פורצת דרך. כל המחקר זה בזבוז כסף שלא יחזור על עצמו. (לא שזה כל כך מתרץ).
2 -MoE. הסינים (ברוב) המודלים שלהם משתמשים בארכייקטורה הזו.
לגבי הפיגור:
1 - סנקציות של טראמפ על שבבים.
2 - הראיה הכי גדולה (לדעתי) להעתקה שלהם ממודלים מערביים זה שהם ממש לא יצירתיים. -
@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אבל פשוט אין!!! אין נתונים אנושיים בכמות מספקת!
@המלאך
@י.-פל.
זה עוד אחד מהדברים שהחליטו במערב בריבוע מוחלט, עד שהסינים הוכיחו שזה לא נכון וזינקו עוד קדימה.
זה נכון לגבי ההנחה שגודל = איכות, שאיכות דורשת השקעה של עשרות מיליארדים, ועוד דברים שנכונים כשלעצמם, אבל חייבים לפתוח את הראש בנוגע ליחסיות שלהם.לפני הכל: אני לא מומחה ai.
אני לא באמת יודע... אני שומע המון תוכן, וקורא (אם כי לאחרונה אוצריא גונבת לי את כל זמן הקריאה...), וזה לכ מה שאני יודע.
אני לא יודע מהן מטריצות, וקטורים, קוונטיזציה וכולי.
לא תכננתי להגיב, אבל תייגת אותי, עניתי. אם דעתי חשובה לך (טעות שלך!) - תייג שוב.- אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.
- לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית? שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???
כי הם מבוססי מודלים מערביים
.
ולמי שכתב שג׳מיני או אנטיגרביטי שווים משהו בקוד - אז לא. כלום לא. לדעתי, גוגל הענקית שכרה כמה הודים שיקלידו מהר מהר, לא משנה מה, העיקר שיראה טוב...

שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות.@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.
קודם כל היה באמצע את GPT 4 אבל זה לא חשוב עכשיו.
בכל מקרה, באמת אז הגיעו לתקרת הזכוכית מבחינת נתונים אנושיים, וזה בדיוק מחזק את מה שכתבתי - שמאז השימוש בנתונים סינטטיים תופס חלק גדול מאוד מנתוני האימון.
עניין מודלי החשיבה פחות רלוונטי, כי מדובר בסך הכל בכוונון לצ'אט. עיקר העבודה היא באימון המקדים. הנתונים המשמשים לאימון לצ'אט הם בערך 1% בלבד מסך הנתונים. השיפור במודלים החדשים הוא בעיקר באימון המקדים ופחות בצורת החשיבה, למרות שגם זה קצת משפיע, כך שעדיין זקוקים לנתונים סינטטיים רבים.@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית?
הסינים מקבלים סיוע עצום מהממשלה הסינית, כוח העבודה זול בהרבה, והם גם מייעלים משמעותית את האימון. אין חולק על כך שהתרבות המערבית בזבזנית בהרבה בכל תחום. ע"ע סורה.
@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???
ברור שהם התקדמו. המודלים הסינים החדשים ביותר שווים לאופוס 4.6, כלומר פער של חודשים בודדים. אם כי סביר להניח שהם לא יכולים לעקוף כי הם מבוססים כמו שכתבת על המודלים המערביים (שוב - נתונים סינטטיים...).
@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות.
מעניין... אולי באמת בקידוד סוכני הוא פחות טוב, אבל באופן כללי הוא מעולה בקוד. אני משתמש בו לליווי צמוד של הפרוייקט שלי של סמארטי לווינדוס במשך בערך 10 שיחות (אני מבקש ממנו ליצור תיק חפיפה לשיחה הבאה כשמתמלא ההקשר).
-
@י.-פל. לגבי הסינים,
1 - OPEN AI היא פורצת דרך. כל המחקר זה בזבוז כסף שלא יחזור על עצמו. (לא שזה כל כך מתרץ).
2 -MoE. הסינים (ברוב) המודלים שלהם משתמשים בארכייקטורה הזו.
לגבי הפיגור:
1 - סנקציות של טראמפ על שבבים.
2 - הראיה הכי גדולה (לדעתי) להעתקה שלהם ממודלים מערביים זה שהם ממש לא יצירתיים.@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
2 -MoE. הסינים (ברוב) המודלים שלהם משתמשים בארכייקטורה הזו.
כל המודלים המערביים משתמשים ב-MoE.
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
2 - הראיה הכי גדולה (לדעתי) להעתקה שלהם ממודלים מערביים זה שהם ממש לא יצירתיים.
חד משמעית. לדוגמא QWEN 3.5 מעולה בקידוד, אבל זה דבר מאוד טכני ויבש, שקל מאוד לזקק ממודל גדול יותר. ביצירתיות הם גרועים.
-
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
2 -MoE. הסינים (ברוב) המודלים שלהם משתמשים בארכייקטורה הזו.
כל המודלים המערביים משתמשים ב-MoE.
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
2 - הראיה הכי גדולה (לדעתי) להעתקה שלהם ממודלים מערביים זה שהם ממש לא יצירתיים.
חד משמעית. לדוגמא QWEN 3.5 מעולה בקידוד, אבל זה דבר מאוד טכני ויבש, שקל מאוד לזקק ממודל גדול יותר. ביצירתיות הם גרועים.
-
@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.
קודם כל היה באמצע את GPT 4 אבל זה לא חשוב עכשיו.
בכל מקרה, באמת אז הגיעו לתקרת הזכוכית מבחינת נתונים אנושיים, וזה בדיוק מחזק את מה שכתבתי - שמאז השימוש בנתונים סינטטיים תופס חלק גדול מאוד מנתוני האימון.
עניין מודלי החשיבה פחות רלוונטי, כי מדובר בסך הכל בכוונון לצ'אט. עיקר העבודה היא באימון המקדים. הנתונים המשמשים לאימון לצ'אט הם בערך 1% בלבד מסך הנתונים. השיפור במודלים החדשים הוא בעיקר באימון המקדים ופחות בצורת החשיבה, למרות שגם זה קצת משפיע, כך שעדיין זקוקים לנתונים סינטטיים רבים.@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית?
הסינים מקבלים סיוע עצום מהממשלה הסינית, כוח העבודה זול בהרבה, והם גם מייעלים משמעותית את האימון. אין חולק על כך שהתרבות המערבית בזבזנית בהרבה בכל תחום. ע"ע סורה.
@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???
ברור שהם התקדמו. המודלים הסינים החדשים ביותר שווים לאופוס 4.6, כלומר פער של חודשים בודדים. אם כי סביר להניח שהם לא יכולים לעקוף כי הם מבוססים כמו שכתבת על המודלים המערביים (שוב - נתונים סינטטיים...).
@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות.
מעניין... אולי באמת בקידוד סוכני הוא פחות טוב, אבל באופן כללי הוא מעולה בקוד. אני משתמש בו לליווי צמוד של הפרוייקט שלי של סמארטי לווינדוס במשך בערך 10 שיחות (אני מבקש ממנו ליצור תיק חפיפה לשיחה הבאה כשמתמלא ההקשר).
@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
מעניין... אולי באמת בקידוד סוכני הוא פחות טוב, אבל באופן כללי הוא מעולה בקוד. אני משתמש בו לליווי צמוד של הפרוייקט שלי של סמארטי לווינדוס במשך בערך 10 שיחות (אני מבקש ממנו ליצור תיק חפיפה לשיחה הבאה כשמתמלא ההקשר).
לא בהכרח קשור.
הוא יכול להיות טוב.
זה כלי שנמצא בגירסת בטא. -
@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.
קודם כל היה באמצע את GPT 4 אבל זה לא חשוב עכשיו.
בכל מקרה, באמת אז הגיעו לתקרת הזכוכית מבחינת נתונים אנושיים, וזה בדיוק מחזק את מה שכתבתי - שמאז השימוש בנתונים סינטטיים תופס חלק גדול מאוד מנתוני האימון.
עניין מודלי החשיבה פחות רלוונטי, כי מדובר בסך הכל בכוונון לצ'אט. עיקר העבודה היא באימון המקדים. הנתונים המשמשים לאימון לצ'אט הם בערך 1% בלבד מסך הנתונים. השיפור במודלים החדשים הוא בעיקר באימון המקדים ופחות בצורת החשיבה, למרות שגם זה קצת משפיע, כך שעדיין זקוקים לנתונים סינטטיים רבים.@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית?
הסינים מקבלים סיוע עצום מהממשלה הסינית, כוח העבודה זול בהרבה, והם גם מייעלים משמעותית את האימון. אין חולק על כך שהתרבות המערבית בזבזנית בהרבה בכל תחום. ע"ע סורה.
@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???
ברור שהם התקדמו. המודלים הסינים החדשים ביותר שווים לאופוס 4.6, כלומר פער של חודשים בודדים. אם כי סביר להניח שהם לא יכולים לעקוף כי הם מבוססים כמו שכתבת על המודלים המערביים (שוב - נתונים סינטטיים...).
@י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות.
מעניין... אולי באמת בקידוד סוכני הוא פחות טוב, אבל באופן כללי הוא מעולה בקוד. אני משתמש בו לליווי צמוד של הפרוייקט שלי של סמארטי לווינדוס במשך בערך 10 שיחות (אני מבקש ממנו ליצור תיק חפיפה לשיחה הבאה כשמתמלא ההקשר).
@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
קודם כל היה באמצע את GPT 4 אבל זה לא חשוב עכשיו.
בכל מקרה, באמת אז הגיעו לתקרת הזכוכית מבחינת נתונים אנושיים, וזה בדיוק מחזק את מה שכתבתי - שמאז השימוש בנתונים סינטטיים תופס חלק גדול מאוד מנתוני האימון.
עניין מודלי החשיבה פחות רלוונטי, כי מדובר בסך הכל בכוונון לצ'אט. עיקר העבודה היא באימון המקדים. הנתונים המשמשים לאימון לצ'אט הם בערך 1% בלבד מסך הנתונים. השיפור במודלים החדשים הוא בעיקר באימון המקדים ופחות בצורת החשיבה, למרות שגם זה קצת משפיע, כך שעדיין זקוקים לנתונים סינטטיים רבים.מודלי חשיבה שינו הרבה יותר מכיוונון בצאט.
הם שינו בScaling.
פרט לכך.
על אף שהPost-training קטנים. האיכות שלהם היא זו ש(לדעתי) מכפילה את החוכמה של המודל.
הוא כפשוטו נהפך מטיפש לחכם.
ממש לא נראה לי שזה רק יותר דאטה.. -
@א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:
כל המודלים המערביים משתמשים ב-MoE.
כוונתי לסיבה שהם הפתיעו את המערביים בהתחלה. (הם אלו שהשתמשו בהתחלה בזה..).
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
כוונתי לסיבה שהם הפתיעו את המערביים בהתחלה. (הם אלו שהשתמשו בהתחלה בזה..).
לא נכון. הראשונים שהשתמשו בזה הם המערב - מודל מיקסטרל של חברת מיסטרל הצרפתית, ומיד זה הפך לסטנדרט בתעשיית ה-AI. החברות הסגורות לא מנדבות מידע טכני על המודלים שלהם, אבל אפילו גרוק 2 המיושן ששוחרר בקוד פתוח כבר היה MoE.
@המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:
מודלי חשיבה שינו הרבה יותר מכיוונון בצאט.
הם שינו בScaling.
פרט לכך.
על אף שהPost-training קטנים. האיכות שלהם היא זו ש(לדעתי) מכפילה את החוכמה של המודל.
הוא כפשוטו נהפך מטיפש לחכם.
ממש לא נראה לי שזה רק יותר דאטה..ברור שזה לא רק דאטה, אבל רוב השיפור נובע משיפור באימון המקדים, שמורכב מכמות גדולה של נתונים סינטטיים.
כיום חלק גדול מהאימון המקדים מתבצע כבר על זוגות של שאלות ותשובות בפורמט צ'אט עם חשיבה כמובן, שזה ודאי סינטטי.