בקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית
-
סתם ברצינות: המודל בכלל לא בשלב של כוונון הצ'אט אז אין מה למדוד בקידוד. כרגע המודל הוא מודל השלמת טקסט, ובזה הוא משתפר מאימון לאימון. כשהוא יגיע לסף הדרוש - אני ילמד אותו איך עונים כצ'אט.
-
@המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
@א.מ.ד. נו? אז אולי תאמן אותו לענות בפורמט ג'סון בשבילי?
אין מערכי נתונים פתוחים בעברית לזה.
מה הבעיה במודלים שאמרתי?@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
מה הבעיה במודלים שאמרתי?
הגודל.
פרטים נוספים בפרטי.@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
הגזמתי כן? אבל הזיות זה אומר שהמודל ממציא. ככל שהאחוז הזה גבוה יותר אז המודל פחות טוב...
אני בטוח בוודאות של 99% שכולנו הבנו את זה..
-
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
@א.מ.ד. לא הבנתי עם ציון של 97 בהזיות למה אתה לא מתחיל לצ'אט?
הגזמתי כן? אבל הזיות זה אומר שהמודל ממציא. ככל שהאחוז הזה גבוה יותר אז המודל פחות טוב...
-
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
מה הבעיה במודלים שאמרתי?
הגודל.
פרטים נוספים בפרטי.@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
הגזמתי כן? אבל הזיות זה אומר שהמודל ממציא. ככל שהאחוז הזה גבוה יותר אז המודל פחות טוב...
אני בטוח בוודאות של 99% שכולנו הבנו את זה..
-
@המלאך אולי אפשר לקחת מודל קטן ולאמן אותו, אם @א.מ.ד. יועיל לתת לנו הדרכה, לי יש 3 חשבונות של ג'ימייל ואוכל להשתמש בהם (@א.מ.ד. אמר שזה חינם לא?) אני בטוח שיהיו כמה שיסכימו להצטרף ולעשות את זה ביחד.
נעשה מודל שיהיה כלי עבודה - מבין עברית, כשר ועדיף שיודע קוד, צריך לשמר בו את יכולות הRAG אין צורך בידע כללי ושטויות שיהיה נטו כלי עבודה.
-
@המלאך אולי אפשר לקחת מודל קטן ולאמן אותו, אם @א.מ.ד. יועיל לתת לנו הדרכה, לי יש 3 חשבונות של ג'ימייל ואוכל להשתמש בהם (@א.מ.ד. אמר שזה חינם לא?) אני בטוח שיהיו כמה שיסכימו להצטרף ולעשות את זה ביחד.
נעשה מודל שיהיה כלי עבודה - מבין עברית, כשר ועדיף שיודע קוד, צריך לשמר בו את יכולות הRAG אין צורך בידע כללי ושטויות שיהיה נטו כלי עבודה.
-
-
@המלאך נו, אז תכתוב איך ואני אעשה לבד.
אם יעבדו על זה מכמה חשבונות זה יהיה יותר מהר לענ"ד.
גם אם לא יועיל לעכשיו יועיל לאח"כ, אני לא חושב שזה הפעם האחרונה שאתה הולך להיתקל בAI.
-
-
@המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?
כן כמובן.
@המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
הבעיה היא שזה לוקח כמה שבועות אם לא חודשים, אין לי זמן וכוח לזה.
בהחלט, ובשביל שיהיה בחינם צריך להפעיל את זה מחדש כל יום.
@המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
חוץ מזה זה דורש דאטה..
@א.מ.ד. מאיפה הדאטה שלך? הורדת את המכלול?הלוואי שהמכלול היה מספיק...
מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...
האמת היא שזה תלוי בגודל המודל. לדוגמא מודל ה-0.6B שלי השתמש רק בשבריר מהחומר, ואז מיצה את הלמידה ממנו.
אבל בשביל לאמן מודל יותר גדול, צריך GPU יותר חזק וזה כבר עולה כסף והרבה...
תראה את דיקטה, שיש להם מערכי נתונים עצומים בעברית, מימון (ממשלתי אם אני לא טועה) ושיתוף פעולה עמוק עם אנבידיה, ומודל ה-1.7B שלהם גרוע יחסית למודלים בשפות אחרות וחסר יכולות אמיתיות.
מה שאני חשבתי לעשות זה לכוונן את דיקטה למשימות ספציפיות.
אם יהיה מימון לזה אין לי בעיה לעשות את זה, אבל כמו שכתבתי זה לא כל כך פשוט...
