בקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית
-
@רציונל כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
אז כל עוד לא תפרסם אותו לא נראה שזה אכן אפשרי...
אימון לוקח כמה שבועות, כן? יש לי רק בערך 3 שעות GPU חינם ביום, ואני משתמש בהם ל-3 מודלים שונים, ובנוסף בשבועיים האחרונים לא כ"כ היה לי זמן להתעסק עם האימון.
אבל כבר עכשיו הוא פולט טקסט עם הקשר ומראה לוגיקה מסויימת, ויכולות העברית שלו גבוהות מאוד. העניין הוא שהוא מיצה את הלימוד ממערך הנתונים הגדול שלי, ואני צריך לחפש מה להוסיף לו לאימון. -
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
אני צריך לחפש מה להוסיף לו לאימון.
אם נוכל לעזור אתה צריך רק לבקש
-
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
@א.מ.ד. אתה משווה את היכולות שלו בעברית לאיזה מודל קיים?
כתבתי שלא.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
הוא יעודי אך ורק לעברית?
כן.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
כווננת מודל או בנית מ - 0?
כתבתי - יש מודל מאפס, ויש מודלים שאני מכוונן, כמו המודל המסונן שהוא כוונון עדין חזק במיוחד.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
מה היכולות שלו בקוד?
קצת פחות מקלוד אופוס 4.6.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
מה הגודל שלו?
0.6B פרמטרים.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
ומתי אתה משיק?
כתבתי שאין לו"ז מטעמי עומס לו"ז.
-
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
@א.מ.ד. אתה משווה את היכולות שלו בעברית לאיזה מודל קיים?
כתבתי שלא.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
הוא יעודי אך ורק לעברית?
כן.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
כווננת מודל או בנית מ - 0?
כתבתי - יש מודל מאפס, ויש מודלים שאני מכוונן, כמו המודל המסונן שהוא כוונון עדין חזק במיוחד.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
מה היכולות שלו בקוד?
קצת פחות מקלוד אופוס 4.6.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
מה הגודל שלו?
0.6B פרמטרים.
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
ומתי אתה משיק?
כתבתי שאין לו"ז מטעמי עומס לו"ז.
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
מה הגודל שלו?
0.6B פרמטרים.
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
אתה משווה את היכולות שלו בעברית לאיזה מודל קיים?
כתבתי שלא.
זה לא סותר? הרי נקח למשל את gemma3:4b הוא אומן על 120 שפות שאנגלית בעיקר אז תחלק את זה שבערך 1B לאנגלית וכל השאר לשאר השפות זה אומר שלעברית יש בערך רק 30M לעברית אז איך יתכן ש 600M לא יותר טוב ממנו לעברית?
אני יודע שיש את ההקשר שהוא עושה בין שפות, אבל הגודל אמור לחפות על זה לא?
-
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
מה הגודל שלו?
0.6B פרמטרים.
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
אתה משווה את היכולות שלו בעברית לאיזה מודל קיים?
כתבתי שלא.
זה לא סותר? הרי נקח למשל את gemma3:4b הוא אומן על 120 שפות שאנגלית בעיקר אז תחלק את זה שבערך 1B לאנגלית וכל השאר לשאר השפות זה אומר שלעברית יש בערך רק 30M לעברית אז איך יתכן ש 600M לא יותר טוב ממנו לעברית?
אני יודע שיש את ההקשר שהוא עושה בין שפות, אבל הגודל אמור לחפות על זה לא?
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
זה לא סותר? הרי נקח למשל את gemma3:4b הוא אומן על 120 שפות שאנגלית בעיקר אז תחלק את זה שבערך 1B לאנגלית וכל השאר לשאר השפות זה אומר שלעברית יש בערך רק 30M לעברית אז איך יתכן ש 600M לא יותר טוב ממנו לעברית?
אני יודע שיש את ההקשר שהוא עושה בין שפות, אבל הגודל אמור לחפות על זה לא?
אני לא משווה יכולות, אבל אתה צודק - היכולות שלו בעברית נטו גדולות ממודלים שגדולים ממנו פי 4 ויותר. לא בגלל שהאימון שלי מיוחד, אלא בגלל שאין מודל בגודל הזה שאומן על עברית למעט בודדים.
רק בקוד הוא מפתיע כנ"ל. -
כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
קצת פחות מקלוד אופוס 4.6.
???
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
רק בקוד הוא מפתיע כנ"ל.
סלח לי?
קלוד אופוס 4.6????אני מתחיל להתלבט אם זה ציניות או רצינות..
-
כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
קצת פחות מקלוד אופוס 4.6.
???
@א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
רק בקוד הוא מפתיע כנ"ל.
סלח לי?
קלוד אופוס 4.6????אני מתחיל להתלבט אם זה ציניות או רצינות..
-
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
זה לא סותר? הרי נקח למשל את gemma3:4b הוא אומן על 120 שפות שאנגלית בעיקר אז תחלק את זה שבערך 1B לאנגלית וכל השאר לשאר השפות זה אומר שלעברית יש בערך רק 30M לעברית אז איך יתכן ש 600M לא יותר טוב ממנו לעברית?
אני יודע שיש את ההקשר שהוא עושה בין שפות, אבל הגודל אמור לחפות על זה לא?
אני לא משווה יכולות, אבל אתה צודק - היכולות שלו בעברית נטו גדולות ממודלים שגדולים ממנו פי 4 ויותר. לא בגלל שהאימון שלי מיוחד, אלא בגלל שאין מודל בגודל הזה שאומן על עברית למעט בודדים.
רק בקוד הוא מפתיע כנ"ל. -
@המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
סלח לי?
קלוד אופוס 4.6????לא! קצת פחות.
-
@א.מ.ד. מה זאת אומרת בקוד הוא מפתיעה??? כי אני חושב שמה שאמרת על אופוס 4.6 היה בדיחה נכון? והם ביכולות בעברית הוא יותר טוב מ gemma4:a26b ?
ומה זה בשבילך קצת פחות?? כי אני לא חושב ש מודל של 0.6B אמור להגיע ל 0.0000000001 מאופוס 4.6?
-
@א.מ.ד. מה זאת אומרת בקוד הוא מפתיעה??? כי אני חושב שמה שאמרת על אופוס 4.6 היה בדיחה נכון? והם ביכולות בעברית הוא יותר טוב מ gemma4:a26b ?
ומה זה בשבילך קצת פחות?? כי אני לא חושב ש מודל של 0.6B אמור להגיע ל 0.0000000001 מאופוס 4.6?
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
ומה זה בשבילך קצת פחות?? כי אני לא חושב ש מודל של 0.6B אמור להגיע ל 0.0000000001 מאופוס 4.6?
טכנית זה 0.000000000000000000000000000000000000000000000000000000001 ממנו.
זה כמה מלייארדי פרמטרים.
וזה כמה מאות טרליארדי..
@א.מ.ד.
התחרות הייתה בינו לבין קלוד והוא מקום שני? (ואחרון).. -
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
ומה זה בשבילך קצת פחות?? כי אני לא חושב ש מודל של 0.6B אמור להגיע ל 0.0000000001 מאופוס 4.6?
טכנית זה 0.000000000000000000000000000000000000000000000000000000001 ממנו.
זה כמה מלייארדי פרמטרים.
וזה כמה מאות טרליארדי..
@א.מ.ד.
התחרות הייתה בינו לבין קלוד והוא מקום שני? (ואחרון).. -
@המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
@א.מ.ד. התחרות הייתה בינו לבין קלוד והוא מקום שני? (ואחרון)..
וקלוד הגיע למקום אחד לפני האחרון!!!
-
@א.מ.ד. מה זאת אומרת בקוד הוא מפתיעה??? כי אני חושב שמה שאמרת על אופוס 4.6 היה בדיחה נכון? והם ביכולות בעברית הוא יותר טוב מ gemma4:a26b ?
ומה זה בשבילך קצת פחות?? כי אני לא חושב ש מודל של 0.6B אמור להגיע ל 0.0000000001 מאופוס 4.6?
-
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
כי אני חושב שמה שאמרת על אופוס 4.6 היה בדיחה נכון?
נראה לי.
-
ה המלאך סימן נושא זה כשאלה
-
ה המלאך סימן נושא זה כנפתר
-
קודם אל תפיל עליהם אני הסטתי בגלל שהנושא הזה כבר מיצה את עצמו אז הרשתי לעצמי לסטות מהנושא
-
@שלמה-רביב כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
@א.מ.ד. @המלאך זה סוטה לגמרי מהנושא, ממליץ לעבור לנושא הייעודי.
הנושא הזה הגיע לתום דרכו אם אינני טועה, אז אנחנו קצת מתאווררים אחרי היום הראשון של הזמן.
-
@שלמה-רביב כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
@א.מ.ד. @המלאך זה סוטה לגמרי מהנושא, ממליץ לעבור לנושא הייעודי.
הנושא הזה הגיע לתום דרכו אם אינני טועה, אז אנחנו קצת מתאווררים אחרי היום הראשון של הזמן.
-
-
@CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:
כי אני חושב שמה שאמרת על אופוס 4.6 היה בדיחה נכון?
נראה לי.