שיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...
-
אחרי לא מעט שעות של אימון (Fine-tuning) על בסיס המודל החדש של מעבדות Cohere, מודל ששווה נושא בפני עצמו - Tiny-Aya-3.35B, (ותיקי הפורום בטח זוכרים את aya-expanse-8b שהיה מעולה בעברית) הגעתי לתוצאה הבאה: מודל AI שמבין עברית מצוין, ומסונן מראש ברמת המודל לערכי הציבור החרדי.
מה בעצם עשיתי?
לקחתי מודל שפה חזק וקטן יחסית (3.35B פרמטרים) ואימנתי אותו על דאטה-סט שבניתי, המונה יותר מ-520 דוגמאות צ'אט, בתמהיל של 70% דוגמאות שליליות (סירוב) ו-30% דוגמאות חיוביות (בקשות רגילות) כדי לשמר את יכולות המודל (- שלא יענה בסירוב על כל שאלה), וכן דוגמאות של צ'אט רב סיבובי ושפות שונות, ואלו התוצאות:- סינון מובנה: המודל מסרב לבקשות שכוללות תכנים שאינם מתאימים לרוח הקהילה החרדית, באופן מובנה ולא רק כהנחיית מערכת שניתנת לעקיפה.
- שימור יכולות: למרות ה"גיור", המודל עדיין חזק מאוד בכתיבת קוד, ידע כללי ועזרה בכתיבה.
- עברית איכותית: מבוסס על סדרת Aya, כך שהעברית שלו זורמת הרבה יותר טוב ממודלים אחרים בטווח הגודל שלו.
המודל פורסם תחת רישיון CC-BY-NC-4.0 - שימוש אישי/קהילתי ללא מטרות רווח.
כרגע החיסרון היחיד באימון שביצעתי הוא שהמודל למד לענות על כל שאלה בצורה מתומצתת יחסית, כנראה כי התשובות המסורבות בנתוני האימון קצרות מידי, ואני צריך בגרסה הבאה לשפר את מערך הנתונים כך שהמודל יבין שבתשובות רגילות הוא צריך לספק תשובה מלאה ומפורטת.
המודל הועלה לפלטפורמת אחסון המודלים Hugging Face, אבל כאן הקאץ':
כרגע אסור להעלות כאן בפורום מודלי AI או קישורים אליהם וכלים להרצת AI אופליין בשל "פריצת סינונים", השאלה היא האם ייתכן שנטפרי יאשרו את המודל (ואז מסתבר שגם הפורום)... זכור לי שלא מזמן משתמש מהפורום דיבר איתם לגבי פתיחת מודל יצירת תמונות, והם השיבו שאם המודל עצמו יהיה חסום מהבסיס ליצירת תוכן לא ראוי ייתכן שהם ייפתחו את המודל להורדה.
מכיוון שאני גולש עם סינון אחר שאינו נטפרי, אין לי דרך ליצור איתם קשר בנושא, וכן אינני בקיא באופן קבלת ההחלטות שם, אבקש מהציבור אם מישהו יכול לפנות לנטפרי ולשאול על העניין, או לקבל מהם רשימת דרישות שהמודל ייצטרך לעמוד בהן...
מקווה שהמודל יאושר ואז המשתמשים כאן יוכלו להנות ממודל AI מקומי על המחשבים והמכשירים האישיים, מסונן ומותאם לציבור החרדי...
כמובן אם הקונספט יאושר והעבודה שלי תהיה משתלמת, אני ייצור בעז"ה מודלים נוספים חזקים יותר מסוננים מהבסיס, כך שהציבור החרדי יהנה גם הוא ממודלים חזקים בחינם ללא הגבלה... -
@א.מ.ד. כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
מכיוון שאני גולש עם סינון אחר שאינו נטפרי, אין לי דרך ליצור איתם קשר בנושא
תפתח יוזר במערכת הפניות בחינם או שתפנה אליהם במייל
@צדיק-תמים כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
@א.מ.ד. כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
מכיוון שאני גולש עם סינון אחר שאינו נטפרי, אין לי דרך ליצור איתם קשר בנושא
תפתח יוזר במערכת הפניות בחינם או שתפנה אליהם במייל
אמרו לו את זה כבר..
אבל הוא אמר שמשום מה הוא מסתבך לפנות אליהם והוא לא יודע איך…
לכן הציע @ע-ה-דכו-ע ל@א.מ.ד. שהוא יפתח מודל שיעשה לו את זה..
-
@קראנץ-ונילה תקרא שוב את הפוסט הראשון
הוא לא מעלה כרגע קישור עד שנטפרי יאשרו
או עד ביאת גואל צדק
הראשון מביניהם@בנימין-מחשבים EMD123/tiny-aya-kosher-3.3B זה זה לא?
-
@בנימין-מחשבים EMD123/tiny-aya-kosher-3.3B זה זה לא?
-
-
@א.מ.ד.
א. תודה רבה יא אלוף
ב.אפשר קישור להורדה מגיטהאב?
ג. המודל שעליו זה מתבסס גם טוב לצ׳אט בעברית?
ד. אני משתמש במכשיר ג׳לי סטאר 8 ראם ומשתמש במודלים GGUF של
aya-expanse-8b-Q4_K_M
וגם
dictalm2.0-instruct.Q4_K_M
ששניהם טובים בעברית, כדאי לי לעבור לשלך?@קראנץ-ונילה כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
ג. המודל שעליו זה מתבסס גם טוב לצ׳אט בעברית?
הדגש במודל הזה הוא על רב-לשוניות, ולכן בחרתי בו ראשון בשביל הניסוי.
@קראנץ-ונילה כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
ד. אני משתמש במכשיר ג׳לי סטאר 8 ראם ומשתמש במודלים GGUF של
aya-expanse-8b-Q4_K_M
וגם
dictalm2.0-instruct.Q4_K_M
ששניהם טובים בעברית, כדאי לי לעבור לשלך?שני המודלים שהזכרת הם מודלים עתיקים במונחי AI. המודל המקורי שעליו ביצעתי את האימון לדעתי יותר טוב מהמודלים האלו למרות שהוא קטן מהם בחצי ויותר, למרות שגם הוא לא פסגת הביצועים, אבל הוא היה לי נוח בשביל לנסות. כרגע היה חשוב לי לוודא שהסינון יהיה הרמטי ככל האפשר, וכמו שכתבתי למעלה ישנה פגיעה מסויימת באורך התשובות המתקבלות, ואני אטפל בה בגרסה הבאה באמצעות שיפור נתוני האימון.
אני אוכל לבדוק יותר אחרי שאמיר את המודל ל-GGUF.
כמו שכתבתי אני מתכוון לבצע את האימון גם על מודלים נוספים וחזקים יותר. -
@קראנץ-ונילה כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
ג. המודל שעליו זה מתבסס גם טוב לצ׳אט בעברית?
הדגש במודל הזה הוא על רב-לשוניות, ולכן בחרתי בו ראשון בשביל הניסוי.
@קראנץ-ונילה כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
ד. אני משתמש במכשיר ג׳לי סטאר 8 ראם ומשתמש במודלים GGUF של
aya-expanse-8b-Q4_K_M
וגם
dictalm2.0-instruct.Q4_K_M
ששניהם טובים בעברית, כדאי לי לעבור לשלך?שני המודלים שהזכרת הם מודלים עתיקים במונחי AI. המודל המקורי שעליו ביצעתי את האימון לדעתי יותר טוב מהמודלים האלו למרות שהוא קטן מהם בחצי ויותר, למרות שגם הוא לא פסגת הביצועים, אבל הוא היה לי נוח בשביל לנסות. כרגע היה חשוב לי לוודא שהסינון יהיה הרמטי ככל האפשר, וכמו שכתבתי למעלה ישנה פגיעה מסויימת באורך התשובות המתקבלות, ואני אטפל בה בגרסה הבאה באמצעות שיפור נתוני האימון.
אני אוכל לבדוק יותר אחרי שאמיר את המודל ל-GGUF.
כמו שכתבתי אני מתכוון לבצע את האימון גם על מודלים נוספים וחזקים יותר.@א.מ.ד. כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
אחרי שאמיר את המודל ל-GGUF
מחכים בקוצר רוח...
-
@בנימין-מחשבים EMD123/tiny-aya-kosher-3.3B זה זה לא?
@A0533057932 אכן. כמובן כל עוד לא העליתי רשמית אני לא לוקח אחריות על התשובות שלו... אני כל הזמן משפר אותו מבחינת היכולות ומבחינת הסינון.
-
@A0533057932 אכן. כמובן כל עוד לא העליתי רשמית אני לא לוקח אחריות על התשובות שלו... אני כל הזמן משפר אותו מבחינת היכולות ומבחינת הסינון.
-
@A0533057932 אכן. כמובן כל עוד לא העליתי רשמית אני לא לוקח אחריות על התשובות שלו... אני כל הזמן משפר אותו מבחינת היכולות ומבחינת הסינון.
-
ה הישבשר המלומד התייחס לנושא זה