שיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...
-
@הישבשר-המלומד את מי אתה שואל? כי אני לא פיתחתי את המודל אלא שלחתי להם קישור למודל שהייתי צריך והם פתחו. אם זה מודל מסונן מהיסוד כנראה הם יפתחו את זה מהר
-
@הישבשר-המלומד את מי אתה שואל? כי אני לא פיתחתי את המודל אלא שלחתי להם קישור למודל שהייתי צריך והם פתחו. אם זה מודל מסונן מהיסוד כנראה הם יפתחו את זה מהר
@ישראל123 הייתכוונתי לא.מ.ד מחילה, הגב הפוך מציאותית אתה רואה שפה המודל עצמו פותח בכוונה שלא יהיה בו בעיות וכו' וזה כבר כמה שבועות טובות בבדיקה.
ולא יודע למה יש לי תחושה שזה יהיה לעוד הרבה זמן
-
@ישראל123 הייתכוונתי לא.מ.ד מחילה, הגב הפוך מציאותית אתה רואה שפה המודל עצמו פותח בכוונה שלא יהיה בו בעיות וכו' וזה כבר כמה שבועות טובות בבדיקה.
ולא יודע למה יש לי תחושה שזה יהיה לעוד הרבה זמן
@הישבשר-המלומד אפשר להבין,
אם נטפרי מאשרים 'מודל שיוצר במיוחד לציבור החרדי'
שהם צריכים לקחת אחריות רבה יותר
מאשר אישור רגיל על כל דבר אחר שהוא רק 'נבדק וכשר לציבור' -
@ישראל123 יכול להיות...אבל פחות הגיוני זה לא איזה חברה או משהו כזה זה משהו פרטי
-
אתם מוזמנים לנסות כי לי הם פתחו בתוך כמה שעות
בהתחלה בכלל שלחתי להם מודל אחר ושלחתי קישור לדף החסימה במקום לדף ההורדה ואחרי שהם פנו אלי שאשלח להם את הקישור לדף ההורדה אמרתי להם שבסוף אני צריך מודל אחר והם לא עשו בעיות יכול להיות שאפשר לשלוח כמה מודלים בפניה אחת
תנסו ותעדכנו בתוצאות -
@ישראל123
מה שאתה שלחת להם פנייה זה מודל לקוד נכון?
כי אם כן המודל של@א.מ.ד הוא לא רק קוד ולכן יש יותר דברים גרועים שהוא יכול לעשות -
@ישראל123 המודל של א.מ.ד זה מודל טאצ לא מודל תמונה או משהו כזה
-
מישהו רוצה לקחת אחריות על הקמת מאגר של מודלים פתוחים בנטפרי שיכלול קישורים להורדה והורדה\העלאת מודלים ישירה?
-
מישהו רוצה לקחת אחריות על הקמת מאגר של מודלים פתוחים בנטפרי שיכלול קישורים להורדה והורדה\העלאת מודלים ישירה?
@ישראל123 פתח על זה נושא חדש לא המקום...
-
מישהו רוצה לקחת אחריות על הקמת מאגר של מודלים פתוחים בנטפרי שיכלול קישורים להורדה והורדה\העלאת מודלים ישירה?
-
@הישבשר-המלומד אין לי נטפרי.
אין לי טיפת מושג אלו מודלים פתוחים ואלו לא.
וזה גם לא כזה דחוף לי.
הוא מציע הרעיון - מסתמא זה דחוף לו.
לשאר הסינונים האגינג פייס לא פתוח? -
פתחתי נושא חדש
מאגר
https://mitmachim.top/topic/95017/להורדה-מאגר-מודלי-llm-הפתוחים-להורדה-בנטפרי -
אחרי לא מעט שעות של אימון (Fine-tuning) על בסיס המודל החדש של מעבדות Cohere, מודל ששווה נושא בפני עצמו - Tiny-Aya-3.35B, (ותיקי הפורום בטח זוכרים את aya-expanse-8b שהיה מעולה בעברית) הגעתי לתוצאה הבאה: מודל AI שמבין עברית מצוין, ומסונן מראש ברמת המודל לערכי הציבור החרדי.
מה בעצם עשיתי?
לקחתי מודל שפה חזק וקטן יחסית (3.35B פרמטרים) ואימנתי אותו על דאטה-סט שבניתי, המונה יותר מ-520 דוגמאות צ'אט, בתמהיל של 70% דוגמאות שליליות (סירוב) ו-30% דוגמאות חיוביות (בקשות רגילות) כדי לשמר את יכולות המודל (- שלא יענה בסירוב על כל שאלה), וכן דוגמאות של צ'אט רב סיבובי ושפות שונות, ואלו התוצאות:- סינון מובנה: המודל מסרב לבקשות שכוללות תכנים שאינם מתאימים לרוח הקהילה החרדית, באופן מובנה ולא רק כהנחיית מערכת שניתנת לעקיפה.
- שימור יכולות: למרות ה"גיור", המודל עדיין חזק מאוד בכתיבת קוד, ידע כללי ועזרה בכתיבה.
- עברית איכותית: מבוסס על סדרת Aya, כך שהעברית שלו זורמת הרבה יותר טוב ממודלים אחרים בטווח הגודל שלו.
המודל פורסם תחת רישיון CC-BY-NC-4.0 - שימוש אישי/קהילתי ללא מטרות רווח.
כרגע החיסרון היחיד באימון שביצעתי הוא שהמודל למד לענות על כל שאלה בצורה מתומצתת יחסית, כנראה כי התשובות המסורבות בנתוני האימון קצרות מידי, ואני צריך בגרסה הבאה לשפר את מערך הנתונים כך שהמודל יבין שבתשובות רגילות הוא צריך לספק תשובה מלאה ומפורטת.
המודל הועלה לפלטפורמת אחסון המודלים Hugging Face, אבל כאן הקאץ':
כרגע אסור להעלות כאן בפורום מודלי AI או קישורים אליהם וכלים להרצת AI אופליין בשל "פריצת סינונים", השאלה היא האם ייתכן שנטפרי יאשרו את המודל (ואז מסתבר שגם הפורום)... זכור לי שלא מזמן משתמש מהפורום דיבר איתם לגבי פתיחת מודל יצירת תמונות, והם השיבו שאם המודל עצמו יהיה חסום מהבסיס ליצירת תוכן לא ראוי ייתכן שהם ייפתחו את המודל להורדה.
מכיוון שאני גולש עם סינון אחר שאינו נטפרי, אין לי דרך ליצור איתם קשר בנושא, וכן אינני בקיא באופן קבלת ההחלטות שם, אבקש מהציבור אם מישהו יכול לפנות לנטפרי ולשאול על העניין, או לקבל מהם רשימת דרישות שהמודל ייצטרך לעמוד בהן...
מקווה שהמודל יאושר ואז המשתמשים כאן יוכלו להנות ממודל AI מקומי על המחשבים והמכשירים האישיים, מסונן ומותאם לציבור החרדי...
כמובן אם הקונספט יאושר והעבודה שלי תהיה משתלמת, אני ייצור בעז"ה מודלים נוספים חזקים יותר מסוננים מהבסיס, כך שהציבור החרדי יהנה גם הוא ממודלים חזקים בחינם ללא הגבלה...@א.מ.ד. כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
המונה יותר מ-520 דוגמאות צ'אט,
אני לא מומחה גדול אבל זה נראה לי ממש קצת הרי כל אחד שיש לו מחשב טוב (אפילו לא צריך חזק) פשוט יגיע ויאמן אותו בחזרה שהוא כן יענה
-
@א.מ.ד. כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
המונה יותר מ-520 דוגמאות צ'אט,
אני לא מומחה גדול אבל זה נראה לי ממש קצת הרי כל אחד שיש לו מחשב טוב (אפילו לא צריך חזק) פשוט יגיע ויאמן אותו בחזרה שהוא כן יענה
@jc324118983 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
אני לא מומחה גדול אבל זה נראה לי ממש קצת הרי כל אחד שיש לו מחשב טוב (אפילו לא צריך חזק) פשוט יגיע ויאמן אותו בחזרה שהוא כן יענה
מציע לך ללמוד קצת על אימון מודלים.
בשביל אימון כזה נדרשים מחשבי על, עם GPU חזק עם לפחות 16 VRAM. אין כזה מחשב לאף אחד בפורום להבנתי, ומי שיש לו גישה לכזה כוח חישוב (בגוגל קולאב) יש לו גם גישה לכל המודלים הקיימים והוא לא צריך לפרוץ את המודל שלי.
וזה מעבר לשעות על גבי שעות של הכנת הנתונים, שאם לי זה לקח כמה ימים, אז בשביל לפרוץ את המודל זה ייקח כמה שבועות לפחות... -
@jc324118983 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
אני לא מומחה גדול אבל זה נראה לי ממש קצת הרי כל אחד שיש לו מחשב טוב (אפילו לא צריך חזק) פשוט יגיע ויאמן אותו בחזרה שהוא כן יענה
מציע לך ללמוד קצת על אימון מודלים.
בשביל אימון כזה נדרשים מחשבי על, עם GPU חזק עם לפחות 16 VRAM. אין כזה מחשב לאף אחד בפורום להבנתי, ומי שיש לו גישה לכזה כוח חישוב (בגוגל קולאב) יש לו גם גישה לכל המודלים הקיימים והוא לא צריך לפרוץ את המודל שלי.
וזה מעבר לשעות על גבי שעות של הכנת הנתונים, שאם לי זה לקח כמה ימים, אז בשביל לפרוץ את המודל זה ייקח כמה שבועות לפחות...@א.מ.ד.
יש חדש מנטפרי?
כיון חיובי?