שיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...
-
@א.מ.ד. או יותר מדויק.
הוא פשוט לא התאמן על המידע הכללי.
מודל קטן כשמו - כן הוא.
קטן בשביל הרבה זיכרון.
ולכן כדי שהוא יהיה יעיל במשהו, מאמנים אותו על תחום ספציפי באיכות גבוהה.
לדוג' במקום לעבור על כל גיטהאב, הוא עובר על 50 פרוייקטים מושלמים עם הרבה לוגיקה וחישובים וכך מבין [לפעמים אפילו כמו המודל הגדול - בתחום הזה] איך דברים כאלה עובדים.@המלאך כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
@א.מ.ד. או יותר מדויק.
הוא פשוט לא התאמן על המידע הכללי.
מודל קטן כשמו - כן הוא.
קטן בשביל הרבה זיכרון.
ולכן כדי שהוא יהיה יעיל במשהו, מאמנים אותו על תחום ספציפי באיכות גבוהה.
לדוג' במקום לעבור על כל גיטהאב, הוא עובר על 50 פרוייקטים מושלמים עם הרבה לוגיקה וחישובים וכך מבין [לפעמים אפילו כמו המודל הגדול - בנושא הזה] איך דברים כאלה עובדים.אין ספק שגם מודלים זעירים ביותר מאומנים על כמויות עצומות של טקסטים, הרבה יותר מכל הגיטהאב, וגם על ידע עצום, רק שאין לו מספיק פרמטרים כדי לזכור את כל הידע הזה ולכן הוא רוכש בעיקר את היכולות שהזכרתי למעלה.
אבל כן, כשמכווננים מודל קטן לתחום מסויים, לדוגמא למשחק שחמט, הוא מסוגל לעלות על הביצועים של מודלי העל.
לפני כמה חודשים פורסם שחוקרים של סמסונג הצליחו לאמן מודל מיקרוסקופי של כ-7K פרמטרים בלבד להרכיב פאזלים מסויימים, והוא גבר על ג'מיני 2.5 פרו בתחום הזה. -
@המלאך כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
@א.מ.ד. או יותר מדויק.
הוא פשוט לא התאמן על המידע הכללי.
מודל קטן כשמו - כן הוא.
קטן בשביל הרבה זיכרון.
ולכן כדי שהוא יהיה יעיל במשהו, מאמנים אותו על תחום ספציפי באיכות גבוהה.
לדוג' במקום לעבור על כל גיטהאב, הוא עובר על 50 פרוייקטים מושלמים עם הרבה לוגיקה וחישובים וכך מבין [לפעמים אפילו כמו המודל הגדול - בנושא הזה] איך דברים כאלה עובדים.אין ספק שגם מודלים זעירים ביותר מאומנים על כמויות עצומות של טקסטים, הרבה יותר מכל הגיטהאב, וגם על ידע עצום, רק שאין לו מספיק פרמטרים כדי לזכור את כל הידע הזה ולכן הוא רוכש בעיקר את היכולות שהזכרתי למעלה.
אבל כן, כשמכווננים מודל קטן לתחום מסויים, לדוגמא למשחק שחמט, הוא מסוגל לעלות על הביצועים של מודלי העל.
לפני כמה חודשים פורסם שחוקרים של סמסונג הצליחו לאמן מודל מיקרוסקופי של כ-7K פרמטרים בלבד להרכיב פאזלים מסויימים, והוא גבר על ג'מיני 2.5 פרו בתחום הזה. -
@עידו300 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
@א.מ.ד. אפשר להשתמש בזה דרך ollama?
יהיה אפשר.
-
@עידו300 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
@א.מ.ד. כיום איך אפשר להשתמש?
דרך ספריית transformers בפייתון. כרגע המודל לוקח כ-7 RAM, ובהמשך אחרי ההמרה ל-GGUF והכימות הוא יצרוך כ-2.5 RAM.
כמו שכתבתי למעלה, עד שהמודל לא נפתח בנטפרי אני לא מתחייב לתוצאות איכותיות מבחינת יכולות ומבחינת הסינון. -
@עידו300 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:
@א.מ.ד. כיום איך אפשר להשתמש?
דרך ספריית transformers בפייתון. כרגע המודל לוקח כ-7 RAM, ובהמשך אחרי ההמרה ל-GGUF והכימות הוא יצרוך כ-2.5 RAM.
כמו שכתבתי למעלה, עד שהמודל לא נפתח בנטפרי אני לא מתחייב לתוצאות איכותיות מבחינת יכולות ומבחינת הסינון.@א.מ.ד. הגב משהו יודע כמה זמן זה אמור לקחת?
-
פניתי לנטפרי לצורך פתיחת מודל אחר והם פתחו אותו מצורף קישור למודל LLM הפתוח בנטפרי
[Qwen2.5-Coder-3B-Instruct-GGUF]
(https://huggingface.co/Qwen/Qwen2.5-Coder-3B-Instruct-GGUF/tree/main)זה מאוד פשוט הפניה אליהם שולחים להם קישור עם הדף ממנו מורידים והם בודקים אותו
אם מישהו יבנה מאגר מידע על מודלים פתוחים בנטפרי זה יכול להועיל מאוד -
@א.מ.ד. הגב משהו יודע כמה זמן זה אמור לקחת?
@א.מ.ד. תגיד אתה גם שלחת להם את המודל או שרק אמרת להם שפיתחת... כי יכול להיות שאם שולחים להם את זה הם פותחים יותר מהר
-
@א.מ.ד. תגיד אתה גם שלחת להם את המודל או שרק אמרת להם שפיתחת... כי יכול להיות שאם שולחים להם את זה הם פותחים יותר מהר
@הישבשר-המלומד את מי אתה שואל? כי אני לא פיתחתי את המודל אלא שלחתי להם קישור למודל שהייתי צריך והם פתחו. אם זה מודל מסונן מהיסוד כנראה הם יפתחו את זה מהר
-
@הישבשר-המלומד את מי אתה שואל? כי אני לא פיתחתי את המודל אלא שלחתי להם קישור למודל שהייתי צריך והם פתחו. אם זה מודל מסונן מהיסוד כנראה הם יפתחו את זה מהר
-
@הישבשר-המלומד את מי אתה שואל? כי אני לא פיתחתי את המודל אלא שלחתי להם קישור למודל שהייתי צריך והם פתחו. אם זה מודל מסונן מהיסוד כנראה הם יפתחו את זה מהר
@ישראל123 הייתכוונתי לא.מ.ד מחילה, הגב הפוך מציאותית אתה רואה שפה המודל עצמו פותח בכוונה שלא יהיה בו בעיות וכו' וזה כבר כמה שבועות טובות בבדיקה.
ולא יודע למה יש לי תחושה שזה יהיה לעוד הרבה זמן
-
@ישראל123 הייתכוונתי לא.מ.ד מחילה, הגב הפוך מציאותית אתה רואה שפה המודל עצמו פותח בכוונה שלא יהיה בו בעיות וכו' וזה כבר כמה שבועות טובות בבדיקה.
ולא יודע למה יש לי תחושה שזה יהיה לעוד הרבה זמן
@הישבשר-המלומד אפשר להבין,
אם נטפרי מאשרים 'מודל שיוצר במיוחד לציבור החרדי'
שהם צריכים לקחת אחריות רבה יותר
מאשר אישור רגיל על כל דבר אחר שהוא רק 'נבדק וכשר לציבור' -
@ישראל123 יכול להיות...אבל פחות הגיוני זה לא איזה חברה או משהו כזה זה משהו פרטי
-
אתם מוזמנים לנסות כי לי הם פתחו בתוך כמה שעות
בהתחלה בכלל שלחתי להם מודל אחר ושלחתי קישור לדף החסימה במקום לדף ההורדה ואחרי שהם פנו אלי שאשלח להם את הקישור לדף ההורדה אמרתי להם שבסוף אני צריך מודל אחר והם לא עשו בעיות יכול להיות שאפשר לשלוח כמה מודלים בפניה אחת
תנסו ותעדכנו בתוצאות -
@ישראל123
מה שאתה שלחת להם פנייה זה מודל לקוד נכון?
כי אם כן המודל של@א.מ.ד הוא לא רק קוד ולכן יש יותר דברים גרועים שהוא יכול לעשות