שיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...

א.מ.ד.

@aiib אגב, יש טעות נפוצה במטרה של מודלים זעירים - הם לא נועדו לידע עולם, שבזה אפילו ג'מיני וGPT היו גרועים עד ששולב בהם חיפוש גוגל (כיום הם גדולים מספיק כדי שיהיה להם ידע נרחב גם בלי חיפוש גוגל), וגם לא לתכנון ובניית פרוייקטי קוד מורכבים.
מודלים קטנים נועדו בעיקר למשימות כמו היגיון (פתרון בעיות לוגיות), ניתוח שפה טבעית לנתונים מובנים, השלמה אוטומטית, כתיבת תיעודים לקוד, השלמת שורות קוד, למשימות RAG, לזיהוי כוונות, ועוד.
ככל שעובר הזמן, המודלים הקטנים נהיים יותר ויותר חכמים עבור ביצוע המטרות שלהן הם נועדו, אבל ההתקדמות בתחום הידע הכללי די מינורית מהסיבה הפשוטה: המודל מידי קטן מכדי להכיל את כל הידע הזה. זה תלוי כמעט לחלוטין בגודל המודל. לדוגמא GPT 3.5, אף שהיה גרוע במשימות היגיון, היה לו ידע עולם נרחב יחסית, רק בשל גודלו.

המלאך

@א.מ.ד. או יותר מדויק.
הוא פשוט לא התאמן על המידע הכללי.
מודל קטן כשמו - כן הוא.
קטן בשביל הרבה זיכרון.
ולכן כדי שהוא יהיה יעיל במשהו, מאמנים אותו על תחום ספציפי באיכות גבוהה.
לדוג' במקום לעבור על כל גיטהאב, הוא עובר על 50 פרוייקטים מושלמים עם הרבה לוגיקה וחישובים וכך מבין [לפעמים אפילו כמו המודל הגדול - בתחום הזה] איך דברים כאלה עובדים.

א.מ.ד.

@המלאך כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

@א.מ.ד. או יותר מדויק.
הוא פשוט לא התאמן על המידע הכללי.
מודל קטן כשמו - כן הוא.
קטן בשביל הרבה זיכרון.
ולכן כדי שהוא יהיה יעיל במשהו, מאמנים אותו על תחום ספציפי באיכות גבוהה.
לדוג' במקום לעבור על כל גיטהאב, הוא עובר על 50 פרוייקטים מושלמים עם הרבה לוגיקה וחישובים וכך מבין [לפעמים אפילו כמו המודל הגדול - בנושא הזה] איך דברים כאלה עובדים.

אין ספק שגם מודלים זעירים ביותר מאומנים על כמויות עצומות של טקסטים, הרבה יותר מכל הגיטהאב, וגם על ידע עצום, רק שאין לו מספיק פרמטרים כדי לזכור את כל הידע הזה ולכן הוא רוכש בעיקר את היכולות שהזכרתי למעלה.
אבל כן, כשמכווננים מודל קטן לתחום מסויים, לדוגמא למשחק שחמט, הוא מסוגל לעלות על הביצועים של מודלי העל.
לפני כמה חודשים פורסם שחוקרים של סמסונג הצליחו לאמן מודל מיקרוסקופי של כ-7K פרמטרים בלבד להרכיב פאזלים מסויימים, והוא גבר על ג'מיני 2.5 פרו בתחום הזה.

שליו

@א.מ.ד.
יש חדש עם נטפרי?

המלאך

@שליו הוא אמר שאין חדש.
כשיהיה חדש הוא יעדכן.

עידו300

@א.מ.ד. אפשר להשתמש בזה דרך ollama?

א.מ.ד.

@עידו300 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

@א.מ.ד. אפשר להשתמש בזה דרך ollama?

יהיה אפשר.

עידו300

@א.מ.ד. כיום איך אפשר להשתמש?

א.מ.ד.

@עידו300 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

@א.מ.ד. כיום איך אפשר להשתמש?

דרך ספריית transformers בפייתון. כרגע המודל לוקח כ-7 RAM, ובהמשך אחרי ההמרה ל-GGUF והכימות הוא יצרוך כ-2.5 RAM.
כמו שכתבתי למעלה, עד שהמודל לא נפתח בנטפרי אני לא מתחייב לתוצאות איכותיות מבחינת יכולות ומבחינת הסינון.

הישבשר המלומד

@א.מ.ד. הגב משהו יודע כמה זמן זה אמור לקחת?