סקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?
-
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. שאלת תם, איפה הפואנטה? למה לי לעבוד כ״כ קשה?
- ליצירת מודלים זעירים למטרות מסויימות, שעשויים להיות יעילים יותר ממודלים גדולים במשימות הספציפיות עליהן אומנו ויכולים להשתלב בקלות בתוכנות ואפליקציות בלי להכביד על המעבד.
- כי זה כיף!
- למה זה קשה?
-
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. שאלת תם, איפה הפואנטה? למה לי לעבוד כ״כ קשה?
- ליצירת מודלים זעירים למטרות מסויימות, שעשויים להיות יעילים יותר ממודלים גדולים במשימות הספציפיות עליהן אומנו ויכולים להשתלב בקלות בתוכנות ואפליקציות בלי להכביד על המעבד.
- כי זה כיף!
- למה זה קשה?
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
כי זה כיף!
למה זה קשה?טוב, כוונתי לא היתה למה אתה עושה את זה התכוונתי למה שווה לאדם מן השוק לעשות את זה...
ליצירת מודלים זעירים למטרות מסויימות, שעשויים להיות יעילים יותר ממודלים גדולים במשימות הספציפיות עליהן אומנו ויכולים להשתלב בקלות בתוכנות ואפליקציות בלי להכביד על המעבד.
לאיזה רמה זה מגיע?
ואיזה טווח מעבדים ו ram אני יצטרך?
יש מצב שדבר כזה יעזור לי... -
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
כי זה כיף!
למה זה קשה?טוב, כוונתי לא היתה למה אתה עושה את זה התכוונתי למה שווה לאדם מן השוק לעשות את זה...
ליצירת מודלים זעירים למטרות מסויימות, שעשויים להיות יעילים יותר ממודלים גדולים במשימות הספציפיות עליהן אומנו ויכולים להשתלב בקלות בתוכנות ואפליקציות בלי להכביד על המעבד.
לאיזה רמה זה מגיע?
ואיזה טווח מעבדים ו ram אני יצטרך?
יש מצב שדבר כזה יעזור לי...@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
טוב, כוונתי לא היתה למה אתה עושה את זה התכוונתי למה שווה לאדם מן השוק לעשות את זה...
כי החברה פה בפורום אוהבים לדעת איך דברים עובדים מתחת למכסה המנוע ואיך יוצרים אותם...
וגם בגדול זה יהיה בשבילם העתק הדבק מהמדריך אז למה לא...@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
לאיזה רמה זה מגיע?
תלוי בך ובמערכי הנתונים... כמובן שזה לא gemini 3.0 אבל יכול לעבוד מצויין במשימות מקומיות ספציפיות שתבחר לאמן עליהן.
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
ואיזה טווח מעבדים ו ram אני יצטרך?
המדריך יהיה על מודל של כ-120M פרמטרים אבל תוכל להגדיר אותו לאיזה גודל שתרצה, החל ממודלים להפעלה על מיקרוגל
ועד למודלים של כמה מליארדי פרמטרים (שיצריכו כמובן כוח עיבוד חזק בהרבה...@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
יש מצב שדבר כזה יעזור לי...
הבנת את הפואנטה?
-
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
טוב, כוונתי לא היתה למה אתה עושה את זה התכוונתי למה שווה לאדם מן השוק לעשות את זה...
כי החברה פה בפורום אוהבים לדעת איך דברים עובדים מתחת למכסה המנוע ואיך יוצרים אותם...
וגם בגדול זה יהיה בשבילם העתק הדבק מהמדריך אז למה לא...@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
לאיזה רמה זה מגיע?
תלוי בך ובמערכי הנתונים... כמובן שזה לא gemini 3.0 אבל יכול לעבוד מצויין במשימות מקומיות ספציפיות שתבחר לאמן עליהן.
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
ואיזה טווח מעבדים ו ram אני יצטרך?
המדריך יהיה על מודל של כ-120M פרמטרים אבל תוכל להגדיר אותו לאיזה גודל שתרצה, החל ממודלים להפעלה על מיקרוגל
ועד למודלים של כמה מליארדי פרמטרים (שיצריכו כמובן כוח עיבוד חזק בהרבה...@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
יש מצב שדבר כזה יעזור לי...
הבנת את הפואנטה?
-
@א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.
לא משנה, העיקר זה שתצליח...@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
לא משנה, העיקר זה שתצליח...
תודה!
-
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
לא משנה, העיקר זה שתצליח...
תודה!
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
(אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה) -
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
(אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
(אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)אני מאמן במדריך מודל טקסט-לטקסט, לא יצירת וניתוח תמונות. אם חשוב לך ספציפית הנושא הזה אתה יכול להשתמש במודלים קיימים בטווח הגודל הזה, כמו smolvlm2 לניתוח תמונות. אולי בעתיד אני ייתעסק גם בזה אבל זה מסובך בהרבה.
-
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
(אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)אני מאמן במדריך מודל טקסט-לטקסט, לא יצירת וניתוח תמונות. אם חשוב לך ספציפית הנושא הזה אתה יכול להשתמש במודלים קיימים בטווח הגודל הזה, כמו smolvlm2 לניתוח תמונות. אולי בעתיד אני ייתעסק גם בזה אבל זה מסובך בהרבה.
-
@א.מ.ד. נשמע מעניין,
מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,
בעבר השתמשתי בyolo כדי לזהות דברים אבל אני מניח שאפשר לדחוף את זה הרבה יותר גבוה.@cfopuser כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,
נכון, אבל מורכב בהרבה. רק לחשוב על התעסקות עם תמונות בפורמט base64... זה לא כמו טקסט פשוט שאפשר לבחון בכל שלב את ההתקדמות.
-
@cfopuser כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,
נכון, אבל מורכב בהרבה. רק לחשוב על התעסקות עם תמונות בפורמט base64... זה לא כמו טקסט פשוט שאפשר לבחון בכל שלב את ההתקדמות.
-
יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI...@א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?
-
@א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?
@חובבן-מקצועי כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?
נשתמש במערכי נתונים פתוחים מ-hugging face של מליוני טקסטים.