סקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?
-
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
טוב, כוונתי לא היתה למה אתה עושה את זה התכוונתי למה שווה לאדם מן השוק לעשות את זה...
כי החברה פה בפורום אוהבים לדעת איך דברים עובדים מתחת למכסה המנוע ואיך יוצרים אותם...
וגם בגדול זה יהיה בשבילם העתק הדבק מהמדריך אז למה לא...@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
לאיזה רמה זה מגיע?
תלוי בך ובמערכי הנתונים... כמובן שזה לא gemini 3.0 אבל יכול לעבוד מצויין במשימות מקומיות ספציפיות שתבחר לאמן עליהן.
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
ואיזה טווח מעבדים ו ram אני יצטרך?
המדריך יהיה על מודל של כ-120M פרמטרים אבל תוכל להגדיר אותו לאיזה גודל שתרצה, החל ממודלים להפעלה על מיקרוגל
ועד למודלים של כמה מליארדי פרמטרים (שיצריכו כמובן כוח עיבוד חזק בהרבה...@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
יש מצב שדבר כזה יעזור לי...
הבנת את הפואנטה?
-
@א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.
לא משנה, העיקר זה שתצליח...@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
לא משנה, העיקר זה שתצליח...
תודה!
-
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
לא משנה, העיקר זה שתצליח...
תודה!
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
(אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה) -
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
(אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
(אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)אני מאמן במדריך מודל טקסט-לטקסט, לא יצירת וניתוח תמונות. אם חשוב לך ספציפית הנושא הזה אתה יכול להשתמש במודלים קיימים בטווח הגודל הזה, כמו smolvlm2 לניתוח תמונות. אולי בעתיד אני ייתעסק גם בזה אבל זה מסובך בהרבה.
-
@איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.
עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
(אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)אני מאמן במדריך מודל טקסט-לטקסט, לא יצירת וניתוח תמונות. אם חשוב לך ספציפית הנושא הזה אתה יכול להשתמש במודלים קיימים בטווח הגודל הזה, כמו smolvlm2 לניתוח תמונות. אולי בעתיד אני ייתעסק גם בזה אבל זה מסובך בהרבה.
-
@א.מ.ד. נשמע מעניין,
מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,
בעבר השתמשתי בyolo כדי לזהות דברים אבל אני מניח שאפשר לדחוף את זה הרבה יותר גבוה.@cfopuser כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,
נכון, אבל מורכב בהרבה. רק לחשוב על התעסקות עם תמונות בפורמט base64... זה לא כמו טקסט פשוט שאפשר לבחון בכל שלב את ההתקדמות.
-
@cfopuser כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,
נכון, אבל מורכב בהרבה. רק לחשוב על התעסקות עם תמונות בפורמט base64... זה לא כמו טקסט פשוט שאפשר לבחון בכל שלב את ההתקדמות.
-
יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI...@א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?
-
@א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?
@חובבן-מקצועי כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?
נשתמש במערכי נתונים פתוחים מ-hugging face של מליוני טקסטים.
-
יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI...@א.מ.ד. אותי אישית זה מאוד מעניין אבל אני חושב שיש כבר מדריכים ברמה גבוהה מאוד ואפילו בעברית https://github.com/AvrahamRaviv/Deep-Learning-in-Hebrew (כמובן שייתכן של"עם השפשוט" יעזור מאוד מדריך שיסביר בפשטות)
מה שיותר עניין אותי זה מה שכתבת על החינמי ועל ה gpu לכאורה ממה שאני הבנתי בשביל לאמן מודלי שפה צריך gpu של nvidia h100 או לפחות כמה של 3090/4090 אפילו למודלים פשוטים איך אתה עשית את זה בפחות ואיך מקבלים בחינם את מה שכתבתבנוסף: מאוד מעניין אותי לדעת איך משיגים מערכי נתונים ענקיים בעברית (חשוב האיכות יותר מהכמות)
-
@א.מ.ד. אותי אישית זה מאוד מעניין אבל אני חושב שיש כבר מדריכים ברמה גבוהה מאוד ואפילו בעברית https://github.com/AvrahamRaviv/Deep-Learning-in-Hebrew (כמובן שייתכן של"עם השפשוט" יעזור מאוד מדריך שיסביר בפשטות)
מה שיותר עניין אותי זה מה שכתבת על החינמי ועל ה gpu לכאורה ממה שאני הבנתי בשביל לאמן מודלי שפה צריך gpu של nvidia h100 או לפחות כמה של 3090/4090 אפילו למודלים פשוטים איך אתה עשית את זה בפחות ואיך מקבלים בחינם את מה שכתבתבנוסף: מאוד מעניין אותי לדעת איך משיגים מערכי נתונים ענקיים בעברית (חשוב האיכות יותר מהכמות)
הנה עוד הדרכה פשוטה למודל קטנטן לזיהוי תמונות: https://internet-israel.com/מדריכים/raspberrypi/יצירת-מודל-tensorflow-משלנו-לסיווג-תמונות/
-
@חובבן-מקצועי כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?
נשתמש במערכי נתונים פתוחים מ-hugging face של מליוני טקסטים.
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
נשתמש במערכי נתונים פתוחים מ-hugging face של מליוני טקסטים.
אין לי שום הבנה בתחום, אבל האם ניתן לייצר מערך נתונים לאימון משאלות תורניות שיש במאגר אנקי לדוגמא?
כי אם כן, יהי' אפשר לאמן מודל על שאלות תורניות, יש בתוכנת אנקי 150,000 !!!!!! שאלות תורניות בכל חלקי התורה עם תשובות.זה מאוד יעזור למה ש@לא-מתייאש רוצה להכניס לתוך התוכנה שלו
-
יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI... -
@א.מ.ד. אותי אישית זה מאוד מעניין אבל אני חושב שיש כבר מדריכים ברמה גבוהה מאוד ואפילו בעברית https://github.com/AvrahamRaviv/Deep-Learning-in-Hebrew (כמובן שייתכן של"עם השפשוט" יעזור מאוד מדריך שיסביר בפשטות)
מה שיותר עניין אותי זה מה שכתבת על החינמי ועל ה gpu לכאורה ממה שאני הבנתי בשביל לאמן מודלי שפה צריך gpu של nvidia h100 או לפחות כמה של 3090/4090 אפילו למודלים פשוטים איך אתה עשית את זה בפחות ואיך מקבלים בחינם את מה שכתבתבנוסף: מאוד מעניין אותי לדעת איך משיגים מערכי נתונים ענקיים בעברית (חשוב האיכות יותר מהכמות)
@mefateach כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. אותי אישית זה מאוד מעניין אבל אני חושב שיש כבר מדריכים ברמה גבוהה מאוד ואפילו בעברית https://github.com/AvrahamRaviv/Deep-Learning-in-Hebrew (כמובן שייתכן של"עם השפשוט" יעזור מאוד מדריך שיסביר בפשטות)
מעניין מאוד לא הכרתי אני יישמח לקרוא את זה
אבל מרפרוף מהיר מדובר בחתיכת ספר מקצועי לאנשים שכבר עוסקים בתחומי ML והמסתעף, לא מדריך אינסטנט עם הוראות להעתק הדבק של קוד.@mefateach כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
מה שיותר עניין אותי זה מה שכתבת על החינמי ועל ה gpu לכאורה ממה שאני הבנתי בשביל לאמן מודלי שפה צריך gpu של nvidia h100 או לפחות כמה של 3090/4090 אפילו למודלים פשוטים איך אתה עשית את זה בפחות ואיך מקבלים בחינם את מה שכתבת
בשביל לאמן מודלים של כמה מליארדי פרמטרים אכן צריך שבבים כאלה, אבל אני לא בא להתחרות בחברות ה-AI הענקיות אלא בסך הכל להמחיש את תהליך יצירת המודל מאפס עד השלב שהוא מגיב לשאלות באופן הגיוני, מסכם טקסטים וכו'. בשביל זה אני יוצר במדריך מודל זעיר של כ-280 מיליון פרמטרים (החלטתי תוך כדי תנועה להעלות מ-120 מיליון כדי להתאים לעברית טוב יותר - אני יסביר במדריך בעז"ה), שאמור להגיב מעולה לאימון בסדר גודל שאני מתכנן (אגב נתקלתי במודל זעיר של רק 103 מיליון פרמטרים שהיה ממש מצויין באנגלית), והוא אמור לתפקד מעולה למטרה אליה מודלים כאלה נועדו וממש לא לכתוב קודים שלמים וכדומה. בשביל זה מספיק לחלוטין מחשב ברמה החינמית של גוגל קולאב.
@mefateach כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
בנוסף: מאוד מעניין אותי לדעת איך משיגים מערכי נתונים ענקיים בעברית (חשוב האיכות יותר מהכמות)
בהחלט חשוב האיכות, ואכן זה הדבר הכי חסר במערכי נתונים עבריים, אבל מצאתי מערך נתונים עצום של טקסט מקורי איכותי כמו ויקיפדיה ותוכן פתוח אחר, ועוד כמה מערכי נתונים אחרים של תבנית צ'אט (שו"ת), ובהם נשתמש.
-
הנה עוד הדרכה פשוטה למודל קטנטן לזיהוי תמונות: https://internet-israel.com/מדריכים/raspberrypi/יצירת-מודל-tensorflow-משלנו-לסיווג-תמונות/
@דאבל כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
הנה עוד הדרכה פשוטה למודל קטנטן לזיהוי תמונות: https://internet-israel.com/מדריכים/raspberrypi/יצירת-מודל-tensorflow-משלנו-לסיווג-תמונות/
זה לא מודל שפה ולא מודל זיהוי תמונות ובכלל לא נקרא AI אלא מודל למידת מכונה של סיווג תמונות, אבל עשיתי עם זה בעבר דברים מעניינים מאוד (הוא מביא שם באתר כמה דוגמאות שימוש)...
ואני באמצע עבודה לשלב את זה באפליקציית סייען ה-AI שלי סמארטי כמנוע זיהוי לקריאה "היי סמארטי" להפעלה...
-
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
נשתמש במערכי נתונים פתוחים מ-hugging face של מליוני טקסטים.
אין לי שום הבנה בתחום, אבל האם ניתן לייצר מערך נתונים לאימון משאלות תורניות שיש במאגר אנקי לדוגמא?
כי אם כן, יהי' אפשר לאמן מודל על שאלות תורניות, יש בתוכנת אנקי 150,000 !!!!!! שאלות תורניות בכל חלקי התורה עם תשובות.זה מאוד יעזור למה ש@לא-מתייאש רוצה להכניס לתוך התוכנה שלו
@יום-חדש-מתחיל כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
נשתמש במערכי נתונים פתוחים מ-hugging face של מליוני טקסטים.
אין לי שום הבנה בתחום, אבל האם ניתן לייצר מערך נתונים לאימון משאלות תורניות שיש במאגר אנקי לדוגמא?
כי אם כן, יהי' אפשר לאמן מודל על שאלות תורניות, יש בתוכנת אנקי 150,000 !!!!!! שאלות תורניות בכל חלקי התורה עם תשובות.זה מאוד יעזור למה ש@לא-מתייאש רוצה להכניס לתוך התוכנה שלו
בהחלט, אבל צריך להמיר את מבנה הנתונים למבנה המתאים.
איך אני משיג את הטקסטים?
וזה 100% טקסט פתוח?@CSS-0 כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. יהיה מדריך או לא יהיה?
באמצע הכתיבה, מחכה שייתחדש לי השימוש החינמי בקולאב...
-
@יום-חדש-מתחיל כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
נשתמש במערכי נתונים פתוחים מ-hugging face של מליוני טקסטים.
אין לי שום הבנה בתחום, אבל האם ניתן לייצר מערך נתונים לאימון משאלות תורניות שיש במאגר אנקי לדוגמא?
כי אם כן, יהי' אפשר לאמן מודל על שאלות תורניות, יש בתוכנת אנקי 150,000 !!!!!! שאלות תורניות בכל חלקי התורה עם תשובות.זה מאוד יעזור למה ש@לא-מתייאש רוצה להכניס לתוך התוכנה שלו
בהחלט, אבל צריך להמיר את מבנה הנתונים למבנה המתאים.
איך אני משיג את הטקסטים?
וזה 100% טקסט פתוח?@CSS-0 כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
@א.מ.ד. יהיה מדריך או לא יהיה?
באמצע הכתיבה, מחכה שייתחדש לי השימוש החינמי בקולאב...
@א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:
בהחלט, אבל צריך להמיר את מבנה הנתונים למבנה המתאים.
איך אני משיג את הטקסטים?
וזה 100% טקסט פתוח?צריך כאן את @הפצת-אנקי שיענה על זה תשובה