שיתוף | מדריך לאימון מודל בינה מלאכותית מקומית בצורה הכי פשוטה שיכולה להיות!

CSS 0

הלכתי, בדקתי את הנושא, למדתי ו....
בסוף יצרתי תוכנה שמפשטת את האימון של בינה מלאכותית מקומית (צ'אט) לאפס!!!!!!!
כאן מתחילים.....
א'- יש להתקין python.
https://www.python.org/ftp/python/3.14.2/python-3.14.2-amd64.exe
ב'- יש לפתוח cmd ולהתקין את הספריה הזו:

pip install torch

ג' יש להוריד את הסקריפט הזה בלבד:
main.py

לשים אותו בתוך תיקיה כל שהיא.
לפתוח טרמינל באותה תיקיה.
להריץ את הסקריפט.

python main.py

ובפנים מחכה לכם התוכנה הכי פשוטה לאימון מודל.

עם ממשק מלא.
יש אפשרות להזין את הטקסט כדי לאמן (מומלץ).
יש אפשרות לעלות קבצים עם טקסט לאימון המודל.
הכי מומלץ זה להדביק את הטקסט בסקריפט!!! כי צריך לשכפל את הטקסט מינימום 20 פעמים כדי שהמודל יתחיל ללמוד ולענות תשובות הגיוניות!!!
אפשר גם לעלות טקסט עם בלגן כמו פרויקט בן יהודה (שמעורב בו מלא אנגלית, מספרים, נקודות ופסיקים) התוכנה מסננת את זה ומשאירה רק את העברית, ומקסימות פסיק או סימן אחד)

CSS 0

לא להבהל עם בהתחלה, אחרי האימון הוא יענה ג'יבריש...
זה אומר שהוא צריך להתאמן יותר...
יש לשכפל את הטקסט מינימום 30 פעם כדי שהוא יתחיל לענות מילים או משפטים הגיוניים!
הטקסט הכי טוב זה טקסט שבנוי ככה:
מה נשמע? הכל טוב!,
(כמובן שכפול של 15 פעם, בזה זה 15 כי זה קצת טקסט, אבל עם זה הרבה כמו: פרויקט בן יהודה אז מינימום 30)

CSS 0

איך יודעים עם הוא כבר מאמן מספיק טוב?
אתם רואים את ה:
loss....
בצד?
שכתוב משהו באזור ה:
loss 1.5678
זה כבר אומר שהמודל כבר חכם ועונה תשובות חכמות מעצמו
זה אומר שהוא בטוח בעצמו שאם ישאלו אותו:
מה רמת הדיק שלך בין 0 (הכי גבוה דיוק מוחלט)
ל: 100 (הכי לא מדוייק)
הוא עונה: אני בטוח בעצמי ברמה של: 1.5678 טעויות מקסימום!
אבל עם הוא ענה: פחות מ 0 (כמו: 0.5678)
זה לא טוב זה או אומר שהוא חוזר על התשובות כמו תוכי...

smct

@CSS-0
למה להריץ את הסקריפט דרך שורת הפקודה ולא לפתוח ישר?

CSS 0

@smct לא באמת משנה...

CSS 0

למי שצריך מאגרי טקסט:
https://mitmachim.top/post/1078269
יש לשים לב שמי שיאמן על הטקסט הזה המערכת תצא לו ספרותית עתיקה
למשל במקום לומר "שלום אחי מה נשמע?"
היא תגיד: "הנה נא ידעתי כי שלום אחי טוב"

א.מ.ד.

@css-0 מציע לך ללמוד שוב את הנושא... אתה באמת חושב שתוכל לאמן מודל מאפס על המחשב שלך? אני מאמן כבר שבועיים מודל זעיר על GPU עם 16GB VRAM כדי להתקרב לתוצאות סבירות בשביל המדריך שאני כותב, ועדיין יש עוד הרבה מה לשפר.

הנה כמה נקודות שחשוב להבין לפני שמתלהבים מ"אימון" של דקה וחצי:

זה לא צ'אט, זה "משלים משפטים" גרוע. המודל הזה הוא ברמת התווים (Character-level). הוא לא מבין מילים, הוא רק מנחש מה האות הבאה. מודלים אמיתיים עובדים עם "טוקנים" (חלקי מילים). בשיטה שלו, המודל מבזבז את כל ה"מוח" שלו רק על לנסות לאיית מילים בעברית בלי שגיאות כתיב.
הפסד (Loss) נמוך זה לא תמיד טוב. אם המודל מגיע לרמות Loss אפסיות על טקסט קצר, זה נקרא "Overfitting". המודל לא למד שפה, הוא פשוט שינן בעל פה את מה שכתבתם לו. תנסו לשאול אותו משהו שלא היה בטקסט - הוא פשוט יגמגם. אין לו שום "יכולת הכללה".
איפה סימני הפיסוק? המודל הזה מוחק מספרים וסימני פיסוק בסיסיים בניקוי הטקסט. מודל שפה שלא יודע מה זה מספר או פסיק הוא נכה שפתית. מודל חייב לקבל גם את סימני הפיסוק והשפות האחרות באימון, אחרת הוא לא יידע לפסק בחיים.
ה"חשיבה" היא זיוף. אם תסתכלו בקוד, תראו שיש שם פקודת time.sleep שפשוט עוצרת את התוכנה לשנייה כדי שזה ייראה כאילו הוא "חושב". זה טריק ויזואלי זול, המודל עצמו כל כך קטן שהוא לא באמת צריך זמן עיבוד.
חסרה "תבנית צ'אט". אתה יודע בכלל מה זה Chat Template? כדי שמודל יהיה "צ'אט", הוא צריך אימון ספציפי (Fine-tuning) שמלמד אותו להבין מה זו שאלה ומה זו תשובה. המודל הזה פשוט ממשיך את הטקסט שלך - אם תכתוב לו "מה קורה?", הוא עשוי לענות "מה קורה היום בגן?". זה לא צ'אט, זה תוכי.

בשורה התחתונה: מודל לא יכול להיות מאומן רק על כמה מילים שאתה כותב לו, וגם לא על פרויקטים קטנים כמו בן יהודה. בשביל מודל שבאמת מבין עברית צריך מאות ג'יגה בייט של טקסט וכוח עיבוד מטורף.

אני עובד כרגע על מדריך מפורט שיסביר איך בונים משהו אמיתי, עם ארכיטקטורה נכונה וטוקנייזר מקצועי. ממליץ להמתין לדבר האמיתי ולא להסתנוור מסקריפטים של חמש דקות ש-AI ג'ינרט.

לא הייתי כותב ככה חריף, אלמלא היית קופץ בראש... אתה יודע שבן-אדם משקיע כבר שבועות במדריך מושקע ומקצועי, ורץ ל-GPT שייתן לך "תוכנה" כדי לגרוף לייקים...

טיפ קטן ממני: אם אתם רוצים לראות אם מודל באמת עובד, תנו לו טקסט שהוא בחיים לא ראה ותראו אם הוא מצליח להבין את ההיגיון שלו. ספוילר: המודל הזה ייכשל.

מחכה לשתף אתכם במדריך המלא בקרוב!

CSS 0

@א.מ.ד. צודק אני יושב להבין יותר טוב ובעז"ה לנסות אולי להוציא משהו יותר טוב...