דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. שיתוף | מדריך לאימון מודל בינה מלאכותית מקומית בצורה הכי פשוטה שיכולה להיות!

שיתוף | מדריך לאימון מודל בינה מלאכותית מקומית בצורה הכי פשוטה שיכולה להיות!

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
8 פוסטים 3 כותבים 173 צפיות 5 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • C מנותק
    C מנותק
    CSS 0
    כתב נערך לאחרונה על ידי CSS 0
    #1

    הלכתי, בדקתי את הנושא, למדתי ו....
    בסוף יצרתי תוכנה שמפשטת את האימון של בינה מלאכותית מקומית (צ'אט) לאפס!!!!!!!
    כאן מתחילים.....
    א'- יש להתקין python.
    https://www.python.org/ftp/python/3.14.2/python-3.14.2-amd64.exe
    ב'- יש לפתוח cmd ולהתקין את הספריה הזו:

    pip install torch
    

    ג' יש להוריד את הסקריפט הזה בלבד:
    main.py

    • לשים אותו בתוך תיקיה כל שהיא.
    • לפתוח טרמינל באותה תיקיה.
    • להריץ את הסקריפט.
    python main.py
    

    ובפנים מחכה לכם התוכנה הכי פשוטה לאימון מודל.

    • עם ממשק מלא.
    • יש אפשרות להזין את הטקסט כדי לאמן (מומלץ).
    • יש אפשרות לעלות קבצים עם טקסט לאימון המודל.
      הכי מומלץ זה להדביק את הטקסט בסקריפט!!! כי צריך לשכפל את הטקסט מינימום 20 פעמים כדי שהמודל יתחיל ללמוד ולענות תשובות הגיוניות!!!
    • אפשר גם לעלות טקסט עם בלגן כמו פרויקט בן יהודה (שמעורב בו מלא אנגלית, מספרים, נקודות ופסיקים) התוכנה מסננת את זה ומשאירה רק את העברית, ומקסימות פסיק או סימן אחד)
    C א.מ.ד.א 4 תגובות תגובה אחרונה
    9
    • C CSS 0

      הלכתי, בדקתי את הנושא, למדתי ו....
      בסוף יצרתי תוכנה שמפשטת את האימון של בינה מלאכותית מקומית (צ'אט) לאפס!!!!!!!
      כאן מתחילים.....
      א'- יש להתקין python.
      https://www.python.org/ftp/python/3.14.2/python-3.14.2-amd64.exe
      ב'- יש לפתוח cmd ולהתקין את הספריה הזו:

      pip install torch
      

      ג' יש להוריד את הסקריפט הזה בלבד:
      main.py

      • לשים אותו בתוך תיקיה כל שהיא.
      • לפתוח טרמינל באותה תיקיה.
      • להריץ את הסקריפט.
      python main.py
      

      ובפנים מחכה לכם התוכנה הכי פשוטה לאימון מודל.

      • עם ממשק מלא.
      • יש אפשרות להזין את הטקסט כדי לאמן (מומלץ).
      • יש אפשרות לעלות קבצים עם טקסט לאימון המודל.
        הכי מומלץ זה להדביק את הטקסט בסקריפט!!! כי צריך לשכפל את הטקסט מינימום 20 פעמים כדי שהמודל יתחיל ללמוד ולענות תשובות הגיוניות!!!
      • אפשר גם לעלות טקסט עם בלגן כמו פרויקט בן יהודה (שמעורב בו מלא אנגלית, מספרים, נקודות ופסיקים) התוכנה מסננת את זה ומשאירה רק את העברית, ומקסימות פסיק או סימן אחד)
      C מנותק
      C מנותק
      CSS 0
      כתב נערך לאחרונה על ידי CSS 0
      #2

      לא להבהל עם בהתחלה, אחרי האימון הוא יענה ג'יבריש...
      זה אומר שהוא צריך להתאמן יותר...
      יש לשכפל את הטקסט מינימום 30 פעם כדי שהוא יתחיל לענות מילים או משפטים הגיוניים!
      הטקסט הכי טוב זה טקסט שבנוי ככה:
      מה נשמע? הכל טוב!,
      (כמובן שכפול של 15 פעם, בזה זה 15 כי זה קצת טקסט, אבל עם זה הרבה כמו: פרויקט בן יהודה אז מינימום 30)

      תגובה 1 תגובה אחרונה
      2
      • C CSS 0

        הלכתי, בדקתי את הנושא, למדתי ו....
        בסוף יצרתי תוכנה שמפשטת את האימון של בינה מלאכותית מקומית (צ'אט) לאפס!!!!!!!
        כאן מתחילים.....
        א'- יש להתקין python.
        https://www.python.org/ftp/python/3.14.2/python-3.14.2-amd64.exe
        ב'- יש לפתוח cmd ולהתקין את הספריה הזו:

        pip install torch
        

        ג' יש להוריד את הסקריפט הזה בלבד:
        main.py

        • לשים אותו בתוך תיקיה כל שהיא.
        • לפתוח טרמינל באותה תיקיה.
        • להריץ את הסקריפט.
        python main.py
        

        ובפנים מחכה לכם התוכנה הכי פשוטה לאימון מודל.

        • עם ממשק מלא.
        • יש אפשרות להזין את הטקסט כדי לאמן (מומלץ).
        • יש אפשרות לעלות קבצים עם טקסט לאימון המודל.
          הכי מומלץ זה להדביק את הטקסט בסקריפט!!! כי צריך לשכפל את הטקסט מינימום 20 פעמים כדי שהמודל יתחיל ללמוד ולענות תשובות הגיוניות!!!
        • אפשר גם לעלות טקסט עם בלגן כמו פרויקט בן יהודה (שמעורב בו מלא אנגלית, מספרים, נקודות ופסיקים) התוכנה מסננת את זה ומשאירה רק את העברית, ומקסימות פסיק או סימן אחד)
        C מנותק
        C מנותק
        CSS 0
        כתב נערך לאחרונה על ידי CSS 0
        #3

        איך יודעים עם הוא כבר מאמן מספיק טוב?
        אתם רואים את ה:
        loss....
        בצד?
        שכתוב משהו באזור ה:
        loss 1.5678
        זה כבר אומר שהמודל כבר חכם ועונה תשובות חכמות מעצמו
        זה אומר שהוא בטוח בעצמו שאם ישאלו אותו:
        מה רמת הדיק שלך בין 0 (הכי גבוה דיוק מוחלט)
        ל: 100 (הכי לא מדוייק)

        הוא עונה: אני בטוח בעצמי ברמה של: 1.5678 טעויות מקסימום!
        אבל עם הוא ענה: פחות מ 0 (כמו: 0.5678)
        זה לא טוב זה או אומר שהוא חוזר על התשובות כמו תוכי...

        S תגובה 1 תגובה אחרונה
        4
        • C CSS 0

          איך יודעים עם הוא כבר מאמן מספיק טוב?
          אתם רואים את ה:
          loss....
          בצד?
          שכתוב משהו באזור ה:
          loss 1.5678
          זה כבר אומר שהמודל כבר חכם ועונה תשובות חכמות מעצמו
          זה אומר שהוא בטוח בעצמו שאם ישאלו אותו:
          מה רמת הדיק שלך בין 0 (הכי גבוה דיוק מוחלט)
          ל: 100 (הכי לא מדוייק)

          הוא עונה: אני בטוח בעצמי ברמה של: 1.5678 טעויות מקסימום!
          אבל עם הוא ענה: פחות מ 0 (כמו: 0.5678)
          זה לא טוב זה או אומר שהוא חוזר על התשובות כמו תוכי...

          S מנותק
          S מנותק
          smct
          כתב נערך לאחרונה על ידי smct
          #4

          @CSS-0
          למה להריץ את הסקריפט דרך שורת הפקודה ולא לפתוח ישר?

          C תגובה 1 תגובה אחרונה
          1
          • S smct

            @CSS-0
            למה להריץ את הסקריפט דרך שורת הפקודה ולא לפתוח ישר?

            C מנותק
            C מנותק
            CSS 0
            כתב נערך לאחרונה על ידי
            #5

            @smct לא באמת משנה...

            תגובה 1 תגובה אחרונה
            2
            • C CSS 0

              הלכתי, בדקתי את הנושא, למדתי ו....
              בסוף יצרתי תוכנה שמפשטת את האימון של בינה מלאכותית מקומית (צ'אט) לאפס!!!!!!!
              כאן מתחילים.....
              א'- יש להתקין python.
              https://www.python.org/ftp/python/3.14.2/python-3.14.2-amd64.exe
              ב'- יש לפתוח cmd ולהתקין את הספריה הזו:

              pip install torch
              

              ג' יש להוריד את הסקריפט הזה בלבד:
              main.py

              • לשים אותו בתוך תיקיה כל שהיא.
              • לפתוח טרמינל באותה תיקיה.
              • להריץ את הסקריפט.
              python main.py
              

              ובפנים מחכה לכם התוכנה הכי פשוטה לאימון מודל.

              • עם ממשק מלא.
              • יש אפשרות להזין את הטקסט כדי לאמן (מומלץ).
              • יש אפשרות לעלות קבצים עם טקסט לאימון המודל.
                הכי מומלץ זה להדביק את הטקסט בסקריפט!!! כי צריך לשכפל את הטקסט מינימום 20 פעמים כדי שהמודל יתחיל ללמוד ולענות תשובות הגיוניות!!!
              • אפשר גם לעלות טקסט עם בלגן כמו פרויקט בן יהודה (שמעורב בו מלא אנגלית, מספרים, נקודות ופסיקים) התוכנה מסננת את זה ומשאירה רק את העברית, ומקסימות פסיק או סימן אחד)
              C מנותק
              C מנותק
              CSS 0
              כתב נערך לאחרונה על ידי CSS 0
              #6

              למי שצריך מאגרי טקסט:
              https://mitmachim.top/post/1078269
              יש לשים לב שמי שיאמן על הטקסט הזה המערכת תצא לו ספרותית עתיקה 😂
              למשל במקום לומר "שלום אחי מה נשמע?"
              היא תגיד: "הנה נא ידעתי כי שלום אחי טוב" 😂 😂

              תגובה 1 תגובה אחרונה
              3
              • C CSS 0

                הלכתי, בדקתי את הנושא, למדתי ו....
                בסוף יצרתי תוכנה שמפשטת את האימון של בינה מלאכותית מקומית (צ'אט) לאפס!!!!!!!
                כאן מתחילים.....
                א'- יש להתקין python.
                https://www.python.org/ftp/python/3.14.2/python-3.14.2-amd64.exe
                ב'- יש לפתוח cmd ולהתקין את הספריה הזו:

                pip install torch
                

                ג' יש להוריד את הסקריפט הזה בלבד:
                main.py

                • לשים אותו בתוך תיקיה כל שהיא.
                • לפתוח טרמינל באותה תיקיה.
                • להריץ את הסקריפט.
                python main.py
                

                ובפנים מחכה לכם התוכנה הכי פשוטה לאימון מודל.

                • עם ממשק מלא.
                • יש אפשרות להזין את הטקסט כדי לאמן (מומלץ).
                • יש אפשרות לעלות קבצים עם טקסט לאימון המודל.
                  הכי מומלץ זה להדביק את הטקסט בסקריפט!!! כי צריך לשכפל את הטקסט מינימום 20 פעמים כדי שהמודל יתחיל ללמוד ולענות תשובות הגיוניות!!!
                • אפשר גם לעלות טקסט עם בלגן כמו פרויקט בן יהודה (שמעורב בו מלא אנגלית, מספרים, נקודות ופסיקים) התוכנה מסננת את זה ומשאירה רק את העברית, ומקסימות פסיק או סימן אחד)
                א.מ.ד.א מנותק
                א.מ.ד.א מנותק
                א.מ.ד.
                כתב נערך לאחרונה על ידי א.מ.ד.
                #7

                @css-0 מציע לך ללמוד שוב את הנושא... אתה באמת חושב שתוכל לאמן מודל מאפס על המחשב שלך? אני מאמן כבר שבועיים מודל זעיר על GPU עם 16GB VRAM כדי להתקרב לתוצאות סבירות בשביל המדריך שאני כותב, ועדיין יש עוד הרבה מה לשפר.

                הנה כמה נקודות שחשוב להבין לפני שמתלהבים מ"אימון" של דקה וחצי:

                • זה לא צ'אט, זה "משלים משפטים" גרוע. המודל הזה הוא ברמת התווים (Character-level). הוא לא מבין מילים, הוא רק מנחש מה האות הבאה. מודלים אמיתיים עובדים עם "טוקנים" (חלקי מילים). בשיטה שלו, המודל מבזבז את כל ה"מוח" שלו רק על לנסות לאיית מילים בעברית בלי שגיאות כתיב.

                • הפסד (Loss) נמוך זה לא תמיד טוב. אם המודל מגיע לרמות Loss אפסיות על טקסט קצר, זה נקרא "Overfitting". המודל לא למד שפה, הוא פשוט שינן בעל פה את מה שכתבתם לו. תנסו לשאול אותו משהו שלא היה בטקסט - הוא פשוט יגמגם. אין לו שום "יכולת הכללה".

                • איפה סימני הפיסוק? המודל הזה מוחק מספרים וסימני פיסוק בסיסיים בניקוי הטקסט. מודל שפה שלא יודע מה זה מספר או פסיק הוא נכה שפתית. מודל חייב לקבל גם את סימני הפיסוק והשפות האחרות באימון, אחרת הוא לא יידע לפסק בחיים.

                • ה"חשיבה" היא זיוף. אם תסתכלו בקוד, תראו שיש שם פקודת time.sleep שפשוט עוצרת את התוכנה לשנייה כדי שזה ייראה כאילו הוא "חושב". זה טריק ויזואלי זול, המודל עצמו כל כך קטן שהוא לא באמת צריך זמן עיבוד.

                • חסרה "תבנית צ'אט". אתה יודע בכלל מה זה Chat Template? כדי שמודל יהיה "צ'אט", הוא צריך אימון ספציפי (Fine-tuning) שמלמד אותו להבין מה זו שאלה ומה זו תשובה. המודל הזה פשוט ממשיך את הטקסט שלך - אם תכתוב לו "מה קורה?", הוא עשוי לענות "מה קורה היום בגן?". זה לא צ'אט, זה תוכי.

                בשורה התחתונה: מודל לא יכול להיות מאומן רק על כמה מילים שאתה כותב לו, וגם לא על פרויקטים קטנים כמו בן יהודה. בשביל מודל שבאמת מבין עברית צריך מאות ג'יגה בייט של טקסט וכוח עיבוד מטורף.

                אני עובד כרגע על מדריך מפורט שיסביר איך בונים משהו אמיתי, עם ארכיטקטורה נכונה וטוקנייזר מקצועי. ממליץ להמתין לדבר האמיתי ולא להסתנוור מסקריפטים של חמש דקות ש-AI ג'ינרט.

                לא הייתי כותב ככה חריף, אלמלא היית קופץ בראש... אתה יודע שבן-אדם משקיע כבר שבועות במדריך מושקע ומקצועי, ורץ ל-GPT שייתן לך "תוכנה" כדי לגרוף לייקים...

                טיפ קטן ממני: אם אתם רוצים לראות אם מודל באמת עובד, תנו לו טקסט שהוא בחיים לא ראה ותראו אם הוא מצליח להבין את ההיגיון שלו. ספוילר: המודל הזה ייכשל.

                מחכה לשתף אתכם במדריך המלא בקרוב!

                מפתח אפליקציות אנדרואיד
                em0548438097@gmail.com

                C תגובה 1 תגובה אחרונה
                11
                • א.מ.ד.א א.מ.ד.

                  @css-0 מציע לך ללמוד שוב את הנושא... אתה באמת חושב שתוכל לאמן מודל מאפס על המחשב שלך? אני מאמן כבר שבועיים מודל זעיר על GPU עם 16GB VRAM כדי להתקרב לתוצאות סבירות בשביל המדריך שאני כותב, ועדיין יש עוד הרבה מה לשפר.

                  הנה כמה נקודות שחשוב להבין לפני שמתלהבים מ"אימון" של דקה וחצי:

                  • זה לא צ'אט, זה "משלים משפטים" גרוע. המודל הזה הוא ברמת התווים (Character-level). הוא לא מבין מילים, הוא רק מנחש מה האות הבאה. מודלים אמיתיים עובדים עם "טוקנים" (חלקי מילים). בשיטה שלו, המודל מבזבז את כל ה"מוח" שלו רק על לנסות לאיית מילים בעברית בלי שגיאות כתיב.

                  • הפסד (Loss) נמוך זה לא תמיד טוב. אם המודל מגיע לרמות Loss אפסיות על טקסט קצר, זה נקרא "Overfitting". המודל לא למד שפה, הוא פשוט שינן בעל פה את מה שכתבתם לו. תנסו לשאול אותו משהו שלא היה בטקסט - הוא פשוט יגמגם. אין לו שום "יכולת הכללה".

                  • איפה סימני הפיסוק? המודל הזה מוחק מספרים וסימני פיסוק בסיסיים בניקוי הטקסט. מודל שפה שלא יודע מה זה מספר או פסיק הוא נכה שפתית. מודל חייב לקבל גם את סימני הפיסוק והשפות האחרות באימון, אחרת הוא לא יידע לפסק בחיים.

                  • ה"חשיבה" היא זיוף. אם תסתכלו בקוד, תראו שיש שם פקודת time.sleep שפשוט עוצרת את התוכנה לשנייה כדי שזה ייראה כאילו הוא "חושב". זה טריק ויזואלי זול, המודל עצמו כל כך קטן שהוא לא באמת צריך זמן עיבוד.

                  • חסרה "תבנית צ'אט". אתה יודע בכלל מה זה Chat Template? כדי שמודל יהיה "צ'אט", הוא צריך אימון ספציפי (Fine-tuning) שמלמד אותו להבין מה זו שאלה ומה זו תשובה. המודל הזה פשוט ממשיך את הטקסט שלך - אם תכתוב לו "מה קורה?", הוא עשוי לענות "מה קורה היום בגן?". זה לא צ'אט, זה תוכי.

                  בשורה התחתונה: מודל לא יכול להיות מאומן רק על כמה מילים שאתה כותב לו, וגם לא על פרויקטים קטנים כמו בן יהודה. בשביל מודל שבאמת מבין עברית צריך מאות ג'יגה בייט של טקסט וכוח עיבוד מטורף.

                  אני עובד כרגע על מדריך מפורט שיסביר איך בונים משהו אמיתי, עם ארכיטקטורה נכונה וטוקנייזר מקצועי. ממליץ להמתין לדבר האמיתי ולא להסתנוור מסקריפטים של חמש דקות ש-AI ג'ינרט.

                  לא הייתי כותב ככה חריף, אלמלא היית קופץ בראש... אתה יודע שבן-אדם משקיע כבר שבועות במדריך מושקע ומקצועי, ורץ ל-GPT שייתן לך "תוכנה" כדי לגרוף לייקים...

                  טיפ קטן ממני: אם אתם רוצים לראות אם מודל באמת עובד, תנו לו טקסט שהוא בחיים לא ראה ותראו אם הוא מצליח להבין את ההיגיון שלו. ספוילר: המודל הזה ייכשל.

                  מחכה לשתף אתכם במדריך המלא בקרוב!

                  C מנותק
                  C מנותק
                  CSS 0
                  כתב נערך לאחרונה על ידי
                  #8

                  @א.מ.ד. צודק אני יושב להבין יותר טוב ובעז"ה לנסות אולי להוציא משהו יותר טוב...

                  תגובה 1 תגובה אחרונה
                  4

                  • התחברות

                  • אין לך חשבון עדיין? הרשמה

                  • התחברו או הירשמו כדי לחפש.
                  • פוסט ראשון
                    פוסט אחרון
                  0
                  • חוקי הפורום
                  • פופולרי
                  • לא נפתר
                  • משתמשים
                  • חיפוש גוגל בפורום
                  • צור קשר