דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. סקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?

סקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
57 פוסטים 17 כותבים 2.9k צפיות 25 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • ח חנני350

    אני היתי ממליץ על לעשות אפשרות שיעבוד דרך המחשב בלי אינטרנט

    א.מ.ד.א מחובר
    א.מ.ד.א מחובר
    א.מ.ד.
    כתב נערך לאחרונה על ידי
    #44

    @חנני350 כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

    אני היתי ממליץ על לעשות אפשרות שיעבוד דרך המחשב בלי אינטרנט

    אז איך המודל יאומן, על תפוח אדמה?

    מפתח אפליקציות אנדרואיד
    em0548438097@gmail.com

    תגובה 1 תגובה אחרונה
    0
    • א.מ.ד.א א.מ.ד.

      @החכם-התם כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      @א.מ.ד.
      אנחנו מחכים בקוצר רוח.
      יש צפי?

      אני יאמר את האמת, אמנם הצלחתי ליצור את המודל, הוא למד עברית תקנית, מענה לשאלות וידע בסיסי, אבל הנתונים כנראה לא היו מושלמים והיו במבנים בעייתיים כמו של ויקיפדיה, מה שהרס את היכולת ש המודל להגיב בצורה תמציתית ומדוייקת. אני צריך לעבור על מערך הנתונים ולברור ממנו טקסטים איכותיים, לנקות אותם ממבנים, לערבב אותו ולהתחיל מחדש, אבל בשביל הניקוי הזה צריך זמן שאין לי כרגע. אולי אם יהיו מספיק חברה שמוכנים לנקות את מערך הנתונים (לא מאמין) נוכל להתקדם מהר יותר.

      ה מנותק
      ה מנותק
      החכם התם
      כתב נערך לאחרונה על ידי
      #45

      @א.מ.ד. אולי תוך כדי ההדרכה?
      זה לא בשביל המודל זה בשביל הלימוד.

      תגובה 1 תגובה אחרונה
      0
      • א.מ.ד.א א.מ.ד.

        יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
        התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
        במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
        הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
        ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
        עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
        את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
        המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
        אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
        אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI...

        CSS 0C מחובר
        CSS 0C מחובר
        CSS 0
        כתב נערך לאחרונה על ידי
        #46

        @א.מ.ד. משהו מתקדם?

        א.מ.ד.א תגובה 1 תגובה אחרונה
        0
        • CSS 0C CSS 0

          @א.מ.ד. משהו מתקדם?

          א.מ.ד.א מחובר
          א.מ.ד.א מחובר
          א.מ.ד.
          כתב נערך לאחרונה על ידי א.מ.ד.
          #47

          @CSS-0 כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

          @א.מ.ד. משהו מתקדם?

          כמו שכתבתי הטיוטה של המדריך שכבר כמעט סיימתי נמחקה לי, אבל אני מתכוון לשחזר את המדריך בקרוב. כרגע אני ממשיך לאמן את המודל שלי שאני יוצר מאפס - הפעם גדול פי 2 (0.6B פרמטרים), וכבר עכשיו הוא המודל הטוב ביותר בעברית בקטגוריית הגודל שלו.

          מפתח אפליקציות אנדרואיד
          em0548438097@gmail.com

          ה תגובה 1 תגובה אחרונה
          4
          • א.מ.ד.א א.מ.ד.

            @CSS-0 כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

            @א.מ.ד. משהו מתקדם?

            כמו שכתבתי הטיוטה של המדריך שכבר כמעט סיימתי נמחקה לי, אבל אני מתכוון לשחזר את המדריך בקרוב. כרגע אני ממשיך לאמן את המודל שלי שאני יוצר מאפס - הפעם גדול פי 2 (0.6B פרמטרים), וכבר עכשיו הוא המודל הטוב ביותר בעברית בקטגוריית הגודל שלו.

            ה מנותק
            ה מנותק
            המלאך
            כתב נערך לאחרונה על ידי
            #48

            @א.מ.ד. כן אבל זה נטו בגלל שאין כמעט מודלים בכזה גודל.

            א.מ.ד.א תגובה 1 תגובה אחרונה
            0
            • ה המלאך

              @א.מ.ד. כן אבל זה נטו בגלל שאין כמעט מודלים בכזה גודל.

              א.מ.ד.א מחובר
              א.מ.ד.א מחובר
              א.מ.ד.
              כתב נערך לאחרונה על ידי א.מ.ד.
              #49

              @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

              @א.מ.ד. כן אבל זה נטו בגלל שאין כמעט מודלים בכזה גודל.

              יש המון מודלים בכזה גודל, רק שהם לא טובים בעברית.
              קודם כל אמנם GPT 2 הוא מודל מיושן אבל לעקוף אותו בסיבוב בעברית באימון חינמי זה חתיכת הישג.
              בנוסף כרגע המודל שלי עוקף בעברית את Qwen-3.5 0.8B ו-2B, ואת Gemma-3 1B שהם לכאורה חזית הרב-לשוניות במודלים זעירים, ומתקרב ליכולות העבריות של DictaLM-3.0 1.7B שגדול ממנו פי 3, והוא רק בתחילת האימון ויש לו עוד המון ללמוד.

              מפתח אפליקציות אנדרואיד
              em0548438097@gmail.com

              ה תגובה 1 תגובה אחרונה
              2
              • א.מ.ד.א א.מ.ד.

                @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                @א.מ.ד. כן אבל זה נטו בגלל שאין כמעט מודלים בכזה גודל.

                יש המון מודלים בכזה גודל, רק שהם לא טובים בעברית.
                קודם כל אמנם GPT 2 הוא מודל מיושן אבל לעקוף אותו בסיבוב בעברית באימון חינמי זה חתיכת הישג.
                בנוסף כרגע המודל שלי עוקף בעברית את Qwen-3.5 0.8B ו-2B, ואת Gemma-3 1B שהם לכאורה חזית הרב-לשוניות במודלים זעירים, ומתקרב ליכולות העבריות של DictaLM-3.0 1.7B שגדול ממנו פי 3, והוא רק בתחילת האימון ויש לו עוד המון ללמוד.

                ה מנותק
                ה מנותק
                המלאך
                כתב נערך לאחרונה על ידי
                #50

                @א.מ.ד. תדייק.
                אתה לא עוקף אותו בסיבוב.
                אתה עוקף אותו רק בהקשר של הבנת עברית.
                וזה לא כזה מסובך בהתחשב בזה שכל האימון שלו על עברית מגיע רק לאחוזים בודדים.
                לגבי המודלים האחרים שהעלת, הסיבה היא כי הם לא אומנו ספציפית על שפה אחת אלא על כך השפות.
                על מה אתה מאמן את המודל?
                איזה תחום.

                א.מ.ד.א תגובה 1 תגובה אחרונה
                0
                • ה המלאך

                  @א.מ.ד. תדייק.
                  אתה לא עוקף אותו בסיבוב.
                  אתה עוקף אותו רק בהקשר של הבנת עברית.
                  וזה לא כזה מסובך בהתחשב בזה שכל האימון שלו על עברית מגיע רק לאחוזים בודדים.
                  לגבי המודלים האחרים שהעלת, הסיבה היא כי הם לא אומנו ספציפית על שפה אחת אלא על כך השפות.
                  על מה אתה מאמן את המודל?
                  איזה תחום.

                  א.מ.ד.א מחובר
                  א.מ.ד.א מחובר
                  א.מ.ד.
                  כתב נערך לאחרונה על ידי
                  #51

                  @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                  @א.מ.ד. תדייק.
                  אתה לא עוקף אותו בסיבוב.
                  אתה עוקף אותו רק בהקשר של הבנת עברית.

                  ברור תפוס ת'עיקרון... לא מתיימר להחליף את GPT 5.4 אלא רק להראות שאפשר לאמן מודל בחינם עם יכולות עבריות טובות.

                  @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                  על מה אתה מאמן את המודל?
                  איזה תחום.

                  סיוע כללי. כרגע זה אימון מקדים ללימוד השפה ומבנה תקין של משפטים ולוגיקה בסיסית, ואחר כך אני מעביר אותו אימון לצ'אט.
                  אולי אני יוסיף לו אחרי האימון המקדים אימונים קצרים על לוגיקה באנגלית (כי אין מספיק טובים בעברית), ועל קידוד פייתון, והמודל אמור להכליל את זה גם לשיפור יכולות בעברית.

                  מפתח אפליקציות אנדרואיד
                  em0548438097@gmail.com

                  ה ח 2 תגובות תגובה אחרונה
                  1
                  • א.מ.ד.א א.מ.ד.

                    @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                    @א.מ.ד. תדייק.
                    אתה לא עוקף אותו בסיבוב.
                    אתה עוקף אותו רק בהקשר של הבנת עברית.

                    ברור תפוס ת'עיקרון... לא מתיימר להחליף את GPT 5.4 אלא רק להראות שאפשר לאמן מודל בחינם עם יכולות עבריות טובות.

                    @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                    על מה אתה מאמן את המודל?
                    איזה תחום.

                    סיוע כללי. כרגע זה אימון מקדים ללימוד השפה ומבנה תקין של משפטים ולוגיקה בסיסית, ואחר כך אני מעביר אותו אימון לצ'אט.
                    אולי אני יוסיף לו אחרי האימון המקדים אימונים קצרים על לוגיקה באנגלית (כי אין מספיק טובים בעברית), ועל קידוד פייתון, והמודל אמור להכליל את זה גם לשיפור יכולות בעברית.

                    ה מנותק
                    ה מנותק
                    המלאך
                    כתב נערך לאחרונה על ידי
                    #52

                    @א.מ.ד. רק שים לב שאם תאמן אותו אחרי זה על הדברים האלה, הוא יהיה פחות טוב בשפה.
                    כי הוא יהיה פחות ממוקד....

                    א.מ.ד.א תגובה 1 תגובה אחרונה
                    0
                    • ה המלאך

                      @א.מ.ד. רק שים לב שאם תאמן אותו אחרי זה על הדברים האלה, הוא יהיה פחות טוב בשפה.
                      כי הוא יהיה פחות ממוקד....

                      א.מ.ד.א מחובר
                      א.מ.ד.א מחובר
                      א.מ.ד.
                      כתב נערך לאחרונה על ידי
                      #53

                      @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                      @א.מ.ד. רק שים לב שאם תאמן אותו אחרי זה על הדברים האלה, הוא יהיה פחות טוב בשפה.
                      כי הוא יהיה פחות ממוקד....

                      קודם כל אני יעשה גרסאות נפרדות, וחוץ מזה אני עושה מיקס של עברית אנגלית וקידוד בחלוקה מסויימת ששומרת על יכולות השפה.

                      מפתח אפליקציות אנדרואיד
                      em0548438097@gmail.com

                      ה תגובה 1 תגובה אחרונה
                      1
                      • א.מ.ד.א א.מ.ד.

                        @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                        @א.מ.ד. תדייק.
                        אתה לא עוקף אותו בסיבוב.
                        אתה עוקף אותו רק בהקשר של הבנת עברית.

                        ברור תפוס ת'עיקרון... לא מתיימר להחליף את GPT 5.4 אלא רק להראות שאפשר לאמן מודל בחינם עם יכולות עבריות טובות.

                        @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                        על מה אתה מאמן את המודל?
                        איזה תחום.

                        סיוע כללי. כרגע זה אימון מקדים ללימוד השפה ומבנה תקין של משפטים ולוגיקה בסיסית, ואחר כך אני מעביר אותו אימון לצ'אט.
                        אולי אני יוסיף לו אחרי האימון המקדים אימונים קצרים על לוגיקה באנגלית (כי אין מספיק טובים בעברית), ועל קידוד פייתון, והמודל אמור להכליל את זה גם לשיפור יכולות בעברית.

                        ח מנותק
                        ח מנותק
                        חובבן מקצועי
                        כתב נערך לאחרונה על ידי חובבן מקצועי
                        #54

                        @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                        שאפשר לאמן מודל בחינם עם יכולות עבריות טובות.

                        אימנת את 'המודל החרדי הראשון' - על טקסטים תלמודיים ? ארמית? גמרא וכו'?

                        כי אז באמת הוא יהיה מודל מספר אחד בכל הנוגע לארמית..

                        א.מ.ד.א תגובה 1 תגובה אחרונה
                        0
                        • א.מ.ד.א א.מ.ד.

                          @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                          @א.מ.ד. רק שים לב שאם תאמן אותו אחרי זה על הדברים האלה, הוא יהיה פחות טוב בשפה.
                          כי הוא יהיה פחות ממוקד....

                          קודם כל אני יעשה גרסאות נפרדות, וחוץ מזה אני עושה מיקס של עברית אנגלית וקידוד בחלוקה מסויימת ששומרת על יכולות השפה.

                          ה מנותק
                          ה מנותק
                          המלאך
                          כתב נערך לאחרונה על ידי המלאך
                          #55

                          @א.מ.ד. זה מעניין.
                          איך עשית את זה?
                          Moe?
                          כי פעם היה לו רעיון ארכטיקטורי עם היררכיה כזו, אבל שלי היה 'קצת' יותר מתקדם מהגישה של Moe.

                          א.מ.ד.א תגובה 1 תגובה אחרונה
                          0
                          • ח חובבן מקצועי

                            @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                            שאפשר לאמן מודל בחינם עם יכולות עבריות טובות.

                            אימנת את 'המודל החרדי הראשון' - על טקסטים תלמודיים ? ארמית? גמרא וכו'?

                            כי אז באמת הוא יהיה מודל מספר אחד בכל הנוגע לארמית..

                            א.מ.ד.א מחובר
                            א.מ.ד.א מחובר
                            א.מ.ד.
                            כתב נערך לאחרונה על ידי
                            #56

                            @חובבן-מקצועי כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                            אימנת את 'המודל החרדי הראשון' - על טקסטים תלמודיים ? ארמית? גמרא וכו'?

                            Tiny-aia-kosher-3.3B מבוסס על מודל קיים, ולא אימנתי אותו מאפס, אלא רק לימדתי אותו לסרב לבקשות לא ראויות. ללמד אותו שפה חדשה זה תהליך מורכב פיג'מה ודורש משאבי חישוב גדולים פי כמה.

                            מפתח אפליקציות אנדרואיד
                            em0548438097@gmail.com

                            תגובה 1 תגובה אחרונה
                            1
                            • ה המלאך

                              @א.מ.ד. זה מעניין.
                              איך עשית את זה?
                              Moe?
                              כי פעם היה לו רעיון ארכטיקטורי עם היררכיה כזו, אבל שלי היה 'קצת' יותר מתקדם מהגישה של Moe.

                              א.מ.ד.א מחובר
                              א.מ.ד.א מחובר
                              א.מ.ד.
                              כתב נערך לאחרונה על ידי
                              #57

                              @המלאך כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                              @א.מ.ד. זה מעניין.
                              איך עשית את זה?
                              Moe?
                              כי פעם היה לו רעיון ארכטיקטורי עם היררכיה כזו, אבל שלי היה 'קצת' יותר מתקדם מהגישה של Moe.

                              לא, פשוט תערובת של הנתונים. MoE פחות אפקטיבי בגדלים כאלו כי אז כל מומחה יהיה ממש זעיר וחסר יכולות.

                              מפתח אפליקציות אנדרואיד
                              em0548438097@gmail.com

                              תגובה 1 תגובה אחרונה
                              1

                              • התחברות

                              • אין לך חשבון עדיין? הרשמה

                              • התחברו או הירשמו כדי לחפש.
                              • פוסט ראשון
                                פוסט אחרון
                              0
                              • חוקי הפורום
                              • פופולרי
                              • לא נפתר
                              • משתמשים
                              • חיפוש גוגל בפורום
                              • צור קשר