דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית

בקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
119 פוסטים 10 כותבים 794 צפיות 9 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א.מ.ד.א א.מ.ד.

    @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

    מה זאת אומרת אם אני יקח את מודל של 8B של Qwen3 ויוריד לו את רכיב הראיה מה זה יתן לי? זה כמעט ולא יוריד כלום?

    מה לא ברור? אתה אמרת שאתה מאמן את Qwen3-0.6B. שאלתי למה הלכת על מודל ישן, תלך על המודל החדש - Qwen3.5-0.8B שהוא גם יותר טוב בעברית, אז אמרת שהוא כבד לך מידי, אז עניתי שהפער קטן מאוד, ואם תאמן אותו בלי רכיב הראיה שלו שתופס בערך רבע מגודלו אז הוא אותו גודל כמו Qwen3-0.6B. זה הכל. לא הבנתי מה הסתבכת.

    ה מנותק
    ה מנותק
    המתכנת התותח
    כתב נערך לאחרונה על ידי המתכנת התותח
    #110

    @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

    מה לא ברור? אתה אמרת שאתה מאמן את Qwen3-0.6B. שאלתי למה הלכת על מודל ישן, תלך על המודל החדש - Qwen3.5-0.8B שהוא גם יותר טוב בעברית, אז אמרת שהוא כבד לך מידי, אז עניתי שהפער קטן מאוד, ואם תאמן אותו בלי רכיב הראיה שלו שתופס בערך רבע מגודלו אז הוא אותו גודל כמו Qwen3-0.6B. זה הכל. לא הבנתי מה הסתבכת.

    @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

    מה זאת אומרת אם אני יקח את מודל של 8B של Qwen3 ויוריד לו את רכיב הראיה מה זה יתן לי? זה כמעט ולא יוריד כלום?

    @css-0 התבלבלת בין המודלים... זה לא Qwen3 -8.0B זה Qwen3.5-0.8B

    CSS 0C תגובה 1 תגובה אחרונה
    1
    • ה המתכנת התותח

      @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

      מה לא ברור? אתה אמרת שאתה מאמן את Qwen3-0.6B. שאלתי למה הלכת על מודל ישן, תלך על המודל החדש - Qwen3.5-0.8B שהוא גם יותר טוב בעברית, אז אמרת שהוא כבד לך מידי, אז עניתי שהפער קטן מאוד, ואם תאמן אותו בלי רכיב הראיה שלו שתופס בערך רבע מגודלו אז הוא אותו גודל כמו Qwen3-0.6B. זה הכל. לא הבנתי מה הסתבכת.

      @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

      מה זאת אומרת אם אני יקח את מודל של 8B של Qwen3 ויוריד לו את רכיב הראיה מה זה יתן לי? זה כמעט ולא יוריד כלום?

      @css-0 התבלבלת בין המודלים... זה לא Qwen3 -8.0B זה Qwen3.5-0.8B

      CSS 0C מנותק
      CSS 0C מנותק
      CSS 0
      כתב נערך לאחרונה על ידי
      #111

      @המתכנת-התותח האא ואי צודק @א.מ.ד. סליחה... טעות שלי...

      תגובה 1 תגובה אחרונה
      0
      • המלאךה מנותק
        המלאךה מנותק
        המלאך
        כתב נערך לאחרונה על ידי
        #112

        @עידו300 מה עשית תכלס' עם שלך? ראג'?

        תגובה 1 תגובה אחרונה
        0
        • א.מ.ד.א א.מ.ד.

          @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

          מה זאת אומרת אם אני יקח את מודל של 8B של Qwen3 ויוריד לו את רכיב הראיה מה זה יתן לי? זה כמעט ולא יוריד כלום?

          מה לא ברור? אתה אמרת שאתה מאמן את Qwen3-0.6B. שאלתי למה הלכת על מודל ישן, תלך על המודל החדש - Qwen3.5-0.8B שהוא גם יותר טוב בעברית, אז אמרת שהוא כבד לך מידי, אז עניתי שהפער קטן מאוד, ואם תאמן אותו בלי רכיב הראיה שלו שתופס בערך רבע מגודלו אז הוא אותו גודל כמו Qwen3-0.6B. זה הכל. לא הבנתי מה הסתבכת.

          CSS 0C מנותק
          CSS 0C מנותק
          CSS 0
          כתב נערך לאחרונה על ידי
          #113

          @א.מ.ד. טוב החלטתי ללכת על Qwen3.5-2B

          א.מ.ד.א תגובה 1 תגובה אחרונה
          0
          • CSS 0C CSS 0

            @א.מ.ד. טוב החלטתי ללכת על Qwen3.5-2B

            א.מ.ד.א מנותק
            א.מ.ד.א מנותק
            א.מ.ד.
            כתב נערך לאחרונה על ידי
            #114

            @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

            @א.מ.ד. טוב החלטתי ללכת על Qwen3.5-2B

            מעולה, גם יש לו בסיס טוב בהבנת עברית גם אם לדבר בעברית הוא לא מצליח. לדוגמא אם תבקש ממנו באנגלית שיסביר לך באנגלית מילה עברית, הוא יצליח.

            מפתח אפליקציות אנדרואיד
            em0548438097@gmail.com

            CSS 0C תגובה 1 תגובה אחרונה
            0
            • א.מ.ד.א א.מ.ד.

              @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

              @א.מ.ד. טוב החלטתי ללכת על Qwen3.5-2B

              מעולה, גם יש לו בסיס טוב בהבנת עברית גם אם לדבר בעברית הוא לא מצליח. לדוגמא אם תבקש ממנו באנגלית שיסביר לך באנגלית מילה עברית, הוא יצליח.

              CSS 0C מנותק
              CSS 0C מנותק
              CSS 0
              כתב נערך לאחרונה על ידי CSS 0
              #115

              @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

              האא מצויין! אז אני עושה לו כוונון על 70GB של טקסט איכותי בעברית, ככה שהעברית שלו ככל הנראה תעקוף את Qwen3.5-8B אני צודק?

              CSS 0C א.מ.ד.א 2 תגובות תגובה אחרונה
              0
              • CSS 0C CSS 0

                @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                האא מצויין! אז אני עושה לו כוונון על 70GB של טקסט איכותי בעברית, ככה שהעברית שלו ככל הנראה תעקוף את Qwen3.5-8B אני צודק?

                CSS 0C מנותק
                CSS 0C מנותק
                CSS 0
                כתב נערך לאחרונה על ידי CSS 0
                #116

                נפגש עוד 20 שעות כוונון שיקח ל GPU T4 X2...

                תגובה 1 תגובה אחרונה
                0
                • CSS 0C CSS 0

                  @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                  האא מצויין! אז אני עושה לו כוונון על 70GB של טקסט איכותי בעברית, ככה שהעברית שלו ככל הנראה תעקוף את Qwen3.5-8B אני צודק?

                  א.מ.ד.א מנותק
                  א.מ.ד.א מנותק
                  א.מ.ד.
                  כתב נערך לאחרונה על ידי
                  #117

                  @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                  האא מצויין! אז אני עושה לו כוונון על 70GB של טקסט איכותי בעברית, ככה שהעברית שלו ככל הנראה תעקוף את Qwen3.5-8B אני צודק?

                  1. כוונון על כזה הרבה חומר לוקח שבועות רצופים עם כזו חומרה, אם לא חודשים.
                  2. די מהר תגיע לשלב שכל שורה נוספת שתאמן רק תהרוס את המודל ותגרום לו לאימון יתר ואיבוד יכולת ההכללה.

                  כדאי שתהיה ערני לבדוק מידי פעם את ה-LOSS של האימון ביחס ל-LOSS של ההכללה, ולראות שהפער ביניהם לא גדול מידי ושאין עליה באף אחד מהם.

                  מפתח אפליקציות אנדרואיד
                  em0548438097@gmail.com

                  ה תגובה 1 תגובה אחרונה
                  1
                  • א.מ.ד.א א.מ.ד.

                    @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                    האא מצויין! אז אני עושה לו כוונון על 70GB של טקסט איכותי בעברית, ככה שהעברית שלו ככל הנראה תעקוף את Qwen3.5-8B אני צודק?

                    1. כוונון על כזה הרבה חומר לוקח שבועות רצופים עם כזו חומרה, אם לא חודשים.
                    2. די מהר תגיע לשלב שכל שורה נוספת שתאמן רק תהרוס את המודל ותגרום לו לאימון יתר ואיבוד יכולת ההכללה.

                    כדאי שתהיה ערני לבדוק מידי פעם את ה-LOSS של האימון ביחס ל-LOSS של ההכללה, ולראות שהפער ביניהם לא גדול מידי ושאין עליה באף אחד מהם.

                    ה מנותק
                    ה מנותק
                    המתכנת התותח
                    כתב נערך לאחרונה על ידי המתכנת התותח
                    #118

                    @css-0 אל תאמן אותו ישירות כדי שלא יקח מלא זמן וגם כדי לא לשרוף לא את המח אל תעשה את זה כ LoRA.

                    CSS 0C תגובה 1 תגובה אחרונה
                    1
                    • ה המתכנת התותח

                      @css-0 אל תאמן אותו ישירות כדי שלא יקח מלא זמן וגם כדי לא לשרוף לא את המח אל תעשה את זה כ LoRA.

                      CSS 0C מנותק
                      CSS 0C מנותק
                      CSS 0
                      כתב נערך לאחרונה על ידי
                      #119

                      @המתכנת-התותח ככה אני עושה

                      תודה על העצה, העיקר הרצון הטוב 😊

                      תגובה 1 תגובה אחרונה
                      0

                      • התחברות

                      • אין לך חשבון עדיין? הרשמה

                      • התחברו או הירשמו כדי לחפש.
                      • פוסט ראשון
                        פוסט אחרון
                      0
                      • חוקי הפורום
                      • פופולרי
                      • לא נפתר
                      • משתמשים
                      • חיפוש גוגל בפורום
                      • צור קשר