דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית

בקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
119 פוסטים 10 כותבים 805 צפיות 9 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • sivan22S sivan22

    @א.מ.ד. הגישה היותר נכונה לדעתי היא לא לחפש מאגרי נתונים אלא לסנתז אותם, כמו שהזכרת לעיל. כך מאמנים היום את רוב/כל המודלים החדשים.
    אתה יכול לקרוא לזה גם תהליך שבו המודל הגדול (קלוד) "מלמד" את המודל הקטן.

    א.מ.ד.א מנותק
    א.מ.ד.א מנותק
    א.מ.ד.
    כתב נערך לאחרונה על ידי
    #70

    @sivan22 אתה מתכוון לזיקוק.
    אבל בדרך כלל משתמשים בזה על מודל קיים, כמו המודלים הקטנים של דיפסיק שבנויים על המודלים של Qwen ו-Llama.
    בשביל לבנות מאפס צריך ליצור מאות אלפי ואפילו מיליוני קטעים כאלו, ואז באמת האיכות גבוהה מאוד (מודלי Phi של מיקרוסופט אומנו בעיקר על נתונים כאלו, ונחשבו פריצת דרך בזמנם), אבל זו עבודה מטורפת ועלות גבוהה מאוד. אפשר להשתמש בזה מקסימום בשביל כוונון עדין מינימלי.

    מפתח אפליקציות אנדרואיד
    em0548438097@gmail.com

    תגובה 1 תגובה אחרונה
    0
    • א.מ.ד.א א.מ.ד.

      @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

      שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?

      כן כמובן.

      @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

      הבעיה היא שזה לוקח כמה שבועות אם לא חודשים, אין לי זמן וכוח לזה.

      בהחלט, ובשביל שיהיה בחינם צריך להפעיל את זה מחדש כל יום.

      @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

      חוץ מזה זה דורש דאטה..
      @א.מ.ד. מאיפה הדאטה שלך? הורדת את המכלול?

      הלוואי שהמכלול היה מספיק...
      מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...
      האמת היא שזה תלוי בגודל המודל. לדוגמא מודל ה-0.6B שלי השתמש רק בשבריר מהחומר, ואז מיצה את הלמידה ממנו.
      אבל בשביל לאמן מודל יותר גדול, צריך GPU יותר חזק וזה כבר עולה כסף והרבה...
      תראה את דיקטה, שיש להם מערכי נתונים עצומים בעברית, מימון (ממשלתי אם אני לא טועה) ושיתוף פעולה עמוק עם אנבידיה, ומודל ה-1.7B שלהם גרוע יחסית למודלים בשפות אחרות וחסר יכולות אמיתיות.
      מה שאני חשבתי לעשות זה לכוונן את דיקטה למשימות ספציפיות.
      אם יהיה מימון לזה אין לי בעיה לעשות את זה, אבל כמו שכתבתי זה לא כל כך פשוט...

      CSS 0C מנותק
      CSS 0C מנותק
      CSS 0
      כתב נערך לאחרונה על ידי
      #71

      @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

      מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...

      איזה?

      (ת'אמת ראיתי משהו והוא שוקל 47GB זה זה?)

      א.מ.ד.א תגובה 1 תגובה אחרונה
      0
      • CSS 0C CSS 0

        @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

        מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...

        איזה?

        (ת'אמת ראיתי משהו והוא שוקל 47GB זה זה?)

        א.מ.ד.א מנותק
        א.מ.ד.א מנותק
        א.מ.ד.
        כתב נערך לאחרונה על ידי
        #72

        @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

        איזה?

        (ת'אמת ראיתי משהו והוא שוקל 47GB זה זה?)

        איך קוראים לו? אני יגיד לך אם כן... בגדול אין יותר מידי מערכים גדולים בעברית אז סביר להניח שזה זה.

        מפתח אפליקציות אנדרואיד
        em0548438097@gmail.com

        CSS 0C תגובה 1 תגובה אחרונה
        0
        • א.מ.ד.א א.מ.ד.

          @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

          איזה?

          (ת'אמת ראיתי משהו והוא שוקל 47GB זה זה?)

          איך קוראים לו? אני יגיד לך אם כן... בגדול אין יותר מידי מערכים גדולים בעברית אז סביר להניח שזה זה.

          CSS 0C מנותק
          CSS 0C מנותק
          CSS 0
          כתב נערך לאחרונה על ידי
          #73

          @א.מ.ד. HeDC4

          א.מ.ד.א תגובה 1 תגובה אחרונה
          0
          • CSS 0C CSS 0

            @א.מ.ד. HeDC4

            א.מ.ד.א מנותק
            א.מ.ד.א מנותק
            א.מ.ד.
            כתב נערך לאחרונה על ידי
            #74

            @CSS-0 לא חושב.

            מפתח אפליקציות אנדרואיד
            em0548438097@gmail.com

            CSS 0C תגובה 1 תגובה אחרונה
            0
            • א.מ.ד.א א.מ.ד.

              @CSS-0 לא חושב.

              CSS 0C מנותק
              CSS 0C מנותק
              CSS 0
              כתב נערך לאחרונה על ידי
              #75

              @א.מ.ד. https://huggingface.co/datasets/HeNLP/HeDC4

              א.מ.ד.א תגובה 1 תגובה אחרונה
              0
              • CSS 0C CSS 0

                @א.מ.ד. https://huggingface.co/datasets/HeNLP/HeDC4

                א.מ.ד.א מנותק
                א.מ.ד.א מנותק
                א.מ.ד.
                כתב נערך לאחרונה על ידי
                #76

                @CSS-0 הוא נראה פחות איכותי. אולי זה תרגום מכונה כלשהו.

                מפתח אפליקציות אנדרואיד
                em0548438097@gmail.com

                CSS 0C תגובה 1 תגובה אחרונה
                0
                • א.מ.ד.א א.מ.ד.

                  @CSS-0 הוא נראה פחות איכותי. אולי זה תרגום מכונה כלשהו.

                  CSS 0C מנותק
                  CSS 0C מנותק
                  CSS 0
                  כתב נערך לאחרונה על ידי
                  #77

                  @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                  @CSS-0 הוא נראה פחות איכותי. אולי זה תרגום מכונה כלשהו.

                  מה זה מה שאתה מצאת?

                  א.מ.ד.א תגובה 1 תגובה אחרונה
                  0
                  • CSS 0C CSS 0

                    @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                    @CSS-0 הוא נראה פחות איכותי. אולי זה תרגום מכונה כלשהו.

                    מה זה מה שאתה מצאת?

                    א.מ.ד.א מנותק
                    א.מ.ד.א מנותק
                    א.מ.ד.
                    כתב נערך לאחרונה על ידי
                    #78

                    @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                    מה זה מה שאתה מצאת?

                    https://huggingface.co/datasets/Moveo/hebrew_pretrain_v1_4baseData

                    מפתח אפליקציות אנדרואיד
                    em0548438097@gmail.com

                    תגובה 1 תגובה אחרונה
                    2
                    • ע מנותק
                      ע מנותק
                      עידו300
                      כתב נערך לאחרונה על ידי
                      #79

                      כמה המירך צריך להיות גדול?
                      ומה צריך להיות כתוב בו

                      א.מ.ד.א תגובה 1 תגובה אחרונה
                      0
                      • ע עידו300

                        כמה המירך צריך להיות גדול?
                        ומה צריך להיות כתוב בו

                        א.מ.ד.א מנותק
                        א.מ.ד.א מנותק
                        א.מ.ד.
                        כתב נערך לאחרונה על ידי
                        #80

                        @עידו300 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                        כמה המירך צריך להיות גדול?
                        ומה צריך להיות כתוב בו

                        צריך להיות בו לפחות מיליארד טוקנים בשביל מודל בסביבות ה-2B, אבל הם צריכים להיות נקיים ואיכותיים, בלי זבל אינטרנט ותגיות HTML וכדומה.

                        מפתח אפליקציות אנדרואיד
                        em0548438097@gmail.com

                        ע תגובה 1 תגובה אחרונה
                        0
                        • א.מ.ד.א א.מ.ד.

                          @עידו300 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                          כמה המירך צריך להיות גדול?
                          ומה צריך להיות כתוב בו

                          צריך להיות בו לפחות מיליארד טוקנים בשביל מודל בסביבות ה-2B, אבל הם צריכים להיות נקיים ואיכותיים, בלי זבל אינטרנט ותגיות HTML וכדומה.

                          ע מנותק
                          ע מנותק
                          עידו300
                          כתב נערך לאחרונה על ידי
                          #81

                          @א.מ.ד. כמה זה כל טוקן?
                          אם לדוגמא נבקש מהם להשתמש בגליונות, יש שם המון חומר איכותי מקצועי בעברית ולא שטויות. אני פשוט לא יודע כמה זה כל טוקן.

                          המלאךה א.מ.ד.א 3 תגובות תגובה אחרונה
                          0
                          • ע עידו300

                            @א.מ.ד. כמה זה כל טוקן?
                            אם לדוגמא נבקש מהם להשתמש בגליונות, יש שם המון חומר איכותי מקצועי בעברית ולא שטויות. אני פשוט לא יודע כמה זה כל טוקן.

                            המלאךה מנותק
                            המלאךה מנותק
                            המלאך
                            כתב נערך לאחרונה על ידי
                            #82

                            @עידו300 זה תלוי בשפה.
                            עברית לדוגמא זה די מורכב.
                            בגדול בשפות רגילות זה מחולק למילה.
                            בעברית זה תלוי איזה מילים.
                            לדוגמא "הלכתי" מחולק ל2- "הלכ" "תי".
                            זה קצת קשה להסבר.. [סתם כך יש כמה סוגי דרכים לפרק מילה לטוקנים..]
                            בכל מקרה האתר הזה לדוגמא [בלי להיכנס לעניין משפטי שזה כמובן אסור ומוגן בזכויות יוצרים] יש הרבה תגיות html יש צורך להוריד רווחים וכותרות.
                            אחרי זה מחלקים לקטעים, אחרי זה אתה משתמש tokenizer של המודל לפירוק לטוקנים..
                            לדעתי לא נראה לי אפשרי לצורך שלך לעשות אימון מלא של מודל.
                            זה פשוט לא יהיה יעיל יחסית להשקעה.
                            פשוט תלך על ראג'.

                            תגובה 1 תגובה אחרונה
                            0
                            • ע עידו300

                              @א.מ.ד. כמה זה כל טוקן?
                              אם לדוגמא נבקש מהם להשתמש בגליונות, יש שם המון חומר איכותי מקצועי בעברית ולא שטויות. אני פשוט לא יודע כמה זה כל טוקן.

                              המלאךה מנותק
                              המלאךה מנותק
                              המלאך
                              כתב נערך לאחרונה על ידי
                              #83
                              פוסט זה נמחק!
                              תגובה 1 תגובה אחרונה
                              0
                              • ע עידו300

                                @א.מ.ד. כמה זה כל טוקן?
                                אם לדוגמא נבקש מהם להשתמש בגליונות, יש שם המון חומר איכותי מקצועי בעברית ולא שטויות. אני פשוט לא יודע כמה זה כל טוקן.

                                א.מ.ד.א מנותק
                                א.מ.ד.א מנותק
                                א.מ.ד.
                                כתב נערך לאחרונה על ידי
                                #84

                                @עידו300 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                אם לדוגמא נבקש מהם להשתמש בגליונות, יש שם המון חומר איכותי מקצועי בעברית ולא שטויות. אני פשוט לא יודע כמה זה כל טוקן.

                                אני חושב שלא ממש הבנת מה הכמויות שצריך בשביל לאמן מודל מאפס. קח את כל האינטרנט העברי, וזה לא יספיק לאימון של מודל קטן.

                                @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                @עידו300 זה תלוי בשפה.
                                עברית לדוגמא זה די מורכב.
                                בגדול בשפות רגילות זה מחולק למילה.
                                בעברית זה תלוי איזה מילים.
                                לדוגמא "הלכתי" מחולק ל2- "הלכ" "תי".
                                זה קצת קשה להסבר.. [סתם כך יש כמה סוגי דרכים לפרק מילה לטוקנים..]

                                כיום במודלים החדשים אין הבדל משמעותי בין עברית לאנגלית. הכל עניין של אימון הטוקנייזר.

                                מפתח אפליקציות אנדרואיד
                                em0548438097@gmail.com

                                CSS 0C המלאךה 2 תגובות תגובה אחרונה
                                0
                                • א.מ.ד.א א.מ.ד.

                                  @עידו300 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                  אם לדוגמא נבקש מהם להשתמש בגליונות, יש שם המון חומר איכותי מקצועי בעברית ולא שטויות. אני פשוט לא יודע כמה זה כל טוקן.

                                  אני חושב שלא ממש הבנת מה הכמויות שצריך בשביל לאמן מודל מאפס. קח את כל האינטרנט העברי, וזה לא יספיק לאימון של מודל קטן.

                                  @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                  @עידו300 זה תלוי בשפה.
                                  עברית לדוגמא זה די מורכב.
                                  בגדול בשפות רגילות זה מחולק למילה.
                                  בעברית זה תלוי איזה מילים.
                                  לדוגמא "הלכתי" מחולק ל2- "הלכ" "תי".
                                  זה קצת קשה להסבר.. [סתם כך יש כמה סוגי דרכים לפרק מילה לטוקנים..]

                                  כיום במודלים החדשים אין הבדל משמעותי בין עברית לאנגלית. הכל עניין של אימון הטוקנייזר.

                                  CSS 0C מנותק
                                  CSS 0C מנותק
                                  CSS 0
                                  כתב נערך לאחרונה על ידי CSS 0
                                  #85

                                  @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                  קח את כל האינטרנט העברי, וזה לא יספיק לאימון של מודל קטן.

                                  מקווה בשביך שאתה אמרת בציניות.... ולא ברצינות
                                  (אלא עם אתה אוחז שכל האינטרנט העברי שוקל 250GB של נתונים שהשגתי לאימון... זה כל האינטרנט העברי.)

                                  שדרך אגב בשעות אלה אני עושה כוונות למודל על 70GB של טקסט בעברית איכותי להביא אותו ל LOSS של 2.00000))
                                  הגדרתי לו לרוץ עד 2,500 STOPS אבל כנראה שהו יצתרך פחות ומקווה שה 30 שעות בחודש של kaggle יספיקו לכוונון מודל...

                                  א.מ.ד.א תגובה 1 תגובה אחרונה
                                  0
                                  • CSS 0C CSS 0

                                    @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                    קח את כל האינטרנט העברי, וזה לא יספיק לאימון של מודל קטן.

                                    מקווה בשביך שאתה אמרת בציניות.... ולא ברצינות
                                    (אלא עם אתה אוחז שכל האינטרנט העברי שוקל 250GB של נתונים שהשגתי לאימון... זה כל האינטרנט העברי.)

                                    שדרך אגב בשעות אלה אני עושה כוונות למודל על 70GB של טקסט בעברית איכותי להביא אותו ל LOSS של 2.00000))
                                    הגדרתי לו לרוץ עד 2,500 STOPS אבל כנראה שהו יצתרך פחות ומקווה שה 30 שעות בחודש של kaggle יספיקו לכוונון מודל...

                                    א.מ.ד.א מנותק
                                    א.מ.ד.א מנותק
                                    א.מ.ד.
                                    כתב נערך לאחרונה על ידי
                                    #86

                                    @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                    מקווה בשביך שאתה אמרת בציניות.... ולא ברצינות

                                    ברצינות גמורה!

                                    @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                    (אלא עם אתה אוחז שכל האינטרנט העברי שוקל 250GB של נתונים שהשגתי לאימון... זה כל האינטרנט העברי.)

                                    זה כמעט כל האינטרנט העברי (הטקסטואלי), סביר להניח עם כפילויות רבות. רוב מערכי הנתונים בעברית חוזרים על עצמם. מציע לך לזרוק את כולם ולהשאיר את הנקי ביותר.

                                    @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                    שדרך אגב בשעות אלה אני עושה כוונות למודל על 70GB של טקסט בעברית איכותי להביא אותו ל LOSS של 2.00000))
                                    הגדרתי לו לרוץ עד 2,500 STOPS אבל כנראה שהו יצתרך פחות ומקווה שה 30 שעות בחודש של kaggle יספיקו לכוונון מודל...

                                    כוונון זה סיפור אחר לגמרי, מספיק אפילו 500-2000 דוגמאות בלבד. כבר יש מודל תקין ורק צריך לכוונן אותו.

                                    מפתח אפליקציות אנדרואיד
                                    em0548438097@gmail.com

                                    CSS 0C 2 תגובות תגובה אחרונה
                                    0
                                    • א.מ.ד.א א.מ.ד.

                                      @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                      מקווה בשביך שאתה אמרת בציניות.... ולא ברצינות

                                      ברצינות גמורה!

                                      @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                      (אלא עם אתה אוחז שכל האינטרנט העברי שוקל 250GB של נתונים שהשגתי לאימון... זה כל האינטרנט העברי.)

                                      זה כמעט כל האינטרנט העברי (הטקסטואלי), סביר להניח עם כפילויות רבות. רוב מערכי הנתונים בעברית חוזרים על עצמם. מציע לך לזרוק את כולם ולהשאיר את הנקי ביותר.

                                      @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                      שדרך אגב בשעות אלה אני עושה כוונות למודל על 70GB של טקסט בעברית איכותי להביא אותו ל LOSS של 2.00000))
                                      הגדרתי לו לרוץ עד 2,500 STOPS אבל כנראה שהו יצתרך פחות ומקווה שה 30 שעות בחודש של kaggle יספיקו לכוונון מודל...

                                      כוונון זה סיפור אחר לגמרי, מספיק אפילו 500-2000 דוגמאות בלבד. כבר יש מודל תקין ורק צריך לכוונן אותו.

                                      CSS 0C מנותק
                                      CSS 0C מנותק
                                      CSS 0
                                      כתב נערך לאחרונה על ידי CSS 0
                                      #87

                                      @א.מ.ד. אמממ המודל שלקחתי העברית שלו בלתי תקנית בעליל ככה שהכונון הזה די דרסטי (המודל שלקחתי זה: Qwen3-0.6B) ואני לא יודע כמה STOPS הוא יצתרך נחייה ונראה... (ב STOP ה 85 הוא אחז ב 3.4 כשב STOP ה 5 הוא אחז על 3.9

                                      א.מ.ד.א תגובה 1 תגובה אחרונה
                                      0
                                      • א.מ.ד.א א.מ.ד.

                                        @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                        מקווה בשביך שאתה אמרת בציניות.... ולא ברצינות

                                        ברצינות גמורה!

                                        @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                        (אלא עם אתה אוחז שכל האינטרנט העברי שוקל 250GB של נתונים שהשגתי לאימון... זה כל האינטרנט העברי.)

                                        זה כמעט כל האינטרנט העברי (הטקסטואלי), סביר להניח עם כפילויות רבות. רוב מערכי הנתונים בעברית חוזרים על עצמם. מציע לך לזרוק את כולם ולהשאיר את הנקי ביותר.

                                        @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                        שדרך אגב בשעות אלה אני עושה כוונות למודל על 70GB של טקסט בעברית איכותי להביא אותו ל LOSS של 2.00000))
                                        הגדרתי לו לרוץ עד 2,500 STOPS אבל כנראה שהו יצתרך פחות ומקווה שה 30 שעות בחודש של kaggle יספיקו לכוונון מודל...

                                        כוונון זה סיפור אחר לגמרי, מספיק אפילו 500-2000 דוגמאות בלבד. כבר יש מודל תקין ורק צריך לכוונן אותו.

                                        CSS 0C מנותק
                                        CSS 0C מנותק
                                        CSS 0
                                        כתב נערך לאחרונה על ידי CSS 0
                                        #88

                                        @א.מ.ד. ודרך אגב אתה אמרת שיש לך רק 3 שעות של כח חישוב כל יום, איך זה? ואיך אתה מסתדר עם זה? ולה אתה לא עובר ל kaggle? אומנם בסך הכללי זה פחות אבל ברצף זה יותר והמומחיות שלו זה שאתה מקבל GPU T4 X2 ל 30 שעות כל חודש...

                                        תגובה 1 תגובה אחרונה
                                        0
                                        • CSS 0C CSS 0

                                          @א.מ.ד. אמממ המודל שלקחתי העברית שלו בלתי תקנית בעליל ככה שהכונון הזה די דרסטי (המודל שלקחתי זה: Qwen3-0.6B) ואני לא יודע כמה STOPS הוא יצתרך נחייה ונראה... (ב STOP ה 85 הוא אחז ב 3.4 כשב STOP ה 5 הוא אחז על 3.9

                                          א.מ.ד.א מנותק
                                          א.מ.ד.א מנותק
                                          א.מ.ד.
                                          כתב נערך לאחרונה על ידי
                                          #89

                                          @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                          @א.מ.ד. אמממ המודל שלקחתי העברית שלו בלתי תקנית בעליל ככה שהכונון הזה די דרסטי (המודל שלקחתי זה: Qwen3-0.6B) ואני לא יודע כמה STOPS הוא יצתרך נחייה ונראה... (ב STOP ה 85 הוא אחז ב 3.4 כשב STOP ה 5 הוא אחז על 3.9

                                          אתה מתכוון ל-steps...
                                          לדעתי זה בזבוז משאבים. המודל הזה לא ייקלוט עברית. תנסה לכוונן מודל עם כיוון טוב בעברית, תחזק אצלו את הנושא הזה.
                                          ואם כבר Qwen, למה לא Qwen3.5-0.8B?

                                          @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                          @א.מ.ד. ודרך אגב אתה אמרת שיש לך רק 3 שעות של כח חישוב כל יום, איך זה? ואיך אתה מסתדר עם זה? ולה אתה לא עובר ל kaggle? אומנם בסך הכללי זה פחות אבל ברצף זה יותר והמומחיות שלו זה שאתה מקבל GPU T4 X2 ל 30 שעות כל חודש...

                                          כי בקולאב יש לי בסה"כ כ-100 שעות GPU בחודש, וגם הוא הרבה יותר נוח.

                                          מפתח אפליקציות אנדרואיד
                                          em0548438097@gmail.com

                                          CSS 0C תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • פופולרי
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר