דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית

בקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית

מתוזמן נעוץ נעול הועבר נפתר עזרה הדדית - בינה מלאכותית
78 פוסטים 9 כותבים 326 צפיות 9 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • המלאךה המלאך

    @עידו300 אני גם יודע לאמן.
    הבעיה היא שזה לוקח כמה שבועות אם לא חודשים, אין לי זמן וכוח לזה.
    חוץ מזה זה דורש דאטה..
    @א.מ.ד. מאיפה הדאטה שלך? הורדת את המכלול?

    ע מחובר
    ע מחובר
    עידו300
    כתב נערך לאחרונה על ידי
    #56

    @המלאך נו, אז תכתוב איך ואני אעשה לבד.

    אם יעבדו על זה מכמה חשבונות זה יהיה יותר מהר לענ"ד.

    גם אם לא יועיל לעכשיו יועיל לאח"כ, אני לא חושב שזה הפעם האחרונה שאתה הולך להיתקל בAI.

    המלאךה תגובה 1 תגובה אחרונה
    0
    • ע עידו300

      @המלאך נו, אז תכתוב איך ואני אעשה לבד.

      אם יעבדו על זה מכמה חשבונות זה יהיה יותר מהר לענ"ד.

      גם אם לא יועיל לעכשיו יועיל לאח"כ, אני לא חושב שזה הפעם האחרונה שאתה הולך להיתקל בAI.

      המלאךה מנותק
      המלאךה מנותק
      המלאך
      כתב נערך לאחרונה על ידי
      #57

      @עידו300 זה מדריך שלם..
      זה ארוך.
      משלב בחירת המודל, שיטת אימון, ספריות, טעינה, דאטה, אימון, דרייב (שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?) ועוד הרבה דברים שצריך לזכור.

      ע א.מ.ד.א 2 תגובות תגובה אחרונה
      0
      • המלאךה המלאך

        @עידו300 זה מדריך שלם..
        זה ארוך.
        משלב בחירת המודל, שיטת אימון, ספריות, טעינה, דאטה, אימון, דרייב (שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?) ועוד הרבה דברים שצריך לזכור.

        ע מחובר
        ע מחובר
        עידו300
        כתב נערך לאחרונה על ידי
        #58

        @המלאך @א.מ.ד. טוב, נחכה למדריך?

        המלאךה תגובה 1 תגובה אחרונה
        0
        • המלאךה המלאך

          @עידו300 זה מדריך שלם..
          זה ארוך.
          משלב בחירת המודל, שיטת אימון, ספריות, טעינה, דאטה, אימון, דרייב (שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?) ועוד הרבה דברים שצריך לזכור.

          א.מ.ד.א מחובר
          א.מ.ד.א מחובר
          א.מ.ד.
          כתב נערך לאחרונה על ידי
          #59

          @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

          שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?

          כן כמובן.

          @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

          הבעיה היא שזה לוקח כמה שבועות אם לא חודשים, אין לי זמן וכוח לזה.

          בהחלט, ובשביל שיהיה בחינם צריך להפעיל את זה מחדש כל יום.

          @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

          חוץ מזה זה דורש דאטה..
          @א.מ.ד. מאיפה הדאטה שלך? הורדת את המכלול?

          הלוואי שהמכלול היה מספיק...
          מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...
          האמת היא שזה תלוי בגודל המודל. לדוגמא מודל ה-0.6B שלי השתמש רק בשבריר מהחומר, ואז מיצה את הלמידה ממנו.
          אבל בשביל לאמן מודל יותר גדול, צריך GPU יותר חזק וזה כבר עולה כסף והרבה...
          תראה את דיקטה, שיש להם מערכי נתונים עצומים בעברית, מימון (ממשלתי אם אני לא טועה) ושיתוף פעולה עמוק עם אנבידיה, ומודל ה-1.7B שלהם גרוע יחסית למודלים בשפות אחרות וחסר יכולות אמיתיות.
          מה שאני חשבתי לעשות זה לכוונן את דיקטה למשימות ספציפיות.
          אם יהיה מימון לזה אין לי בעיה לעשות את זה, אבל כמו שכתבתי זה לא כל כך פשוט...

          מפתח אפליקציות אנדרואיד
          em0548438097@gmail.com

          mefateachM CSS 0C 4 תגובות תגובה אחרונה
          0
          • א.מ.ד.א א.מ.ד.

            @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

            שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?

            כן כמובן.

            @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

            הבעיה היא שזה לוקח כמה שבועות אם לא חודשים, אין לי זמן וכוח לזה.

            בהחלט, ובשביל שיהיה בחינם צריך להפעיל את זה מחדש כל יום.

            @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

            חוץ מזה זה דורש דאטה..
            @א.מ.ד. מאיפה הדאטה שלך? הורדת את המכלול?

            הלוואי שהמכלול היה מספיק...
            מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...
            האמת היא שזה תלוי בגודל המודל. לדוגמא מודל ה-0.6B שלי השתמש רק בשבריר מהחומר, ואז מיצה את הלמידה ממנו.
            אבל בשביל לאמן מודל יותר גדול, צריך GPU יותר חזק וזה כבר עולה כסף והרבה...
            תראה את דיקטה, שיש להם מערכי נתונים עצומים בעברית, מימון (ממשלתי אם אני לא טועה) ושיתוף פעולה עמוק עם אנבידיה, ומודל ה-1.7B שלהם גרוע יחסית למודלים בשפות אחרות וחסר יכולות אמיתיות.
            מה שאני חשבתי לעשות זה לכוונן את דיקטה למשימות ספציפיות.
            אם יהיה מימון לזה אין לי בעיה לעשות את זה, אבל כמו שכתבתי זה לא כל כך פשוט...

            mefateachM מחובר
            mefateachM מחובר
            mefateach
            מדריכים
            כתב נערך לאחרונה על ידי
            #60

            @א.מ.ד. אם אתה מאמן למשימות ספציפיות לדעתי האימון הכי טוב זה לשימוש בכלים, וידע כללי, אף אחד לא ינסה לתכנת עם כזה מודל וגם לא לפתור בעיות מורכבות, לדעתי מה שהכי צריך זה מודל שיודע להשתמש בכלים בצורה טובה, זה לא מדי מסובך ועם אימון טוב זה יכול לעבוד פצצה (נניח אני מחפש אחד כזה בשביל הומ אססיטנט שיוכל לשלוט על הבית) אבל אני מאמין שזה מאוד שימושי בכללי

            Life is learning

            ע א.מ.ד.א 2 תגובות תגובה אחרונה
            0
            • mefateachM mefateach

              @א.מ.ד. אם אתה מאמן למשימות ספציפיות לדעתי האימון הכי טוב זה לשימוש בכלים, וידע כללי, אף אחד לא ינסה לתכנת עם כזה מודל וגם לא לפתור בעיות מורכבות, לדעתי מה שהכי צריך זה מודל שיודע להשתמש בכלים בצורה טובה, זה לא מדי מסובך ועם אימון טוב זה יכול לעבוד פצצה (נניח אני מחפש אחד כזה בשביל הומ אססיטנט שיוכל לשלוט על הבית) אבל אני מאמין שזה מאוד שימושי בכללי

              ע מחובר
              ע מחובר
              עידו300
              כתב נערך לאחרונה על ידי
              #61

              @mefateach זה לא נכנס כבר לMCP?

              תגובה 1 תגובה אחרונה
              0
              • ע עידו300

                @המלאך @א.מ.ד. טוב, נחכה למדריך?

                המלאךה מנותק
                המלאךה מנותק
                המלאך
                כתב נערך לאחרונה על ידי
                #62

                @עידו300 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                טוב, נחכה למדריך?

                נראה לי @א.מ.ד. עושה.
                אני משער שהוא יעדכן אותי אם הוא לא ימצא זמן לזה, (בין עשרות דברים שהוא עושה במקביל, רובם בחינם לטובת הציבור... תעריכו!)
                ואז אני אעשה..

                @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                הלוואי שהמכלול היה מספיק...
                מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...
                האמת היא שזה תלוי בגודל המודל. לדוגמא מודל ה-0.6B שלי השתמש רק בשבריר מהחומר, ואז מיצה את הלמידה ממנו.
                אבל בשביל לאמן מודל יותר גדול, צריך GPU יותר חזק וזה כבר עולה כסף והרבה...
                תראה את דיקטה, שיש להם מערכי נתונים עצומים בעברית, מימון (ממשלתי אם אני לא טועה) ושיתוף פעולה עמוק עם אנבידיה, ומודל ה-1.7B שלהם גרוע יחסית למודלים בשפות אחרות וחסר יכולות אמיתיות.
                מה שאני חשבתי לעשות זה לכוונן את דיקטה למשימות ספציפיות.
                אם יהיה מימון לזה אין לי בעיה לעשות את זה, אבל כמו שכתבתי זה לא כל כך פשוט...

                כמובן שצחקתי.
                אחד החלקים הכי מסובכים זה הדאטה, אלא אם יהיה איזה כלי (אולי בינה🤔 ) שיסדר כמויות אדירות של טקסט לדאטה איכותי.
                אם כי כמובן זה לא הגיוני, לפחות לא ביכולות ובגודל טוקנים של היום..
                אחרי הכל דאטה איכותי יכול להפוך מודל קטן ברבע מהמודלים הגדולים לחכם יותר מהם..
                (זה גם מה שקוואן עשו..)

                תגובה 1 תגובה אחרונה
                1
                • mefateachM mefateach

                  @א.מ.ד. אם אתה מאמן למשימות ספציפיות לדעתי האימון הכי טוב זה לשימוש בכלים, וידע כללי, אף אחד לא ינסה לתכנת עם כזה מודל וגם לא לפתור בעיות מורכבות, לדעתי מה שהכי צריך זה מודל שיודע להשתמש בכלים בצורה טובה, זה לא מדי מסובך ועם אימון טוב זה יכול לעבוד פצצה (נניח אני מחפש אחד כזה בשביל הומ אססיטנט שיוכל לשלוט על הבית) אבל אני מאמין שזה מאוד שימושי בכללי

                  א.מ.ד.א מחובר
                  א.מ.ד.א מחובר
                  א.מ.ד.
                  כתב נערך לאחרונה על ידי
                  #63

                  @mefateach כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                  @א.מ.ד. אם אתה מאמן למשימות ספציפיות לדעתי האימון הכי טוב זה לשימוש בכלים, וידע כללי, אף אחד לא ינסה לתכנת עם כזה מודל וגם לא לפתור בעיות מורכבות, לדעתי מה שהכי צריך זה מודל שיודע להשתמש בכלים בצורה טובה, זה לא מדי מסובך ועם אימון טוב זה יכול לעבוד פצצה (נניח אני מחפש אחד כזה בשביל הומ אססיטנט שיוכל לשלוט על הבית) אבל אני מאמין שזה מאוד שימושי בכללי

                  שימוש בכלים זה האימון הכי קשה, כי המודל צריך ללמוד לא לשבור את הקריאות לכלי ולשמור על לולאת פעולות מורכבת לאורך שיחה ארוכה... כיום אין עדיין מודל גם לא בשפות אחרות שמוצלח בקריאה לכלי פחות מ-4B.
                  דווקא ידע עולם אי אפשר טכנית להכניס במודלים קטנים, וההתקדמות בתחום הזה מינורית יחסית, אבל קידוד לא דורש הרבה ידע אלא בעיקר לוגיקה שבזה המודלים הקטנים משתפרים בשנים האחרונות.

                  מפתח אפליקציות אנדרואיד
                  em0548438097@gmail.com

                  mefateachM sivan22S 2 תגובות תגובה אחרונה
                  0
                  • א.מ.ד.א א.מ.ד.

                    @mefateach כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                    @א.מ.ד. אם אתה מאמן למשימות ספציפיות לדעתי האימון הכי טוב זה לשימוש בכלים, וידע כללי, אף אחד לא ינסה לתכנת עם כזה מודל וגם לא לפתור בעיות מורכבות, לדעתי מה שהכי צריך זה מודל שיודע להשתמש בכלים בצורה טובה, זה לא מדי מסובך ועם אימון טוב זה יכול לעבוד פצצה (נניח אני מחפש אחד כזה בשביל הומ אססיטנט שיוכל לשלוט על הבית) אבל אני מאמין שזה מאוד שימושי בכללי

                    שימוש בכלים זה האימון הכי קשה, כי המודל צריך ללמוד לא לשבור את הקריאות לכלי ולשמור על לולאת פעולות מורכבת לאורך שיחה ארוכה... כיום אין עדיין מודל גם לא בשפות אחרות שמוצלח בקריאה לכלי פחות מ-4B.
                    דווקא ידע עולם אי אפשר טכנית להכניס במודלים קטנים, וההתקדמות בתחום הזה מינורית יחסית, אבל קידוד לא דורש הרבה ידע אלא בעיקר לוגיקה שבזה המודלים הקטנים משתפרים בשנים האחרונות.

                    mefateachM מחובר
                    mefateachM מחובר
                    mefateach
                    מדריכים
                    כתב נערך לאחרונה על ידי
                    #64

                    @א.מ.ד. נו באמת תכנות ברובו מבוסס על ידע, צריך לדעת באיזה ספריות להשתמש מה הפרמטרים הנכונים וכו'
                    בכל מקרה לא הבנתי מה כזה מסובך בכלים, אומנם הוא צריך להיות מדויק אבל לא צריך להיות כזה חכם (אולי לכלים מסובכים זה כן אבל לעשות כמה פעולות פשוטות כמו ליצור תזכורת להתקשר למישהו וכדומה הוא לא יכול לעשות?)

                    Life is learning

                    תגובה 1 תגובה אחרונה
                    0
                    • א.מ.ד.א א.מ.ד.

                      @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                      שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?

                      כן כמובן.

                      @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                      הבעיה היא שזה לוקח כמה שבועות אם לא חודשים, אין לי זמן וכוח לזה.

                      בהחלט, ובשביל שיהיה בחינם צריך להפעיל את זה מחדש כל יום.

                      @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                      חוץ מזה זה דורש דאטה..
                      @א.מ.ד. מאיפה הדאטה שלך? הורדת את המכלול?

                      הלוואי שהמכלול היה מספיק...
                      מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...
                      האמת היא שזה תלוי בגודל המודל. לדוגמא מודל ה-0.6B שלי השתמש רק בשבריר מהחומר, ואז מיצה את הלמידה ממנו.
                      אבל בשביל לאמן מודל יותר גדול, צריך GPU יותר חזק וזה כבר עולה כסף והרבה...
                      תראה את דיקטה, שיש להם מערכי נתונים עצומים בעברית, מימון (ממשלתי אם אני לא טועה) ושיתוף פעולה עמוק עם אנבידיה, ומודל ה-1.7B שלהם גרוע יחסית למודלים בשפות אחרות וחסר יכולות אמיתיות.
                      מה שאני חשבתי לעשות זה לכוונן את דיקטה למשימות ספציפיות.
                      אם יהיה מימון לזה אין לי בעיה לעשות את זה, אבל כמו שכתבתי זה לא כל כך פשוט...

                      CSS 0C מנותק
                      CSS 0C מנותק
                      CSS 0
                      כתב נערך לאחרונה על ידי
                      #65

                      @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                      מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...

                      איזה?

                      תגובה 1 תגובה אחרונה
                      0
                      • א.מ.ד.א א.מ.ד.

                        @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                        שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?

                        כן כמובן.

                        @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                        הבעיה היא שזה לוקח כמה שבועות אם לא חודשים, אין לי זמן וכוח לזה.

                        בהחלט, ובשביל שיהיה בחינם צריך להפעיל את זה מחדש כל יום.

                        @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                        חוץ מזה זה דורש דאטה..
                        @א.מ.ד. מאיפה הדאטה שלך? הורדת את המכלול?

                        הלוואי שהמכלול היה מספיק...
                        מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...
                        האמת היא שזה תלוי בגודל המודל. לדוגמא מודל ה-0.6B שלי השתמש רק בשבריר מהחומר, ואז מיצה את הלמידה ממנו.
                        אבל בשביל לאמן מודל יותר גדול, צריך GPU יותר חזק וזה כבר עולה כסף והרבה...
                        תראה את דיקטה, שיש להם מערכי נתונים עצומים בעברית, מימון (ממשלתי אם אני לא טועה) ושיתוף פעולה עמוק עם אנבידיה, ומודל ה-1.7B שלהם גרוע יחסית למודלים בשפות אחרות וחסר יכולות אמיתיות.
                        מה שאני חשבתי לעשות זה לכוונן את דיקטה למשימות ספציפיות.
                        אם יהיה מימון לזה אין לי בעיה לעשות את זה, אבל כמו שכתבתי זה לא כל כך פשוט...

                        mefateachM מחובר
                        mefateachM מחובר
                        mefateach
                        מדריכים
                        כתב נערך לאחרונה על ידי
                        #66

                        @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                        ואז מיצה את הלמידה ממנו.

                        מה זה אומר לפי מה אתה מחליט שהוא מיצה?

                        Life is learning

                        CSS 0C תגובה 1 תגובה אחרונה
                        0
                        • mefateachM mefateach

                          @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                          ואז מיצה את הלמידה ממנו.

                          מה זה אומר לפי מה אתה מחליט שהוא מיצה?

                          CSS 0C מנותק
                          CSS 0C מנותק
                          CSS 0
                          כתב נערך לאחרונה על ידי
                          #67

                          @mefateach על פי ה loss

                          תגובה 1 תגובה אחרונה
                          1
                          • א.מ.ד.א א.מ.ד.

                            @mefateach כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                            @א.מ.ד. אם אתה מאמן למשימות ספציפיות לדעתי האימון הכי טוב זה לשימוש בכלים, וידע כללי, אף אחד לא ינסה לתכנת עם כזה מודל וגם לא לפתור בעיות מורכבות, לדעתי מה שהכי צריך זה מודל שיודע להשתמש בכלים בצורה טובה, זה לא מדי מסובך ועם אימון טוב זה יכול לעבוד פצצה (נניח אני מחפש אחד כזה בשביל הומ אססיטנט שיוכל לשלוט על הבית) אבל אני מאמין שזה מאוד שימושי בכללי

                            שימוש בכלים זה האימון הכי קשה, כי המודל צריך ללמוד לא לשבור את הקריאות לכלי ולשמור על לולאת פעולות מורכבת לאורך שיחה ארוכה... כיום אין עדיין מודל גם לא בשפות אחרות שמוצלח בקריאה לכלי פחות מ-4B.
                            דווקא ידע עולם אי אפשר טכנית להכניס במודלים קטנים, וההתקדמות בתחום הזה מינורית יחסית, אבל קידוד לא דורש הרבה ידע אלא בעיקר לוגיקה שבזה המודלים הקטנים משתפרים בשנים האחרונות.

                            sivan22S מנותק
                            sivan22S מנותק
                            sivan22
                            כתב נערך לאחרונה על ידי
                            #68

                            @א.מ.ד. הגישה היותר נכונה לדעתי היא לא לחפש מאגרי נתונים אלא לסנתז אותם, כמו שהזכרת לעיל. כך מאמנים היום את רוב/כל המודלים החדשים.
                            אתה יכול לקרוא לזה גם תהליך שבו המודל הגדול (קלוד) "מלמד" את המודל הקטן.

                            המלאךה א.מ.ד.א 2 תגובות תגובה אחרונה
                            0
                            • sivan22S sivan22

                              @א.מ.ד. הגישה היותר נכונה לדעתי היא לא לחפש מאגרי נתונים אלא לסנתז אותם, כמו שהזכרת לעיל. כך מאמנים היום את רוב/כל המודלים החדשים.
                              אתה יכול לקרוא לזה גם תהליך שבו המודל הגדול (קלוד) "מלמד" את המודל הקטן.

                              המלאךה מנותק
                              המלאךה מנותק
                              המלאך
                              כתב נערך לאחרונה על ידי
                              #69

                              @sivan22 סינסוז זה רעיון טוב כהשלמה.
                              הוא אף פעם לא רעיון טוב כאימון בפני עצמו.
                              יש לזה הרבה סיבות..

                              תגובה 1 תגובה אחרונה
                              0
                              • sivan22S sivan22

                                @א.מ.ד. הגישה היותר נכונה לדעתי היא לא לחפש מאגרי נתונים אלא לסנתז אותם, כמו שהזכרת לעיל. כך מאמנים היום את רוב/כל המודלים החדשים.
                                אתה יכול לקרוא לזה גם תהליך שבו המודל הגדול (קלוד) "מלמד" את המודל הקטן.

                                א.מ.ד.א מחובר
                                א.מ.ד.א מחובר
                                א.מ.ד.
                                כתב נערך לאחרונה על ידי
                                #70

                                @sivan22 אתה מתכוון לזיקוק.
                                אבל בדרך כלל משתמשים בזה על מודל קיים, כמו המודלים הקטנים של דיפסיק שבנויים על המודלים של Qwen ו-Llama.
                                בשביל לבנות מאפס צריך ליצור מאות אלפי ואפילו מיליוני קטעים כאלו, ואז באמת האיכות גבוהה מאוד (מודלי Phi של מיקרוסופט אומנו בעיקר על נתונים כאלו, ונחשבו פריצת דרך בזמנם), אבל זו עבודה מטורפת ועלות גבוהה מאוד. אפשר להשתמש בזה מקסימום בשביל כוונון עדין מינימלי.

                                מפתח אפליקציות אנדרואיד
                                em0548438097@gmail.com

                                תגובה 1 תגובה אחרונה
                                0
                                • א.מ.ד.א א.מ.ד.

                                  @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                  שמירה של הזיכרון זמני, @א.מ.ד. אתה גם עשית כך?

                                  כן כמובן.

                                  @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                  הבעיה היא שזה לוקח כמה שבועות אם לא חודשים, אין לי זמן וכוח לזה.

                                  בהחלט, ובשביל שיהיה בחינם צריך להפעיל את זה מחדש כל יום.

                                  @המלאך כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                  חוץ מזה זה דורש דאטה..
                                  @א.מ.ד. מאיפה הדאטה שלך? הורדת את המכלול?

                                  הלוואי שהמכלול היה מספיק...
                                  מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...
                                  האמת היא שזה תלוי בגודל המודל. לדוגמא מודל ה-0.6B שלי השתמש רק בשבריר מהחומר, ואז מיצה את הלמידה ממנו.
                                  אבל בשביל לאמן מודל יותר גדול, צריך GPU יותר חזק וזה כבר עולה כסף והרבה...
                                  תראה את דיקטה, שיש להם מערכי נתונים עצומים בעברית, מימון (ממשלתי אם אני לא טועה) ושיתוף פעולה עמוק עם אנבידיה, ומודל ה-1.7B שלהם גרוע יחסית למודלים בשפות אחרות וחסר יכולות אמיתיות.
                                  מה שאני חשבתי לעשות זה לכוונן את דיקטה למשימות ספציפיות.
                                  אם יהיה מימון לזה אין לי בעיה לעשות את זה, אבל כמו שכתבתי זה לא כל כך פשוט...

                                  CSS 0C מנותק
                                  CSS 0C מנותק
                                  CSS 0
                                  כתב נערך לאחרונה על ידי
                                  #71

                                  @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                  מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...

                                  איזה?

                                  (ת'אמת ראיתי משהו והוא שוקל 47GB זה זה?)

                                  א.מ.ד.א תגובה 1 תגובה אחרונה
                                  0
                                  • CSS 0C CSS 0

                                    @א.מ.ד. כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                    מערך הנתונים שמצאתי כולל 50 מיליון פיסקאות...

                                    איזה?

                                    (ת'אמת ראיתי משהו והוא שוקל 47GB זה זה?)

                                    א.מ.ד.א מחובר
                                    א.מ.ד.א מחובר
                                    א.מ.ד.
                                    כתב נערך לאחרונה על ידי
                                    #72

                                    @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                    איזה?

                                    (ת'אמת ראיתי משהו והוא שוקל 47GB זה זה?)

                                    איך קוראים לו? אני יגיד לך אם כן... בגדול אין יותר מידי מערכים גדולים בעברית אז סביר להניח שזה זה.

                                    מפתח אפליקציות אנדרואיד
                                    em0548438097@gmail.com

                                    CSS 0C תגובה 1 תגובה אחרונה
                                    0
                                    • א.מ.ד.א א.מ.ד.

                                      @CSS-0 כתב בבקשת מידע | מודל אופליין להבנת טקסט בשפה טבעית:

                                      איזה?

                                      (ת'אמת ראיתי משהו והוא שוקל 47GB זה זה?)

                                      איך קוראים לו? אני יגיד לך אם כן... בגדול אין יותר מידי מערכים גדולים בעברית אז סביר להניח שזה זה.

                                      CSS 0C מנותק
                                      CSS 0C מנותק
                                      CSS 0
                                      כתב נערך לאחרונה על ידי
                                      #73

                                      @א.מ.ד. HeDC4

                                      א.מ.ד.א תגובה 1 תגובה אחרונה
                                      0
                                      • CSS 0C CSS 0

                                        @א.מ.ד. HeDC4

                                        א.מ.ד.א מחובר
                                        א.מ.ד.א מחובר
                                        א.מ.ד.
                                        כתב נערך לאחרונה על ידי
                                        #74

                                        @CSS-0 לא חושב.

                                        מפתח אפליקציות אנדרואיד
                                        em0548438097@gmail.com

                                        CSS 0C תגובה 1 תגובה אחרונה
                                        0
                                        • א.מ.ד.א א.מ.ד.

                                          @CSS-0 לא חושב.

                                          CSS 0C מנותק
                                          CSS 0C מנותק
                                          CSS 0
                                          כתב נערך לאחרונה על ידי
                                          #75

                                          @א.מ.ד. https://huggingface.co/datasets/HeNLP/HeDC4

                                          א.מ.ד.א תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • פופולרי
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר