דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. שיתוף | תקרת הזכוכית של עולם הAI התפוצצה????

שיתוף | תקרת הזכוכית של עולם הAI התפוצצה????

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
66 פוסטים 16 כותבים 2.0k צפיות 23 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • מתכנת חובבמ מתכנת חובב

    @המלאך טרנספורמר זו לא הארכיטקטורה של המודל שבתכלס' מקיפה כמעט את כל החלקים בו?
    ואגב קצת מוזר לי שכולם פה מתווכחים כמבינים לעומק את הטכנולוגיות בעוד שאני עדיין מתבוסס במאמרים משנות ה 80 כדי להבין את שורשי הטכנולוגיה ונאבק עם משוואות באלגברה לינארית אל תוך הלילה
    או שיש פה גאונים או שממהרים לקפוץ למסקנות
    כמובן שהגיוני שמשהו שם לא כצעקתה אבל להוכיח את זה על בסיס עקרונות טכניים זה קצת מצחיק

    המלאךה מנותק
    המלאךה מנותק
    המלאך
    כתב נערך לאחרונה על ידי המלאך
    #50

    @מתכנת-חובב וודאי.
    אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
    לגופו של דבר לא צריך להיות גאון כדי להבין שמה שהוא אמר לא עובד ככה.
    באגים זה דבר שיכול להיות בקצוות ההקשר, דבר שלטענתו המודל לא מחשב..
    קצת קשה שלא לצחוק על התגובה הזו..
    @pythoni
    בכל מקרה הם טענו שזה דווקא כן! ברמת מודלי חזית כמו קלוד..
    נ. ב. הסברתי כמה שיכולתי..
    נ. ב. 2 למה נראה לך שנולדתי אתמול? שצריך ללמד אותי מה זה llm?
    התכוונתי לומר שלהגיד שזה מבוסס טרנספורמר פירוש לומר שהשני לא. וכאן הטעות.
    בכל מקרה אחרון.
    כל llm משתמש בטרנספורמר משולב עם לינארי.

    @מתכנת-חובב מודה.
    אני לא נלחם עם השוואות אלגברה לינארית בשתים בלילה.
    אבל זה דברים ידועים..

    מתכנת חובבמ ה 2 תגובות תגובה אחרונה
    0
    • המלאךה המלאך

      @מתכנת-חובב וודאי.
      אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
      לגופו של דבר לא צריך להיות גאון כדי להבין שמה שהוא אמר לא עובד ככה.
      באגים זה דבר שיכול להיות בקצוות ההקשר, דבר שלטענתו המודל לא מחשב..
      קצת קשה שלא לצחוק על התגובה הזו..
      @pythoni
      בכל מקרה הם טענו שזה דווקא כן! ברמת מודלי חזית כמו קלוד..
      נ. ב. הסברתי כמה שיכולתי..
      נ. ב. 2 למה נראה לך שנולדתי אתמול? שצריך ללמד אותי מה זה llm?
      התכוונתי לומר שלהגיד שזה מבוסס טרנספורמר פירוש לומר שהשני לא. וכאן הטעות.
      בכל מקרה אחרון.
      כל llm משתמש בטרנספורמר משולב עם לינארי.

      @מתכנת-חובב מודה.
      אני לא נלחם עם השוואות אלגברה לינארית בשתים בלילה.
      אבל זה דברים ידועים..

      מתכנת חובבמ מנותק
      מתכנת חובבמ מנותק
      מתכנת חובב
      מדריכים
      כתב נערך לאחרונה על ידי
      #51

      @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

      אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
      לגופו של דבר לא צריך להיות טיפש כדי להבין שמה שהוא אמר לא עובד ככה.

      למה לא?
      אני לא מכיר את הארכיטקטורות של המודלים של היום אבל להבנתי מודלי mamba לדוגמה הם לא בארכיטקטורת טרנספורמר וצריכת החישוב שלהם היא ליניארית
      איפה הייתה הטעות?

      צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

      המלאךה תגובה 1 תגובה אחרונה
      1
      • מתכנת חובבמ מתכנת חובב

        @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

        אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
        לגופו של דבר לא צריך להיות טיפש כדי להבין שמה שהוא אמר לא עובד ככה.

        למה לא?
        אני לא מכיר את הארכיטקטורות של המודלים של היום אבל להבנתי מודלי mamba לדוגמה הם לא בארכיטקטורת טרנספורמר וצריכת החישוב שלהם היא ליניארית
        איפה הייתה הטעות?

        המלאךה מנותק
        המלאךה מנותק
        המלאך
        כתב נערך לאחרונה על ידי
        #52

        @מתכנת-חובב צודק.
        אחזתי שהוא כתב לגבי הllm, לא לגבי המודלים הספציפיים.
        אבל דרך אגב.
        @pythoni
        מטמון קי וי זה דבר שכל מודל למיטב ידיעתי משתמש בו..

        מתכנת חובבמ תגובה 1 תגובה אחרונה
        0
        • המלאךה המלאך

          @מתכנת-חובב צודק.
          אחזתי שהוא כתב לגבי הllm, לא לגבי המודלים הספציפיים.
          אבל דרך אגב.
          @pythoni
          מטמון קי וי זה דבר שכל מודל למיטב ידיעתי משתמש בו..

          מתכנת חובבמ מנותק
          מתכנת חובבמ מנותק
          מתכנת חובב
          מדריכים
          כתב נערך לאחרונה על ידי
          #53

          @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

          אחזתי שהוא כתב לגבי הllm, לא לגבי המודלים הספציפיים.

          גם מודלי LLM יכולים להיות ליניאריים

          צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

          המלאךה תגובה 1 תגובה אחרונה
          0
          • מתכנת חובבמ מתכנת חובב

            @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

            אחזתי שהוא כתב לגבי הllm, לא לגבי המודלים הספציפיים.

            גם מודלי LLM יכולים להיות ליניאריים

            המלאךה מנותק
            המלאךה מנותק
            המלאך
            כתב נערך לאחרונה על ידי
            #54

            @מתכנת-חובב לא.
            שהחילוק בין מודלי llm לממבה זה הטרנספורמר.
            מה שכמובן לא נכון, יש גם ממבה לllm.

            מתכנת חובבמ תגובה 1 תגובה אחרונה
            0
            • המלאךה המלאך

              @מתכנת-חובב לא.
              שהחילוק בין מודלי llm לממבה זה הטרנספורמר.
              מה שכמובן לא נכון, יש גם ממבה לllm.

              מתכנת חובבמ מנותק
              מתכנת חובבמ מנותק
              מתכנת חובב
              מדריכים
              כתב נערך לאחרונה על ידי מתכנת חובב
              #55

              @המלאך הוא לא כתב בשום מקום שמודלי ממבה לא יכולים להיות מודלי שפה

              צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

              המלאךה תגובה 1 תגובה אחרונה
              0
              • מתכנת חובבמ מתכנת חובב

                @המלאך הוא לא כתב בשום מקום שמודלי ממבה לא יכולים להיות מודלי שפה

                המלאךה מנותק
                המלאךה מנותק
                המלאך
                כתב נערך לאחרונה על ידי
                #56

                @מתכנת-חובב נכון.
                ולכן חזרתי בי.
                כשכתבתי את התגובה כך היה זכור.
                ובאותה נשימה כתבתי שעיקר דבריו עדיין לא נכונים.

                א.מ.ד.א תגובה 1 תגובה אחרונה
                1
                • המלאךה המלאך

                  @מתכנת-חובב וודאי.
                  אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
                  לגופו של דבר לא צריך להיות גאון כדי להבין שמה שהוא אמר לא עובד ככה.
                  באגים זה דבר שיכול להיות בקצוות ההקשר, דבר שלטענתו המודל לא מחשב..
                  קצת קשה שלא לצחוק על התגובה הזו..
                  @pythoni
                  בכל מקרה הם טענו שזה דווקא כן! ברמת מודלי חזית כמו קלוד..
                  נ. ב. הסברתי כמה שיכולתי..
                  נ. ב. 2 למה נראה לך שנולדתי אתמול? שצריך ללמד אותי מה זה llm?
                  התכוונתי לומר שלהגיד שזה מבוסס טרנספורמר פירוש לומר שהשני לא. וכאן הטעות.
                  בכל מקרה אחרון.
                  כל llm משתמש בטרנספורמר משולב עם לינארי.

                  @מתכנת-חובב מודה.
                  אני לא נלחם עם השוואות אלגברה לינארית בשתים בלילה.
                  אבל זה דברים ידועים..

                  ה מנותק
                  ה מנותק
                  החכם התם
                  כתב נערך לאחרונה על ידי
                  #57

                  @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

                  נ. ב. 2 למה נראה לך שנולדתי אתמול? שצריך ללמד אותי מה זה llm?

                  מי שלא יודע מה זה LLM זה אומר שהוא נולד אתמול 👶 ?

                  תגובה 1 תגובה אחרונה
                  0
                  • המלאךה המלאך

                    @מתכנת-חובב נכון.
                    ולכן חזרתי בי.
                    כשכתבתי את התגובה כך היה זכור.
                    ובאותה נשימה כתבתי שעיקר דבריו עדיין לא נכונים.

                    א.מ.ד.א מנותק
                    א.מ.ד.א מנותק
                    א.מ.ד.
                    כתב נערך לאחרונה על ידי א.מ.ד.
                    #58

                    llm זה שם כללי, כלומר מודל שפה גדול, שיש לו כמה ארכיטקטורות אפשריות. יש ארכיטקטורת טרנספומר, שהמכפלה בה היא ריבועית, יש ארכיטקטורת mamba שהמכפלה בה היא ליניארית ולכן היא מהירה יותר, ויש סוג 3 בשם SSM שמלה שכבות טרנספומר ו-mamba בתוך אותו מודל.
                    יש גם ארכיטקטורת liquid כמו במודלים lfm.
                    מתוך הטרנספורמר השלם שפותח ע"י גוגל, llm משתמש בחציו המפענח, ואילו מודלי הטמעה משתמשים בחציו המקודד.
                    כלומר, llm הוא חלק מהטרנספורמר (במידה והוא מבוסס עליו), ולא הפוך.

                    המלאךה P 2 תגובות תגובה אחרונה
                    1
                    • א.מ.ד.א א.מ.ד.

                      llm זה שם כללי, כלומר מודל שפה גדול, שיש לו כמה ארכיטקטורות אפשריות. יש ארכיטקטורת טרנספומר, שהמכפלה בה היא ריבועית, יש ארכיטקטורת mamba שהמכפלה בה היא ליניארית ולכן היא מהירה יותר, ויש סוג 3 בשם SSM שמלה שכבות טרנספומר ו-mamba בתוך אותו מודל.
                      יש גם ארכיטקטורת liquid כמו במודלים lfm.
                      מתוך הטרנספורמר השלם שפותח ע"י גוגל, llm משתמש בחציו המפענח, ואילו מודלי הטמעה משתמשים בחציו המקודד.
                      כלומר, llm הוא חלק מהטרנספורמר (במידה והוא מבוסס עליו), ולא הפוך.

                      המלאךה מנותק
                      המלאךה מנותק
                      המלאך
                      כתב נערך לאחרונה על ידי
                      #59
                      פוסט זה נמחק!
                      א.מ.ד.א תגובה 1 תגובה אחרונה
                      0
                      • המלאךה המלאך

                        פוסט זה נמחק!

                        א.מ.ד.א מנותק
                        א.מ.ד.א מנותק
                        א.מ.ד.
                        כתב נערך לאחרונה על ידי
                        #60
                        פוסט זה נמחק!
                        המלאךה תגובה 1 תגובה אחרונה
                        0
                        • א.מ.ד.א א.מ.ד.

                          פוסט זה נמחק!

                          המלאךה מנותק
                          המלאךה מנותק
                          המלאך
                          כתב נערך לאחרונה על ידי
                          #61
                          פוסט זה נמחק!
                          תגובה 1 תגובה אחרונה
                          0
                          • א.מ.ד.א א.מ.ד.

                            llm זה שם כללי, כלומר מודל שפה גדול, שיש לו כמה ארכיטקטורות אפשריות. יש ארכיטקטורת טרנספומר, שהמכפלה בה היא ריבועית, יש ארכיטקטורת mamba שהמכפלה בה היא ליניארית ולכן היא מהירה יותר, ויש סוג 3 בשם SSM שמלה שכבות טרנספומר ו-mamba בתוך אותו מודל.
                            יש גם ארכיטקטורת liquid כמו במודלים lfm.
                            מתוך הטרנספורמר השלם שפותח ע"י גוגל, llm משתמש בחציו המפענח, ואילו מודלי הטמעה משתמשים בחציו המקודד.
                            כלומר, llm הוא חלק מהטרנספורמר (במידה והוא מבוסס עליו), ולא הפוך.

                            P מנותק
                            P מנותק
                            pythoni
                            כתב נערך לאחרונה על ידי
                            #62

                            @המלאך
                            מודלים לינארים טהורים ולא משולבים אין להם KV
                            אלא Hidden State שלא משתנה הגודל ולכן גם יש את החיסרון בשליפת פרטים קטנים מתחילת שיחה

                            @א.מ.ד.
                            לגבי הLFM השתמשתי קצת אחרי שיצא במודל של ה24B והוא די טוב בעברית וממש נחמד

                            המלאךה תגובה 1 תגובה אחרונה
                            0
                            • P pythoni

                              @המלאך
                              מודלים לינארים טהורים ולא משולבים אין להם KV
                              אלא Hidden State שלא משתנה הגודל ולכן גם יש את החיסרון בשליפת פרטים קטנים מתחילת שיחה

                              @א.מ.ד.
                              לגבי הLFM השתמשתי קצת אחרי שיצא במודל של ה24B והוא די טוב בעברית וממש נחמד

                              המלאךה מנותק
                              המלאךה מנותק
                              המלאך
                              כתב נערך לאחרונה על ידי
                              #63

                              @pythoni אכן.
                              אבל אז שוב חזרנו לשאלה הראשונית.
                              איך הם טוענים שהם טובים כמעט כמו אופוס 4.7?

                              P תגובה 1 תגובה אחרונה
                              0
                              • המלאךה המלאך

                                @pythoni אכן.
                                אבל אז שוב חזרנו לשאלה הראשונית.
                                איך הם טוענים שהם טובים כמעט כמו אופוס 4.7?

                                P מנותק
                                P מנותק
                                pythoni
                                כתב נערך לאחרונה על ידי
                                #64

                                @המלאך
                                לפי מה שהבנתי לשימוש אמתי לא חושב וכמעט בטוח שהם לא כמו קלוד אבל לסרוק קוד ולמצוא את הבאגים יכול להיות
                                וזה גם חלק מהמבחנים אז בקטע הזה הוא אולי יכול להיות ברמה גבוהה

                                המלאךה תגובה 1 תגובה אחרונה
                                0
                                • P pythoni

                                  @המלאך
                                  לפי מה שהבנתי לשימוש אמתי לא חושב וכמעט בטוח שהם לא כמו קלוד אבל לסרוק קוד ולמצוא את הבאגים יכול להיות
                                  וזה גם חלק מהמבחנים אז בקטע הזה הוא אולי יכול להיות ברמה גבוהה

                                  המלאךה מנותק
                                  המלאךה מנותק
                                  המלאך
                                  כתב נערך לאחרונה על ידי
                                  #65

                                  @pythoni תקרא את הפוסט הראשון.
                                  הם כבר מציעים api.

                                  א.מ.ד.א תגובה 1 תגובה אחרונה
                                  0
                                  • המלאךה המלאך

                                    @pythoni תקרא את הפוסט הראשון.
                                    הם כבר מציעים api.

                                    א.מ.ד.א מנותק
                                    א.מ.ד.א מנותק
                                    א.מ.ד.
                                    כתב נערך לאחרונה על ידי
                                    #66

                                    @המלאך אני חושב שהם מתכוונים שבהקשר של מיליון טוקנים ומעלה הם יותר טובים מקלוד אופוס. ככה נשמע מטבלת ההשוואה שלהם. כמובן שזה מגוחך כי קלוד אופוס לא נועד להקשר של יותר ממיליון טוקנים.

                                    תגובה 1 תגובה אחרונה
                                    1

                                    • התחברות

                                    • אין לך חשבון עדיין? הרשמה

                                    • התחברו או הירשמו כדי לחפש.
                                    • פוסט ראשון
                                      פוסט אחרון
                                    0
                                    • חוקי הפורום
                                    • פופולרי
                                    • לא נפתר
                                    • משתמשים
                                    • חיפוש גוגל בפורום
                                    • צור קשר