דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. שיתוף | תקרת הזכוכית של עולם הAI התפוצצה????

שיתוף | תקרת הזכוכית של עולם הAI התפוצצה????

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
57 פוסטים 16 כותבים 1.6k צפיות 21 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • י יוסלה קניקובסקי

    @pythoni כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

    זה לא סטארט אפ חדש ומשהו גאוני כול כך זה פשוט מודל עם תהודה דליליה שזה אומר שהקונטקסט כמעט לינארי כמו ממבה שזה לינארי אך כאן זה לא לינארי לגמרי פשוט לא כול מחושבים אלא רק כאלה שזהו כחשובים ובנוסף בנו את זה לקוד המודל תוכנן מראש לפעול על בסיסי קוד ולא על טקסט פרוזה רציף. קוד תוכנה מתאפיין במבנה מודולרי, היררכי ולוגי (פונקציות, מחלקות, קריאות מקומיות). מבנה זה מאפשר למנגנונים דלילים לאתר את הקשרים הנדרשים ביעילות רבה יותר, שכן התלות בין חלקי הקוד מוגדרת היטב ואינה מפוזרת באופן אקראי על פני מיליוני שורות

    פרשת סוקל או גאונות טהורה? 🤣🤣

    P מנותק
    P מנותק
    pythoni
    כתב נערך לאחרונה על ידי
    #45

    @יוסלה-קניקובסקי
    נכון או לא נכון הם מחרטטים בביטחון 😂

    תגובה 1 תגובה אחרונה
    0
    • P pythoni

      @המלאך זה נכון ולא נכון
      1 מה שהם באמת הצליחו לעשות זה לקחת מודל שהוא לא SSM אלא Attention אך שאינו מחשב את כול האסימונים אלא מזהה את האלה שנראים לו רלונטים וביחד עם דחיסה אגרסיבית של הזיכרון KV בכ90 אחוז כך יש הרבה פחות קריאות זיכרון ופחות תעבורה בין מגשי עיבוד שיוצר צואר בקבוק ואז פחות מהירות לעומת מודל זה שהוא עובד כמעט כמו SSM

      2 זה נכון שזה לא ברמת מודלי חזית כמו קלוד אך הוא יכול לשמש כסורק לפרויקטים שלמים למצוא את החלק הבעיתי ומשם לדוגמא אפשר לשלוח לקלוד ומה שקיבל בציונים הגבוהים)יחסית זה בגלל שבמבחני איתור באגים הוא פשוט סורק מהר בהתיחסות למה שצריך בעוד מודלים גדולים מחשבים בצורה רביעית מלאה וכבדה אך בפתרון בעיות אין ספק שקלוד יהיה פי 2 טוב
      @י.-פל.

      אני כתבתי את התשובה אך היה מבולבל וקשה להבנה אז העברתי לגימיני את סוף התשובה והא ניסח את הסוף )חצי חצי😉

      המלאךה מנותק
      המלאךה מנותק
      המלאך
      כתב נערך לאחרונה על ידי
      #46

      @pythoni שני אופציות.
      או שאתה קשור אליהם והם מחרטטים.
      או שזה אתה.
      תעבור שוב על הפוסט שלי.

      תגובה 1 תגובה אחרונה
      0
      • P pythoni

        @jack חפש בHugging Face את המודלMamba שהוא מסוג SSM )לינארי ) בניגוד למודלים הרגילים שהם מסוג Transformer

        אלא אם כן אתה AI ללא גישה לרשת

        ההבדל הTransformer
        אם הכנסתי 100 מילים הוא משווה כל מילה מתוך ה-100 לכל אחת מ-99 המילים האחרות.כמות פעולות: בערך 100 × 100 10,000= השוואות.

        הלינארי פשוט יחשב 100 מילים

        המלאךה מנותק
        המלאךה מנותק
        המלאך
        כתב נערך לאחרונה על ידי
        #47

        @pythoni סתם ככה זה לא טרנספורמר.
        זה llm.
        טרנספורמר זה חלק קטן במודל.

        מתכנת חובבמ P 2 תגובות תגובה אחרונה
        1
        • המלאךה המלאך

          @pythoni סתם ככה זה לא טרנספורמר.
          זה llm.
          טרנספורמר זה חלק קטן במודל.

          מתכנת חובבמ מנותק
          מתכנת חובבמ מנותק
          מתכנת חובב
          מדריכים
          כתב נערך לאחרונה על ידי מתכנת חובב
          #48

          @המלאך טרנספורמר זו לא הארכיטקטורה של המודל שבתכלס' מקיפה כמעט את כל החלקים בו?
          ואגב קצת מוזר לי שכולם פה מתווכחים כמבינים לעומק את הטכנולוגיות בעוד שאני עדיין מתבוסס במאמרים משנות ה 80 כדי להבין את שורשי הטכנולוגיה ונאבק עם משוואות באלגברה לינארית אל תוך הלילה
          או שיש פה גאונים או שממהרים לקפוץ למסקנות
          כמובן שהגיוני שמשהו שם לא כצעקתה אבל להוכיח את זה על בסיס עקרונות טכניים זה קצת מצחיק

          צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

          המלאךה תגובה 1 תגובה אחרונה
          1
          • המלאךה המלאך

            @pythoni סתם ככה זה לא טרנספורמר.
            זה llm.
            טרנספורמר זה חלק קטן במודל.

            P מנותק
            P מנותק
            pythoni
            כתב נערך לאחרונה על ידי
            #49

            @המלאך לגבי ההגדרה של כול ארכיטקטורת המודל שזה Transformer משודרג/משוכתב שזה חלק קטן מהמודל היא קצת. . .
            וגם זה מודל LLM מסוג Transformer

            נ.ב
            אם תוכל לפרט ולהסביר יותר את מה שאתה טוען אשמח
            נ.ב 2
            LLM פרושו מודל שפה גדול ויש כול מיני סוגים של LLM
            נ.ב 3
            אין לי שום קשר עסקי או רגשי לחברה הנל

            תגובה 1 תגובה אחרונה
            0
            • מתכנת חובבמ מתכנת חובב

              @המלאך טרנספורמר זו לא הארכיטקטורה של המודל שבתכלס' מקיפה כמעט את כל החלקים בו?
              ואגב קצת מוזר לי שכולם פה מתווכחים כמבינים לעומק את הטכנולוגיות בעוד שאני עדיין מתבוסס במאמרים משנות ה 80 כדי להבין את שורשי הטכנולוגיה ונאבק עם משוואות באלגברה לינארית אל תוך הלילה
              או שיש פה גאונים או שממהרים לקפוץ למסקנות
              כמובן שהגיוני שמשהו שם לא כצעקתה אבל להוכיח את זה על בסיס עקרונות טכניים זה קצת מצחיק

              המלאךה מנותק
              המלאךה מנותק
              המלאך
              כתב נערך לאחרונה על ידי המלאך
              #50

              @מתכנת-חובב וודאי.
              אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
              לגופו של דבר לא צריך להיות גאון כדי להבין שמה שהוא אמר לא עובד ככה.
              באגים זה דבר שיכול להיות בקצוות ההקשר, דבר שלטענתו המודל לא מחשב..
              קצת קשה שלא לצחוק על התגובה הזו..
              @pythoni
              בכל מקרה הם טענו שזה דווקא כן! ברמת מודלי חזית כמו קלוד..
              נ. ב. הסברתי כמה שיכולתי..
              נ. ב. 2 למה נראה לך שנולדתי אתמול? שצריך ללמד אותי מה זה llm?
              התכוונתי לומר שלהגיד שזה מבוסס טרנספורמר פירוש לומר שהשני לא. וכאן הטעות.
              בכל מקרה אחרון.
              כל llm משתמש בטרנספורמר משולב עם לינארי.

              @מתכנת-חובב מודה.
              אני לא נלחם עם השוואות אלגברה לינארית בשתים בלילה.
              אבל זה דברים ידועים..

              מתכנת חובבמ ה 2 תגובות תגובה אחרונה
              0
              • המלאךה המלאך

                @מתכנת-חובב וודאי.
                אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
                לגופו של דבר לא צריך להיות גאון כדי להבין שמה שהוא אמר לא עובד ככה.
                באגים זה דבר שיכול להיות בקצוות ההקשר, דבר שלטענתו המודל לא מחשב..
                קצת קשה שלא לצחוק על התגובה הזו..
                @pythoni
                בכל מקרה הם טענו שזה דווקא כן! ברמת מודלי חזית כמו קלוד..
                נ. ב. הסברתי כמה שיכולתי..
                נ. ב. 2 למה נראה לך שנולדתי אתמול? שצריך ללמד אותי מה זה llm?
                התכוונתי לומר שלהגיד שזה מבוסס טרנספורמר פירוש לומר שהשני לא. וכאן הטעות.
                בכל מקרה אחרון.
                כל llm משתמש בטרנספורמר משולב עם לינארי.

                @מתכנת-חובב מודה.
                אני לא נלחם עם השוואות אלגברה לינארית בשתים בלילה.
                אבל זה דברים ידועים..

                מתכנת חובבמ מנותק
                מתכנת חובבמ מנותק
                מתכנת חובב
                מדריכים
                כתב נערך לאחרונה על ידי
                #51

                @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

                אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
                לגופו של דבר לא צריך להיות טיפש כדי להבין שמה שהוא אמר לא עובד ככה.

                למה לא?
                אני לא מכיר את הארכיטקטורות של המודלים של היום אבל להבנתי מודלי mamba לדוגמה הם לא בארכיטקטורת טרנספורמר וצריכת החישוב שלהם היא ליניארית
                איפה הייתה הטעות?

                צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

                המלאךה תגובה 1 תגובה אחרונה
                1
                • מתכנת חובבמ מתכנת חובב

                  @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

                  אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
                  לגופו של דבר לא צריך להיות טיפש כדי להבין שמה שהוא אמר לא עובד ככה.

                  למה לא?
                  אני לא מכיר את הארכיטקטורות של המודלים של היום אבל להבנתי מודלי mamba לדוגמה הם לא בארכיטקטורת טרנספורמר וצריכת החישוב שלהם היא ליניארית
                  איפה הייתה הטעות?

                  המלאךה מנותק
                  המלאךה מנותק
                  המלאך
                  כתב נערך לאחרונה על ידי
                  #52

                  @מתכנת-חובב צודק.
                  אחזתי שהוא כתב לגבי הllm, לא לגבי המודלים הספציפיים.
                  אבל דרך אגב.
                  @pythoni
                  מטמון קי וי זה דבר שכל מודל למיטב ידיעתי משתמש בו..

                  מתכנת חובבמ תגובה 1 תגובה אחרונה
                  0
                  • המלאךה המלאך

                    @מתכנת-חובב צודק.
                    אחזתי שהוא כתב לגבי הllm, לא לגבי המודלים הספציפיים.
                    אבל דרך אגב.
                    @pythoni
                    מטמון קי וי זה דבר שכל מודל למיטב ידיעתי משתמש בו..

                    מתכנת חובבמ מנותק
                    מתכנת חובבמ מנותק
                    מתכנת חובב
                    מדריכים
                    כתב נערך לאחרונה על ידי
                    #53

                    @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

                    אחזתי שהוא כתב לגבי הllm, לא לגבי המודלים הספציפיים.

                    גם מודלי LLM יכולים להיות ליניאריים

                    צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

                    המלאךה תגובה 1 תגובה אחרונה
                    0
                    • מתכנת חובבמ מתכנת חובב

                      @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

                      אחזתי שהוא כתב לגבי הllm, לא לגבי המודלים הספציפיים.

                      גם מודלי LLM יכולים להיות ליניאריים

                      המלאךה מנותק
                      המלאךה מנותק
                      המלאך
                      כתב נערך לאחרונה על ידי
                      #54

                      @מתכנת-חובב לא.
                      שהחילוק בין מודלי llm לממבה זה הטרנספורמר.
                      מה שכמובן לא נכון, יש גם ממבה לllm.

                      מתכנת חובבמ תגובה 1 תגובה אחרונה
                      0
                      • המלאךה המלאך

                        @מתכנת-חובב לא.
                        שהחילוק בין מודלי llm לממבה זה הטרנספורמר.
                        מה שכמובן לא נכון, יש גם ממבה לllm.

                        מתכנת חובבמ מנותק
                        מתכנת חובבמ מנותק
                        מתכנת חובב
                        מדריכים
                        כתב נערך לאחרונה על ידי מתכנת חובב
                        #55

                        @המלאך הוא לא כתב בשום מקום שמודלי ממבה לא יכולים להיות מודלי שפה

                        צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

                        המלאךה תגובה 1 תגובה אחרונה
                        0
                        • מתכנת חובבמ מתכנת חובב

                          @המלאך הוא לא כתב בשום מקום שמודלי ממבה לא יכולים להיות מודלי שפה

                          המלאךה מנותק
                          המלאךה מנותק
                          המלאך
                          כתב נערך לאחרונה על ידי
                          #56

                          @מתכנת-חובב נכון.
                          ולכן חזרתי בי.
                          כשכתבתי את התגובה כך היה זכור.
                          ובאותה נשימה כתבתי שעיקר דבריו עדיין לא נכונים.

                          תגובה 1 תגובה אחרונה
                          1
                          • המלאךה המלאך

                            @מתכנת-חובב וודאי.
                            אבל הוא הגדיר את החילוק כהאם יש טרנספורמר או אין..
                            לגופו של דבר לא צריך להיות גאון כדי להבין שמה שהוא אמר לא עובד ככה.
                            באגים זה דבר שיכול להיות בקצוות ההקשר, דבר שלטענתו המודל לא מחשב..
                            קצת קשה שלא לצחוק על התגובה הזו..
                            @pythoni
                            בכל מקרה הם טענו שזה דווקא כן! ברמת מודלי חזית כמו קלוד..
                            נ. ב. הסברתי כמה שיכולתי..
                            נ. ב. 2 למה נראה לך שנולדתי אתמול? שצריך ללמד אותי מה זה llm?
                            התכוונתי לומר שלהגיד שזה מבוסס טרנספורמר פירוש לומר שהשני לא. וכאן הטעות.
                            בכל מקרה אחרון.
                            כל llm משתמש בטרנספורמר משולב עם לינארי.

                            @מתכנת-חובב מודה.
                            אני לא נלחם עם השוואות אלגברה לינארית בשתים בלילה.
                            אבל זה דברים ידועים..

                            ה מנותק
                            ה מנותק
                            החכם התם
                            כתב נערך לאחרונה על ידי
                            #57

                            @המלאך כתב בשיתוף | תקרת הזכוכית של עולם הAI התפוצצה????:

                            נ. ב. 2 למה נראה לך שנולדתי אתמול? שצריך ללמד אותי מה זה llm?

                            מי שלא יודע מה זה LLM זה אומר שהוא נולד אתמול 👶 ?

                            תגובה 1 תגובה אחרונה
                            0

                            • התחברות

                            • אין לך חשבון עדיין? הרשמה

                            • התחברו או הירשמו כדי לחפש.
                            • פוסט ראשון
                              פוסט אחרון
                            0
                            • חוקי הפורום
                            • פופולרי
                            • לא נפתר
                            • משתמשים
                            • חיפוש גוגל בפורום
                            • צור קשר