דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. שיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל

שיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
11 פוסטים 6 כותבים 349 צפיות 6 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • NH.LOCALN NH.LOCAL

    האמת היא שזה הופך לאירוע כמעט משעמם וצפוי מראש.
    פעם בחודשיים-שלושה, גוגל, OpenAI, Anthropic או xAI מוציאות מודל חדש ורענן שעוקף את כל שאר המודלים והופך ל"טוב ביותר בעולם".

    יש אפילו תרשים נחמד (מם בלע"ז) שמתפרסם מפעם לפעם ומייצג היטב את המצב:

    10aa7720-9b76-4d0c-9d66-94adf9b0815c-image.png

    ועדיין, כעוקב מושבע אחר התחום, אי אפשר להתעלם מהשחרור החדש של גרוק 4, שמציג קפיצות ביצועים מרשימות למדי במגוון מדדים – וזאת רק חמישה חודשים אחרי שחרור גרוק 3.
    (ואל תשכחו כמה זמן עבר בין GPT-3 ל-GPT-4... וכמה זמן עוד נצטרך לחכות ל-GPT-5.)

    היום בבוקר, שחררה xAI את הגרסה החדשה כשתי מודלים, Grok 4 ו-Grok 4 Heavy. למי שלא מכיר, גרוק 4 הוא המודל של xAI, מבית X – החברה הפרטית של אילון מאסק.

    המודל החדש זמין כרגע רק למנויים בתשלום, אך סביר להניח שמהר מאוד הוא יגיע לכולם.

    וכעת, למדדים:

    התוצאה המרשימה ביותר היא במבחן האחרון של האנושות (HLE), שבו גרוק מוביל בפער עצום עם 44.4%, לעומת Gemini 2.5 Pro שבמקום השני עם 26.9% "בלבד".

    8817ea12-a926-42f7-9012-e44ed74ed119-image.png

    מדובר באוסף שאלות קשות ומורכבות להחריד מכל תחום אפשרי – מדע, משפט, רפואה, פילוסופיה, כלכלה – כשמו כן הוא: המבחן הקשה ביותר שיצרה האנושות עבור מודלי AI.

    פריצה נוספת ומרשימה נרשמה במדד ARC-2 – מבחן חזותי מורכב.
    קלוד 4 אופוס (Claude 4 Opus) הוביל עד כה עם 8.6%,
    גרוק 4 מכפיל את התוצאה הזו ומגיע ל-15.9%!

    29cf4b7f-8631-45b3-9b21-080452bd0215-image.png

    ולנתונים המשעממים יותר, שהפכו כבר לשגרה בכל שחרור מודל:
    שיפור כללי במדדים הקלאסיים – שכבר קרובים לגרד את ה-100%.

    גרוק 4 מציג ביצועים חזקים גם כאן:

    • מדד AIME25 – 100%
    • מדד GPQA – 88.9%
      ועוד...

    1cb0d272-908b-49ee-8b99-496f49464d83-image.png

    הנתונים האלו מתייחסים לגרסה החזקה ביותר של המודל – Groq 4 Heavy.

    עד כאן העדכון לפעם – העדכון הבא כנראה בקרוב, עם מודל הקוד הפתוח הצפוי של OpenAI, GPT-5 וכל מה שחם בתעשייה...


    העשרה נוספת:

    • מאסק חושף את Grok 4 כמודל הבינה המלאכותית החדש של xAI שעולה על OpenAI וגוגל במבחנים מרכזיים

    • הסבר על מדדי Grok 4 - גרוק 4 הוא עכשיו הבינה המלאכותית הטובה ביותר אי פעם


    הכנסו לבלוג שלי למאמרים ותגליות אחרות:

    https://blog.ze-kal.top

    א מנותק
    א מנותק
    אלי ויל
    כתב נערך לאחרונה על ידי
    #2

    HLE לא ממש ראיה כנראה שהם אימנו אותו ישירות לדברים כאלה, זה גם לא נוגע לסתם אנשים.
    ברוב הדברים גרוק 4 לא עשה קפיצה משמעותית(כמו גמיני פרו 2.5 בזמנו) מהדגמים המובילים האחרים.
    והחיסרון של גרוק שהוא עדיין לא עושה וידאו וכמובן שאין לו אפשרות חינמית לפחות כרגע
    אגב זה פעם ראשונה שXAI מצליח להיכנס ל3 הגדולות, מאמין שבהמשך מטא תצטרף

    פ תגובה 1 תגובה אחרונה
    0
    • NH.LOCALN NH.LOCAL

      האמת היא שזה הופך לאירוע כמעט משעמם וצפוי מראש.
      פעם בחודשיים-שלושה, גוגל, OpenAI, Anthropic או xAI מוציאות מודל חדש ורענן שעוקף את כל שאר המודלים והופך ל"טוב ביותר בעולם".

      יש אפילו תרשים נחמד (מם בלע"ז) שמתפרסם מפעם לפעם ומייצג היטב את המצב:

      10aa7720-9b76-4d0c-9d66-94adf9b0815c-image.png

      ועדיין, כעוקב מושבע אחר התחום, אי אפשר להתעלם מהשחרור החדש של גרוק 4, שמציג קפיצות ביצועים מרשימות למדי במגוון מדדים – וזאת רק חמישה חודשים אחרי שחרור גרוק 3.
      (ואל תשכחו כמה זמן עבר בין GPT-3 ל-GPT-4... וכמה זמן עוד נצטרך לחכות ל-GPT-5.)

      היום בבוקר, שחררה xAI את הגרסה החדשה כשתי מודלים, Grok 4 ו-Grok 4 Heavy. למי שלא מכיר, גרוק 4 הוא המודל של xAI, מבית X – החברה הפרטית של אילון מאסק.

      המודל החדש זמין כרגע רק למנויים בתשלום, אך סביר להניח שמהר מאוד הוא יגיע לכולם.

      וכעת, למדדים:

      התוצאה המרשימה ביותר היא במבחן האחרון של האנושות (HLE), שבו גרוק מוביל בפער עצום עם 44.4%, לעומת Gemini 2.5 Pro שבמקום השני עם 26.9% "בלבד".

      8817ea12-a926-42f7-9012-e44ed74ed119-image.png

      מדובר באוסף שאלות קשות ומורכבות להחריד מכל תחום אפשרי – מדע, משפט, רפואה, פילוסופיה, כלכלה – כשמו כן הוא: המבחן הקשה ביותר שיצרה האנושות עבור מודלי AI.

      פריצה נוספת ומרשימה נרשמה במדד ARC-2 – מבחן חזותי מורכב.
      קלוד 4 אופוס (Claude 4 Opus) הוביל עד כה עם 8.6%,
      גרוק 4 מכפיל את התוצאה הזו ומגיע ל-15.9%!

      29cf4b7f-8631-45b3-9b21-080452bd0215-image.png

      ולנתונים המשעממים יותר, שהפכו כבר לשגרה בכל שחרור מודל:
      שיפור כללי במדדים הקלאסיים – שכבר קרובים לגרד את ה-100%.

      גרוק 4 מציג ביצועים חזקים גם כאן:

      • מדד AIME25 – 100%
      • מדד GPQA – 88.9%
        ועוד...

      1cb0d272-908b-49ee-8b99-496f49464d83-image.png

      הנתונים האלו מתייחסים לגרסה החזקה ביותר של המודל – Groq 4 Heavy.

      עד כאן העדכון לפעם – העדכון הבא כנראה בקרוב, עם מודל הקוד הפתוח הצפוי של OpenAI, GPT-5 וכל מה שחם בתעשייה...


      העשרה נוספת:

      • מאסק חושף את Grok 4 כמודל הבינה המלאכותית החדש של xAI שעולה על OpenAI וגוגל במבחנים מרכזיים

      • הסבר על מדדי Grok 4 - גרוק 4 הוא עכשיו הבינה המלאכותית הטובה ביותר אי פעם


      הכנסו לבלוג שלי למאמרים ותגליות אחרות:

      https://blog.ze-kal.top

      צדיק תמיםצ מנותק
      צדיק תמיםצ מנותק
      צדיק תמים
      מדריכים
      כתב נערך לאחרונה על ידי
      #3

      @NH.LOCAL יש מקור רשמי? פה זה לא מופיע משום מה https://x.ai/news

      רוצה לזכור קריאת שמע בזמן? לחץ כאן! || אתר שכולו מדריכים

      א NH.LOCALN 2 תגובות תגובה אחרונה
      0
      • צדיק תמיםצ צדיק תמים

        @NH.LOCAL יש מקור רשמי? פה זה לא מופיע משום מה https://x.ai/news

        א מנותק
        א מנותק
        אלי ויל
        כתב נערך לאחרונה על ידי
        #4

        @צדיק-תמים https://grok.com/#subscribe

        צדיק תמיםצ תגובה 1 תגובה אחרונה
        0
        • א אלי ויל

          @צדיק-תמים https://grok.com/#subscribe

          צדיק תמיםצ מנותק
          צדיק תמיםצ מנותק
          צדיק תמים
          מדריכים
          כתב נערך לאחרונה על ידי
          #5

          @אלי-ויל אין שם מידע חוץ ממחיר

          רוצה לזכור קריאת שמע בזמן? לחץ כאן! || אתר שכולו מדריכים

          תגובה 1 תגובה אחרונה
          0
          • צדיק תמיםצ צדיק תמים

            @NH.LOCAL יש מקור רשמי? פה זה לא מופיע משום מה https://x.ai/news

            NH.LOCALN מנותק
            NH.LOCALN מנותק
            NH.LOCAL
            מדריכים
            כתב נערך לאחרונה על ידי NH.LOCAL
            #6

            @צדיק-תמים כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

            @NH.LOCAL יש מקור רשמי? פה זה לא מופיע משום מה https://x.ai/news

            כל התעשייה מדברת על זה. לא חיפשתי את בלוג השחרור הרשמי, אבל זה פורסם בלי שום ספק

            @אלי-ויל כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

            HLE לא ממש ראיה כנראה שהם אימנו אותו ישירות לדברים כאלה, זה גם לא נוגע לסתם אנשים.

            אומרים את הטיעון הזה על כל מדד אפשרי כבר שנים. אבל זה טיעון סרק.

            לפי הטיעון שלך לא ברור למה גרוק 4 קיבל "רק" 44 אחוז, ולמה כל שאר המודלים לא הצליחו לעבור את סביבות ה-20 אחוז

            מדובר במדד מאוד משמעותי, כי הוא מודד יכולות אינטליגנציה מאוד רחבות במגוון תחומים גדול. יכולת טובה במבחן הזה משיקה בבירור גם לתחומים אחרים

            לבלוג שלי (מתעדכן!)
            https://blog.ze-kal.top

            א תגובה 1 תגובה אחרונה
            1
            • NH.LOCALN NH.LOCAL

              @צדיק-תמים כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

              @NH.LOCAL יש מקור רשמי? פה זה לא מופיע משום מה https://x.ai/news

              כל התעשייה מדברת על זה. לא חיפשתי את בלוג השחרור הרשמי, אבל זה פורסם בלי שום ספק

              @אלי-ויל כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

              HLE לא ממש ראיה כנראה שהם אימנו אותו ישירות לדברים כאלה, זה גם לא נוגע לסתם אנשים.

              אומרים את הטיעון הזה על כל מדד אפשרי כבר שנים. אבל זה טיעון סרק.

              לפי הטיעון שלך לא ברור למה גרוק 4 קיבל "רק" 44 אחוז, ולמה כל שאר המודלים לא הצליחו לעבור את סביבות ה-20 אחוז

              מדובר במדד מאוד משמעותי, כי הוא מודד יכולות אינטליגנציה מאוד רחבות במגוון תחומים גדול. יכולת טובה במבחן הזה משיקה בבירור גם לתחומים אחרים

              א מנותק
              א מנותק
              אלי ויל
              כתב נערך לאחרונה על ידי
              #7

              @NH.LOCAL כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

              אומרים את הטיעון הזה על כל מדד אפשרי כבר שנים. אבל זה טיעון סרק.
              לפי הטיעון שלך לא ברור למה גרוק 4 קיבל "רק" 44 אחוז, ולמה כל שאר המודלים לא הצליחו לעבור את סביבות ה-20 אחוז

              (בלאמה נטען שהיה זיהום)
              עכ"פ לא התכוונתי שהם אימנו אותו על שאלות אלה ממש, אלא שמראש מאסק עם החלומות שלו על בינה מלאכותית שפותרת דברים קשים ושכותבת את ההיסטוריה מחדש, הם ניסו איתו לפתור כל מיני שאלות קשות ולכן נשאר לו מזה יותר ידע לעניינים אלו.
              זה מסביר מדוע בשאר המבחנים הוא לא מתעלה משמעותית על המודלים המתקדמים, כמו במבחן זה.

              NH.LOCALN תגובה 1 תגובה אחרונה
              0
              • א אלי ויל

                @NH.LOCAL כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

                אומרים את הטיעון הזה על כל מדד אפשרי כבר שנים. אבל זה טיעון סרק.
                לפי הטיעון שלך לא ברור למה גרוק 4 קיבל "רק" 44 אחוז, ולמה כל שאר המודלים לא הצליחו לעבור את סביבות ה-20 אחוז

                (בלאמה נטען שהיה זיהום)
                עכ"פ לא התכוונתי שהם אימנו אותו על שאלות אלה ממש, אלא שמראש מאסק עם החלומות שלו על בינה מלאכותית שפותרת דברים קשים ושכותבת את ההיסטוריה מחדש, הם ניסו איתו לפתור כל מיני שאלות קשות ולכן נשאר לו מזה יותר ידע לעניינים אלו.
                זה מסביר מדוע בשאר המבחנים הוא לא מתעלה משמעותית על המודלים המתקדמים, כמו במבחן זה.

                NH.LOCALN מנותק
                NH.LOCALN מנותק
                NH.LOCAL
                מדריכים
                כתב נערך לאחרונה על ידי
                #8

                @אלי-ויל כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

                עכ"פ לא התכוונתי שהם אימנו אותו על שאלות אלה ממש, אלא שמראש מאסק עם החלומות שלו על בינה מלאכותית שפותרת דברים קשים ושכותבת את ההיסטוריה מחדש, הם ניסו איתו לפתור כל מיני שאלות קשות ולכן נשאר לו מזה יותר ידע לעניינים אלו.
                זה מסביר מדוע בשאר המבחנים הוא לא מתעלה משמעותית על המודלים המתקדמים, כמו במבחן זה.

                הוא מתעלה על מודלים אחרים גם ב-ARC 2, ובעוד כמה וכמה מדדים.
                במדדים כמו GPQA ודומיו די קשה להתעלות משמעותית על האחרים, כי כולם מגרדים גם ככה את ה-80-90.

                אלא שמראש מאסק עם החלומות שלו על בינה מלאכותית שפותרת דברים קשים ושכותבת את ההיסטוריה מחדש, הם ניסו איתו לפתור כל מיני שאלות קשות ולכן נשאר לו מזה יותר ידע לעניינים אלו.

                לא זכיתי להבין את הקשר בין הטיעון לבין המסקנה

                נראה לי שאתה יכול להסכים איתי שמדובר בלא יותר מספקולציות והשערות לא מבוססות...

                לבלוג שלי (מתעדכן!)
                https://blog.ze-kal.top

                תגובה 1 תגובה אחרונה
                2
                • א אלי ויל

                  HLE לא ממש ראיה כנראה שהם אימנו אותו ישירות לדברים כאלה, זה גם לא נוגע לסתם אנשים.
                  ברוב הדברים גרוק 4 לא עשה קפיצה משמעותית(כמו גמיני פרו 2.5 בזמנו) מהדגמים המובילים האחרים.
                  והחיסרון של גרוק שהוא עדיין לא עושה וידאו וכמובן שאין לו אפשרות חינמית לפחות כרגע
                  אגב זה פעם ראשונה שXAI מצליח להיכנס ל3 הגדולות, מאמין שבהמשך מטא תצטרף

                  פ מנותק
                  פ מנותק
                  פראירי
                  כתב נערך לאחרונה על ידי
                  #9

                  @אלי-ויל כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

                  והחיסרון של גרוק שהוא עדיין לא עושה וידאו וכמובן שאין לו אפשרות חינמית לפחות כרגע

                  שטויות
                  בחינמי יש לו כרגע את התוכנית החינמית הכי גדולה...

                  A א 2 תגובות תגובה אחרונה
                  1
                  • פ פראירי

                    @אלי-ויל כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

                    והחיסרון של גרוק שהוא עדיין לא עושה וידאו וכמובן שאין לו אפשרות חינמית לפחות כרגע

                    שטויות
                    בחינמי יש לו כרגע את התוכנית החינמית הכי גדולה...

                    A מנותק
                    A מנותק
                    aiib
                    כתב נערך לאחרונה על ידי
                    #10

                    @פראירי כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

                    @אלי-ויל כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

                    והחיסרון של גרוק שהוא עדיין לא עושה וידאו וכמובן שאין לו אפשרות חינמית לפחות כרגע

                    שטויות
                    בחינמי יש לו כרגע את התוכנית החינמית הכי גדולה...

                    למעט AI סטודיו לכאורה..

                    תגובה 1 תגובה אחרונה
                    1
                    • פ פראירי

                      @אלי-ויל כתב בשיתוף | מירוץ ה-AI ממשיך להתקדם בקצב מסחרר - והפעם Grok 4 על הגריל:

                      והחיסרון של גרוק שהוא עדיין לא עושה וידאו וכמובן שאין לו אפשרות חינמית לפחות כרגע

                      שטויות
                      בחינמי יש לו כרגע את התוכנית החינמית הכי גדולה...

                      א מנותק
                      א מנותק
                      אריאלל
                      כתב נערך לאחרונה על ידי
                      #11

                      @פראירי אני משער שכוונתו לגרוק 4

                      תגובה 1 תגובה אחרונה
                      0

                      • התחברות

                      • אין לך חשבון עדיין? הרשמה

                      • התחברו או הירשמו כדי לחפש.
                      • פוסט ראשון
                        פוסט אחרון
                      0
                      • חוקי הפורום
                      • פופולרי
                      • לא נפתר
                      • משתמשים
                      • חיפוש גוגל בפורום
                      • צור קשר