דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. שיתוף | מרוץ ה-AI מתקדם במהירות האור - OpenAI הציגה את מודל o3

שיתוף | מרוץ ה-AI מתקדם במהירות האור - OpenAI הציגה את מודל o3

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
14 פוסטים 5 כותבים 849 צפיות 14 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • NH.LOCALN NH.LOCAL

    @י-פל כתב בשיתוף | מרוץ ה-AI מתקדם במהירות האור - OpenAI הציגה את מודל o3:

    שאתה תשבח את זה?
    הם הרסו את O1, והעבירו אותו ל200$. גם כן שדרוג... זמני המקוואות בק"ס קיבלו שדרוג יותר גדול....

    נכון ולא נכון. אני גם מרגיש ככה בחלק מהשימושים, אבל מדד livebench שהוא כנראה אחד האמינים בתחום חושב אחרת.

    7a4e3d56-a2af-46c5-b6ca-fe25a6155cf3-image.png

    י. פל.י מנותק
    י. פל.י מנותק
    י. פל.
    כתב נערך לאחרונה על ידי י. פל.
    #4

    @NH-LOCAL כתב בשיתוף | מרוץ ה-AI מתקדם במהירות האור - OpenAI הציגה את מודל o3:

    נכון ולא נכון

    עובדתית, הוא לא חושב יותר מ4 שניות.
    נכון או לא?
    אם ענית כן, אז המודל טיפש יותר, ולא מעניינת אותי המציאות [או יותר נכון: המדדים]...

    NH.LOCALN תגובה 1 תגובה אחרונה
    0
    • י. פל.י י. פל.

      @NH-LOCAL כתב בשיתוף | מרוץ ה-AI מתקדם במהירות האור - OpenAI הציגה את מודל o3:

      נכון ולא נכון

      עובדתית, הוא לא חושב יותר מ4 שניות.
      נכון או לא?
      אם ענית כן, אז המודל טיפש יותר, ולא מעניינת אותי המציאות [או יותר נכון: המדדים]...

      NH.LOCALN מנותק
      NH.LOCALN מנותק
      NH.LOCAL
      מדריכים
      כתב נערך לאחרונה על ידי
      #5

      @י-פל א. הוא בהחלט חושב יותר מ-4 שניות. במקרים מסויימים הוא חשב גם דקה. ב. זה שהוא חושב פחות זמן לא בהכרח הופך אותו לטיפש יותר, אלא ליעיל יותר.

      אבל אתה צודק שזה מרגיש פחות טוב בהרבה דברים

      לאינדקס המלא של כלל הסקריפטים שלי
      https://nhlocal.github.io

      תגובה 1 תגובה אחרונה
      0
      • יום_שמחי מנותק
        יום_שמחי מנותק
        יום_שמח
        כתב נערך לאחרונה על ידי
        #6

        אני לא יודע איזה אינטרנט יש לכם אבל ניסיתי התכתבות שני סינונים (על המודל שפתוח לכולם), בסינון רימון תוך שנייה ענה ובנטפרי היה צריך לחשוב קצת

        אהבת תן לייק

        NH.LOCALN י. פל.י 2 תגובות תגובה אחרונה
        0
        • יום_שמחי יום_שמח

          אני לא יודע איזה אינטרנט יש לכם אבל ניסיתי התכתבות שני סינונים (על המודל שפתוח לכולם), בסינון רימון תוך שנייה ענה ובנטפרי היה צריך לחשוב קצת

          NH.LOCALN מנותק
          NH.LOCALN מנותק
          NH.LOCAL
          מדריכים
          כתב נערך לאחרונה על ידי
          #7

          @יום_שמח הוא לא באמת חושב, נטפרי בסך הכל מעכבים לך את הצגת התשובה כדי לאפשר לבוט שלהם לסנן אותה. נראה לך שנטפרי יכולים לגרום לאתר להשתנות?

          לאינדקס המלא של כלל הסקריפטים שלי
          https://nhlocal.github.io

          תגובה 1 תגובה אחרונה
          0
          • יום_שמחי יום_שמח

            אני לא יודע איזה אינטרנט יש לכם אבל ניסיתי התכתבות שני סינונים (על המודל שפתוח לכולם), בסינון רימון תוך שנייה ענה ובנטפרי היה צריך לחשוב קצת

            י. פל.י מנותק
            י. פל.י מנותק
            י. פל.
            כתב נערך לאחרונה על ידי י. פל.
            #8

            @יום_שמח כתב בשיתוף | מרוץ ה-AI מתקדם במהירות האור - OpenAI הציגה את מודל o3:

            ובנטפרי היה צריך לחשוב קצת

            כשהוא חושב, הוא מספר את זה [וגם כמה זמן לקח לו].
            25345f09-1a30-4410-8933-bcce2ea9bb75-image.png

            תגובה 1 תגובה אחרונה
            2
            • NH.LOCALN NH.LOCAL

              קשה להאמין, אבל רק לפני 3 חודשים, פרסמתי את הפוסט הזה על שחרור מודל o1 וכבר מודל o3 הוצג! (על o2 OpenAI פשוט דילגה)


              קצת רקע:


              מודל o1 הוא מודל שהציגה Openai לפני מספר חודשים, המודל עובד בשיטה חדשה המכונה COT = שרשרת חשיבה. השיטה עובדת כך שהמודל חושב זמן מסויים (בין מספר שניות למספר דקות) עד שהוא עונה תשובה, מה שמקפיץ את ביצועי המודל בתחומים כמו מתמטיקה ותכנות.

              בשלב הראשון הציגה החברה את מודל o1, אבל שחררה לציבור (למנויים בלבד) מודל חכם פחות, בשם o1 preview, אם כי גם הוא הציג ביצועים מדהימים כשלעצמו, כתבתי עליהם כאן.


              ההתפתחויות האחרונות:


              לפני שבועיים בלבד, היא שחררה את מודל o1 המלא ואת מודל o1 pro (בעלות של 200$ לחודש, אבל זה כבר נושא אחר) - שהציגו ביצועים אפילו טובים יותר!

              ממש בסוף השבוע האחרון, גוגל שחררה גם היא מודל חשיבה כזה בגרסת בטא. הוא נקרא בשם gemini-2.0-flash-thinking, וניתן לנסות אותו בחינם ב-AI STUDIO


              וכעת לתכלס':


              אתמול, הציגה החברה את מודל o3 שמציג קפיצת מדרגה מדהימה במבחנים הקשים ביותר

              המודל עוד לא שוחרר לציבור, וכפי הנראה גם כשזה יקרה, הוא יעלה כסף. הרבה כסף. מכיוון שהמודל דורש כח עיבוד מטורף עבור כל שאלה.

              לא כל הנתונים פורסמו, וגם אני עצמי לא הספקתי לעבור על כולם. אבל הגרף הבא די מספק. מדובר על אחד המדדים הקשים ביותר בתחום, וכדי לסבר את האוזן שימו לב לעובדה הבאה: ל-ARC-AGI-1 לקח 4 שנים לעבור מ-0% עם GPT-3 ב-2020 ל-5% ב-2024 עם GPT-4o.

              במילים אחרות - אנחנו נמצאים בתוך עלייה אקספוננציאלית, בקו כמעט ישר כלפי מעלה! במילים אחרות - מהירות ההכפלה של אינטליגנציה מלאכותית היא ההתפתחות הטכנולוגית המהירה ביותר אי פעם משחר ההיסטוריה!

              לטעמי, הגרף הזה אמנם לא נותן את התמונה המלאה על התחום, אבל מראה מצויין לאן פנינו מועדות!

              f70da495-3b90-4ccf-8e2d-67b5c1e3c053-image.png

              פרטים נוספים בפוסט הרשמי של מדד ARC:
              https://arcprize.org/blog/oai-o3-pub-breakthrough

              להתראות מתכנתים! 😑

              הכי חשוב: תזכרו מי הראשון שזיהה! 😉

              א מחובר
              א מחובר
              אלף שין
              כתב נערך לאחרונה על ידי
              #9

              @NH-LOCAL
              מה למשל הוא יכול לעשות שהקודם לא יכל?

              תגובה 1 תגובה אחרונה
              0
              • NH.LOCALN NH.LOCAL

                קשה להאמין, אבל רק לפני 3 חודשים, פרסמתי את הפוסט הזה על שחרור מודל o1 וכבר מודל o3 הוצג! (על o2 OpenAI פשוט דילגה)


                קצת רקע:


                מודל o1 הוא מודל שהציגה Openai לפני מספר חודשים, המודל עובד בשיטה חדשה המכונה COT = שרשרת חשיבה. השיטה עובדת כך שהמודל חושב זמן מסויים (בין מספר שניות למספר דקות) עד שהוא עונה תשובה, מה שמקפיץ את ביצועי המודל בתחומים כמו מתמטיקה ותכנות.

                בשלב הראשון הציגה החברה את מודל o1, אבל שחררה לציבור (למנויים בלבד) מודל חכם פחות, בשם o1 preview, אם כי גם הוא הציג ביצועים מדהימים כשלעצמו, כתבתי עליהם כאן.


                ההתפתחויות האחרונות:


                לפני שבועיים בלבד, היא שחררה את מודל o1 המלא ואת מודל o1 pro (בעלות של 200$ לחודש, אבל זה כבר נושא אחר) - שהציגו ביצועים אפילו טובים יותר!

                ממש בסוף השבוע האחרון, גוגל שחררה גם היא מודל חשיבה כזה בגרסת בטא. הוא נקרא בשם gemini-2.0-flash-thinking, וניתן לנסות אותו בחינם ב-AI STUDIO


                וכעת לתכלס':


                אתמול, הציגה החברה את מודל o3 שמציג קפיצת מדרגה מדהימה במבחנים הקשים ביותר

                המודל עוד לא שוחרר לציבור, וכפי הנראה גם כשזה יקרה, הוא יעלה כסף. הרבה כסף. מכיוון שהמודל דורש כח עיבוד מטורף עבור כל שאלה.

                לא כל הנתונים פורסמו, וגם אני עצמי לא הספקתי לעבור על כולם. אבל הגרף הבא די מספק. מדובר על אחד המדדים הקשים ביותר בתחום, וכדי לסבר את האוזן שימו לב לעובדה הבאה: ל-ARC-AGI-1 לקח 4 שנים לעבור מ-0% עם GPT-3 ב-2020 ל-5% ב-2024 עם GPT-4o.

                במילים אחרות - אנחנו נמצאים בתוך עלייה אקספוננציאלית, בקו כמעט ישר כלפי מעלה! במילים אחרות - מהירות ההכפלה של אינטליגנציה מלאכותית היא ההתפתחות הטכנולוגית המהירה ביותר אי פעם משחר ההיסטוריה!

                לטעמי, הגרף הזה אמנם לא נותן את התמונה המלאה על התחום, אבל מראה מצויין לאן פנינו מועדות!

                f70da495-3b90-4ccf-8e2d-67b5c1e3c053-image.png

                פרטים נוספים בפוסט הרשמי של מדד ARC:
                https://arcprize.org/blog/oai-o3-pub-breakthrough

                להתראות מתכנתים! 😑

                הכי חשוב: תזכרו מי הראשון שזיהה! 😉

                sivan22S מנותק
                sivan22S מנותק
                sivan22
                כתב נערך לאחרונה על ידי
                #10

                @NH-LOCAL לכל המתלהבים אני ממליץ לקרוא את זה: https://pub.towardsai.net/why-openais-o1-model-is-a-scam-eb3356c3d70e

                הוא טוען שהטכנולוגיה קיימת כבר שנים ואין כאן חידוש, פשוט קצת עבודה בעיניים. אתה יכול לגרום לכל מודל לחשוב. אז בוודאי שזה לא מודל חדש, זה סה''כ מנגנון מעל המודל. והרעיון ה"מהפכני" הוא לאמן אותו על הבנצ'מארקים עצמם, כדי להטות את התוצאות.

                י. פל.י NH.LOCALN 2 תגובות תגובה אחרונה
                1
                • sivan22S sivan22

                  @NH-LOCAL לכל המתלהבים אני ממליץ לקרוא את זה: https://pub.towardsai.net/why-openais-o1-model-is-a-scam-eb3356c3d70e

                  הוא טוען שהטכנולוגיה קיימת כבר שנים ואין כאן חידוש, פשוט קצת עבודה בעיניים. אתה יכול לגרום לכל מודל לחשוב. אז בוודאי שזה לא מודל חדש, זה סה''כ מנגנון מעל המודל. והרעיון ה"מהפכני" הוא לאמן אותו על הבנצ'מארקים עצמם, כדי להטות את התוצאות.

                  י. פל.י מנותק
                  י. פל.י מנותק
                  י. פל.
                  כתב נערך לאחרונה על ידי
                  #11

                  @sivan22 כתב בשיתוף | מרוץ ה-AI מתקדם במהירות האור - OpenAI הציגה את מודל o3:

                  @NH-LOCAL לכל המתלהבים אני ממליץ לקרוא את זה: https://pub.towardsai.net/why-openais-o1-model-is-a-scam-eb3356c3d70e

                  הוא טוען שהטכנולוגיה קיימת כבר שנים ואין כאן חידוש, פשוט קצת עבודה בעיניים. אתה יכול לגרום לכל מודל לחשוב. אז בוודאי שזה לא מודל חדש, זה סה''כ מנגנון מעל המודל. והרעיון ה"מהפכני" הוא לאמן אותו על הבנצ'מארקים עצמם, כדי להטות את התוצאות.

                  והוא https://arcprize.org/blog/oai-o3-pub-breakthrough טוען שבאמת אין הוספה של נתונים לאימון, אלא שימוש בטכנולוגיות כאלו ואחרות.
                  כמעט כל רעיון חדש אינו טכנולוגיה חדשה, אלא מימוש שלה, לא?

                  תגובה 1 תגובה אחרונה
                  0
                  • sivan22S sivan22

                    @NH-LOCAL לכל המתלהבים אני ממליץ לקרוא את זה: https://pub.towardsai.net/why-openais-o1-model-is-a-scam-eb3356c3d70e

                    הוא טוען שהטכנולוגיה קיימת כבר שנים ואין כאן חידוש, פשוט קצת עבודה בעיניים. אתה יכול לגרום לכל מודל לחשוב. אז בוודאי שזה לא מודל חדש, זה סה''כ מנגנון מעל המודל. והרעיון ה"מהפכני" הוא לאמן אותו על הבנצ'מארקים עצמם, כדי להטות את התוצאות.

                    NH.LOCALN מנותק
                    NH.LOCALN מנותק
                    NH.LOCAL
                    מדריכים
                    כתב נערך לאחרונה על ידי NH.LOCAL
                    #12

                    @sivan22 אתה יודע מה מצחיק בכל מפקפקי ה-AI למיניהם? שתוך כמה חודשים הם נאלצים לבלוע את הלשון או לאכול את הכובע, פשוט בגלל שמודל חדש שיוצא שובר את התאוריות הקודמות שלהם.

                    זה התחיל במחקר מעמיק שבוצע על GPT 3.5 וקבע שנתונים סינטטיים יזיקו בהכרח לאיכות של מודל. הבעיה היא, שעד שהמחקר פורסם, שוחררו מודלים חדשים בעולם האמיתי (כמו PHI3 של מיקרוסופט) שהוכיחו את ההפך הגמור.

                    ולגבי המאמר שהבאת, לא עברתי על כולו, והציטוט הבא צץ לנגד עיני מיד (מתורגם לשם הנוחות):

                    FrontierMath, אמת מידה חדשה לחלוטין במתמטיקה, שימשה לבדיקת ה-LLMs הטובים ביותר. היוצרים של מערך הנתונים הזה מזכירים:

                    כל הבעיות הן חדשות ולא פורסמו, מה שמבטל חששות לזיהום נתונים שפוגעים במדדים קיימים.

                    ואם מסתכלים על התוצאות - הפתעה, הפתעה - o1-preview לא הגיעה למקום הראשון (או אפילו השני). ואני אפילו לא מזכיר שזה פתר פחות מ-1% מהבעיות המפורטות במערך הנתונים הזה.

                    אתה יכול גם לראות ש-o1-preview לא הציג ביצועים טובים בהרבה בהשוואה ל-GPT-4o, דגם הבסיס של o1.

                    זה עשוי לרמוז למסקנה ש-CoT כוונן עדין לביצועים טובים יותר במדדים, אבל בפועל הוא לא עשה שום התקדמות משמעותית.

                    והנה, הפתעה הפתעה(!!!) שלושה חודשים בלבד אחרי פרסום המאמר המלומד, יוצא מודל חדש שמקבל 25.2% במדד ה"בלתי פתיר" הזה

                    אגב, הוא לא היחיד המופתע. הנה ציטוט של טרנס טאו, אחד המתמטיקאים המפורסמים והגאונים ביותר בעולם על מדד FrontierMath המדובר:

                    00dd192f-3951-4150-b557-1cc402bbe052-image.png

                    לאינדקס המלא של כלל הסקריפטים שלי
                    https://nhlocal.github.io

                    י. פל.י תגובה 1 תגובה אחרונה
                    1
                    • NH.LOCALN NH.LOCAL

                      @sivan22 אתה יודע מה מצחיק בכל מפקפקי ה-AI למיניהם? שתוך כמה חודשים הם נאלצים לבלוע את הלשון או לאכול את הכובע, פשוט בגלל שמודל חדש שיוצא שובר את התאוריות הקודמות שלהם.

                      זה התחיל במחקר מעמיק שבוצע על GPT 3.5 וקבע שנתונים סינטטיים יזיקו בהכרח לאיכות של מודל. הבעיה היא, שעד שהמחקר פורסם, שוחררו מודלים חדשים בעולם האמיתי (כמו PHI3 של מיקרוסופט) שהוכיחו את ההפך הגמור.

                      ולגבי המאמר שהבאת, לא עברתי על כולו, והציטוט הבא צץ לנגד עיני מיד (מתורגם לשם הנוחות):

                      FrontierMath, אמת מידה חדשה לחלוטין במתמטיקה, שימשה לבדיקת ה-LLMs הטובים ביותר. היוצרים של מערך הנתונים הזה מזכירים:

                      כל הבעיות הן חדשות ולא פורסמו, מה שמבטל חששות לזיהום נתונים שפוגעים במדדים קיימים.

                      ואם מסתכלים על התוצאות - הפתעה, הפתעה - o1-preview לא הגיעה למקום הראשון (או אפילו השני). ואני אפילו לא מזכיר שזה פתר פחות מ-1% מהבעיות המפורטות במערך הנתונים הזה.

                      אתה יכול גם לראות ש-o1-preview לא הציג ביצועים טובים בהרבה בהשוואה ל-GPT-4o, דגם הבסיס של o1.

                      זה עשוי לרמוז למסקנה ש-CoT כוונן עדין לביצועים טובים יותר במדדים, אבל בפועל הוא לא עשה שום התקדמות משמעותית.

                      והנה, הפתעה הפתעה(!!!) שלושה חודשים בלבד אחרי פרסום המאמר המלומד, יוצא מודל חדש שמקבל 25.2% במדד ה"בלתי פתיר" הזה

                      אגב, הוא לא היחיד המופתע. הנה ציטוט של טרנס טאו, אחד המתמטיקאים המפורסמים והגאונים ביותר בעולם על מדד FrontierMath המדובר:

                      00dd192f-3951-4150-b557-1cc402bbe052-image.png

                      י. פל.י מנותק
                      י. פל.י מנותק
                      י. פל.
                      כתב נערך לאחרונה על ידי
                      #13

                      @NH-LOCAL כתב בשיתוף | מרוץ ה-AI מתקדם במהירות האור - OpenAI הציגה את מודל o3:

                      אתה יכול גם לראות ש-o1-preview לא הציג ביצועים טובים בהרבה בהשוואה ל-GPT-4o, דגם הבסיס של o1.

                      זה משפט לא הגיוני בעליל!!!

                      NH.LOCALN תגובה 1 תגובה אחרונה
                      0
                      • י. פל.י י. פל.

                        @NH-LOCAL כתב בשיתוף | מרוץ ה-AI מתקדם במהירות האור - OpenAI הציגה את מודל o3:

                        אתה יכול גם לראות ש-o1-preview לא הציג ביצועים טובים בהרבה בהשוואה ל-GPT-4o, דגם הבסיס של o1.

                        זה משפט לא הגיוני בעליל!!!

                        NH.LOCALN מנותק
                        NH.LOCALN מנותק
                        NH.LOCAL
                        מדריכים
                        כתב נערך לאחרונה על ידי
                        #14

                        @י-פל אני כבר עייפתי. כל הטיעונים שם מוכרים טחונים ולעוסים. כמו בקורונה, גם כאן יש כמה מכחישי AI כמו כותב המאמר הנ"ל וגארי מרקוס למי שמכיר

                        הטיעונים לעוסים ולא באמת משנים משהו. הוא טוען ש:

                        "אתה יכול לגרום לכל מודל לחשוב. אז בוודאי שזה לא מודל חדש, זה סה''כ מנגנון מעל המודל. והרעיון ה"מהפכני" הוא לאמן אותו על הבנצ'מארקים עצמם, כדי להטות את התוצאות."

                        הבעיה היא שאם זה היה כל כך קל, כל החברות הגדולות היו עושות את זה מזמן כדי לנצח במירוץ, וגם OpenAI היו משחררים את זה כבר מזמן במקום לעבוד על המוצר שנה ויותר. (השמועות על השיטה הזו נפוצו כבר בדצמבר 2023 תחת השם Q*)

                        לאינדקס המלא של כלל הסקריפטים שלי
                        https://nhlocal.github.io

                        תגובה 1 תגובה אחרונה
                        1

                        • התחברות

                        • אין לך חשבון עדיין? הרשמה

                        • התחברו או הירשמו כדי לחפש.
                        • פוסט ראשון
                          פוסט אחרון
                        0
                        • חוקי הפורום
                        • פופולרי
                        • לא נפתר
                        • משתמשים
                        • חיפוש גוגל בפורום
                        • צור קשר