דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. סקר | מהו הצ'אט AI המועדף עליך?

סקר | מהו הצ'אט AI המועדף עליך?

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
162 פוסטים 39 כותבים 3.3k צפיות 34 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א.מ.ד.א א.מ.ד.

    @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

    אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.

    קודם כל היה באמצע את GPT 4 אבל זה לא חשוב עכשיו.
    בכל מקרה, באמת אז הגיעו לתקרת הזכוכית מבחינת נתונים אנושיים, וזה בדיוק מחזק את מה שכתבתי - שמאז השימוש בנתונים סינטטיים תופס חלק גדול מאוד מנתוני האימון.
    עניין מודלי החשיבה פחות רלוונטי, כי מדובר בסך הכל בכוונון לצ'אט. עיקר העבודה היא באימון המקדים. הנתונים המשמשים לאימון לצ'אט הם בערך 1% בלבד מסך הנתונים. השיפור במודלים החדשים הוא בעיקר באימון המקדים ופחות בצורת החשיבה, למרות שגם זה קצת משפיע, כך שעדיין זקוקים לנתונים סינטטיים רבים.

    @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

    לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית?

    הסינים מקבלים סיוע עצום מהממשלה הסינית, כוח העבודה זול בהרבה, והם גם מייעלים משמעותית את האימון. אין חולק על כך שהתרבות המערבית בזבזנית בהרבה בכל תחום. ע"ע סורה.

    @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

    שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???

    ברור שהם התקדמו. המודלים הסינים החדשים ביותר שווים לאופוס 4.6, כלומר פער של חודשים בודדים. אם כי סביר להניח שהם לא יכולים לעקוף כי הם מבוססים כמו שכתבת על המודלים המערביים (שוב - נתונים סינטטיים...).

    @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

    שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות.

    מעניין... אולי באמת בקידוד סוכני הוא פחות טוב, אבל באופן כללי הוא מעולה בקוד. אני משתמש בו לליווי צמוד של הפרוייקט שלי של סמארטי לווינדוס במשך בערך 10 שיחות (אני מבקש ממנו ליצור תיק חפיפה לשיחה הבאה כשמתמלא ההקשר).

    המלאךה מנותק
    המלאךה מנותק
    המלאך
    כתב נערך לאחרונה על ידי
    #121

    @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

    קודם כל היה באמצע את GPT 4 אבל זה לא חשוב עכשיו.
    בכל מקרה, באמת אז הגיעו לתקרת הזכוכית מבחינת נתונים אנושיים, וזה בדיוק מחזק את מה שכתבתי - שמאז השימוש בנתונים סינטטיים תופס חלק גדול מאוד מנתוני האימון.
    עניין מודלי החשיבה פחות רלוונטי, כי מדובר בסך הכל בכוונון לצ'אט. עיקר העבודה היא באימון המקדים. הנתונים המשמשים לאימון לצ'אט הם בערך 1% בלבד מסך הנתונים. השיפור במודלים החדשים הוא בעיקר באימון המקדים ופחות בצורת החשיבה, למרות שגם זה קצת משפיע, כך שעדיין זקוקים לנתונים סינטטיים רבים.

    מודלי חשיבה שינו הרבה יותר מכיוונון בצאט.
    הם שינו בScaling.
    פרט לכך.
    על אף שהPost-training קטנים. האיכות שלהם היא זו ש(לדעתי) מכפילה את החוכמה של המודל.
    הוא כפשוטו נהפך מטיפש לחכם.
    ממש לא נראה לי שזה רק יותר דאטה..

    תגובה 1 תגובה אחרונה
    0
    • המלאךה המלאך

      @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

      כל המודלים המערביים משתמשים ב-MoE.

      כוונתי לסיבה שהם הפתיעו את המערביים בהתחלה. (הם אלו שהשתמשו בהתחלה בזה..).

      א.מ.ד.א מנותק
      א.מ.ד.א מנותק
      א.מ.ד.
      כתב נערך לאחרונה על ידי
      #122

      @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

      כוונתי לסיבה שהם הפתיעו את המערביים בהתחלה. (הם אלו שהשתמשו בהתחלה בזה..).

      לא נכון. הראשונים שהשתמשו בזה הם המערב - מודל מיקסטרל של חברת מיסטרל הצרפתית, ומיד זה הפך לסטנדרט בתעשיית ה-AI. החברות הסגורות לא מנדבות מידע טכני על המודלים שלהם, אבל אפילו גרוק 2 המיושן ששוחרר בקוד פתוח כבר היה MoE.

      @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

      מודלי חשיבה שינו הרבה יותר מכיוונון בצאט.
      הם שינו בScaling.
      פרט לכך.
      על אף שהPost-training קטנים. האיכות שלהם היא זו ש(לדעתי) מכפילה את החוכמה של המודל.
      הוא כפשוטו נהפך מטיפש לחכם.
      ממש לא נראה לי שזה רק יותר דאטה..

      ברור שזה לא רק דאטה, אבל רוב השיפור נובע משיפור באימון המקדים, שמורכב מכמות גדולה של נתונים סינטטיים.
      כיום חלק גדול מהאימון המקדים מתבצע כבר על זוגות של שאלות ותשובות בפורמט צ'אט עם חשיבה כמובן, שזה ודאי סינטטי.

      מפתח אפליקציות אנדרואיד
      em0548438097@gmail.com

      מתכנת חובבמ תגובה 1 תגובה אחרונה
      0
      • א.מ.ד.א א.מ.ד.

        @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

        אין צורך בנתונים: בשעתו, לאחר המעבר מgpt 3.5 ל4o, דיברו ע״ז שאין מספיק, והגענו לתקרת זכוכית, וכו׳. ואז הגיעו מודלי החשיבה, והוכיחו שהאימון אמור לעבוד בצורה שונה לגמרי וכו׳.

        קודם כל היה באמצע את GPT 4 אבל זה לא חשוב עכשיו.
        בכל מקרה, באמת אז הגיעו לתקרת הזכוכית מבחינת נתונים אנושיים, וזה בדיוק מחזק את מה שכתבתי - שמאז השימוש בנתונים סינטטיים תופס חלק גדול מאוד מנתוני האימון.
        עניין מודלי החשיבה פחות רלוונטי, כי מדובר בסך הכל בכוונון לצ'אט. עיקר העבודה היא באימון המקדים. הנתונים המשמשים לאימון לצ'אט הם בערך 1% בלבד מסך הנתונים. השיפור במודלים החדשים הוא בעיקר באימון המקדים ופחות בצורת החשיבה, למרות שגם זה קצת משפיע, כך שעדיין זקוקים לנתונים סינטטיים רבים.

        @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

        לגבי הסינים: חשבתי רבות: מה גורם לopenai להשקיע מעל (ולפעמים כפול מ)500m דולר למודל, אם הסינים עשו זאת במאית?

        הסינים מקבלים סיוע עצום מהממשלה הסינית, כוח העבודה זול בהרבה, והם גם מייעלים משמעותית את האימון. אין חולק על כך שהתרבות המערבית בזבזנית בהרבה בכל תחום. ע"ע סורה.

        @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

        שאלה נוספת: רגע הדיפסיק של העולם, אירע לפני מעל שנה. לפני תקופה קצרה אמר דריו אמודאי שהסינים במרחק של 9-12 חודשים. אבל גם אז הם היו כך. אז למה הם לא התקדמו ב14 החודשים שעברו???

        ברור שהם התקדמו. המודלים הסינים החדשים ביותר שווים לאופוס 4.6, כלומר פער של חודשים בודדים. אם כי סביר להניח שהם לא יכולים לעקוף כי הם מבוססים כמו שכתבת על המודלים המערביים (שוב - נתונים סינטטיים...).

        @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

        שלא לדבר על כך שלא הצלחתי לעבור איתו מעולם שיחה נורמלית, בלי לפחות 15 קריסות.

        מעניין... אולי באמת בקידוד סוכני הוא פחות טוב, אבל באופן כללי הוא מעולה בקוד. אני משתמש בו לליווי צמוד של הפרוייקט שלי של סמארטי לווינדוס במשך בערך 10 שיחות (אני מבקש ממנו ליצור תיק חפיפה לשיחה הבאה כשמתמלא ההקשר).

        י. פל.י מנותק
        י. פל.י מנותק
        י. פל.
        כתב נערך לאחרונה על ידי
        #123

        @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

        הסינים מקבלים סיוע עצום מהממשלה הסינית, כוח העבודה זול בהרבה

        אין לי מה להגיב על מה שכתבת - למרות שתייגת... זה יחזור ע״ע בלופ.
        אתה טוען שהשינוי באימון הוא הנתונים הסינטטיים. אני חושש שאתה טועה, אבל לא יודע לומר כלום בוודאות.

        רק לגבי הפיסקה שציטטתי: בזה אתה טועה, העובדה היא עובדה, וניתנת שלחזור (כי הכל פתוח, גם מערכי הנתונים וגם קוד האימון וכולי): האימון שלהם זול מאוד, ללא קשר לממשל.

        גאה להיות חלק:
        otzaria.org

        א.מ.ד.א תגובה 1 תגובה אחרונה
        0
        • י. פל.י י. פל.

          @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

          הסינים מקבלים סיוע עצום מהממשלה הסינית, כוח העבודה זול בהרבה

          אין לי מה להגיב על מה שכתבת - למרות שתייגת... זה יחזור ע״ע בלופ.
          אתה טוען שהשינוי באימון הוא הנתונים הסינטטיים. אני חושש שאתה טועה, אבל לא יודע לומר כלום בוודאות.

          רק לגבי הפיסקה שציטטתי: בזה אתה טועה, העובדה היא עובדה, וניתנת שלחזור (כי הכל פתוח, גם מערכי הנתונים וגם קוד האימון וכולי): האימון שלהם זול מאוד, ללא קשר לממשל.

          א.מ.ד.א מנותק
          א.מ.ד.א מנותק
          א.מ.ד.
          כתב נערך לאחרונה על ידי
          #124

          @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

          רק לגבי הפיסקה שציטטתי: בזה אתה טועה, העובדה היא עובדה, וניתנת שלחזור (כי הכל פתוח, גם מערכי הנתונים וגם קוד האימון וכולי): האימון שלהם זול מאוד, ללא קשר לממשל.

          שום דבר לא פתוח חוץ מהמשקלים של המודל. אין איך לשחזר את העבודה שלהם.
          ולגבי הסיוע מהממשל, הוא לא מתבטא רק בכסף פיזי אלא בסבסוד משמעותי בעלות המים והחשמל האדירה הנדרשת לקירור חוות השבבים שהמודלים מאומנים בהם. זה בהחלט מחושב בתוך עלות האימון, ואפילו זה כמעט כל העלות.

          מפתח אפליקציות אנדרואיד
          em0548438097@gmail.com

          י. פל.י תגובה 1 תגובה אחרונה
          0
          • א.מ.ד.א א.מ.ד.

            @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

            רק לגבי הפיסקה שציטטתי: בזה אתה טועה, העובדה היא עובדה, וניתנת שלחזור (כי הכל פתוח, גם מערכי הנתונים וגם קוד האימון וכולי): האימון שלהם זול מאוד, ללא קשר לממשל.

            שום דבר לא פתוח חוץ מהמשקלים של המודל. אין איך לשחזר את העבודה שלהם.
            ולגבי הסיוע מהממשל, הוא לא מתבטא רק בכסף פיזי אלא בסבסוד משמעותי בעלות המים והחשמל האדירה הנדרשת לקירור חוות השבבים שהמודלים מאומנים בהם. זה בהחלט מחושב בתוך עלות האימון, ואפילו זה כמעט כל העלות.

            י. פל.י מנותק
            י. פל.י מנותק
            י. פל.
            כתב נערך לאחרונה על ידי
            #125

            @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

            שום דבר לא פתוח חוץ מהמשקלים של המודל. אין איך לשחזר את העבודה שלהם.

            הכל שוחזר בhuggingface.

            גאה להיות חלק:
            otzaria.org

            א.מ.ד.א תגובה 1 תגובה אחרונה
            0
            • י. פל.י י. פל.

              @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

              שום דבר לא פתוח חוץ מהמשקלים של המודל. אין איך לשחזר את העבודה שלהם.

              הכל שוחזר בhuggingface.

              א.מ.ד.א מנותק
              א.מ.ד.א מנותק
              א.מ.ד.
              כתב נערך לאחרונה על ידי
              #126

              @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

              הכל שוחזר בhuggingface.

              איך בדיוק? זה קוד סגור... רק המשקלים פתוחים... אין איך לשחזר אא"כ מישהו הדליף הכל מתוך החברה, שעל זה היינו שומעים...

              מפתח אפליקציות אנדרואיד
              em0548438097@gmail.com

              י. פל.י תגובה 1 תגובה אחרונה
              0
              • א.מ.ד.א א.מ.ד.

                @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                הכל שוחזר בhuggingface.

                איך בדיוק? זה קוד סגור... רק המשקלים פתוחים... אין איך לשחזר אא"כ מישהו הדליף הכל מתוך החברה, שעל זה היינו שומעים...

                י. פל.י מנותק
                י. פל.י מנותק
                י. פל.
                כתב נערך לאחרונה על ידי י. פל.
                #127

                @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                אין איך לשחזר

                תחפש בבקשה Open-R1.
                אין לי טעם להתווכח אתך: כנראה אתה יודע יותר ממני.
                אבל אני חושב שאתה לא יודע הכל (לא שמישהו יודע...), ויתכן שאתה מפספס הרבה בדרך.
                הראיה הגדולה, שאתה משתמש בג'מיני הטיפש לקוד 😜
                אגב, מוזר ש @sivan22 ו @nh.local לא הגיבו פה בכלל!!!

                גאה להיות חלק:
                otzaria.org

                א.מ.ד.א תגובה 1 תגובה אחרונה
                0
                • א.מ.ד.א א.מ.ד.

                  @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                  כוונתי לסיבה שהם הפתיעו את המערביים בהתחלה. (הם אלו שהשתמשו בהתחלה בזה..).

                  לא נכון. הראשונים שהשתמשו בזה הם המערב - מודל מיקסטרל של חברת מיסטרל הצרפתית, ומיד זה הפך לסטנדרט בתעשיית ה-AI. החברות הסגורות לא מנדבות מידע טכני על המודלים שלהם, אבל אפילו גרוק 2 המיושן ששוחרר בקוד פתוח כבר היה MoE.

                  @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                  מודלי חשיבה שינו הרבה יותר מכיוונון בצאט.
                  הם שינו בScaling.
                  פרט לכך.
                  על אף שהPost-training קטנים. האיכות שלהם היא זו ש(לדעתי) מכפילה את החוכמה של המודל.
                  הוא כפשוטו נהפך מטיפש לחכם.
                  ממש לא נראה לי שזה רק יותר דאטה..

                  ברור שזה לא רק דאטה, אבל רוב השיפור נובע משיפור באימון המקדים, שמורכב מכמות גדולה של נתונים סינטטיים.
                  כיום חלק גדול מהאימון המקדים מתבצע כבר על זוגות של שאלות ותשובות בפורמט צ'אט עם חשיבה כמובן, שזה ודאי סינטטי.

                  מתכנת חובבמ מנותק
                  מתכנת חובבמ מנותק
                  מתכנת חובב
                  מדריכים
                  כתב נערך לאחרונה על ידי
                  #128

                  @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                  ברור שזה לא רק דאטה, אבל רוב השיפור נובע משיפור באימון המקדים, שמורכב מכמות גדולה של נתונים סינטטיים.
                  כיום חלק גדול מהאימון המקדים מתבצע כבר על זוגות של שאלות ותשובות בפורמט צ'אט עם חשיבה כמובן, שזה ודאי סינטטי.

                  אתה כנראה מתכוון למה שנקרא mid training
                  כי אימון מודל בסיס על נתונים סינטטיים יוביל למודל גרוע
                  בדיוק השבוע יצא לי לקרוא כמה מאמרים על זה
                  נושא מבלבל ממש

                  צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

                  א.מ.ד.א תגובה 1 תגובה אחרונה
                  0
                  • מתכנת חובבמ מתכנת חובב

                    @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                    ברור שזה לא רק דאטה, אבל רוב השיפור נובע משיפור באימון המקדים, שמורכב מכמות גדולה של נתונים סינטטיים.
                    כיום חלק גדול מהאימון המקדים מתבצע כבר על זוגות של שאלות ותשובות בפורמט צ'אט עם חשיבה כמובן, שזה ודאי סינטטי.

                    אתה כנראה מתכוון למה שנקרא mid training
                    כי אימון מודל בסיס על נתונים סינטטיים יוביל למודל גרוע
                    בדיוק השבוע יצא לי לקרוא כמה מאמרים על זה
                    נושא מבלבל ממש

                    א.מ.ד.א מנותק
                    א.מ.ד.א מנותק
                    א.מ.ד.
                    כתב נערך לאחרונה על ידי א.מ.ד.
                    #129

                    @מתכנת-חובב צריך לשלב הרבה נתונים סינטטיים. לא הייתי קורא למודלי qwen 3.5 מודלים גרועים (למעשה הם הטובים ביותר במשקלים פתוחים), והם אומנו בעיקר על נתונים סינטטיים.
                    אימון אמצע מורכב בדרך כלל מנתונים סינטטיים, וזה מה שנותן להם את האיכות.
                    אין חולק שנתונים סינטטיים נחשבים איכותיים יותר. כל מי שמתעסק בתחום יודע את זה. אבל כמו כל דבר טוב, אי אפשר יותר מידי כי זה מזיק. לכן זה איפשהו באמצע - 50% מהנתונים בערך הם סינטטיים, ומשתמשים בהם בעיקר באימון האמצעי אבל לא רק.

                    מפתח אפליקציות אנדרואיד
                    em0548438097@gmail.com

                    מתכנת חובבמ תגובה 1 תגובה אחרונה
                    0
                    • י. פל.י י. פל.

                      @א.מ.ד. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                      אין איך לשחזר

                      תחפש בבקשה Open-R1.
                      אין לי טעם להתווכח אתך: כנראה אתה יודע יותר ממני.
                      אבל אני חושב שאתה לא יודע הכל (לא שמישהו יודע...), ויתכן שאתה מפספס הרבה בדרך.
                      הראיה הגדולה, שאתה משתמש בג'מיני הטיפש לקוד 😜
                      אגב, מוזר ש @sivan22 ו @nh.local לא הגיבו פה בכלל!!!

                      א.מ.ד.א מנותק
                      א.מ.ד.א מנותק
                      א.מ.ד.
                      כתב נערך לאחרונה על ידי א.מ.ד.
                      #130

                      @י.-פל. כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                      תחפש בבקשה Open-R1.

                      אתה צוחק?
                      זה פרוייקט שמזקק נתונים מתוך דיפסיק R1 המקורי, ומנסה לשחזר את האימון לפי הדו"ח הטכנולוגי של דיפסיק...
                      אני לא יודע אם לקרוא לזה גימיק או קוריוז...
                      אתה יכול באותה מידה בדיוק "לשחזר" את אופוס 4.7...

                      מפתח אפליקציות אנדרואיד
                      em0548438097@gmail.com

                      תגובה 1 תגובה אחרונה
                      0
                      • א.מ.ד.א א.מ.ד.

                        @מתכנת-חובב צריך לשלב הרבה נתונים סינטטיים. לא הייתי קורא למודלי qwen 3.5 מודלים גרועים (למעשה הם הטובים ביותר במשקלים פתוחים), והם אומנו בעיקר על נתונים סינטטיים.
                        אימון אמצע מורכב בדרך כלל מנתונים סינטטיים, וזה מה שנותן להם את האיכות.
                        אין חולק שנתונים סינטטיים נחשבים איכותיים יותר. כל מי שמתעסק בתחום יודע את זה. אבל כמו כל דבר טוב, אי אפשר יותר מידי כי זה מזיק. לכן זה איפשהו באמצע - 50% מהנתונים בערך הם סינטטיים, ומשתמשים בהם בעיקר באימון האמצעי אבל לא רק.

                        מתכנת חובבמ מנותק
                        מתכנת חובבמ מנותק
                        מתכנת חובב
                        מדריכים
                        כתב נערך לאחרונה על ידי מתכנת חובב
                        #131

                        @א.מ.ד. גם בשלב ה pre training?
                        מוזר מאוד
                        אפשר מקורות?
                        באופן כללי מה שכתבת קצת מוזר
                        על פי מה שקראתי גם בשלב אימון האמצע לא משתמשים ביותר מידי נתונים סטטיסטיים אלא אם כן רוצים לחזק יכולות ספציפיות ותוך שימוש בשיטות מורכבות יחסית כמו שעשו ב phi4
                        בשלב אימון הבסיס אם משתמשים בנתונים סינטטיים זה מידע שעבר rephrasing ולא מידע שמקורו סינטטי
                        כמו כן למה אתה חושב שמידי סינטטי הוא טוב יותר? (אלא אם כן אתה מתכוון לעובדה שאפשר לייצר מידע סינטטי מסודר ובאיכות יחסית גם אם נגמרו מאגרי המידע האיכותי הלא סינטטי אבל אז זה לא שהוא איכותי אלא שהוא פשוט יותר טוב מכלום)

                        צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

                        המלאךה תגובה 1 תגובה אחרונה
                        0
                        • מתכנת חובבמ מתכנת חובב

                          @א.מ.ד. גם בשלב ה pre training?
                          מוזר מאוד
                          אפשר מקורות?
                          באופן כללי מה שכתבת קצת מוזר
                          על פי מה שקראתי גם בשלב אימון האמצע לא משתמשים ביותר מידי נתונים סטטיסטיים אלא אם כן רוצים לחזק יכולות ספציפיות ותוך שימוש בשיטות מורכבות יחסית כמו שעשו ב phi4
                          בשלב אימון הבסיס אם משתמשים בנתונים סינטטיים זה מידע שעבר rephrasing ולא מידע שמקורו סינטטי
                          כמו כן למה אתה חושב שמידי סינטטי הוא טוב יותר? (אלא אם כן אתה מתכוון לעובדה שאפשר לייצר מידע סינטטי מסודר ובאיכות יחסית גם אם נגמרו מאגרי המידע האיכותי הלא סינטטי אבל אז זה לא שהוא איכותי אלא שהוא פשוט יותר טוב מכלום)

                          המלאךה מנותק
                          המלאךה מנותק
                          המלאך
                          כתב נערך לאחרונה על ידי
                          #132

                          @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                          . גם בשלב ה pre training?
                          מוזר מאוד
                          אפשר מקורות?

                          אכן. גם בשלב באימון המקדים משתמשים כיום בדאטה מזוקק.
                          דאטה מזוקק יעיל הרבה יותר בכמות קטנה יותר מדאטה לא מזוקק.
                          מאמר מעניין שראיתי בנושא.

                          @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                          כמו כן למה אתה חושב שמידי סינטטי הוא טוב יותר? (אלא אם כן אתה מתכוון לעובדה שאפשר לייצר מידע סינטטי מסודר ובאיכות יחסית גם אם נגמרו מאגרי המידע האיכותי הלא סינטטי אבל אז זה לא שהוא איכותי אלא שהוא פשוט יותר טוב מכלום)

                          העניין הוא שישנה מגבלה טכנית.
                          כל הטקסטים באינטרנט נגמרו.
                          דאטה סינטטי רגיל יעיל בגלל האיכות שלו.
                          אבל עיקר החיסרון הוא הלולאה שנוצרת כמו שאמרתי לעיל.
                          ככל שמשתמשים יותר בדאטה סינטטי דברים יותר נדירים נעלמים. [המודל חושב הסתברותית כן? - פחות רואה באימון את הדבר הנדיר - פחות מסתבר בשבילו להגיב אותו בצאט.]

                          @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                          על פי מה שקראתי גם בשלב אימון האמצע לא משתמשים ביותר מידי נתונים סטטיסטיים אלא אם כן רוצים לחזק יכולות ספציפיות ותוך שימוש בשיטות מורכבות יחסית כמו שעשו ב phi4

                          כך היה בעבר.
                          כיום הטקסט האנושי כאמור נגמר.
                          [לפחות לא האלה בתשלום. - דרך אגב גם בתשלום הבנתי שהחברות כבר קונות]
                          אין דרך אחרת טכנית לעקוף את המגבלה מלבד נתונים סינטטיים.
                          אבל וודאי שזה כאמור יגרום לירידה ביצירתיות וכו'..

                          מתכנת חובבמ תגובה 1 תגובה אחרונה
                          0
                          • המלאךה המלאך

                            @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                            . גם בשלב ה pre training?
                            מוזר מאוד
                            אפשר מקורות?

                            אכן. גם בשלב באימון המקדים משתמשים כיום בדאטה מזוקק.
                            דאטה מזוקק יעיל הרבה יותר בכמות קטנה יותר מדאטה לא מזוקק.
                            מאמר מעניין שראיתי בנושא.

                            @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                            כמו כן למה אתה חושב שמידי סינטטי הוא טוב יותר? (אלא אם כן אתה מתכוון לעובדה שאפשר לייצר מידע סינטטי מסודר ובאיכות יחסית גם אם נגמרו מאגרי המידע האיכותי הלא סינטטי אבל אז זה לא שהוא איכותי אלא שהוא פשוט יותר טוב מכלום)

                            העניין הוא שישנה מגבלה טכנית.
                            כל הטקסטים באינטרנט נגמרו.
                            דאטה סינטטי רגיל יעיל בגלל האיכות שלו.
                            אבל עיקר החיסרון הוא הלולאה שנוצרת כמו שאמרתי לעיל.
                            ככל שמשתמשים יותר בדאטה סינטטי דברים יותר נדירים נעלמים. [המודל חושב הסתברותית כן? - פחות רואה באימון את הדבר הנדיר - פחות מסתבר בשבילו להגיב אותו בצאט.]

                            @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                            על פי מה שקראתי גם בשלב אימון האמצע לא משתמשים ביותר מידי נתונים סטטיסטיים אלא אם כן רוצים לחזק יכולות ספציפיות ותוך שימוש בשיטות מורכבות יחסית כמו שעשו ב phi4

                            כך היה בעבר.
                            כיום הטקסט האנושי כאמור נגמר.
                            [לפחות לא האלה בתשלום. - דרך אגב גם בתשלום הבנתי שהחברות כבר קונות]
                            אין דרך אחרת טכנית לעקוף את המגבלה מלבד נתונים סינטטיים.
                            אבל וודאי שזה כאמור יגרום לירידה ביצירתיות וכו'..

                            מתכנת חובבמ מנותק
                            מתכנת חובבמ מנותק
                            מתכנת חובב
                            מדריכים
                            כתב נערך לאחרונה על ידי
                            #133

                            @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                            אכן. גם בשלב באימון המקדים משתמשים כיום בדאטה מזוקק.
                            דאטה מזוקק יעיל הרבה יותר בכמות קטנה יותר מדאטה לא מזוקק.
                            מאמר מעניין שראיתי בנושא.

                            מה? הבנת על מה הפוסט הזה מדבר? (ואגב זה לא מאמר)

                            @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                            העניין הוא שישנה מגבלה טכנית.
                            כל הטקסטים באינטרנט נגמרו.
                            דאטה סינטטי רגיל יעיל בגלל האיכות שלו.
                            אבל עיקר החיסרון הוא הלולאה שנוצרת כמו שאמרתי לעיל.
                            ככל שמשתמשים יותר בדאטה סינטטי דברים יותר נדירים נעלמים. [המודל חושב הסתברותית כן? - פחות רואה באימון את הדבר הנדיר - פחות מסתבר בשבילו להגיב אותו בצאט.]

                            מה חידשת על מה שכתבתי?

                            @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                            כך היה בעבר.
                            כיום הטקסט האנושי כאמור נגמר.
                            [לפחות לא האלה בתשלום. - דרך אגב גם בתשלום הבנתי שהחברות כבר קונות]
                            אין דרך אחרת טכנית לעקוף את המגבלה מלבד נתונים סינטטיים.
                            אבל וודאי שזה כאמור יגרום לירידה ביצירתיות וכו'..

                            לא יודע על מה אתה מסתמך
                            אני הסתמכתי על המקורות האלו

                            מחקר של HF
                            דו"ח של מיקרוסופט על Phi-4
                            אחד המאמרים המרכזיים בתחום
                            מאמר נוסף
                            שני האחרונים נכתבו בעיקר על ידי חוקרים ממטא
                            הם מורכבים ממש אבל מספיק לקרוא רק את ה abstract שלהם כדי להבין

                            צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

                            המלאךה א.מ.ד.א 2 תגובות תגובה אחרונה
                            0
                            • י מנותק
                              י מנותק
                              י.ר.ק
                              כתב נערך לאחרונה על ידי
                              #134

                              @חובבן-מקצועי בחתול השחור העלו את הסקר שלך פה

                              תגובה 1 תגובה אחרונה
                              0
                              • מתכנת חובבמ מתכנת חובב

                                @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                אכן. גם בשלב באימון המקדים משתמשים כיום בדאטה מזוקק.
                                דאטה מזוקק יעיל הרבה יותר בכמות קטנה יותר מדאטה לא מזוקק.
                                מאמר מעניין שראיתי בנושא.

                                מה? הבנת על מה הפוסט הזה מדבר? (ואגב זה לא מאמר)

                                @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                העניין הוא שישנה מגבלה טכנית.
                                כל הטקסטים באינטרנט נגמרו.
                                דאטה סינטטי רגיל יעיל בגלל האיכות שלו.
                                אבל עיקר החיסרון הוא הלולאה שנוצרת כמו שאמרתי לעיל.
                                ככל שמשתמשים יותר בדאטה סינטטי דברים יותר נדירים נעלמים. [המודל חושב הסתברותית כן? - פחות רואה באימון את הדבר הנדיר - פחות מסתבר בשבילו להגיב אותו בצאט.]

                                מה חידשת על מה שכתבתי?

                                @המלאך כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                כך היה בעבר.
                                כיום הטקסט האנושי כאמור נגמר.
                                [לפחות לא האלה בתשלום. - דרך אגב גם בתשלום הבנתי שהחברות כבר קונות]
                                אין דרך אחרת טכנית לעקוף את המגבלה מלבד נתונים סינטטיים.
                                אבל וודאי שזה כאמור יגרום לירידה ביצירתיות וכו'..

                                לא יודע על מה אתה מסתמך
                                אני הסתמכתי על המקורות האלו

                                מחקר של HF
                                דו"ח של מיקרוסופט על Phi-4
                                אחד המאמרים המרכזיים בתחום
                                מאמר נוסף
                                שני האחרונים נכתבו בעיקר על ידי חוקרים ממטא
                                הם מורכבים ממש אבל מספיק לקרוא רק את ה abstract שלהם כדי להבין

                                המלאךה מנותק
                                המלאךה מנותק
                                המלאך
                                כתב נערך לאחרונה על ידי
                                #135

                                @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                מה? הבנת על מה הפוסט הזה מדבר? (ואגב זה לא מאמר)

                                לא באתי להביא מקורות.
                                סתם משהו מעניין בנושא שראיתי.

                                @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                לא יודע על מה אתה מסתמך

                                על כל מה שאני רואה באינטרנט בנושא.
                                כן.
                                ראיתי גם את האלה ממטא.

                                אפשר בקשה קטנה? קצת יותר לכבד.
                                יש לי קצת ידע בנושא.
                                יש לי דעה ומותר לי להגיד אותה.
                                לא אהדתי את הנימה שהתייחסת אלי.

                                @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                מה חידשת על מה שכתבתי?

                                שגם באימון המקדים משתמשים במידע מזוקק.

                                מתכנת חובבמ תגובה 1 תגובה אחרונה
                                1
                                • המלאךה המלאך

                                  @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                  מה? הבנת על מה הפוסט הזה מדבר? (ואגב זה לא מאמר)

                                  לא באתי להביא מקורות.
                                  סתם משהו מעניין בנושא שראיתי.

                                  @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                  לא יודע על מה אתה מסתמך

                                  על כל מה שאני רואה באינטרנט בנושא.
                                  כן.
                                  ראיתי גם את האלה ממטא.

                                  אפשר בקשה קטנה? קצת יותר לכבד.
                                  יש לי קצת ידע בנושא.
                                  יש לי דעה ומותר לי להגיד אותה.
                                  לא אהדתי את הנימה שהתייחסת אלי.

                                  @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                  מה חידשת על מה שכתבתי?

                                  שגם באימון המקדים משתמשים במידע מזוקק.

                                  מתכנת חובבמ מנותק
                                  מתכנת חובבמ מנותק
                                  מתכנת חובב
                                  מדריכים
                                  כתב נערך לאחרונה על ידי מתכנת חובב
                                  #136

                                  @המלאך
                                  א. המאמר ההוא לא בנושא הזה - מאמר על שימוש בבינה מלאכותית לצורך זיהוי שרפות היה רלוונטי באותה מידה
                                  ב. נשמח למקורות שיתמכו במה שאמרת כי הנ"ל טענו אחרת


                                  ג. אם תכבד יכבדו אותך - אם היית קורא ברצינות את הפוסט שלי היית מבין שאני יודע על מה אני מדבר ואין צורך להסביר לי כאילו היום שמעתי מה זה chatGPT - זה קצת פוגע כשמסבירים ככה
                                  אמנם זה אגו אבל עדיין טבע האדם

                                  ד. שוב, אם אתה מדבר עם ה pre training אתה טועה או לא מדייק - לא מצאתי עדויות לזה שמידע מזוקק משמש באימון הזה ולהיפך - כל מה שמצאתי טוען שהמקסימום זה מידע אמיתי שעבר ניסוח מחודש

                                  צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

                                  המלאךה תגובה 1 תגובה אחרונה
                                  0
                                  • מתכנת חובבמ מתכנת חובב

                                    @המלאך
                                    א. המאמר ההוא לא בנושא הזה - מאמר על שימוש בבינה מלאכותית לצורך זיהוי שרפות היה רלוונטי באותה מידה
                                    ב. נשמח למקורות שיתמכו במה שאמרת כי הנ"ל טענו אחרת


                                    ג. אם תכבד יכבדו אותך - אם היית קורא ברצינות את הפוסט שלי היית מבין שאני יודע על מה אני מדבר ואין צורך להסביר לי כאילו היום שמעתי מה זה chatGPT - זה קצת פוגע כשמסבירים ככה
                                    אמנם זה אגו אבל עדיין טבע האדם

                                    ד. שוב, אם אתה מדבר עם ה pre training אתה טועה או לא מדייק - לא מצאתי עדויות לזה שמידע מזוקק משמש באימון הזה ולהיפך - כל מה שמצאתי טוען שהמקסימום זה מידע אמיתי שעבר ניסוח מחודש

                                    המלאךה מנותק
                                    המלאךה מנותק
                                    המלאך
                                    כתב נערך לאחרונה על ידי
                                    #137

                                    @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                    נשמח למקורות שיתמכו במה שאמרת כי הנ"ל טענו אחרת

                                    לא כך הבנתי מהם.
                                    אבל ייתכן.
                                    בכל מקרה.
                                    הנה:
                                    https://hyper.ai/en/papers/2508.10975
                                    והנה:
                                    https://huggingface.co/papers/2509.01649?.com

                                    @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                    . אם תכבד יכבדו אותך - אם היית קורא ברצינות את הפוסט שלי היית מבין שאני יודע על מה אני מדבר ואין צורך להסביר לי כאילו היום שמעתי מה זה chatGPT - זה קצת פוגע כשמסבירים ככה
                                    אמנם זה אגו אבל עדיין טבע האדם

                                    אם כך אבקש מחילה.
                                    אני מאוד מכבד ומעריך אותך.
                                    לרגע לא חשבתי שאתה לא יודע את זה..

                                    מתכנת חובבמ 2 תגובות תגובה אחרונה
                                    1
                                    • המלאךה המלאך

                                      @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                      נשמח למקורות שיתמכו במה שאמרת כי הנ"ל טענו אחרת

                                      לא כך הבנתי מהם.
                                      אבל ייתכן.
                                      בכל מקרה.
                                      הנה:
                                      https://hyper.ai/en/papers/2508.10975
                                      והנה:
                                      https://huggingface.co/papers/2509.01649?.com

                                      @מתכנת-חובב כתב בסקר | מהו הצ'אט AI המועדף עליך?:

                                      . אם תכבד יכבדו אותך - אם היית קורא ברצינות את הפוסט שלי היית מבין שאני יודע על מה אני מדבר ואין צורך להסביר לי כאילו היום שמעתי מה זה chatGPT - זה קצת פוגע כשמסבירים ככה
                                      אמנם זה אגו אבל עדיין טבע האדם

                                      אם כך אבקש מחילה.
                                      אני מאוד מכבד ומעריך אותך.
                                      לרגע לא חשבתי שאתה לא יודע את זה..

                                      מתכנת חובבמ מנותק
                                      מתכנת חובבמ מנותק
                                      מתכנת חובב
                                      מדריכים
                                      כתב נערך לאחרונה על ידי מתכנת חובב
                                      #138

                                      @המלאך הקישור הראשון למיטב הבנתי לא מדבר על זה (אם כי קראתי רק את התקציר)
                                      השני נראה מעניין - אני קורא אותו עכשיו
                                      תודה

                                      צריך עזרה בשחזור מידע? ייעוץ? egozkokus1@gmail.com

                                      תגובה 1 תגובה אחרונה
                                      1
                                      • המלאךה המלאך

                                        @א.מ.ד. הייתי מסכים איתך ועם כולם.
                                        אבל לא בנקודה הרגישה לי, (לזוכרים מבינינו, @בנימין-מחשבים )
                                        קידוד. = ג'מיני - זוועה = בכל קנה מידה.
                                        הוא לא מעודכן, מלא באגים כרימון, מלא בעיות אבטחה יותר מרימון.
                                        לעיצוב אני באמת משתמש בו, או בGPT כשאני מעלה לו תמונה (המלצה של @שלמה-רביב ).
                                        אה. שכחתי להוסיף, במיוחד בשביל משתמשי אתרוג/רימון = הוא גם תקוע בהם.

                                        יעקב ישראלי מנותק
                                        יעקב ישראלי מנותק
                                        יעקב ישראל
                                        מדריכים
                                        כתב נערך לאחרונה על ידי
                                        #139

                                        @המלאך האם השתמשת בAntigravity ?

                                        אנטי וירוס ESET (הכי יקר)ב 110₪
                                        ya218022@gmail.com

                                        המלאךה תגובה 1 תגובה אחרונה
                                        0
                                        • יעקב ישראלי יעקב ישראל

                                          @המלאך האם השתמשת בAntigravity ?

                                          המלאךה מנותק
                                          המלאךה מנותק
                                          המלאך
                                          כתב נערך לאחרונה על ידי
                                          #140

                                          @יעקב-ישראל האמת? אתמול ממש הורדתי אותו.
                                          אבל נתקעתי בהתחברות לחשבון גוגל.
                                          חיפשתי וראיתי שהרבה מתלוננים על זה.
                                          וגוגל עצמה אמרה שהיא מתכננת להוציא עדכון שיטפל.
                                          בינתיים אני מחכה.

                                          יעקב ישראלי תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • פופולרי
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר