דילוג לתוכן
  • חוקי הפורום
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשת מידע | DeepSeek המודל הסיני

בקשת מידע | DeepSeek המודל הסיני

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
225 פוסטים 48 כותבים 13.1k צפיות 36 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • 25802 2580

    פרק ב' בסדרה 😉

    אפקט DeepSeek: עוקף בהורדות את ChatGPT, מטא הקימה חמ"ל והנאסד"ק לא רגוע

    במטא הקימו "חדרי מלחמה" והצ'אטבוט הפופולרי בעולם, ChatGPT, כבר לא במקום הראשון בהורדות. אפקט מודל דיפסיק הסיני

    Screenshot-2025-01-27-at-8.20.44-1024x561.png.webp

    רק אתמול כתבנו כאן על DeepSeek, הסטארטאפ החדש שהצליח לפתח מודלי שפה ענקיים – כולל מודל היסק מוצלח – בתקציב זעום ובכח מחשוב קטן לכאורה, אבל נראה ש"שיגעון ה-DeepSeek" רק מתחיל. עכשיו נראה שהגלים, שההכרזות והכלים של דיפסיק עושים, מגיעים רחוק.

    ארבעה חדרי מלחמה

    אחד הדיווחים המעניינים ביממה האחרונה סביב ההשפעה של המודלים ששחרר DeepSeek מגיע ממנלו פארק. על פי דיווח של The Information, במשרדי מטא שורר מצב מתוח ודרוך במיוחד. נזכיר שהמודלים של DeepSeek מוצעים בקוד פתוח – בדיוק כמו המודלים של מטא; עם זאת, על פי מבחני ההשוואה שנערכו, הם כבר עוקפים בביצועים שלהם את Llama 4 – המודל החדש ביותר של מטא, שעדיין בפיתוח. הדיווח הזה מעניין במיוחד מכיוון שהוא מאשר פוסט אנונימי ב-Blind שעלה בסוף השבוע ולפיו "מהנדסים עובדים בטירוף בניסיון לפרק לגורמים את DeepSeek ולהעתיק כל מה שאפשר ממנו".

    על פי הדיווח של The Information במשרדי מטא הקימו לא פחות מארבעה "חדרי מלחמה", במטרה לנסות לפרק לגורמים את המודלים של DeepSeek, להנדס אותם לאחור ולנסות לשחזר את "הרוטב הסודי" הזה עם לאמה 4 והמודלים הבאים של החברה. עוד דווח מפי שני עובדי מטא שאיתם שוחחו באתר האמריקאי כי מת'יו אולדהם, ראש תחום תשתיות AI של החברה, אמר למספר עובדים כי הם חוששים ש-Llama 4 לא יוכל להתחרות באלו של דיפסיק.

    חשוב לציין כי "הפאניקה" הזאת במטא (כפי שהגדיר זאת עובד החברה) מגיעה בתזמון מעניין מאוד, שיכול גם להסביר את פוסט ה"למי יש יותר גדול" שפרסם מארק צוקרברג. מנכ"ל ומייסד מטא התהדר במהלך סוף השבוע בכך שמטא תוציא בין 60 ל-65 מיליארד דולר עד סוף השנה בהוצאות על שבבים וחוות שרתים ייעודיים למודלים וליישומי AI שונים: "נסיים את השנה עם 1.3 מיליון שבבים גרפיים עד סוף 2025… ונבנה חוות שרתים כל כך גדולה, שהיא תוכל לכסות חלק משמעותי ממנהטן", כתב צוקרברג בפוסט שלו. צוקרברג גם טען כי עד סוף השנה לאמה 4 יהיה "המודל המתקדם ביותר", והחברה תבנה "מהנדס AI" שיוכל לתרום משמעותית למאמצי הפיתוח של החברה.

    עוקף את ChatGPT

    אבל לא רק מטא. גם ב-OpenAI מביטים בדאגה ב-DeepSeek, שהצליח לרשום ביממה האחרונה הישג: האפליקציה שלו הפכה לפופולרית ביותר בהורדות בחנות האפליקציות של אפל בארצות הברית – תוך כדי שהיא עוקפת את המתחרה הגדולה, ChatGPT. בניגוד לג'בטה אגב, לפחות כרגע, כל המודלים (כולל ההיסק – reasoning) מוצעים ללא תשלום נוסף.

    הזינוק של DeepSeek כבר מתחיל להעלות שאלות, ובדיחות, על הדימיון לטיקטוק – עם אפליקציה חינמית סינית שהופכת לסופר-פופולרית ברגע בארצות הברית. כתבת ה-Wall Street Journal ג'ואנה רובינסון כבר אמרה שהיא מחכה ל"חסימה שהיא לא באמת חסימה" של DeepSeek, כפי שקרה עם טיקטוק.

    הבורסה מתחילה להרגיש את ההשפעות

    אבל ההשפעה של DeepSeek לא נעצרת בטבלאות ההורדה של האפליקציות או במטה של מטא. החוזים העתידיים של מדד נאסד"ק 100, מכשיר כלכלי שמאפשר למשקיעים להמר על ההצלחה (או הכישלון) של חברות המדד בעתיד, ירדו ב-2% כתוצאה מההתפוצצות של DeepSeek. ההשפעה של הסטארטאפ הסיני צפויה להגיע לא רק למניות של חברות התוכנה דוגמת מטא או גוגל, אלא גם על מניות השבבים, מכיוון שהחוקרים של DeepSeek מוכיחים לכאורה כי אפשר לייצר מודלים עוצמתיים גם בלי להחזיק חוות שרתים ענקיות עם מאות אלפים משבבי הדגל של NVIDIA. כזכור, על אנבידיה הוטלו הגבלות שמונעות ממנה למכור לחברות סיניות את השבבים המתקדמים ביותר שלה, כך שאם הן מסתדרות עם שבבים זולים יותר, זה עלול להקרין על שאר השוק. גם המניות של חברה בשם Advantest – ספקית גדולה של אנבידיה – נפלו בכמעט 10% מאז פתיחת יום המסחר ביפן שם היא נסחרת, כתוצאה מההתקדמות וההייפ סביב דיפסיק. כעת נצטרך לחכות לפתיחת יום המסחר בארה"ב בשעות אחר הצהריים היום (ב') כדי לראות אם ההצלחה של דיפסיק תמשיך להשפיע על המניות – כמו אלו של אנבידיה, או שמדובר בהייפ חולף.

    מקור - https://www.geektime.co.il/the-deepseek-effect-is-in-full-swing/

    אם זה מפריע למישהו שאני מעלה את הכתבות תגידו...

    25802 מנותק
    25802 מנותק
    2580
    מדריכים
    כתב נערך לאחרונה על ידי 2580
    #47

    @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

    על פי הדיווח של The Information במשרדי מטא הקימו לא פחות מארבעה "חדרי מלחמה", במטרה לנסות לפרק לגורמים את המודלים של DeepSeek, להנדס אותם לאחור ולנסות לשחזר את "הרוטב הסודי" הזה עם לאמה 4 והמודלים הבאים של החברה. עוד דווח מפי שני עובדי מטא שאיתם שוחחו באתר האמריקאי כי מת'יו אולדהם, ראש תחום תשתיות AI של החברה, אמר למספר עובדים כי הם חוששים ש-Llama 4 לא יוכל להתחרות באלו של דיפסיק.

    חשוב לציין כי "הפאניקה" הזאת במטא (כפי שהגדיר זאת עובד החברה) מגיעה בתזמון מעניין מאוד, שיכול גם להסביר את פוסט ה"למי יש יותר גדול" שפרסם מארק צוקרברג. מנכ"ל ומייסד מטא התהדר במהלך סוף השבוע בכך שמטא תוציא בין 60 ל-65 מיליארד דולר עד סוף השנה בהוצאות על שבבים וחוות שרתים ייעודיים למודלים וליישומי AI שונים: "נסיים את השנה עם 1.3 מיליון שבבים גרפיים עד סוף 2025… ונבנה חוות שרתים כל כך גדולה, שהיא תוכל לכסות חלק משמעותי ממנהטן", כתב צוקרברג בפוסט שלו. צוקרברג גם טען כי עד סוף השנה לאמה 4 יהיה "המודל המתקדם ביותר", והחברה תבנה "מהנדס AI" שיוכל לתרום משמעותית למאמצי הפיתוח של החברה.

    מעניין: מטא החברה היחידה שקשורה לעניין באופן ישיר שחווה עליה בערכה כולל אתמול... (אפל ואמזון יחסית מחוץ לתמונה...)

    ר תגובה 1 תגובה אחרונה
    1
    • 25802 2580

      @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

      על פי הדיווח של The Information במשרדי מטא הקימו לא פחות מארבעה "חדרי מלחמה", במטרה לנסות לפרק לגורמים את המודלים של DeepSeek, להנדס אותם לאחור ולנסות לשחזר את "הרוטב הסודי" הזה עם לאמה 4 והמודלים הבאים של החברה. עוד דווח מפי שני עובדי מטא שאיתם שוחחו באתר האמריקאי כי מת'יו אולדהם, ראש תחום תשתיות AI של החברה, אמר למספר עובדים כי הם חוששים ש-Llama 4 לא יוכל להתחרות באלו של דיפסיק.

      חשוב לציין כי "הפאניקה" הזאת במטא (כפי שהגדיר זאת עובד החברה) מגיעה בתזמון מעניין מאוד, שיכול גם להסביר את פוסט ה"למי יש יותר גדול" שפרסם מארק צוקרברג. מנכ"ל ומייסד מטא התהדר במהלך סוף השבוע בכך שמטא תוציא בין 60 ל-65 מיליארד דולר עד סוף השנה בהוצאות על שבבים וחוות שרתים ייעודיים למודלים וליישומי AI שונים: "נסיים את השנה עם 1.3 מיליון שבבים גרפיים עד סוף 2025… ונבנה חוות שרתים כל כך גדולה, שהיא תוכל לכסות חלק משמעותי ממנהטן", כתב צוקרברג בפוסט שלו. צוקרברג גם טען כי עד סוף השנה לאמה 4 יהיה "המודל המתקדם ביותר", והחברה תבנה "מהנדס AI" שיוכל לתרום משמעותית למאמצי הפיתוח של החברה.

      מעניין: מטא החברה היחידה שקשורה לעניין באופן ישיר שחווה עליה בערכה כולל אתמול... (אפל ואמזון יחסית מחוץ לתמונה...)

      ר מנותק
      ר מנותק
      רפאל vnkl
      כתב נערך לאחרונה על ידי רפאל vnkl
      #48

      משום מה עכשיו אני לא מצליח לשלוח לו הודעות... קורה גם אצלכם או שזה רק אני?

      A תגובה 1 תגובה אחרונה
      0
      • 25802 2580

        פרק ה'!!!!!!!!!!!!!! לאיפה זה עוד יכול להגיע!!!!!!!!!!!!!!!

        לא עוצרת: DeepSeek משיקה מודלים חדשים כולל ג'ינרוט תמונות

        הסטארטאפ הסיני DeepSeek שמזעזע את עולם ה-AI מציג מודל ג'ינרוט תמונות חדש בשם Janus-Pro

        DEEPSEEK-BY-GEEKTIME-2-1024x768.jpg.webp

        עולם הטכנולוגיה עסוק בימים האחרונים רק בדבר אחד: DeepSeek, הסטארטאפ הסיני שמזעזע את תחום ה-AI מהיסוד, לאחר שפיתח מודלים עוצמתיים בעלות של תקציב הקייטרינג של OpenAI ו-Antrhopic. אחרי שהוביל אמש (ב') למחיקת הערך הגדולה בהיסטוריה בבורסה,, מנצל הסטארטאפ את הבאז להכרזה נוספת.

        ההכרזה החדשה

        המודלים החדשים של דיפסיק הם מולטי-מודאליים, כלומר יודעים להתמודד עם מספר סוגי קלט, כמו טקסט ותמונה, ובעלי יכולת ג'נרוט תמונות שיתחרו ב-DALL-E של OpenAI, מידג'רני ואחרים. כמו המודלים האחרים של החברה, גם Janus-Pro, משפחת המודלים החדשה, משוחררת בקוד פתוח (ברישיון MIT, המאפשר שימוש בהם במוצרים מסחריים ללא הגבלה) וזמינה להורדה כבר עכשיו לכל מיני שמעוניין בהם. יש שני מודלים במשפחה, אחד עם מיליארד פרמטרים והשני עם שבעה מיליארד פרמטרים.

        חשוב לציין כי ב-DeepSeek הציגו כבר בשנה שעברה מודל ממשפחת Janus, אך אלו סבלו מביצועים חלשים כשקיבלו פרומפטים קצרים ולא מפורטים, ובג'ינרוט תמונות. משפחת מודלי הפרו הצליחה לפתור את הבעיות הללו על ידי אימון על דאטה-סט גדול יותר ובעזרת אסטרטגיית אימון שונה שעברה אופטימיזציה לג'ינרוט תמונות. המודל הגדול מבין השניים זמין להתנסות, למי מכם שעדיין לא בנויים להרצה של אחד על המחשב שלהם, דרך HuggingFace.

        ב-DeepSeek הבינו שהדרך הכי טובה להמחיש עד כמה המודל מוצלח היא על ידי ההשוואה שלו למודלים של OpenAI, וכך עשו. בכמה בנצ'מרקים בתחום ג'ינרוט התמונות, כמו GenEval ו-DPG-Bench, המודל הגדול ביותר במשפחה החדשה (Janus-Pro-7B) עוקף את דאלי 3, כמו גם את Stable Diffusion XL ומודלים פחות מוכרים כמו PixArt-alpha ו-Emu3-Gen. חשוב לציין כי המודל יכול לנתח תמונות ברזולוציה נמוכה יותר לעומת המתחרים (עד 384×384 בלבד), אבל במקביל כל משפחת המודלים החדשה הרבה יותר קטנה מבחינת מספר הפרמטרים לעומת המתחרים.

        DALL·E-2025-01-28-09.58.58-A-surreal-and-imaginative-image-of-a-whale-creatively-crafted-entirely-out-of-avocados.-The-whales-body-is-made-from-the-smooth-textured-skin-of-avo-225x135.webp
        מקור: דאלי 3

        image-225x135.webp
        מקור: Janus-Pro-7B

        aeb4ffc6-c768-4c20-9f3f-975e394b2d99-image.png
        מקור: אימג׳ן 3

        כמו עם מודל V3 של החברה, הראשון שהתחיל את הבאז הגדול סביבה, חוקרי דיפסיק אומרים כי הצליחו לפתח את המודלים החדשים עם הרצת הפריימוורק HAI-LLM ב-PyTorch (המתחרה החינמי בקוד פתוח של מטא ל-CUDA של אנבידיה) על כמה מאות GPUs בלבד. החוקרים אומרים כי תהליך האימון כולו ארך בין שבוע לשבועיים על cluster הכולל 8 מעבדי A100 של אנבידיה בלבד.

        המודל החדש מייצר תמונות בגודל 768×768 בלבד, בניגוד למודלים של ענקיות הטכנולוגיה כמו דאלי 3 ואימג'ן של גוגל שמג'נרטים תמונות ב-1024×1024 (ריבוע). אימג'ן של גוגל יכול לג'נרט תמונות גם בפורמטים מלבניים כמו 16:9 ו-4:3. מההתנסות הקצרה שלנו אנחנו חייבים להודות ש-Janus לא היה מרשים מדי ובפרומפט שהזנתי אליו לעומת דאלי 3 ואימג'ן של גוגל זה די ברור שהמודל הסיני עדיין לא מתחרה אמיתי. עם זאת, ההצלחה היא כמובן באימון המתוחכם על ידי החוקרים הסיניים, והעובדה שמדובר בדור ראשון של מודל פתוח לחלוטין הזמין לשימוש ללא שום הגבלות – לעומת המודלים הסגורים של גוגל ו-OpenAI.

        מקור - https://www.geektime.co.il/deepseek-shows-off-new-models/

        בונוס לפרק:

        מנכ"ל אינטל כבר משתמש ב-DeepSeek לסטארטאפ החדש שלו
        פאט גלסינגר, מנכ"ל אינטל עד לאחרונה, סיפר כי הסטארטאפ שלו, Gloo, כבר עושה שימוש במודלים של DeepSeek במקום המודלים של OpenAI. לדבריו, ההחלטה הגיעה לאחר שהתרשם עמוקות ממודל R1 של החברה הסינית.

        מקור - https://www.geektime.co.il/flash/former-intel-ceo-uses-deepseek-for-his-new-startup/?utm_source=copy_link&utm_medium=social&utm_campaign=share&utm_term=newsflash&utm_content=538705

        א.מ.ד.א מנותק
        א.מ.ד.א מנותק
        א.מ.ד.
        כתב נערך לאחרונה על ידי
        #49

        @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

        המודל הגדול מבין השניים זמין להתנסות, למי מכם שעדיין לא בנויים להרצה של אחד על המחשב שלהם, דרך HuggingFace.

        לא מצאתי.

        25802 תגובה 1 תגובה אחרונה
        0
        • ר רפאל vnkl

          משום מה עכשיו אני לא מצליח לשלוח לו הודעות... קורה גם אצלכם או שזה רק אני?

          A מנותק
          A מנותק
          aiib
          כתב נערך לאחרונה על ידי
          #50

          @רפאל-vnkl כתב בבקשת מידע | DeepSeek המודל הסיני:

          משום מה עכשיו אני לא מצליח לשלוח לו הודעות... קורה גם אצלכם או שזה רק אני?

          גם אצלי. נראה שלא עומדים בעומס...

          25802 תגובה 1 תגובה אחרונה
          0
          • א.מ.ד.א א.מ.ד.

            @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

            המודל הגדול מבין השניים זמין להתנסות, למי מכם שעדיין לא בנויים להרצה של אחד על המחשב שלהם, דרך HuggingFace.

            לא מצאתי.

            25802 מנותק
            25802 מנותק
            2580
            מדריכים
            כתב נערך לאחרונה על ידי 2580
            #51

            @א-מ-ד בגדול זה כאן: https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B

            אני בבנטפרי אז זה ממילא לא עובד אצלי כרגע כך שאני לא יכול לדעת בדיוק...

            יש קישורים בגוף הכתבה...

            א.מ.ד.א תגובה 1 תגובה אחרונה
            0
            • A aiib

              @רפאל-vnkl כתב בבקשת מידע | DeepSeek המודל הסיני:

              משום מה עכשיו אני לא מצליח לשלוח לו הודעות... קורה גם אצלכם או שזה רק אני?

              גם אצלי. נראה שלא עומדים בעומס...

              25802 מנותק
              25802 מנותק
              2580
              מדריכים
              כתב נערך לאחרונה על ידי
              #52

              @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

              A תגובה 1 תגובה אחרונה
              0
              • 25802 2580

                @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

                A מנותק
                A מנותק
                aiib
                כתב נערך לאחרונה על ידי
                #53

                @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

                הם כותבים שיש מתקפת סייבר ולכן יהיה בעיה להרשמה חדשה אבל משתמשים רשומים כרגיל.
                והשגיאה שאני מקבל אחרי שהמודל מנסה לרוץ שיש עומס

                25802 תגובה 1 תגובה אחרונה
                0
                • 25802 מנותק
                  25802 מנותק
                  2580
                  מדריכים
                  כתב נערך לאחרונה על ידי 2580
                  #54

                  ויש גם פרק ו'............

                  זה מה שקרה כשניסינו לשאול את DeepSeek על נושאים שנויים במחלוקת בסין

                  האם הצ'ט-בוט החדש של דיפסיק מצנזר ידיעות לא נוחות לממשל הסיני? בהחלט. האם זה חריג? לא בטוח

                  DEEPSEEK-BY-GEEKTIME-2-1024x768.jpg.webp

                  בימים האחרונים נראה שיש רק שם אחד שמטריף את עולם הטכנולוגיה: DeepSeek.

                  הסטארטאפ הסיני, שמעטים מחוץ לקהילת המחקר וה-AI הכירו עד לאחרונה, חשף את המודלים והכלים החדשים שלו, r1 ו-v3. למרות שמדובר בסטארטאפ קטן וצעיר יחסית, ולמרות שעמדו לרשותו משאבי אימון ומיחשוב מוגבלים, הצליחו החוקרים להפתיע עם מודלים שמנצחים במבחני השוואה (Benchmark) ומוצעים כקוד פתוח, כלומר, כל אחד יכול להשתמש בו לפיתוחים שלו או להריץ אותו לוקלית על המחשב שלו. התוצאה: גלי הדף בעולם הטכנולוגיה שהגיעו מצוותי הפיתוח במטא ועד מניות השבבים בנאסד"ק.

                  עם זאת, בד בבד עם ההתפעלות מהפיתוח הטכנולוגי והמוצרי, רבים העלו תהיות לגבי ההטייה "הפוליטית" שלו, על מה אומן בדיוק הדאטהסט שלו, ואיזו אמת הוא ישקף בתשובות שלו. או במילים אחרות, האם כמו כל מוצר ושירות שזמין בסין, גם הוא יהיה תחת "חומת האש הגדולה" ויצונזר.

                  אז בדקנו את זה עם 2 סוגיות שנויות במחלוקת בסין: הטבח בכיכר טיין-אן-מן, במסגרתו נהרגו בין מאות לאלפי מפגינים נגד המשטר; וכן, סוגיית העם האויגורי, מיעוט אתני שחי במערב סין ונתון לדיכוי תרבותי ואתני. באופן לא מפתיע, המודל סירב להתייחס ל-2 הבקשות שלנו, אבל מה שמפתיע יותר מבחינתנו היה שלא היתה זו חסימה גורפת ואוטומטית… אלא בתשלומים.

                  https://netfree.link/app/#/tickets/new?u=https%3A%2F%2Fwww.youtube.com%2Fembed%2FKAqYufFLyjw&r=&t=video&bi=

                  (הסרטון לע"ע לא נבדק עדיין בנטפרי...)

                  כמו שאתם יכולים לראות בסרטון שצירפנו, המודל בהתחלה כן החל לפרט על הנושאים השנויים במחלוקת ולפלוט טקסטים כמו כל מודל אחר, אולם רגע אחרי הוא כאילו "התעשת", מחק את כל הפלט והציג הודעה גנרית: Sorry. that's beyond my current scope. Let's talk about something else".

                  אני שייך ל-OpenAI

                  אגב אלו לא התשובות המוזרות היחידות שהמודל פולט. קוראים פנו אלינו במייל האדום וגם בקבוצת הדיונים שלנו ושיתפו במסכים שמעידים על תשובות מבלבלות בנוגע למקור של המודל ומי פיתח אותו. ההסבר ככל הנראה קשור ל"הזיות" המאפיינות LLMs ולדאטה-סט עליו הם מאומנים, אבל עדיין משעשע.

                  ONE.jpg.webp

                  TWO.jpg.webp

                  כולם מצנזרים

                  למרות תצוגת התכלית הזו, חשוב לזכור שכל המודלים, אולי למעט Grok של xAI, מצנזרים את התשובות שהם פולטים וכוללים לא מעט "הטיות" מכוונות ומובנות. הם אולי קוראים לזה Guardrails ו-Alignment, אבל בסופו של דבר גם מודלים פרטיים אמריקאיים מסננים תשובות ומטים את הפרומפטים, כדי לשקף נורמות או אידיאולוגיות מסוימות. אחד המקרים הזכורים ביותר לכך קרה כשג'מיני, בשם ערכי הגיוון והשיוויון, יצר תמונות מדויקות היסטורית לכאורה של חיילים נאצים שחורים.

                  קרדיט - https://www.geektime.co.il/this-is-what-happens-when-you-ask-deepseek-about-controversial-issues/

                  25802 תגובה 1 תגובה אחרונה
                  0
                  • A aiib

                    @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                    @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

                    הם כותבים שיש מתקפת סייבר ולכן יהיה בעיה להרשמה חדשה אבל משתמשים רשומים כרגיל.
                    והשגיאה שאני מקבל אחרי שהמודל מנסה לרוץ שיש עומס

                    25802 מנותק
                    25802 מנותק
                    2580
                    מדריכים
                    כתב נערך לאחרונה על ידי
                    #55

                    @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                    @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                    @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

                    הם כותבים שיש מתקפת סייבר ולכן יהיה בעיה להרשמה חדשה אבל משתמשים רשומים כרגיל.
                    והשגיאה שאני מקבל אחרי שהמודל מנסה לרוץ שיש עומס

                    איפה כתוב? לא נתקלתי בזה?

                    A 25802 2 תגובות תגובה אחרונה
                    0
                    • א אלי ויל

                      בימים האחרונים התפרסם שיש מודל חדש סיני שהוא טוב כמו GPT O1
                      כרגע סגור בנטפרי
                      האם יש מישהו שהתנסה איתו?

                      A מנותק
                      A מנותק
                      avrasha
                      כתב נערך לאחרונה על ידי
                      #56

                      @אלי-ויל צריך רק לדעת שהם ברישמי מודים שהם שומרים את כל המידע של הגושים במחשבים שלהם בסין. יש כאן בעיה גדולה של רגישות למידע

                      A תגובה 1 תגובה אחרונה
                      0
                      • A avrasha

                        @אלי-ויל צריך רק לדעת שהם ברישמי מודים שהם שומרים את כל המידע של הגושים במחשבים שלהם בסין. יש כאן בעיה גדולה של רגישות למידע

                        A מנותק
                        A מנותק
                        aiib
                        כתב נערך לאחרונה על ידי
                        #57

                        @avrasha כתב בבקשת מידע | DeepSeek המודל הסיני:

                        @אלי-ויל צריך רק לדעת שהם ברישמי מודים שהם שומרים את כל המידע של הגושים במחשבים שלהם בסין. יש כאן בעיה גדולה של רגישות למידע

                        וGPT לא רושמים את זה?

                        צ A 2 תגובות תגובה אחרונה
                        1
                        • 25802 2580

                          @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                          @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                          @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

                          הם כותבים שיש מתקפת סייבר ולכן יהיה בעיה להרשמה חדשה אבל משתמשים רשומים כרגיל.
                          והשגיאה שאני מקבל אחרי שהמודל מנסה לרוץ שיש עומס

                          איפה כתוב? לא נתקלתי בזה?

                          A מנותק
                          A מנותק
                          aiib
                          כתב נערך לאחרונה על ידי
                          #58

                          @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                          @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                          @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                          @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

                          הם כותבים שיש מתקפת סייבר ולכן יהיה בעיה להרשמה חדשה אבל משתמשים רשומים כרגיל.
                          והשגיאה שאני מקבל אחרי שהמודל מנסה לרוץ שיש עומס

                          איפה כתוב? לא נתקלתי בזה?

                          7bcef842-3ec5-4442-9921-58dc8dea28cb-image.png

                          זה על העומס.

                          תגובה 1 תגובה אחרונה
                          1
                          • A aiib

                            @avrasha כתב בבקשת מידע | DeepSeek המודל הסיני:

                            @אלי-ויל צריך רק לדעת שהם ברישמי מודים שהם שומרים את כל המידע של הגושים במחשבים שלהם בסין. יש כאן בעיה גדולה של רגישות למידע

                            וGPT לא רושמים את זה?

                            צ מנותק
                            צ מנותק
                            צדיק וטוב לו 0
                            כתב נערך לאחרונה על ידי
                            #59

                            @aiib למה ש GPT ישמור בסין?

                            תגובה 1 תגובה אחרונה
                            0
                            • 25802 2580

                              @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

                              הם כותבים שיש מתקפת סייבר ולכן יהיה בעיה להרשמה חדשה אבל משתמשים רשומים כרגיל.
                              והשגיאה שאני מקבל אחרי שהמודל מנסה לרוץ שיש עומס

                              איפה כתוב? לא נתקלתי בזה?

                              25802 מנותק
                              25802 מנותק
                              2580
                              מדריכים
                              כתב נערך לאחרונה על ידי
                              #60

                              @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

                              הם כותבים שיש מתקפת סייבר ולכן יהיה בעיה להרשמה חדשה אבל משתמשים רשומים כרגיל.
                              והשגיאה שאני מקבל אחרי שהמודל מנסה לרוץ שיש עומס

                              איפה כתוב? לא נתקלתי בזה?

                              @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @aiib או שזה מתקפת סייבר כפי ש @א-מ-ד כתב למעלה...

                              הם כותבים שיש מתקפת סייבר ולכן יהיה בעיה להרשמה חדשה אבל משתמשים רשומים כרגיל.
                              והשגיאה שאני מקבל אחרי שהמודל מנסה לרוץ שיש עומס

                              איפה כתוב? לא נתקלתי בזה?

                              7bcef842-3ec5-4442-9921-58dc8dea28cb-image.png

                              זה על העומס.

                              עוד על כך...

                              https://www.calcalist.co.il/calcalistech/article/b1edper001l

                              https://www.bizportal.co.il/BizTech/news/article/20012873

                              תגובה 1 תגובה אחרונה
                              0
                              • A aiib

                                @avrasha כתב בבקשת מידע | DeepSeek המודל הסיני:

                                @אלי-ויל צריך רק לדעת שהם ברישמי מודים שהם שומרים את כל המידע של הגושים במחשבים שלהם בסין. יש כאן בעיה גדולה של רגישות למידע

                                וGPT לא רושמים את זה?

                                A מנותק
                                A מנותק
                                avrasha
                                כתב נערך לאחרונה על ידי
                                #61

                                @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                                וGPT לא רושמים את זה?

                                gpt זאת חברה אמריקאית

                                A תגובה 1 תגובה אחרונה
                                0
                                • 25802 2580

                                  ויש גם פרק ו'............

                                  זה מה שקרה כשניסינו לשאול את DeepSeek על נושאים שנויים במחלוקת בסין

                                  האם הצ'ט-בוט החדש של דיפסיק מצנזר ידיעות לא נוחות לממשל הסיני? בהחלט. האם זה חריג? לא בטוח

                                  DEEPSEEK-BY-GEEKTIME-2-1024x768.jpg.webp

                                  בימים האחרונים נראה שיש רק שם אחד שמטריף את עולם הטכנולוגיה: DeepSeek.

                                  הסטארטאפ הסיני, שמעטים מחוץ לקהילת המחקר וה-AI הכירו עד לאחרונה, חשף את המודלים והכלים החדשים שלו, r1 ו-v3. למרות שמדובר בסטארטאפ קטן וצעיר יחסית, ולמרות שעמדו לרשותו משאבי אימון ומיחשוב מוגבלים, הצליחו החוקרים להפתיע עם מודלים שמנצחים במבחני השוואה (Benchmark) ומוצעים כקוד פתוח, כלומר, כל אחד יכול להשתמש בו לפיתוחים שלו או להריץ אותו לוקלית על המחשב שלו. התוצאה: גלי הדף בעולם הטכנולוגיה שהגיעו מצוותי הפיתוח במטא ועד מניות השבבים בנאסד"ק.

                                  עם זאת, בד בבד עם ההתפעלות מהפיתוח הטכנולוגי והמוצרי, רבים העלו תהיות לגבי ההטייה "הפוליטית" שלו, על מה אומן בדיוק הדאטהסט שלו, ואיזו אמת הוא ישקף בתשובות שלו. או במילים אחרות, האם כמו כל מוצר ושירות שזמין בסין, גם הוא יהיה תחת "חומת האש הגדולה" ויצונזר.

                                  אז בדקנו את זה עם 2 סוגיות שנויות במחלוקת בסין: הטבח בכיכר טיין-אן-מן, במסגרתו נהרגו בין מאות לאלפי מפגינים נגד המשטר; וכן, סוגיית העם האויגורי, מיעוט אתני שחי במערב סין ונתון לדיכוי תרבותי ואתני. באופן לא מפתיע, המודל סירב להתייחס ל-2 הבקשות שלנו, אבל מה שמפתיע יותר מבחינתנו היה שלא היתה זו חסימה גורפת ואוטומטית… אלא בתשלומים.

                                  https://netfree.link/app/#/tickets/new?u=https%3A%2F%2Fwww.youtube.com%2Fembed%2FKAqYufFLyjw&r=&t=video&bi=

                                  (הסרטון לע"ע לא נבדק עדיין בנטפרי...)

                                  כמו שאתם יכולים לראות בסרטון שצירפנו, המודל בהתחלה כן החל לפרט על הנושאים השנויים במחלוקת ולפלוט טקסטים כמו כל מודל אחר, אולם רגע אחרי הוא כאילו "התעשת", מחק את כל הפלט והציג הודעה גנרית: Sorry. that's beyond my current scope. Let's talk about something else".

                                  אני שייך ל-OpenAI

                                  אגב אלו לא התשובות המוזרות היחידות שהמודל פולט. קוראים פנו אלינו במייל האדום וגם בקבוצת הדיונים שלנו ושיתפו במסכים שמעידים על תשובות מבלבלות בנוגע למקור של המודל ומי פיתח אותו. ההסבר ככל הנראה קשור ל"הזיות" המאפיינות LLMs ולדאטה-סט עליו הם מאומנים, אבל עדיין משעשע.

                                  ONE.jpg.webp

                                  TWO.jpg.webp

                                  כולם מצנזרים

                                  למרות תצוגת התכלית הזו, חשוב לזכור שכל המודלים, אולי למעט Grok של xAI, מצנזרים את התשובות שהם פולטים וכוללים לא מעט "הטיות" מכוונות ומובנות. הם אולי קוראים לזה Guardrails ו-Alignment, אבל בסופו של דבר גם מודלים פרטיים אמריקאיים מסננים תשובות ומטים את הפרומפטים, כדי לשקף נורמות או אידיאולוגיות מסוימות. אחד המקרים הזכורים ביותר לכך קרה כשג'מיני, בשם ערכי הגיוון והשיוויון, יצר תמונות מדויקות היסטורית לכאורה של חיילים נאצים שחורים.

                                  קרדיט - https://www.geektime.co.il/this-is-what-happens-when-you-ask-deepseek-about-controversial-issues/

                                  25802 מנותק
                                  25802 מנותק
                                  2580
                                  מדריכים
                                  כתב נערך לאחרונה על ידי 2580
                                  #62

                                  @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  אני שייך ל-OpenAI
                                  אגב אלו לא התשובות המוזרות היחידות שהמודל פולט. קוראים פנו אלינו במייל האדום וגם בקבוצת הדיונים שלנו ושיתפו במסכים שמעידים על תשובות מבלבלות בנוגע למקור של המודל ומי פיתח אותו. ההסבר ככל הנראה קשור ל"הזיות" המאפיינות LLMs ולדאטה-סט עליו הם מאומנים, אבל עדיין משעשע.

                                  @א-מ-ד כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  @NH-LOCAL
                                  @2580
                                  שאלתי את מודל ההיסק איזה מודל הוא, וזה מה שהוא ענה:

                                  אני חלק מ-OpenAI, החברה שפיתחה את הטכנולוגיה שמאחוריי. המודלים העיקריים של OpenAI כוללים מגוון רחב של יכולות, בהתאם לשימוש ולצורך. הנה כמה מהבולטים שבהם:

                                  1. GPT-4 ו-GPT-3.5

                                  • מה הם עושים?
                                    מודלי שפה מתקדמים (כמוני!) שמסוגלים לענות על שאלות, לייצר טקסטים, לתרגם שפות, לסכם מסמכים, לכתוב קוד, ועוד.
                                  • שימושים נפוצים: צ'אטבוטים, עוזרים וירטואליים, כלי כתיבה, תמיכה טכנית, ועוד.

                                  2. DALL-E

                                  • מה הוא עושה?
                                    יוצר תמונות ודימויים ויזואליים מתיאורים טקסטואליים (למשל: "דוב קוטב מצייר בצבעי מים").
                                  • שימושים: עיצוב גרפי, יצירת איורים, רעיונות לשיווק, ועוד.

                                  3. Whisper

                                  • מה הוא עושה?
                                    מודל לזיהוי ודיבוב קול (Speech-to-Text) עם תמיכה במגוון שפות, כולל עברית.
                                  • שימושים: תמלול הקלטות, יצירת כתוביות, תרגום קולי בזמן אמת.

                                  4. Codex

                                  • מה הוא עושה?
                                    מודל שמתמחה בכתיבת קוד ותכנות, והוא הבסיס ל-GitHub Copilot.
                                  • שימושים: אוטומציה של פיתוח תוכנה, עזרה בתכנות, פתרון באגים.

                                  5. CLIP

                                  • מה הוא עושה?
                                    מודל שמקשר בין טקסט לתמונה – מזהה תוכן בתמונות על סמך תיאורים.
                                  • שימושים: חיפוש תמונות, סיווג אוטומטי, מערכות המלצה.

                                  הערה חשובה:

                                  לא כל המודלים זמינים ישירות דרך ממשק הצ'אט (כמוני). חלקם, כמו DALL-E או Whisper, דורשים גישה דרך API או פלטפורמות ייעודיות של OpenAI.

                                  אם תרצה מידע ספציפי על אחד המודלים או עזרה בשימוש בהם, אשמח להרחיב! 😊

                                  אז ייתכן שכן היתה שם איזו העתקה, כמנהג made in china, לפחות עבור ייצור מערכי נתונים...

                                  ..........................

                                  דרך אגב לגבי המדדים בפרה מרקט (מכירה מוקדמת) נראה שיש התאוששות קלה...

                                  תגובה 1 תגובה אחרונה
                                  0
                                  • א מחובר
                                    א מחובר
                                    אהרן
                                    כתב נערך לאחרונה על ידי
                                    #63

                                    פתוח בנטפרי [ולא נותן תשובה, לא יודע אם בגלל העומס / סייבר או בגלל נטפרי]

                                    ראובן שבתיר תגובה 1 תגובה אחרונה
                                    0
                                    • A avrasha

                                      @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                                      וGPT לא רושמים את זה?

                                      gpt זאת חברה אמריקאית

                                      A מנותק
                                      A מנותק
                                      aiib
                                      כתב נערך לאחרונה על ידי
                                      #64

                                      @avrasha כתב בבקשת מידע | DeepSeek המודל הסיני:

                                      @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                                      וGPT לא רושמים את זה?

                                      gpt זאת חברה אמריקאית

                                      למשתמש הרגיל לא יודע אם יש הבדל

                                      תגובה 1 תגובה אחרונה
                                      0
                                      • א אהרן

                                        פתוח בנטפרי [ולא נותן תשובה, לא יודע אם בגלל העומס / סייבר או בגלל נטפרי]

                                        ראובן שבתיר מנותק
                                        ראובן שבתיר מנותק
                                        ראובן שבתי
                                        מדריכים
                                        כתב נערך לאחרונה על ידי
                                        #65

                                        @אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

                                        פתוח בנטפרי [ולא נותן תשובה, לא יודע אם בגלל העומס / סייבר או בגלל נטפרי]

                                        היה פתוח בעבר
                                        כיום חסום

                                        ...

                                        25802 א 2 תגובות תגובה אחרונה
                                        0
                                        • ראובן שבתיר ראובן שבתי

                                          @אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

                                          פתוח בנטפרי [ולא נותן תשובה, לא יודע אם בגלל העומס / סייבר או בגלל נטפרי]

                                          היה פתוח בעבר
                                          כיום חסום

                                          25802 מנותק
                                          25802 מנותק
                                          2580
                                          מדריכים
                                          כתב נערך לאחרונה על ידי
                                          #66

                                          @ראובן-שבתי אתה מדבר על הצ'אטבוט הוא לכאורה מדבר על זה----

                                          https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B

                                          תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר