דילוג לתוכן
  • חוקי הפורום
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשת מידע | DeepSeek המודל הסיני

בקשת מידע | DeepSeek המודל הסיני

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
225 פוסטים 48 כותבים 13.1k צפיות 36 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • צדיק תמיםצ צדיק תמים

    @א-מ-ד מה בדיוק שאלת כדי להגיע לכזאת תשובה?

    נ.ב. מי שרוצה ניתוח ברמה באמת - https://stratechery.com/2025/deepseek-faq

    א.מ.ד.א מחובר
    א.מ.ד.א מחובר
    א.מ.ד.
    כתב נערך לאחרונה על ידי
    #30

    @צדיק-תמים כתב בבקשת מידע | DeepSeek המודל הסיני:

    @א-מ-ד מה בדיוק שאלת כדי להגיע לכזאת תשובה?

    פשוט - "איזה מודל אתה, ואיזה מודלים יש לחברה שלך?"

    תגובה 1 תגובה אחרונה
    1
    • ט מנותק
      ט מנותק
      טופטופיסט
      כתב נערך לאחרונה על ידי טופטופיסט
      #31

      אגב, יש שם פיצ'ר ממש ממש טוב
      יש כפתור שאפשר להשאיר אותו דולק כל השיחה ואז בכל תגובה שלו לראות מה הוא 'חושב' בדיוק ומה לענות לך ולמה לענות לך, משהו ממש טוב!

      2f9a35fd-aa27-448d-a869-224f65b2bf01-image.png ספויילר

      א.מ.ד.א יעקב מ. פינסי Y 3 תגובות תגובה אחרונה
      2
      • ט טופטופיסט

        אגב, יש שם פיצ'ר ממש ממש טוב
        יש כפתור שאפשר להשאיר אותו דולק כל השיחה ואז בכל תגובה שלו לראות מה הוא 'חושב' בדיוק ומה לענות לך ולמה לענות לך, משהו ממש טוב!

        2f9a35fd-aa27-448d-a869-224f65b2bf01-image.png ספויילר

        א.מ.ד.א מחובר
        א.מ.ד.א מחובר
        א.מ.ד.
        כתב נערך לאחרונה על ידי א.מ.ד.
        #32

        @טופטופיסט כתב בבקשת מידע | DeepSeek המודל הסיני:

        אגב, יש שם פיצ'ר ממש ממש טוב
        יש כפתור שאפשר להשאיר אותו דולק כל השיחה ואז בכל תגובה שלו לראות מה הוא 'חושב' בדיוק ומה לענות לך ולמה לענות לך, משהו ממש טוב!

        זה לא פיצ'ר. זה פשוט הפעלת מודל R1 שלהם, שהוא מודל היסק (כמו gpt o1), במקום המודל הרגיל שלהם.

        אגב, יש להם גם פיצ'ר חיפוש באינטרנט טוב יחסית, לא ניסיתי מספיק.

        תגובה 1 תגובה אחרונה
        2
        • 1 106

          @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

          מורגן בראון, סגן נשיא מוצר בדרופבוקס ניסה להסביר את התהליך שעשתה החברה במילים פשוטות יחסית...

          אם כך זה ממש זמני, כי האמריקאים יתחילו להשתמש בטריקים הנ"ל + שבבים מהירים, ותוך זמן קצר יעקפו את הסינים בקלות.

          ישראל 142י מנותק
          ישראל 142י מנותק
          ישראל 142
          מדריכים
          כתב נערך לאחרונה על ידי
          #33

          @106 כתב בבקשת מידע | DeepSeek המודל הסיני:

          @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

          מורגן בראון, סגן נשיא מוצר בדרופבוקס ניסה להסביר את התהליך שעשתה החברה במילים פשוטות יחסית...

          אם כך זה ממש זמני, כי האמריקאים יתחילו להשתמש בטריקים הנ"ל + שבבים מהירים, ותוך זמן קצר יעקפו את הסינים בקלות.

          אולי זה נכון לגבי OpenAi, אבל לא לגבי Nvidia כי היא מייצרת את השבבים

          טכנאי מחשבים

          תגובה 1 תגובה אחרונה
          2
          • ט טופטופיסט

            אגב, יש שם פיצ'ר ממש ממש טוב
            יש כפתור שאפשר להשאיר אותו דולק כל השיחה ואז בכל תגובה שלו לראות מה הוא 'חושב' בדיוק ומה לענות לך ולמה לענות לך, משהו ממש טוב!

            2f9a35fd-aa27-448d-a869-224f65b2bf01-image.png ספויילר

            יעקב מ. פינסי מנותק
            יעקב מ. פינסי מנותק
            יעקב מ. פינס
            כתב נערך לאחרונה על ידי
            #34

            @טופטופיסט כתב בבקשת מידע | DeepSeek המודל הסיני:

            אגב, יש שם פיצ'ר ממש ממש טוב
            יש כפתור שאפשר להשאיר אותו דולק כל השיחה ואז בכל תגובה שלו לראות מה הוא 'חושב' בדיוק ומה לענות לך ולמה לענות לך, משהו ממש טוב!

            2f9a35fd-aa27-448d-a869-224f65b2bf01-image.png ספויילר

            למישהו היה כח לקרוא את ה'מחשבות' שלו??

            זה פשוט מגניב... ממליץ מאוד

            @יוסף-אלחנן במיוחד בשבילך

            תגובה 1 תגובה אחרונה
            3
            • א אלי ויל

              בימים האחרונים התפרסם שיש מודל חדש סיני שהוא טוב כמו GPT O1
              כרגע סגור בנטפרי
              האם יש מישהו שהתנסה איתו?

              י מנותק
              י מנותק
              יעקב11
              כתב נערך לאחרונה על ידי יעקב11
              #35

              @אלי-ויל היה פתוח בנטפרי ונחסם, מה שמוריד את הסיכוי שיפתחו (לדעתי).
              ניסיתי אותו לפני שלשה שבועות והוא בלבל ת'מח עם אותיות בסינית, אבל איך שנראה מההתלהבות בעולם, כנראה שהשתפר.

              NH.LOCALN תגובה 1 תגובה אחרונה
              1
              • י יעקב11

                @אלי-ויל היה פתוח בנטפרי ונחסם, מה שמוריד את הסיכוי שיפתחו (לדעתי).
                ניסיתי אותו לפני שלשה שבועות והוא בלבל ת'מח עם אותיות בסינית, אבל איך שנראה מההתלהבות בעולם, כנראה שהשתפר.

                NH.LOCALN מנותק
                NH.LOCALN מנותק
                NH.LOCAL
                מדריכים
                כתב נערך לאחרונה על ידי NH.LOCAL
                #36

                @יעקב11 כתב בבקשת מידע | DeepSeek המודל הסיני:

                ניסיתי אותו לפני שלשה שבועות והוא בלבל ת'מח עם אותיות בסינית, אבל איך שנראה מההתלהבות בעולם, כנראה שהשתפר.

                יש לו בעיה בשפות, והם ציינו את זה. הוא הרבה יותר טוב באנגלית.

                שים לב שצריך להפעיל את יכולת החשיבה של המודל בכפתור המתאים בממשק הצ'אט, אחרת הוא למעשה מריץ מודל אחר, שהוא הרבה פחות חכם (אם כי הוא עדיין חכם מאוד באופן יחסי)

                @חטח כתב בבקשת מידע | DeepSeek המודל הסיני:

                אין מצב שהם איכשהו העתיקו קבצים מ openAI?
                אני ממש לא מבין בדברים כאלה...

                ממש לא. מה שכן, הם כפי הנראה בהחלט ניסו לבצע חיקוי של הארכיקטורה בה פועל המודל של OpenAI וגם השתמשו בנתונים שהמודל הפיק

                לאינדקס המלא של כלל הסקריפטים שלי
                https://nhlocal.github.io

                A תגובה 1 תגובה אחרונה
                3
                • א אלי ויל

                  מה שמעניין באופן כללי חוץ מהאימון שבו הם טוענים שהם מצליחים לעשות זאת בזול (לא ראיתי שהם הביאו ראיות)
                  והעובדה שהאימון שלהם עקף את גוגל ומאטה
                  האם גם השימוש הסדיר (טוקנים) וכוח העיבוד שצריך לזה הוזל ובכמה, כי בעצם זה אחד הדברים הכי משמעותיים כמה זה יעלה לנו המשתמשים.

                  A מנותק
                  A מנותק
                  aiib
                  כתב נערך לאחרונה על ידי
                  #37

                  @אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:

                  האם גם השימוש הסדיר (טוקנים) וכוח העיבוד שצריך לזה הוזל ובכמה, כי בעצם זה אחד הדברים הכי משמעותיים כמה זה יעלה לנו המשתמשים.

                  הAPI שלהם עולה 0.55 דולר לעומת 15 דולר. ככה למיטב הבנתי.

                  תגובה 1 תגובה אחרונה
                  0
                  • NH.LOCALN NH.LOCAL

                    @יעקב11 כתב בבקשת מידע | DeepSeek המודל הסיני:

                    ניסיתי אותו לפני שלשה שבועות והוא בלבל ת'מח עם אותיות בסינית, אבל איך שנראה מההתלהבות בעולם, כנראה שהשתפר.

                    יש לו בעיה בשפות, והם ציינו את זה. הוא הרבה יותר טוב באנגלית.

                    שים לב שצריך להפעיל את יכולת החשיבה של המודל בכפתור המתאים בממשק הצ'אט, אחרת הוא למעשה מריץ מודל אחר, שהוא הרבה פחות חכם (אם כי הוא עדיין חכם מאוד באופן יחסי)

                    @חטח כתב בבקשת מידע | DeepSeek המודל הסיני:

                    אין מצב שהם איכשהו העתיקו קבצים מ openAI?
                    אני ממש לא מבין בדברים כאלה...

                    ממש לא. מה שכן, הם כפי הנראה בהחלט ניסו לבצע חיקוי של הארכיקטורה בה פועל המודל של OpenAI וגם השתמשו בנתונים שהמודל הפיק

                    A מנותק
                    A מנותק
                    aiib
                    כתב נערך לאחרונה על ידי aiib
                    #38

                    @NH-LOCAL כתב בבקשת מידע | DeepSeek המודל הסיני:

                    שים לב שצריך להפעיל את יכולת החשיבה של המודל בכפתור המתאים בממשק הצ'אט,

                    איזה כפתור בדיוק?

                    אגב, הוא עבד לי בצורה מושלמת בעברית (לגבי כמה זה היה חכם אני לא מספיק מומחה...)
                    מה שכן הוא נכנס ללופים....
                    (-היה כאן בפורום בקשה לנוסחת אקסל שמחשבת איזה שטרות צריך להוציא מהבנק כדי להגיע לסכום הספציפי. הייתה בעיה עם סכומים שנגמרו ב30 לדוגמא 230 שבחישוב פשוט לפי סדר גודל השטרות תמיד הגיע התוצאה ל220 וכדו'. אז הסברתי לו את הבעיה והוא התחיל להציע הצעות, הכל ברצף בלי שאני מפריע, הוא מציע פתרון, מתחיל לחשב אותו ומגיע לתוצאה של 220, מסביר לעצמו שזה לא טוב ומציע עוד פתרון אבל גם הוא מגיע ל220 ככה עשר פעמים בערך עד שעצרתי אותו בעצמי...
                    אגב, בסוף הוא הביא לי תשובה מה שלא הצלחתי עם קלאוד וGPT)

                    י 2 תגובות תגובה אחרונה
                    2
                    • צ צדיק וטוב לו 0

                      @NH-LOCAL כתב בבקשת מידע | DeepSeek המודל הסיני:

                      תחושת הבטן שלך טועה בוודאות.
                      אפשר לזייף כוננים בעלי אקספרס אבל לא לזייף אינטליגנציה. בייחוד שזה קוד פתוח שניתן לשכפול בקלות

                      אפשר לשקר בקלות כמה משאבים דרש האימון או השימוש המיטבי.

                      A מנותק
                      A מנותק
                      aiib
                      כתב נערך לאחרונה על ידי
                      #39

                      @צדיק-וטוב-לו-0 כתב בבקשת מידע | DeepSeek המודל הסיני:

                      @NH-LOCAL כתב בבקשת מידע | DeepSeek המודל הסיני:

                      תחושת הבטן שלך טועה בוודאות.
                      אפשר לזייף כוננים בעלי אקספרס אבל לא לזייף אינטליגנציה. בייחוד שזה קוד פתוח שניתן לשכפול בקלות

                      אפשר לשקר בקלות כמה משאבים דרש האימון או השימוש המיטבי.

                      אז למה העולם נלחץ?

                      תגובה 1 תגובה אחרונה
                      0
                      • A aiib

                        @NH-LOCAL כתב בבקשת מידע | DeepSeek המודל הסיני:

                        שים לב שצריך להפעיל את יכולת החשיבה של המודל בכפתור המתאים בממשק הצ'אט,

                        איזה כפתור בדיוק?

                        אגב, הוא עבד לי בצורה מושלמת בעברית (לגבי כמה זה היה חכם אני לא מספיק מומחה...)
                        מה שכן הוא נכנס ללופים....
                        (-היה כאן בפורום בקשה לנוסחת אקסל שמחשבת איזה שטרות צריך להוציא מהבנק כדי להגיע לסכום הספציפי. הייתה בעיה עם סכומים שנגמרו ב30 לדוגמא 230 שבחישוב פשוט לפי סדר גודל השטרות תמיד הגיע התוצאה ל220 וכדו'. אז הסברתי לו את הבעיה והוא התחיל להציע הצעות, הכל ברצף בלי שאני מפריע, הוא מציע פתרון, מתחיל לחשב אותו ומגיע לתוצאה של 220, מסביר לעצמו שזה לא טוב ומציע עוד פתרון אבל גם הוא מגיע ל220 ככה עשר פעמים בערך עד שעצרתי אותו בעצמי...
                        אגב, בסוף הוא הביא לי תשובה מה שלא הצלחתי עם קלאוד וGPT)

                        י מנותק
                        י מנותק
                        יעקב11
                        כתב נערך לאחרונה על ידי
                        #40

                        @aiib על DeepThink

                        A תגובה 1 תגובה אחרונה
                        0
                        • י יעקב11

                          @aiib על DeepThink

                          A מנותק
                          A מנותק
                          aiib
                          כתב נערך לאחרונה על ידי
                          #41

                          @יעקב11 כתב בבקשת מידע | DeepSeek המודל הסיני:

                          @aiib על DeepThink

                          מומלץ לצטט את ההודעה שעליה אתה מגיב

                          תגובה 1 תגובה אחרונה
                          1
                          • A aiib

                            @NH-LOCAL כתב בבקשת מידע | DeepSeek המודל הסיני:

                            שים לב שצריך להפעיל את יכולת החשיבה של המודל בכפתור המתאים בממשק הצ'אט,

                            איזה כפתור בדיוק?

                            אגב, הוא עבד לי בצורה מושלמת בעברית (לגבי כמה זה היה חכם אני לא מספיק מומחה...)
                            מה שכן הוא נכנס ללופים....
                            (-היה כאן בפורום בקשה לנוסחת אקסל שמחשבת איזה שטרות צריך להוציא מהבנק כדי להגיע לסכום הספציפי. הייתה בעיה עם סכומים שנגמרו ב30 לדוגמא 230 שבחישוב פשוט לפי סדר גודל השטרות תמיד הגיע התוצאה ל220 וכדו'. אז הסברתי לו את הבעיה והוא התחיל להציע הצעות, הכל ברצף בלי שאני מפריע, הוא מציע פתרון, מתחיל לחשב אותו ומגיע לתוצאה של 220, מסביר לעצמו שזה לא טוב ומציע עוד פתרון אבל גם הוא מגיע ל220 ככה עשר פעמים בערך עד שעצרתי אותו בעצמי...
                            אגב, בסוף הוא הביא לי תשובה מה שלא הצלחתי עם קלאוד וGPT)

                            י מנותק
                            י מנותק
                            יעקב11
                            כתב נערך לאחרונה על ידי
                            #42

                            @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                            @NH-LOCAL כתב בבקשת מידע | DeepSeek המודל הסיני:

                            שים לב שצריך להפעיל את יכולת החשיבה של המודל בכפתור המתאים בממשק הצ'אט,

                            איזה כפתור בדיוק?

                            על DeepThink

                            תגובה 1 תגובה אחרונה
                            1
                            • ט טופטופיסט

                              אגב, יש שם פיצ'ר ממש ממש טוב
                              יש כפתור שאפשר להשאיר אותו דולק כל השיחה ואז בכל תגובה שלו לראות מה הוא 'חושב' בדיוק ומה לענות לך ולמה לענות לך, משהו ממש טוב!

                              2f9a35fd-aa27-448d-a869-224f65b2bf01-image.png ספויילר

                              Y מנותק
                              Y מנותק
                              yeh
                              כתב נערך לאחרונה על ידי yeh
                              #43

                              @טופטופיסט מתורגם לעברית
                              translated_image_iw.png

                              A תגובה 1 תגובה אחרונה
                              6
                              • Y yeh

                                @טופטופיסט מתורגם לעברית
                                translated_image_iw.png

                                A מנותק
                                A מנותק
                                aiib
                                כתב נערך לאחרונה על ידי
                                #44

                                כרגע הכל תקוע... עמוס... שום דבר לא עובד

                                א.מ.ד.א תגובה 1 תגובה אחרונה
                                0
                                • A aiib

                                  כרגע הכל תקוע... עמוס... שום דבר לא עובד

                                  א.מ.ד.א מחובר
                                  א.מ.ד.א מחובר
                                  א.מ.ד.
                                  כתב נערך לאחרונה על ידי
                                  #45

                                  @aiib כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  כרגע הכל תקוע... עמוס... שום דבר לא עובד

                                  הם הודיעו שהם חוו היום מתקפות סייבר רציניות...

                                  תגובה 1 תגובה אחרונה
                                  0
                                  • 25802 מנותק
                                    25802 מנותק
                                    2580
                                    מדריכים
                                    כתב נערך לאחרונה על ידי 2580
                                    #46

                                    פרק ה'!!!!!!!!!!!!!! לאיפה זה עוד יכול להגיע!!!!!!!!!!!!!!!

                                    לא עוצרת: DeepSeek משיקה מודלים חדשים כולל ג'ינרוט תמונות

                                    הסטארטאפ הסיני DeepSeek שמזעזע את עולם ה-AI מציג מודל ג'ינרוט תמונות חדש בשם Janus-Pro

                                    DEEPSEEK-BY-GEEKTIME-2-1024x768.jpg.webp

                                    עולם הטכנולוגיה עסוק בימים האחרונים רק בדבר אחד: DeepSeek, הסטארטאפ הסיני שמזעזע את תחום ה-AI מהיסוד, לאחר שפיתח מודלים עוצמתיים בעלות של תקציב הקייטרינג של OpenAI ו-Antrhopic. אחרי שהוביל אמש (ב') למחיקת הערך הגדולה בהיסטוריה בבורסה,, מנצל הסטארטאפ את הבאז להכרזה נוספת.

                                    ההכרזה החדשה

                                    המודלים החדשים של דיפסיק הם מולטי-מודאליים, כלומר יודעים להתמודד עם מספר סוגי קלט, כמו טקסט ותמונה, ובעלי יכולת ג'נרוט תמונות שיתחרו ב-DALL-E של OpenAI, מידג'רני ואחרים. כמו המודלים האחרים של החברה, גם Janus-Pro, משפחת המודלים החדשה, משוחררת בקוד פתוח (ברישיון MIT, המאפשר שימוש בהם במוצרים מסחריים ללא הגבלה) וזמינה להורדה כבר עכשיו לכל מיני שמעוניין בהם. יש שני מודלים במשפחה, אחד עם מיליארד פרמטרים והשני עם שבעה מיליארד פרמטרים.

                                    חשוב לציין כי ב-DeepSeek הציגו כבר בשנה שעברה מודל ממשפחת Janus, אך אלו סבלו מביצועים חלשים כשקיבלו פרומפטים קצרים ולא מפורטים, ובג'ינרוט תמונות. משפחת מודלי הפרו הצליחה לפתור את הבעיות הללו על ידי אימון על דאטה-סט גדול יותר ובעזרת אסטרטגיית אימון שונה שעברה אופטימיזציה לג'ינרוט תמונות. המודל הגדול מבין השניים זמין להתנסות, למי מכם שעדיין לא בנויים להרצה של אחד על המחשב שלהם, דרך HuggingFace.

                                    ב-DeepSeek הבינו שהדרך הכי טובה להמחיש עד כמה המודל מוצלח היא על ידי ההשוואה שלו למודלים של OpenAI, וכך עשו. בכמה בנצ'מרקים בתחום ג'ינרוט התמונות, כמו GenEval ו-DPG-Bench, המודל הגדול ביותר במשפחה החדשה (Janus-Pro-7B) עוקף את דאלי 3, כמו גם את Stable Diffusion XL ומודלים פחות מוכרים כמו PixArt-alpha ו-Emu3-Gen. חשוב לציין כי המודל יכול לנתח תמונות ברזולוציה נמוכה יותר לעומת המתחרים (עד 384×384 בלבד), אבל במקביל כל משפחת המודלים החדשה הרבה יותר קטנה מבחינת מספר הפרמטרים לעומת המתחרים.

                                    DALL·E-2025-01-28-09.58.58-A-surreal-and-imaginative-image-of-a-whale-creatively-crafted-entirely-out-of-avocados.-The-whales-body-is-made-from-the-smooth-textured-skin-of-avo-225x135.webp
                                    מקור: דאלי 3

                                    image-225x135.webp
                                    מקור: Janus-Pro-7B

                                    aeb4ffc6-c768-4c20-9f3f-975e394b2d99-image.png
                                    מקור: אימג׳ן 3

                                    כמו עם מודל V3 של החברה, הראשון שהתחיל את הבאז הגדול סביבה, חוקרי דיפסיק אומרים כי הצליחו לפתח את המודלים החדשים עם הרצת הפריימוורק HAI-LLM ב-PyTorch (המתחרה החינמי בקוד פתוח של מטא ל-CUDA של אנבידיה) על כמה מאות GPUs בלבד. החוקרים אומרים כי תהליך האימון כולו ארך בין שבוע לשבועיים על cluster הכולל 8 מעבדי A100 של אנבידיה בלבד.

                                    המודל החדש מייצר תמונות בגודל 768×768 בלבד, בניגוד למודלים של ענקיות הטכנולוגיה כמו דאלי 3 ואימג'ן של גוגל שמג'נרטים תמונות ב-1024×1024 (ריבוע). אימג'ן של גוגל יכול לג'נרט תמונות גם בפורמטים מלבניים כמו 16:9 ו-4:3. מההתנסות הקצרה שלנו אנחנו חייבים להודות ש-Janus לא היה מרשים מדי ובפרומפט שהזנתי אליו לעומת דאלי 3 ואימג'ן של גוגל זה די ברור שהמודל הסיני עדיין לא מתחרה אמיתי. עם זאת, ההצלחה היא כמובן באימון המתוחכם על ידי החוקרים הסיניים, והעובדה שמדובר בדור ראשון של מודל פתוח לחלוטין הזמין לשימוש ללא שום הגבלות – לעומת המודלים הסגורים של גוגל ו-OpenAI.

                                    מקור - https://www.geektime.co.il/deepseek-shows-off-new-models/

                                    בונוס לפרק:

                                    מנכ"ל אינטל כבר משתמש ב-DeepSeek לסטארטאפ החדש שלו
                                    פאט גלסינגר, מנכ"ל אינטל עד לאחרונה, סיפר כי הסטארטאפ שלו, Gloo, כבר עושה שימוש במודלים של DeepSeek במקום המודלים של OpenAI. לדבריו, ההחלטה הגיעה לאחר שהתרשם עמוקות ממודל R1 של החברה הסינית.

                                    מקור - https://www.geektime.co.il/flash/former-intel-ceo-uses-deepseek-for-his-new-startup/?utm_source=copy_link&utm_medium=social&utm_campaign=share&utm_term=newsflash&utm_content=538705

                                    א.מ.ד.א תגובה 1 תגובה אחרונה
                                    6
                                    • 25802 2580

                                      פרק ב' בסדרה 😉

                                      אפקט DeepSeek: עוקף בהורדות את ChatGPT, מטא הקימה חמ"ל והנאסד"ק לא רגוע

                                      במטא הקימו "חדרי מלחמה" והצ'אטבוט הפופולרי בעולם, ChatGPT, כבר לא במקום הראשון בהורדות. אפקט מודל דיפסיק הסיני

                                      Screenshot-2025-01-27-at-8.20.44-1024x561.png.webp

                                      רק אתמול כתבנו כאן על DeepSeek, הסטארטאפ החדש שהצליח לפתח מודלי שפה ענקיים – כולל מודל היסק מוצלח – בתקציב זעום ובכח מחשוב קטן לכאורה, אבל נראה ש"שיגעון ה-DeepSeek" רק מתחיל. עכשיו נראה שהגלים, שההכרזות והכלים של דיפסיק עושים, מגיעים רחוק.

                                      ארבעה חדרי מלחמה

                                      אחד הדיווחים המעניינים ביממה האחרונה סביב ההשפעה של המודלים ששחרר DeepSeek מגיע ממנלו פארק. על פי דיווח של The Information, במשרדי מטא שורר מצב מתוח ודרוך במיוחד. נזכיר שהמודלים של DeepSeek מוצעים בקוד פתוח – בדיוק כמו המודלים של מטא; עם זאת, על פי מבחני ההשוואה שנערכו, הם כבר עוקפים בביצועים שלהם את Llama 4 – המודל החדש ביותר של מטא, שעדיין בפיתוח. הדיווח הזה מעניין במיוחד מכיוון שהוא מאשר פוסט אנונימי ב-Blind שעלה בסוף השבוע ולפיו "מהנדסים עובדים בטירוף בניסיון לפרק לגורמים את DeepSeek ולהעתיק כל מה שאפשר ממנו".

                                      על פי הדיווח של The Information במשרדי מטא הקימו לא פחות מארבעה "חדרי מלחמה", במטרה לנסות לפרק לגורמים את המודלים של DeepSeek, להנדס אותם לאחור ולנסות לשחזר את "הרוטב הסודי" הזה עם לאמה 4 והמודלים הבאים של החברה. עוד דווח מפי שני עובדי מטא שאיתם שוחחו באתר האמריקאי כי מת'יו אולדהם, ראש תחום תשתיות AI של החברה, אמר למספר עובדים כי הם חוששים ש-Llama 4 לא יוכל להתחרות באלו של דיפסיק.

                                      חשוב לציין כי "הפאניקה" הזאת במטא (כפי שהגדיר זאת עובד החברה) מגיעה בתזמון מעניין מאוד, שיכול גם להסביר את פוסט ה"למי יש יותר גדול" שפרסם מארק צוקרברג. מנכ"ל ומייסד מטא התהדר במהלך סוף השבוע בכך שמטא תוציא בין 60 ל-65 מיליארד דולר עד סוף השנה בהוצאות על שבבים וחוות שרתים ייעודיים למודלים וליישומי AI שונים: "נסיים את השנה עם 1.3 מיליון שבבים גרפיים עד סוף 2025… ונבנה חוות שרתים כל כך גדולה, שהיא תוכל לכסות חלק משמעותי ממנהטן", כתב צוקרברג בפוסט שלו. צוקרברג גם טען כי עד סוף השנה לאמה 4 יהיה "המודל המתקדם ביותר", והחברה תבנה "מהנדס AI" שיוכל לתרום משמעותית למאמצי הפיתוח של החברה.

                                      עוקף את ChatGPT

                                      אבל לא רק מטא. גם ב-OpenAI מביטים בדאגה ב-DeepSeek, שהצליח לרשום ביממה האחרונה הישג: האפליקציה שלו הפכה לפופולרית ביותר בהורדות בחנות האפליקציות של אפל בארצות הברית – תוך כדי שהיא עוקפת את המתחרה הגדולה, ChatGPT. בניגוד לג'בטה אגב, לפחות כרגע, כל המודלים (כולל ההיסק – reasoning) מוצעים ללא תשלום נוסף.

                                      הזינוק של DeepSeek כבר מתחיל להעלות שאלות, ובדיחות, על הדימיון לטיקטוק – עם אפליקציה חינמית סינית שהופכת לסופר-פופולרית ברגע בארצות הברית. כתבת ה-Wall Street Journal ג'ואנה רובינסון כבר אמרה שהיא מחכה ל"חסימה שהיא לא באמת חסימה" של DeepSeek, כפי שקרה עם טיקטוק.

                                      הבורסה מתחילה להרגיש את ההשפעות

                                      אבל ההשפעה של DeepSeek לא נעצרת בטבלאות ההורדה של האפליקציות או במטה של מטא. החוזים העתידיים של מדד נאסד"ק 100, מכשיר כלכלי שמאפשר למשקיעים להמר על ההצלחה (או הכישלון) של חברות המדד בעתיד, ירדו ב-2% כתוצאה מההתפוצצות של DeepSeek. ההשפעה של הסטארטאפ הסיני צפויה להגיע לא רק למניות של חברות התוכנה דוגמת מטא או גוגל, אלא גם על מניות השבבים, מכיוון שהחוקרים של DeepSeek מוכיחים לכאורה כי אפשר לייצר מודלים עוצמתיים גם בלי להחזיק חוות שרתים ענקיות עם מאות אלפים משבבי הדגל של NVIDIA. כזכור, על אנבידיה הוטלו הגבלות שמונעות ממנה למכור לחברות סיניות את השבבים המתקדמים ביותר שלה, כך שאם הן מסתדרות עם שבבים זולים יותר, זה עלול להקרין על שאר השוק. גם המניות של חברה בשם Advantest – ספקית גדולה של אנבידיה – נפלו בכמעט 10% מאז פתיחת יום המסחר ביפן שם היא נסחרת, כתוצאה מההתקדמות וההייפ סביב דיפסיק. כעת נצטרך לחכות לפתיחת יום המסחר בארה"ב בשעות אחר הצהריים היום (ב') כדי לראות אם ההצלחה של דיפסיק תמשיך להשפיע על המניות – כמו אלו של אנבידיה, או שמדובר בהייפ חולף.

                                      מקור - https://www.geektime.co.il/the-deepseek-effect-is-in-full-swing/

                                      אם זה מפריע למישהו שאני מעלה את הכתבות תגידו...

                                      25802 מנותק
                                      25802 מנותק
                                      2580
                                      מדריכים
                                      כתב נערך לאחרונה על ידי 2580
                                      #47

                                      @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                                      על פי הדיווח של The Information במשרדי מטא הקימו לא פחות מארבעה "חדרי מלחמה", במטרה לנסות לפרק לגורמים את המודלים של DeepSeek, להנדס אותם לאחור ולנסות לשחזר את "הרוטב הסודי" הזה עם לאמה 4 והמודלים הבאים של החברה. עוד דווח מפי שני עובדי מטא שאיתם שוחחו באתר האמריקאי כי מת'יו אולדהם, ראש תחום תשתיות AI של החברה, אמר למספר עובדים כי הם חוששים ש-Llama 4 לא יוכל להתחרות באלו של דיפסיק.

                                      חשוב לציין כי "הפאניקה" הזאת במטא (כפי שהגדיר זאת עובד החברה) מגיעה בתזמון מעניין מאוד, שיכול גם להסביר את פוסט ה"למי יש יותר גדול" שפרסם מארק צוקרברג. מנכ"ל ומייסד מטא התהדר במהלך סוף השבוע בכך שמטא תוציא בין 60 ל-65 מיליארד דולר עד סוף השנה בהוצאות על שבבים וחוות שרתים ייעודיים למודלים וליישומי AI שונים: "נסיים את השנה עם 1.3 מיליון שבבים גרפיים עד סוף 2025… ונבנה חוות שרתים כל כך גדולה, שהיא תוכל לכסות חלק משמעותי ממנהטן", כתב צוקרברג בפוסט שלו. צוקרברג גם טען כי עד סוף השנה לאמה 4 יהיה "המודל המתקדם ביותר", והחברה תבנה "מהנדס AI" שיוכל לתרום משמעותית למאמצי הפיתוח של החברה.

                                      מעניין: מטא החברה היחידה שקשורה לעניין באופן ישיר שחווה עליה בערכה כולל אתמול... (אפל ואמזון יחסית מחוץ לתמונה...)

                                      ר תגובה 1 תגובה אחרונה
                                      1
                                      • 25802 2580

                                        @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                                        על פי הדיווח של The Information במשרדי מטא הקימו לא פחות מארבעה "חדרי מלחמה", במטרה לנסות לפרק לגורמים את המודלים של DeepSeek, להנדס אותם לאחור ולנסות לשחזר את "הרוטב הסודי" הזה עם לאמה 4 והמודלים הבאים של החברה. עוד דווח מפי שני עובדי מטא שאיתם שוחחו באתר האמריקאי כי מת'יו אולדהם, ראש תחום תשתיות AI של החברה, אמר למספר עובדים כי הם חוששים ש-Llama 4 לא יוכל להתחרות באלו של דיפסיק.

                                        חשוב לציין כי "הפאניקה" הזאת במטא (כפי שהגדיר זאת עובד החברה) מגיעה בתזמון מעניין מאוד, שיכול גם להסביר את פוסט ה"למי יש יותר גדול" שפרסם מארק צוקרברג. מנכ"ל ומייסד מטא התהדר במהלך סוף השבוע בכך שמטא תוציא בין 60 ל-65 מיליארד דולר עד סוף השנה בהוצאות על שבבים וחוות שרתים ייעודיים למודלים וליישומי AI שונים: "נסיים את השנה עם 1.3 מיליון שבבים גרפיים עד סוף 2025… ונבנה חוות שרתים כל כך גדולה, שהיא תוכל לכסות חלק משמעותי ממנהטן", כתב צוקרברג בפוסט שלו. צוקרברג גם טען כי עד סוף השנה לאמה 4 יהיה "המודל המתקדם ביותר", והחברה תבנה "מהנדס AI" שיוכל לתרום משמעותית למאמצי הפיתוח של החברה.

                                        מעניין: מטא החברה היחידה שקשורה לעניין באופן ישיר שחווה עליה בערכה כולל אתמול... (אפל ואמזון יחסית מחוץ לתמונה...)

                                        ר מנותק
                                        ר מנותק
                                        רפאל vnkl
                                        כתב נערך לאחרונה על ידי רפאל vnkl
                                        #48

                                        משום מה עכשיו אני לא מצליח לשלוח לו הודעות... קורה גם אצלכם או שזה רק אני?

                                        A תגובה 1 תגובה אחרונה
                                        0
                                        • 25802 2580

                                          פרק ה'!!!!!!!!!!!!!! לאיפה זה עוד יכול להגיע!!!!!!!!!!!!!!!

                                          לא עוצרת: DeepSeek משיקה מודלים חדשים כולל ג'ינרוט תמונות

                                          הסטארטאפ הסיני DeepSeek שמזעזע את עולם ה-AI מציג מודל ג'ינרוט תמונות חדש בשם Janus-Pro

                                          DEEPSEEK-BY-GEEKTIME-2-1024x768.jpg.webp

                                          עולם הטכנולוגיה עסוק בימים האחרונים רק בדבר אחד: DeepSeek, הסטארטאפ הסיני שמזעזע את תחום ה-AI מהיסוד, לאחר שפיתח מודלים עוצמתיים בעלות של תקציב הקייטרינג של OpenAI ו-Antrhopic. אחרי שהוביל אמש (ב') למחיקת הערך הגדולה בהיסטוריה בבורסה,, מנצל הסטארטאפ את הבאז להכרזה נוספת.

                                          ההכרזה החדשה

                                          המודלים החדשים של דיפסיק הם מולטי-מודאליים, כלומר יודעים להתמודד עם מספר סוגי קלט, כמו טקסט ותמונה, ובעלי יכולת ג'נרוט תמונות שיתחרו ב-DALL-E של OpenAI, מידג'רני ואחרים. כמו המודלים האחרים של החברה, גם Janus-Pro, משפחת המודלים החדשה, משוחררת בקוד פתוח (ברישיון MIT, המאפשר שימוש בהם במוצרים מסחריים ללא הגבלה) וזמינה להורדה כבר עכשיו לכל מיני שמעוניין בהם. יש שני מודלים במשפחה, אחד עם מיליארד פרמטרים והשני עם שבעה מיליארד פרמטרים.

                                          חשוב לציין כי ב-DeepSeek הציגו כבר בשנה שעברה מודל ממשפחת Janus, אך אלו סבלו מביצועים חלשים כשקיבלו פרומפטים קצרים ולא מפורטים, ובג'ינרוט תמונות. משפחת מודלי הפרו הצליחה לפתור את הבעיות הללו על ידי אימון על דאטה-סט גדול יותר ובעזרת אסטרטגיית אימון שונה שעברה אופטימיזציה לג'ינרוט תמונות. המודל הגדול מבין השניים זמין להתנסות, למי מכם שעדיין לא בנויים להרצה של אחד על המחשב שלהם, דרך HuggingFace.

                                          ב-DeepSeek הבינו שהדרך הכי טובה להמחיש עד כמה המודל מוצלח היא על ידי ההשוואה שלו למודלים של OpenAI, וכך עשו. בכמה בנצ'מרקים בתחום ג'ינרוט התמונות, כמו GenEval ו-DPG-Bench, המודל הגדול ביותר במשפחה החדשה (Janus-Pro-7B) עוקף את דאלי 3, כמו גם את Stable Diffusion XL ומודלים פחות מוכרים כמו PixArt-alpha ו-Emu3-Gen. חשוב לציין כי המודל יכול לנתח תמונות ברזולוציה נמוכה יותר לעומת המתחרים (עד 384×384 בלבד), אבל במקביל כל משפחת המודלים החדשה הרבה יותר קטנה מבחינת מספר הפרמטרים לעומת המתחרים.

                                          DALL·E-2025-01-28-09.58.58-A-surreal-and-imaginative-image-of-a-whale-creatively-crafted-entirely-out-of-avocados.-The-whales-body-is-made-from-the-smooth-textured-skin-of-avo-225x135.webp
                                          מקור: דאלי 3

                                          image-225x135.webp
                                          מקור: Janus-Pro-7B

                                          aeb4ffc6-c768-4c20-9f3f-975e394b2d99-image.png
                                          מקור: אימג׳ן 3

                                          כמו עם מודל V3 של החברה, הראשון שהתחיל את הבאז הגדול סביבה, חוקרי דיפסיק אומרים כי הצליחו לפתח את המודלים החדשים עם הרצת הפריימוורק HAI-LLM ב-PyTorch (המתחרה החינמי בקוד פתוח של מטא ל-CUDA של אנבידיה) על כמה מאות GPUs בלבד. החוקרים אומרים כי תהליך האימון כולו ארך בין שבוע לשבועיים על cluster הכולל 8 מעבדי A100 של אנבידיה בלבד.

                                          המודל החדש מייצר תמונות בגודל 768×768 בלבד, בניגוד למודלים של ענקיות הטכנולוגיה כמו דאלי 3 ואימג'ן של גוגל שמג'נרטים תמונות ב-1024×1024 (ריבוע). אימג'ן של גוגל יכול לג'נרט תמונות גם בפורמטים מלבניים כמו 16:9 ו-4:3. מההתנסות הקצרה שלנו אנחנו חייבים להודות ש-Janus לא היה מרשים מדי ובפרומפט שהזנתי אליו לעומת דאלי 3 ואימג'ן של גוגל זה די ברור שהמודל הסיני עדיין לא מתחרה אמיתי. עם זאת, ההצלחה היא כמובן באימון המתוחכם על ידי החוקרים הסיניים, והעובדה שמדובר בדור ראשון של מודל פתוח לחלוטין הזמין לשימוש ללא שום הגבלות – לעומת המודלים הסגורים של גוגל ו-OpenAI.

                                          מקור - https://www.geektime.co.il/deepseek-shows-off-new-models/

                                          בונוס לפרק:

                                          מנכ"ל אינטל כבר משתמש ב-DeepSeek לסטארטאפ החדש שלו
                                          פאט גלסינגר, מנכ"ל אינטל עד לאחרונה, סיפר כי הסטארטאפ שלו, Gloo, כבר עושה שימוש במודלים של DeepSeek במקום המודלים של OpenAI. לדבריו, ההחלטה הגיעה לאחר שהתרשם עמוקות ממודל R1 של החברה הסינית.

                                          מקור - https://www.geektime.co.il/flash/former-intel-ceo-uses-deepseek-for-his-new-startup/?utm_source=copy_link&utm_medium=social&utm_campaign=share&utm_term=newsflash&utm_content=538705

                                          א.מ.ד.א מחובר
                                          א.מ.ד.א מחובר
                                          א.מ.ד.
                                          כתב נערך לאחרונה על ידי
                                          #49

                                          @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

                                          המודל הגדול מבין השניים זמין להתנסות, למי מכם שעדיין לא בנויים להרצה של אחד על המחשב שלהם, דרך HuggingFace.

                                          לא מצאתי.

                                          25802 תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר