דילוג לתוכן
  • חוקי הפורום
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשת מידע | DeepSeek המודל הסיני

בקשת מידע | DeepSeek המודל הסיני

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
225 פוסטים 48 כותבים 13.1k צפיות 36 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א אלי ויל

    האם מישהו חיצוני בדק שאכן הפיתוח עלה להם פחות?
    כי אם אני בעל קרן גידור, אני משקיע בחשאי 10 מיליארד דולר בפיתוח AI, רוכש מניות בחסר של נבידיה ועוד כמה חברות כאלה, מפרסם שעלות האימון של AI עלה רק 5 מיליון דולר וגורף 300 מיליארד דולר רווח

    A מנותק
    A מנותק
    aiib
    כתב נערך לאחרונה על ידי
    #78

    @אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:

    האם מישהו חיצוני בדק שאכן הפיתוח עלה להם פחות?
    כי אם אני בעל קרן גידור, אני משקיע בחשאי 10 מיליארד דולר בפיתוח AI, רוכש מניות בחסר של נבידיה ועוד כמה חברות כאלה, מפרסם שעלות האימון של AI עלה רק 5 מיליון דולר וגורף 300 מיליארד דולר רווח

    יש כבר טענות חזקות כאלו עכשיו. מאסק הצטרף לטענות האלו.
    השאלה היא (שאלת בור...) האם אין הוכחה לכל הפחות חלקית מעלות השימוש לעלות האימון.

    ה תגובה 1 תגובה אחרונה
    0
    • א אברהם אברהם 1

      רשום פה ברור שהוא עובד על open Ai

      6559bc76-1f1e-4a5c-9323-50e680ef7502-image.png

      A0533057932A מנותק
      A0533057932A מנותק
      A0533057932
      כתב נערך לאחרונה על ידי
      #79

      @אברהם-אברהם-1 זה לא מה שרשום שם
      אלא שAPI שלהם מועתק אחד לאחד מאופן AI

      תגובה 1 תגובה אחרונה
      4
      • א אברהם אברהם 1

        רשום פה ברור שהוא עובד על open Ai

        6559bc76-1f1e-4a5c-9323-50e680ef7502-image.png

        צדיק תמיםצ מנותק
        צדיק תמיםצ מנותק
        צדיק תמים
        מדריכים
        כתב נערך לאחרונה על ידי
        #80

        @אברהם-אברהם-1 כתוב שהAPI שלהם תואם למבנה של הAPI של OpenAPI כדי שיהיה אפשר לעבור אליהם בלי לגעת בקוד קיים
        זה מאוד מקובל בתחום, לדוגמה לxAI, Groq, גוגל, יש גם API תואם לספרייה של OpenAI

        רוצה לזכור קריאת שמע בזמן? לחץ כאן! || אתר שכולו מדריכים

        תגובה 1 תגובה אחרונה
        3
        • א.מ.ד.א א.מ.ד.

          @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

          @א-מ-ד בגדול זה כאן: https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B

          אני בבנטפרי אז זה ממילא לא עובד אצלי כרגע כך שאני לא יכול לדעת בדיוק...

          יש קישורים בגוף הכתבה...

          את זה מצאתי מיד, אני מתכוון למה שכתוב בכתבה שהבאת לגבי הרצת המודל ב-hugging face - לא ראיתי כזאת אפשרות שם.

          25802 מנותק
          25802 מנותק
          2580
          מדריכים
          כתב נערך לאחרונה על ידי
          #81

          @א-מ-ד זה בדיוק זה תסתכל בדומיין...

          א.מ.ד.א 2 תגובות תגובה אחרונה
          1
          • 25802 2580

            @א-מ-ד זה בדיוק זה תסתכל בדומיין...

            א.מ.ד.א מנותק
            א.מ.ד.א מנותק
            א.מ.ד.
            כתב נערך לאחרונה על ידי
            #82

            @2580 צודק, לא שמתי לב... לא מצאתי את זה בדף של המודל.

            תגובה 1 תגובה אחרונה
            0
            • 25802 2580

              @א-מ-ד זה בדיוק זה תסתכל בדומיין...

              א.מ.ד.א מנותק
              א.מ.ד.א מנותק
              א.מ.ד.
              כתב נערך לאחרונה על ידי
              #83

              @2580 איכות יצירת התמונות שלו גרועה!!!
              ביקשתי (באנגלית!) שייצור תמונה של מטוס קרב, ואלו התוצאות:
              image (4).webp image (3).webp image (2).webp image (1).webp image.webp

              נורא!

              א.מ.ד.א תגובה 1 תגובה אחרונה
              2
              • א.מ.ד.א א.מ.ד.

                @2580 איכות יצירת התמונות שלו גרועה!!!
                ביקשתי (באנגלית!) שייצור תמונה של מטוס קרב, ואלו התוצאות:
                image (4).webp image (3).webp image (2).webp image (1).webp image.webp

                נורא!

                א.מ.ד.א מנותק
                א.מ.ד.א מנותק
                א.מ.ד.
                כתב נערך לאחרונה על ידי
                #84

                בתמונות נוף הוא יותר טוב (כנראה כי אין במה לפשל כמעט):
                image (6).webp image (5).webp

                תגובה 1 תגובה אחרונה
                1
                • 25802 מנותק
                  25802 מנותק
                  2580
                  מדריכים
                  כתב נערך לאחרונה על ידי
                  #85

                  זה לא נגמר עד שזה לא נגמר... פרק ז'...

                  סם אלטמן, אנבידיה וטראמפ מגיבים לראשונה לטרפת של DeepSeek

                  ממנכ"ל OpenAI, דרך הנשיא טראמפ ועד NVIDIA - עולם הטכנולוגיה לא נשאר אדיש לפיתוחים של DeepSeek

                  videoframe_2585538-1-1024x576.jpg.webp

                  הבאזז סביב DeepSeek לא עוצר. לצד המודלים החדשים שהציגה החברה כדי להתחרות במודלי התמונות הפופולריים, חברות הענק, כולל המתחרים של הסטארטאפ הסיני, לא נשארים אדישים.

                  אחרי מחיקת הערך, אנבידיה מגיבה

                  ההכרזות של DeepSeek, שהתפוצצו בסוף השבוע, הובילו לתנועה רצינית בבורסה אמש – כולל מחיקת הערך הגדולה בהיסטוריה של נאסד"ק. אנבידיה, שהמניה שלה התרסקה ב-17% ואיבדה 600 מיליארד דולר מערכה, הגיבה לראשונה לסטארטאפ שהצליח להגיע להישגים שלו דווקא עם החומרה החלשה שלה – ועם מעט ממנה. "DeepSeek מציגה התקדמות מדהימה ב-AI והיא דוגמה מושלמת ל-Test-Time Scaling (שיטה לשיפור ביצועי המודלים בשלב ההיסק, א.א.)", מסר דובר מטעם NVIDIA, והוסיף כי "DeepSeek ממחישה כיצד ניתן לייצר מודלים חדשים באמצעות טכניקה זו, תוך מינוף של מודלים קיימים וטכנולוגיות מחשוב שעומדות בתקנות הייצוא (שאנבידיה מאוד לא מרוצה מהן, א.א.)". בחברה כמובן לא התייחסו למחיקת הערך האדירה שלה הוביל הסטארטאפ הסיני הקטן, ונשארו דיפלומטיים – לפחות בינתיים.

                  המתחרה הגדול מפרגן, בערך

                  אבל לא רק אנבידיה הגיבה לתופעה. גם המתחרה הגדול, מנכ"ל OpenAI סם אלטמן, פרסם שורת ציוצים ב-X בתגובה להשקה האחרונה של הסטארטאפ הסיני. "R1 של דיפסיק הוא מודל מרשים, במיוחד במחיר שבו הוא מוצע", כותב אלטמן, אבל לא מפספס הזדמנות לעקוץ – "אנחנו כמובן נייצר מודלים טובים יותר". לדבריו, הוא שמח מאוד על התחרות החדשה ואף מציין כי OpenAI תקדים את ההשקה של מודלים חדשים בתגובה.

                  עם זאת, אלטמן לא אומר כי OpenAI תאמץ את הטריקים של DeepSeek, ותנסה לפתח מודלים עם פחות כוח מחשוב (compute), אלא להיפך: "אנחנו מאמינים כי יותר כוח מחשוב הכרחי היום יותר מאי פעם, כדי שנוכל להשלים את המשימה שלנו", כתב אלטמן כשהוא טוען כי "העולם יופתע מהדור הבא של המודלים (שישוחררו)".

                  מי שעוד פרגן לחברה הסינית הוא פרופסור יאן לקון, אחד החוקרים הנחשבים בעולם ה-ML וה-AI, ומי שמרכז את מאמצי מטא בתחום שאמר בתגובה להשקה של המודל של DeepSeek: "אנשים שרואים את הביצועים של DeepSeek וחושבים: 'סין עוקפת את ארה"ב בתחום ה-AI' – אתם מפרשים זאת לא נכון. הפירוש הנכון הוא: 'מודלים בקוד פתוח עוקפים מודלים סגורים'… דיפסיק הרוויחו ממחקר פתוח וקוד פתוח (לדוגמה, PyTorch ו-Llama של Meta). הם פיתחו רעיונות חדשים ובנו אותם על בסיס עבודות של אחרים. מכיוון שעבודתם פורסמה והיא בקוד פתוח, כולם יכולים להרוויח מכך. זו העוצמה של מחקר פתוח וקוד פתוח".

                  גם הנשיא טראמפ, שידוע ביחס המיוחד שהוא מעניק לחברות טכנולוגיה סיניות, הגיב על הפיתוח. בריאיון ל-BBC אמר טראמפ שסטארטאפ ה-AI הסיני הוא "קריאת השכמה לתעשיה שלנו". טראמפ הוסיף שכדי לנצח, האמריקאים צריכים להיות ממוקדים בתחרות "כמו לייזר". טראמפ הוסיף שהוא רואה יתרון בעלות הנמוכה של המודלים הסיניים ואמר: "במקום להוציא מיליארדים על גבי מיליארדים, תוציאו פחות ותגיעו, בתקווה, לאותו פתרון".

                  גם מנכ"ל אינטל לשעבר מאמץ

                  לא רק אלטמן התרשם מהמודל הסיני. פאט גלסינגר, מנכ"ל אינטל לשעבר ומי שהוא יו"ר הדירקטוריון של סטארטאפ בשם Gloo – המפתח מערכת לתקשורת פנימית בין כנסיות (כן, זה אמיתי) – אמר: "המוצר הפתוח מנצח. דיפסיק יעזור לנקות את העולם של מודלי ה-AI הגדולים שהולך ונסגר", כתב גלסינגר ב-X. גלסינגר אמר ל-TechCrunch כי הוא ואנשי Gloo התרשמו כל כך מ-R1 – מודל ההיסק של דיפסיק שמתחרה ב-o1 של OpenAI – שהם מתכננים להטמיע אותו לתוך המוצר שלהם. "המהנדסים בגלו כבר מריצים את R1. הם יכלו לבחור ב-o1 – אך יכלו לעשות זאת רק דרך ה-API". לדבריו המהפכה הגדולה של דיפסיק תהיה לא רק ההנגשה של AI לכולם, אלא הנגשה של AI מוצלח יותר לכולם.

                  כל כך גדולים שמתקפת הסייבר הגיעה

                  אבל עם הגדילה, הפרסום והזינוק במשתמשים מגיעים גם כאבי ראש חדשים. אמש הכריז הסטארטאפ הסיני על עצירה זמנית של הרשמת משתמשים לאפליקציה ולצ'אט שלו "עקב שורה של מתקפות על שירותי דיפסיק". נכון לכתיבת שורות אלו, בהודעה שמופיעה בעמוד ההרשמה של דיפסיק מצוין כי בעקבות המתקפה המדוברת יש עומס על ההרשמות, אך הן לא סגורות. "תודה על ההבנה והתמיכה", נכתב בהודעה. בנוסף, אם כבר נרשמתם לשירות בימים האחרונים תוכלו להתחבר אליו כרגיל.

                  מקור - https://www.geektime.co.il/altman-says-openai-will-pull-up-new-models-and-nvidia-reacts-to-deepseek/

                  תגובה 1 תגובה אחרונה
                  2
                  • 25802 מנותק
                    25802 מנותק
                    2580
                    מדריכים
                    כתב נערך לאחרונה על ידי
                    #86

                    ולכל אלו שדאגו מגמת השיפור במניות ממשיכה.....

                    מייקרוסופט (כבר עברה את רף הצניחה...)

                    c933f501-4d2d-4c0c-babf-1501ceb8f73c-image.png

                    אנבידיה (עליה מתונה...)

                    83e8d26c-523e-40fe-859d-2021cc04c87a-image.png

                    גוגל (כבר היה היום יותר טוב... אבל עדיין עולה...)

                    1f649dec-f83c-4eee-ad33-84794e1584a9-image.png

                    מטא (רק הרויחו מאז שזה קרה...)

                    25b35c36-a8a3-4b10-9a1b-8417c9457e85-image.png

                    שימו לב - בכוונה אני מעלה נתונים מחמשת הימים האחרונים ולא רק של היום האחרון הם משקפים את המצב יותר טוב...

                    תגובה 1 תגובה אחרונה
                    3
                    • FSHLOMOF מנותק
                      FSHLOMOF מנותק
                      FSHLOMO
                      כתב נערך לאחרונה על ידי
                      #87

                      הם לא רציניים

                      ef2734ca-1578-4e63-ae0f-5349695801a2-image.png

                      tisotbzol@gmail.com

                      ראובן שבתיר תגובה 1 תגובה אחרונה
                      0
                      • G מנותק
                        G מנותק
                        gon.kandi
                        כתב נערך לאחרונה על ידי gon.kandi
                        #88

                        מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                        מ א 3 תגובות תגובה אחרונה
                        0
                        • G gon.kandi

                          מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                          מ מנותק
                          מ מנותק
                          מוגן
                          כתב נערך לאחרונה על ידי
                          #89

                          @gon-kandi הוא מחזיר לי תשובה בערבית
                          איך מגדירים שיהיה בעברית?

                          תגובה 1 תגובה אחרונה
                          0
                          • FSHLOMOF FSHLOMO

                            הם לא רציניים

                            ef2734ca-1578-4e63-ae0f-5349695801a2-image.png

                            ראובן שבתיר מנותק
                            ראובן שבתיר מנותק
                            ראובן שבתי
                            מדריכים
                            כתב נערך לאחרונה על ידי ראובן שבתי
                            #90

                            @FSHLOMO כתב בבקשת מידע | DeepSeek המודל הסיני:

                            הם לא רציניים

                            קרה לי אלף פעם בGPT
                            בתחילת דרכם שכל העולם התחבר לזה, זה בכלל היה קטסטרופה
                            שלבי הרצה קלאסיים

                            תגובה 1 תגובה אחרונה
                            1
                            • G gon.kandi

                              מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                              א מנותק
                              א מנותק
                              אהרן
                              כתב נערך לאחרונה על ידי
                              #91

                              @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                              מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                              מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                              א.מ.ד.א תגובה 1 תגובה אחרונה
                              0
                              • א אהרן

                                @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                                מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                                מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                                א.מ.ד.א מנותק
                                א.מ.ד.א מנותק
                                א.מ.ד.
                                כתב נערך לאחרונה על ידי
                                #92

                                @אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

                                @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                                מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                                מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                                זה רץ על הדפדפן. יורד 1.28 GB.

                                א תגובה 1 תגובה אחרונה
                                2
                                • א.מ.ד.א א.מ.ד.

                                  @אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                                  מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                                  זה רץ על הדפדפן. יורד 1.28 GB.

                                  א מנותק
                                  א מנותק
                                  ארץ הצבי
                                  מורחק
                                  כתב נערך לאחרונה על ידי
                                  #93

                                  @א-מ-ד
                                  זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                  א.מ.ד.א תגובה 1 תגובה אחרונה
                                  0
                                  • א ארץ הצבי

                                    @א-מ-ד
                                    זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                    א.מ.ד.א מנותק
                                    א.מ.ד.א מנותק
                                    א.מ.ד.
                                    כתב נערך לאחרונה על ידי א.מ.ד.
                                    #94

                                    @ארץ-הצבי כתב בבקשת מידע | DeepSeek המודל הסיני:

                                    @א-מ-ד
                                    זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                    לא, מה פתאום, הוא 500 GB, אבל הם פיתחו איזה טכניקה שמשתמשת רק בנתונים הרלוונטיים וחוסכת 80% אאל"ט מכוח המחשוב להרצה של המודל. אבל אני באמת צריך לחקור את זה... זה יכול לאפשר הרצה של מודלים חזקים אפילו באופליין!!!

                                    עריכה: מדובר במודל הקטן שלהם - 1.5B.

                                    ראובן שבתיר תגובה 1 תגובה אחרונה
                                    1
                                    • א.מ.ד.א א.מ.ד.

                                      @ארץ-הצבי כתב בבקשת מידע | DeepSeek המודל הסיני:

                                      @א-מ-ד
                                      זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                      לא, מה פתאום, הוא 500 GB, אבל הם פיתחו איזה טכניקה שמשתמשת רק בנתונים הרלוונטיים וחוסכת 80% אאל"ט מכוח המחשוב להרצה של המודל. אבל אני באמת צריך לחקור את זה... זה יכול לאפשר הרצה של מודלים חזקים אפילו באופליין!!!

                                      עריכה: מדובר במודל הקטן שלהם - 1.5B.

                                      ראובן שבתיר מנותק
                                      ראובן שבתיר מנותק
                                      ראובן שבתי
                                      מדריכים
                                      כתב נערך לאחרונה על ידי
                                      #95

                                      @א-מ-ד כתב בבקשת מידע | DeepSeek המודל הסיני:

                                      1.5B.

                                      B or G

                                      NH.LOCALN תגובה 1 תגובה אחרונה
                                      0
                                      • ראובן שבתיר ראובן שבתי

                                        @א-מ-ד כתב בבקשת מידע | DeepSeek המודל הסיני:

                                        1.5B.

                                        B or G

                                        NH.LOCALN מנותק
                                        NH.LOCALN מנותק
                                        NH.LOCAL
                                        מדריכים
                                        כתב נערך לאחרונה על ידי NH.LOCAL
                                        #96

                                        @ראובן-שבתי 1.5B = 1/5 ביליון פרמטרים. וביליון בתרגום לעברית זה מיליארד

                                        לאינדקס המלא של כלל הסקריפטים שלי
                                        https://nhlocal.github.io

                                        ראובן שבתיר תגובה 1 תגובה אחרונה
                                        1
                                        • NH.LOCALN NH.LOCAL

                                          @ראובן-שבתי 1.5B = 1/5 ביליון פרמטרים. וביליון בתרגום לעברית זה מיליארד

                                          ראובן שבתיר מנותק
                                          ראובן שבתיר מנותק
                                          ראובן שבתי
                                          מדריכים
                                          כתב נערך לאחרונה על ידי
                                          #97
                                          פוסט זה נמחק!
                                          תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר