דילוג לתוכן
  • חוקי הפורום
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשת מידע | DeepSeek המודל הסיני

בקשת מידע | DeepSeek המודל הסיני

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
225 פוסטים 48 כותבים 13.1k צפיות 36 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א מנותק
    א מנותק
    אברהם אברהם 1
    כתב נערך לאחרונה על ידי
    #77

    רשום פה ברור שהוא עובד על open Ai

    6559bc76-1f1e-4a5c-9323-50e680ef7502-image.png

    A0533057932A צדיק תמיםצ 2 תגובות תגובה אחרונה
    0
    • א אלי ויל

      האם מישהו חיצוני בדק שאכן הפיתוח עלה להם פחות?
      כי אם אני בעל קרן גידור, אני משקיע בחשאי 10 מיליארד דולר בפיתוח AI, רוכש מניות בחסר של נבידיה ועוד כמה חברות כאלה, מפרסם שעלות האימון של AI עלה רק 5 מיליון דולר וגורף 300 מיליארד דולר רווח

      A מנותק
      A מנותק
      aiib
      כתב נערך לאחרונה על ידי
      #78

      @אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:

      האם מישהו חיצוני בדק שאכן הפיתוח עלה להם פחות?
      כי אם אני בעל קרן גידור, אני משקיע בחשאי 10 מיליארד דולר בפיתוח AI, רוכש מניות בחסר של נבידיה ועוד כמה חברות כאלה, מפרסם שעלות האימון של AI עלה רק 5 מיליון דולר וגורף 300 מיליארד דולר רווח

      יש כבר טענות חזקות כאלו עכשיו. מאסק הצטרף לטענות האלו.
      השאלה היא (שאלת בור...) האם אין הוכחה לכל הפחות חלקית מעלות השימוש לעלות האימון.

      ה תגובה 1 תגובה אחרונה
      0
      • א אברהם אברהם 1

        רשום פה ברור שהוא עובד על open Ai

        6559bc76-1f1e-4a5c-9323-50e680ef7502-image.png

        A0533057932A מנותק
        A0533057932A מנותק
        A0533057932
        כתב נערך לאחרונה על ידי
        #79

        @אברהם-אברהם-1 זה לא מה שרשום שם
        אלא שAPI שלהם מועתק אחד לאחד מאופן AI

        תגובה 1 תגובה אחרונה
        4
        • א אברהם אברהם 1

          רשום פה ברור שהוא עובד על open Ai

          6559bc76-1f1e-4a5c-9323-50e680ef7502-image.png

          צדיק תמיםצ מנותק
          צדיק תמיםצ מנותק
          צדיק תמים
          מדריכים
          כתב נערך לאחרונה על ידי
          #80

          @אברהם-אברהם-1 כתוב שהAPI שלהם תואם למבנה של הAPI של OpenAPI כדי שיהיה אפשר לעבור אליהם בלי לגעת בקוד קיים
          זה מאוד מקובל בתחום, לדוגמה לxAI, Groq, גוגל, יש גם API תואם לספרייה של OpenAI

          רוצה לזכור קריאת שמע בזמן? לחץ כאן! || אתר שכולו מדריכים

          תגובה 1 תגובה אחרונה
          3
          • א.מ.ד.א א.מ.ד.

            @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

            @א-מ-ד בגדול זה כאן: https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B

            אני בבנטפרי אז זה ממילא לא עובד אצלי כרגע כך שאני לא יכול לדעת בדיוק...

            יש קישורים בגוף הכתבה...

            את זה מצאתי מיד, אני מתכוון למה שכתוב בכתבה שהבאת לגבי הרצת המודל ב-hugging face - לא ראיתי כזאת אפשרות שם.

            25802 מנותק
            25802 מנותק
            2580
            מדריכים
            כתב נערך לאחרונה על ידי
            #81

            @א-מ-ד זה בדיוק זה תסתכל בדומיין...

            א.מ.ד.א 2 תגובות תגובה אחרונה
            1
            • 25802 2580

              @א-מ-ד זה בדיוק זה תסתכל בדומיין...

              א.מ.ד.א מנותק
              א.מ.ד.א מנותק
              א.מ.ד.
              כתב נערך לאחרונה על ידי
              #82

              @2580 צודק, לא שמתי לב... לא מצאתי את זה בדף של המודל.

              תגובה 1 תגובה אחרונה
              0
              • 25802 2580

                @א-מ-ד זה בדיוק זה תסתכל בדומיין...

                א.מ.ד.א מנותק
                א.מ.ד.א מנותק
                א.מ.ד.
                כתב נערך לאחרונה על ידי
                #83

                @2580 איכות יצירת התמונות שלו גרועה!!!
                ביקשתי (באנגלית!) שייצור תמונה של מטוס קרב, ואלו התוצאות:
                image (4).webp image (3).webp image (2).webp image (1).webp image.webp

                נורא!

                א.מ.ד.א תגובה 1 תגובה אחרונה
                2
                • א.מ.ד.א א.מ.ד.

                  @2580 איכות יצירת התמונות שלו גרועה!!!
                  ביקשתי (באנגלית!) שייצור תמונה של מטוס קרב, ואלו התוצאות:
                  image (4).webp image (3).webp image (2).webp image (1).webp image.webp

                  נורא!

                  א.מ.ד.א מנותק
                  א.מ.ד.א מנותק
                  א.מ.ד.
                  כתב נערך לאחרונה על ידי
                  #84

                  בתמונות נוף הוא יותר טוב (כנראה כי אין במה לפשל כמעט):
                  image (6).webp image (5).webp

                  תגובה 1 תגובה אחרונה
                  1
                  • 25802 מנותק
                    25802 מנותק
                    2580
                    מדריכים
                    כתב נערך לאחרונה על ידי
                    #85

                    זה לא נגמר עד שזה לא נגמר... פרק ז'...

                    סם אלטמן, אנבידיה וטראמפ מגיבים לראשונה לטרפת של DeepSeek

                    ממנכ"ל OpenAI, דרך הנשיא טראמפ ועד NVIDIA - עולם הטכנולוגיה לא נשאר אדיש לפיתוחים של DeepSeek

                    videoframe_2585538-1-1024x576.jpg.webp

                    הבאזז סביב DeepSeek לא עוצר. לצד המודלים החדשים שהציגה החברה כדי להתחרות במודלי התמונות הפופולריים, חברות הענק, כולל המתחרים של הסטארטאפ הסיני, לא נשארים אדישים.

                    אחרי מחיקת הערך, אנבידיה מגיבה

                    ההכרזות של DeepSeek, שהתפוצצו בסוף השבוע, הובילו לתנועה רצינית בבורסה אמש – כולל מחיקת הערך הגדולה בהיסטוריה של נאסד"ק. אנבידיה, שהמניה שלה התרסקה ב-17% ואיבדה 600 מיליארד דולר מערכה, הגיבה לראשונה לסטארטאפ שהצליח להגיע להישגים שלו דווקא עם החומרה החלשה שלה – ועם מעט ממנה. "DeepSeek מציגה התקדמות מדהימה ב-AI והיא דוגמה מושלמת ל-Test-Time Scaling (שיטה לשיפור ביצועי המודלים בשלב ההיסק, א.א.)", מסר דובר מטעם NVIDIA, והוסיף כי "DeepSeek ממחישה כיצד ניתן לייצר מודלים חדשים באמצעות טכניקה זו, תוך מינוף של מודלים קיימים וטכנולוגיות מחשוב שעומדות בתקנות הייצוא (שאנבידיה מאוד לא מרוצה מהן, א.א.)". בחברה כמובן לא התייחסו למחיקת הערך האדירה שלה הוביל הסטארטאפ הסיני הקטן, ונשארו דיפלומטיים – לפחות בינתיים.

                    המתחרה הגדול מפרגן, בערך

                    אבל לא רק אנבידיה הגיבה לתופעה. גם המתחרה הגדול, מנכ"ל OpenAI סם אלטמן, פרסם שורת ציוצים ב-X בתגובה להשקה האחרונה של הסטארטאפ הסיני. "R1 של דיפסיק הוא מודל מרשים, במיוחד במחיר שבו הוא מוצע", כותב אלטמן, אבל לא מפספס הזדמנות לעקוץ – "אנחנו כמובן נייצר מודלים טובים יותר". לדבריו, הוא שמח מאוד על התחרות החדשה ואף מציין כי OpenAI תקדים את ההשקה של מודלים חדשים בתגובה.

                    עם זאת, אלטמן לא אומר כי OpenAI תאמץ את הטריקים של DeepSeek, ותנסה לפתח מודלים עם פחות כוח מחשוב (compute), אלא להיפך: "אנחנו מאמינים כי יותר כוח מחשוב הכרחי היום יותר מאי פעם, כדי שנוכל להשלים את המשימה שלנו", כתב אלטמן כשהוא טוען כי "העולם יופתע מהדור הבא של המודלים (שישוחררו)".

                    מי שעוד פרגן לחברה הסינית הוא פרופסור יאן לקון, אחד החוקרים הנחשבים בעולם ה-ML וה-AI, ומי שמרכז את מאמצי מטא בתחום שאמר בתגובה להשקה של המודל של DeepSeek: "אנשים שרואים את הביצועים של DeepSeek וחושבים: 'סין עוקפת את ארה"ב בתחום ה-AI' – אתם מפרשים זאת לא נכון. הפירוש הנכון הוא: 'מודלים בקוד פתוח עוקפים מודלים סגורים'… דיפסיק הרוויחו ממחקר פתוח וקוד פתוח (לדוגמה, PyTorch ו-Llama של Meta). הם פיתחו רעיונות חדשים ובנו אותם על בסיס עבודות של אחרים. מכיוון שעבודתם פורסמה והיא בקוד פתוח, כולם יכולים להרוויח מכך. זו העוצמה של מחקר פתוח וקוד פתוח".

                    גם הנשיא טראמפ, שידוע ביחס המיוחד שהוא מעניק לחברות טכנולוגיה סיניות, הגיב על הפיתוח. בריאיון ל-BBC אמר טראמפ שסטארטאפ ה-AI הסיני הוא "קריאת השכמה לתעשיה שלנו". טראמפ הוסיף שכדי לנצח, האמריקאים צריכים להיות ממוקדים בתחרות "כמו לייזר". טראמפ הוסיף שהוא רואה יתרון בעלות הנמוכה של המודלים הסיניים ואמר: "במקום להוציא מיליארדים על גבי מיליארדים, תוציאו פחות ותגיעו, בתקווה, לאותו פתרון".

                    גם מנכ"ל אינטל לשעבר מאמץ

                    לא רק אלטמן התרשם מהמודל הסיני. פאט גלסינגר, מנכ"ל אינטל לשעבר ומי שהוא יו"ר הדירקטוריון של סטארטאפ בשם Gloo – המפתח מערכת לתקשורת פנימית בין כנסיות (כן, זה אמיתי) – אמר: "המוצר הפתוח מנצח. דיפסיק יעזור לנקות את העולם של מודלי ה-AI הגדולים שהולך ונסגר", כתב גלסינגר ב-X. גלסינגר אמר ל-TechCrunch כי הוא ואנשי Gloo התרשמו כל כך מ-R1 – מודל ההיסק של דיפסיק שמתחרה ב-o1 של OpenAI – שהם מתכננים להטמיע אותו לתוך המוצר שלהם. "המהנדסים בגלו כבר מריצים את R1. הם יכלו לבחור ב-o1 – אך יכלו לעשות זאת רק דרך ה-API". לדבריו המהפכה הגדולה של דיפסיק תהיה לא רק ההנגשה של AI לכולם, אלא הנגשה של AI מוצלח יותר לכולם.

                    כל כך גדולים שמתקפת הסייבר הגיעה

                    אבל עם הגדילה, הפרסום והזינוק במשתמשים מגיעים גם כאבי ראש חדשים. אמש הכריז הסטארטאפ הסיני על עצירה זמנית של הרשמת משתמשים לאפליקציה ולצ'אט שלו "עקב שורה של מתקפות על שירותי דיפסיק". נכון לכתיבת שורות אלו, בהודעה שמופיעה בעמוד ההרשמה של דיפסיק מצוין כי בעקבות המתקפה המדוברת יש עומס על ההרשמות, אך הן לא סגורות. "תודה על ההבנה והתמיכה", נכתב בהודעה. בנוסף, אם כבר נרשמתם לשירות בימים האחרונים תוכלו להתחבר אליו כרגיל.

                    מקור - https://www.geektime.co.il/altman-says-openai-will-pull-up-new-models-and-nvidia-reacts-to-deepseek/

                    תגובה 1 תגובה אחרונה
                    2
                    • 25802 מנותק
                      25802 מנותק
                      2580
                      מדריכים
                      כתב נערך לאחרונה על ידי
                      #86

                      ולכל אלו שדאגו מגמת השיפור במניות ממשיכה.....

                      מייקרוסופט (כבר עברה את רף הצניחה...)

                      c933f501-4d2d-4c0c-babf-1501ceb8f73c-image.png

                      אנבידיה (עליה מתונה...)

                      83e8d26c-523e-40fe-859d-2021cc04c87a-image.png

                      גוגל (כבר היה היום יותר טוב... אבל עדיין עולה...)

                      1f649dec-f83c-4eee-ad33-84794e1584a9-image.png

                      מטא (רק הרויחו מאז שזה קרה...)

                      25b35c36-a8a3-4b10-9a1b-8417c9457e85-image.png

                      שימו לב - בכוונה אני מעלה נתונים מחמשת הימים האחרונים ולא רק של היום האחרון הם משקפים את המצב יותר טוב...

                      תגובה 1 תגובה אחרונה
                      3
                      • FSHLOMOF מנותק
                        FSHLOMOF מנותק
                        FSHLOMO
                        כתב נערך לאחרונה על ידי
                        #87

                        הם לא רציניים

                        ef2734ca-1578-4e63-ae0f-5349695801a2-image.png

                        tisotbzol@gmail.com

                        ראובן שבתיר תגובה 1 תגובה אחרונה
                        0
                        • G מנותק
                          G מנותק
                          gon.kandi
                          כתב נערך לאחרונה על ידי gon.kandi
                          #88

                          מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                          מ א 3 תגובות תגובה אחרונה
                          0
                          • G gon.kandi

                            מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                            מ מנותק
                            מ מנותק
                            מוגן
                            כתב נערך לאחרונה על ידי
                            #89

                            @gon-kandi הוא מחזיר לי תשובה בערבית
                            איך מגדירים שיהיה בעברית?

                            תגובה 1 תגובה אחרונה
                            0
                            • FSHLOMOF FSHLOMO

                              הם לא רציניים

                              ef2734ca-1578-4e63-ae0f-5349695801a2-image.png

                              ראובן שבתיר מנותק
                              ראובן שבתיר מנותק
                              ראובן שבתי
                              מדריכים
                              כתב נערך לאחרונה על ידי ראובן שבתי
                              #90

                              @FSHLOMO כתב בבקשת מידע | DeepSeek המודל הסיני:

                              הם לא רציניים

                              קרה לי אלף פעם בGPT
                              בתחילת דרכם שכל העולם התחבר לזה, זה בכלל היה קטסטרופה
                              שלבי הרצה קלאסיים

                              ...

                              תגובה 1 תגובה אחרונה
                              1
                              • G gon.kandi

                                מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                                א מנותק
                                א מנותק
                                אהרן
                                כתב נערך לאחרונה על ידי
                                #91

                                @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                                מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                                מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                                א.מ.ד.א תגובה 1 תגובה אחרונה
                                0
                                • א אהרן

                                  @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                                  מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                                  א.מ.ד.א מנותק
                                  א.מ.ד.א מנותק
                                  א.מ.ד.
                                  כתב נערך לאחרונה על ידי
                                  #92

                                  @אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                                  מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                                  זה רץ על הדפדפן. יורד 1.28 GB.

                                  א תגובה 1 תגובה אחרונה
                                  2
                                  • א.מ.ד.א א.מ.ד.

                                    @אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

                                    @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                                    מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                                    מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                                    זה רץ על הדפדפן. יורד 1.28 GB.

                                    א מנותק
                                    א מנותק
                                    ארץ הצבי
                                    מורחק
                                    כתב נערך לאחרונה על ידי
                                    #93

                                    @א-מ-ד
                                    זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                    א.מ.ד.א תגובה 1 תגובה אחרונה
                                    0
                                    • א ארץ הצבי

                                      @א-מ-ד
                                      זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                      א.מ.ד.א מנותק
                                      א.מ.ד.א מנותק
                                      א.מ.ד.
                                      כתב נערך לאחרונה על ידי א.מ.ד.
                                      #94

                                      @ארץ-הצבי כתב בבקשת מידע | DeepSeek המודל הסיני:

                                      @א-מ-ד
                                      זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                      לא, מה פתאום, הוא 500 GB, אבל הם פיתחו איזה טכניקה שמשתמשת רק בנתונים הרלוונטיים וחוסכת 80% אאל"ט מכוח המחשוב להרצה של המודל. אבל אני באמת צריך לחקור את זה... זה יכול לאפשר הרצה של מודלים חזקים אפילו באופליין!!!

                                      עריכה: מדובר במודל הקטן שלהם - 1.5B.

                                      ראובן שבתיר תגובה 1 תגובה אחרונה
                                      1
                                      • א.מ.ד.א א.מ.ד.

                                        @ארץ-הצבי כתב בבקשת מידע | DeepSeek המודל הסיני:

                                        @א-מ-ד
                                        זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                        לא, מה פתאום, הוא 500 GB, אבל הם פיתחו איזה טכניקה שמשתמשת רק בנתונים הרלוונטיים וחוסכת 80% אאל"ט מכוח המחשוב להרצה של המודל. אבל אני באמת צריך לחקור את זה... זה יכול לאפשר הרצה של מודלים חזקים אפילו באופליין!!!

                                        עריכה: מדובר במודל הקטן שלהם - 1.5B.

                                        ראובן שבתיר מנותק
                                        ראובן שבתיר מנותק
                                        ראובן שבתי
                                        מדריכים
                                        כתב נערך לאחרונה על ידי
                                        #95

                                        @א-מ-ד כתב בבקשת מידע | DeepSeek המודל הסיני:

                                        1.5B.

                                        B or G

                                        ...

                                        NH.LOCALN תגובה 1 תגובה אחרונה
                                        0
                                        • ראובן שבתיר ראובן שבתי

                                          @א-מ-ד כתב בבקשת מידע | DeepSeek המודל הסיני:

                                          1.5B.

                                          B or G

                                          NH.LOCALN מנותק
                                          NH.LOCALN מנותק
                                          NH.LOCAL
                                          מדריכים
                                          כתב נערך לאחרונה על ידי NH.LOCAL
                                          #96

                                          @ראובן-שבתי 1.5B = 1/5 ביליון פרמטרים. וביליון בתרגום לעברית זה מיליארד

                                          לאינדקס המלא של כלל הסקריפטים שלי
                                          https://nhlocal.github.io

                                          ראובן שבתיר תגובה 1 תגובה אחרונה
                                          1

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר