דילוג לתוכן
  • חוקי הפורום
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשת מידע | DeepSeek המודל הסיני

בקשת מידע | DeepSeek המודל הסיני

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
225 פוסטים 48 כותבים 13.1k צפיות 36 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א אברהם אברהם 1

    רשום פה ברור שהוא עובד על open Ai

    6559bc76-1f1e-4a5c-9323-50e680ef7502-image.png

    צדיק תמיםצ מנותק
    צדיק תמיםצ מנותק
    צדיק תמים
    מדריכים
    כתב נערך לאחרונה על ידי
    #80

    @אברהם-אברהם-1 כתוב שהAPI שלהם תואם למבנה של הAPI של OpenAPI כדי שיהיה אפשר לעבור אליהם בלי לגעת בקוד קיים
    זה מאוד מקובל בתחום, לדוגמה לxAI, Groq, גוגל, יש גם API תואם לספרייה של OpenAI

    רוצה לזכור קריאת שמע בזמן? לחץ כאן! || אתר שכולו מדריכים

    תגובה 1 תגובה אחרונה
    3
    • א.מ.ד.א א.מ.ד.

      @2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

      @א-מ-ד בגדול זה כאן: https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B

      אני בבנטפרי אז זה ממילא לא עובד אצלי כרגע כך שאני לא יכול לדעת בדיוק...

      יש קישורים בגוף הכתבה...

      את זה מצאתי מיד, אני מתכוון למה שכתוב בכתבה שהבאת לגבי הרצת המודל ב-hugging face - לא ראיתי כזאת אפשרות שם.

      25802 מנותק
      25802 מנותק
      2580
      מדריכים
      כתב נערך לאחרונה על ידי
      #81

      @א-מ-ד זה בדיוק זה תסתכל בדומיין...

      א.מ.ד.א 2 תגובות תגובה אחרונה
      1
      • 25802 2580

        @א-מ-ד זה בדיוק זה תסתכל בדומיין...

        א.מ.ד.א מנותק
        א.מ.ד.א מנותק
        א.מ.ד.
        כתב נערך לאחרונה על ידי
        #82

        @2580 צודק, לא שמתי לב... לא מצאתי את זה בדף של המודל.

        תגובה 1 תגובה אחרונה
        0
        • 25802 2580

          @א-מ-ד זה בדיוק זה תסתכל בדומיין...

          א.מ.ד.א מנותק
          א.מ.ד.א מנותק
          א.מ.ד.
          כתב נערך לאחרונה על ידי
          #83

          @2580 איכות יצירת התמונות שלו גרועה!!!
          ביקשתי (באנגלית!) שייצור תמונה של מטוס קרב, ואלו התוצאות:
          image (4).webp image (3).webp image (2).webp image (1).webp image.webp

          נורא!

          א.מ.ד.א תגובה 1 תגובה אחרונה
          2
          • א.מ.ד.א א.מ.ד.

            @2580 איכות יצירת התמונות שלו גרועה!!!
            ביקשתי (באנגלית!) שייצור תמונה של מטוס קרב, ואלו התוצאות:
            image (4).webp image (3).webp image (2).webp image (1).webp image.webp

            נורא!

            א.מ.ד.א מנותק
            א.מ.ד.א מנותק
            א.מ.ד.
            כתב נערך לאחרונה על ידי
            #84

            בתמונות נוף הוא יותר טוב (כנראה כי אין במה לפשל כמעט):
            image (6).webp image (5).webp

            תגובה 1 תגובה אחרונה
            1
            • 25802 מנותק
              25802 מנותק
              2580
              מדריכים
              כתב נערך לאחרונה על ידי
              #85

              זה לא נגמר עד שזה לא נגמר... פרק ז'...

              סם אלטמן, אנבידיה וטראמפ מגיבים לראשונה לטרפת של DeepSeek

              ממנכ"ל OpenAI, דרך הנשיא טראמפ ועד NVIDIA - עולם הטכנולוגיה לא נשאר אדיש לפיתוחים של DeepSeek

              videoframe_2585538-1-1024x576.jpg.webp

              הבאזז סביב DeepSeek לא עוצר. לצד המודלים החדשים שהציגה החברה כדי להתחרות במודלי התמונות הפופולריים, חברות הענק, כולל המתחרים של הסטארטאפ הסיני, לא נשארים אדישים.

              אחרי מחיקת הערך, אנבידיה מגיבה

              ההכרזות של DeepSeek, שהתפוצצו בסוף השבוע, הובילו לתנועה רצינית בבורסה אמש – כולל מחיקת הערך הגדולה בהיסטוריה של נאסד"ק. אנבידיה, שהמניה שלה התרסקה ב-17% ואיבדה 600 מיליארד דולר מערכה, הגיבה לראשונה לסטארטאפ שהצליח להגיע להישגים שלו דווקא עם החומרה החלשה שלה – ועם מעט ממנה. "DeepSeek מציגה התקדמות מדהימה ב-AI והיא דוגמה מושלמת ל-Test-Time Scaling (שיטה לשיפור ביצועי המודלים בשלב ההיסק, א.א.)", מסר דובר מטעם NVIDIA, והוסיף כי "DeepSeek ממחישה כיצד ניתן לייצר מודלים חדשים באמצעות טכניקה זו, תוך מינוף של מודלים קיימים וטכנולוגיות מחשוב שעומדות בתקנות הייצוא (שאנבידיה מאוד לא מרוצה מהן, א.א.)". בחברה כמובן לא התייחסו למחיקת הערך האדירה שלה הוביל הסטארטאפ הסיני הקטן, ונשארו דיפלומטיים – לפחות בינתיים.

              המתחרה הגדול מפרגן, בערך

              אבל לא רק אנבידיה הגיבה לתופעה. גם המתחרה הגדול, מנכ"ל OpenAI סם אלטמן, פרסם שורת ציוצים ב-X בתגובה להשקה האחרונה של הסטארטאפ הסיני. "R1 של דיפסיק הוא מודל מרשים, במיוחד במחיר שבו הוא מוצע", כותב אלטמן, אבל לא מפספס הזדמנות לעקוץ – "אנחנו כמובן נייצר מודלים טובים יותר". לדבריו, הוא שמח מאוד על התחרות החדשה ואף מציין כי OpenAI תקדים את ההשקה של מודלים חדשים בתגובה.

              עם זאת, אלטמן לא אומר כי OpenAI תאמץ את הטריקים של DeepSeek, ותנסה לפתח מודלים עם פחות כוח מחשוב (compute), אלא להיפך: "אנחנו מאמינים כי יותר כוח מחשוב הכרחי היום יותר מאי פעם, כדי שנוכל להשלים את המשימה שלנו", כתב אלטמן כשהוא טוען כי "העולם יופתע מהדור הבא של המודלים (שישוחררו)".

              מי שעוד פרגן לחברה הסינית הוא פרופסור יאן לקון, אחד החוקרים הנחשבים בעולם ה-ML וה-AI, ומי שמרכז את מאמצי מטא בתחום שאמר בתגובה להשקה של המודל של DeepSeek: "אנשים שרואים את הביצועים של DeepSeek וחושבים: 'סין עוקפת את ארה"ב בתחום ה-AI' – אתם מפרשים זאת לא נכון. הפירוש הנכון הוא: 'מודלים בקוד פתוח עוקפים מודלים סגורים'… דיפסיק הרוויחו ממחקר פתוח וקוד פתוח (לדוגמה, PyTorch ו-Llama של Meta). הם פיתחו רעיונות חדשים ובנו אותם על בסיס עבודות של אחרים. מכיוון שעבודתם פורסמה והיא בקוד פתוח, כולם יכולים להרוויח מכך. זו העוצמה של מחקר פתוח וקוד פתוח".

              גם הנשיא טראמפ, שידוע ביחס המיוחד שהוא מעניק לחברות טכנולוגיה סיניות, הגיב על הפיתוח. בריאיון ל-BBC אמר טראמפ שסטארטאפ ה-AI הסיני הוא "קריאת השכמה לתעשיה שלנו". טראמפ הוסיף שכדי לנצח, האמריקאים צריכים להיות ממוקדים בתחרות "כמו לייזר". טראמפ הוסיף שהוא רואה יתרון בעלות הנמוכה של המודלים הסיניים ואמר: "במקום להוציא מיליארדים על גבי מיליארדים, תוציאו פחות ותגיעו, בתקווה, לאותו פתרון".

              גם מנכ"ל אינטל לשעבר מאמץ

              לא רק אלטמן התרשם מהמודל הסיני. פאט גלסינגר, מנכ"ל אינטל לשעבר ומי שהוא יו"ר הדירקטוריון של סטארטאפ בשם Gloo – המפתח מערכת לתקשורת פנימית בין כנסיות (כן, זה אמיתי) – אמר: "המוצר הפתוח מנצח. דיפסיק יעזור לנקות את העולם של מודלי ה-AI הגדולים שהולך ונסגר", כתב גלסינגר ב-X. גלסינגר אמר ל-TechCrunch כי הוא ואנשי Gloo התרשמו כל כך מ-R1 – מודל ההיסק של דיפסיק שמתחרה ב-o1 של OpenAI – שהם מתכננים להטמיע אותו לתוך המוצר שלהם. "המהנדסים בגלו כבר מריצים את R1. הם יכלו לבחור ב-o1 – אך יכלו לעשות זאת רק דרך ה-API". לדבריו המהפכה הגדולה של דיפסיק תהיה לא רק ההנגשה של AI לכולם, אלא הנגשה של AI מוצלח יותר לכולם.

              כל כך גדולים שמתקפת הסייבר הגיעה

              אבל עם הגדילה, הפרסום והזינוק במשתמשים מגיעים גם כאבי ראש חדשים. אמש הכריז הסטארטאפ הסיני על עצירה זמנית של הרשמת משתמשים לאפליקציה ולצ'אט שלו "עקב שורה של מתקפות על שירותי דיפסיק". נכון לכתיבת שורות אלו, בהודעה שמופיעה בעמוד ההרשמה של דיפסיק מצוין כי בעקבות המתקפה המדוברת יש עומס על ההרשמות, אך הן לא סגורות. "תודה על ההבנה והתמיכה", נכתב בהודעה. בנוסף, אם כבר נרשמתם לשירות בימים האחרונים תוכלו להתחבר אליו כרגיל.

              מקור - https://www.geektime.co.il/altman-says-openai-will-pull-up-new-models-and-nvidia-reacts-to-deepseek/

              תגובה 1 תגובה אחרונה
              2
              • 25802 מנותק
                25802 מנותק
                2580
                מדריכים
                כתב נערך לאחרונה על ידי
                #86

                ולכל אלו שדאגו מגמת השיפור במניות ממשיכה.....

                מייקרוסופט (כבר עברה את רף הצניחה...)

                c933f501-4d2d-4c0c-babf-1501ceb8f73c-image.png

                אנבידיה (עליה מתונה...)

                83e8d26c-523e-40fe-859d-2021cc04c87a-image.png

                גוגל (כבר היה היום יותר טוב... אבל עדיין עולה...)

                1f649dec-f83c-4eee-ad33-84794e1584a9-image.png

                מטא (רק הרויחו מאז שזה קרה...)

                25b35c36-a8a3-4b10-9a1b-8417c9457e85-image.png

                שימו לב - בכוונה אני מעלה נתונים מחמשת הימים האחרונים ולא רק של היום האחרון הם משקפים את המצב יותר טוב...

                תגובה 1 תגובה אחרונה
                3
                • FSHLOMOF מנותק
                  FSHLOMOF מנותק
                  FSHLOMO
                  כתב נערך לאחרונה על ידי
                  #87

                  הם לא רציניים

                  ef2734ca-1578-4e63-ae0f-5349695801a2-image.png

                  tisotbzol@gmail.com

                  ראובן שבתיר תגובה 1 תגובה אחרונה
                  0
                  • G מנותק
                    G מנותק
                    gon.kandi
                    כתב נערך לאחרונה על ידי gon.kandi
                    #88

                    מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                    מ א 3 תגובות תגובה אחרונה
                    0
                    • G gon.kandi

                      מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                      מ מנותק
                      מ מנותק
                      מוגן
                      כתב נערך לאחרונה על ידי
                      #89

                      @gon-kandi הוא מחזיר לי תשובה בערבית
                      איך מגדירים שיהיה בעברית?

                      תגובה 1 תגובה אחרונה
                      0
                      • FSHLOMOF FSHLOMO

                        הם לא רציניים

                        ef2734ca-1578-4e63-ae0f-5349695801a2-image.png

                        ראובן שבתיר מנותק
                        ראובן שבתיר מנותק
                        ראובן שבתי
                        מדריכים
                        כתב נערך לאחרונה על ידי ראובן שבתי
                        #90

                        @FSHLOMO כתב בבקשת מידע | DeepSeek המודל הסיני:

                        הם לא רציניים

                        קרה לי אלף פעם בGPT
                        בתחילת דרכם שכל העולם התחבר לזה, זה בכלל היה קטסטרופה
                        שלבי הרצה קלאסיים

                        תגובה 1 תגובה אחרונה
                        1
                        • G gon.kandi

                          מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                          א מנותק
                          א מנותק
                          אהרן
                          כתב נערך לאחרונה על ידי
                          #91

                          @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                          מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                          מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                          א.מ.ד.א תגובה 1 תגובה אחרונה
                          0
                          • א אהרן

                            @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                            מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                            מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                            א.מ.ד.א מנותק
                            א.מ.ד.א מנותק
                            א.מ.ד.
                            כתב נערך לאחרונה על ידי
                            #92

                            @אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

                            @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                            מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                            מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                            זה רץ על הדפדפן. יורד 1.28 GB.

                            א תגובה 1 תגובה אחרונה
                            2
                            • א.מ.ד.א א.מ.ד.

                              @אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

                              @gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:

                              מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu

                              מה הכוונה שהוא פועל אצלי במחשב, כל החומר יורד למחשב שלי? כל פעם מחדש? כמה זה תופס?

                              זה רץ על הדפדפן. יורד 1.28 GB.

                              א מנותק
                              א מנותק
                              ארץ הצבי
                              מורחק
                              כתב נערך לאחרונה על ידי
                              #93

                              @א-מ-ד
                              זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                              א.מ.ד.א תגובה 1 תגובה אחרונה
                              0
                              • א ארץ הצבי

                                @א-מ-ד
                                זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                א.מ.ד.א מנותק
                                א.מ.ד.א מנותק
                                א.מ.ד.
                                כתב נערך לאחרונה על ידי א.מ.ד.
                                #94

                                @ארץ-הצבי כתב בבקשת מידע | DeepSeek המודל הסיני:

                                @א-מ-ד
                                זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                לא, מה פתאום, הוא 500 GB, אבל הם פיתחו איזה טכניקה שמשתמשת רק בנתונים הרלוונטיים וחוסכת 80% אאל"ט מכוח המחשוב להרצה של המודל. אבל אני באמת צריך לחקור את זה... זה יכול לאפשר הרצה של מודלים חזקים אפילו באופליין!!!

                                עריכה: מדובר במודל הקטן שלהם - 1.5B.

                                ראובן שבתיר תגובה 1 תגובה אחרונה
                                1
                                • א.מ.ד.א א.מ.ד.

                                  @ארץ-הצבי כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  @א-מ-ד
                                  זה כל המודל ? או חלק ממנו מקודם מישהו כתב שהוא 50GB

                                  לא, מה פתאום, הוא 500 GB, אבל הם פיתחו איזה טכניקה שמשתמשת רק בנתונים הרלוונטיים וחוסכת 80% אאל"ט מכוח המחשוב להרצה של המודל. אבל אני באמת צריך לחקור את זה... זה יכול לאפשר הרצה של מודלים חזקים אפילו באופליין!!!

                                  עריכה: מדובר במודל הקטן שלהם - 1.5B.

                                  ראובן שבתיר מנותק
                                  ראובן שבתיר מנותק
                                  ראובן שבתי
                                  מדריכים
                                  כתב נערך לאחרונה על ידי
                                  #95

                                  @א-מ-ד כתב בבקשת מידע | DeepSeek המודל הסיני:

                                  1.5B.

                                  B or G

                                  NH.LOCALN תגובה 1 תגובה אחרונה
                                  0
                                  • ראובן שבתיר ראובן שבתי

                                    @א-מ-ד כתב בבקשת מידע | DeepSeek המודל הסיני:

                                    1.5B.

                                    B or G

                                    NH.LOCALN מנותק
                                    NH.LOCALN מנותק
                                    NH.LOCAL
                                    מדריכים
                                    כתב נערך לאחרונה על ידי NH.LOCAL
                                    #96

                                    @ראובן-שבתי 1.5B = 1/5 ביליון פרמטרים. וביליון בתרגום לעברית זה מיליארד

                                    לאינדקס המלא של כלל הסקריפטים שלי
                                    https://nhlocal.github.io

                                    ראובן שבתיר תגובה 1 תגובה אחרונה
                                    1
                                    • NH.LOCALN NH.LOCAL

                                      @ראובן-שבתי 1.5B = 1/5 ביליון פרמטרים. וביליון בתרגום לעברית זה מיליארד

                                      ראובן שבתיר מנותק
                                      ראובן שבתיר מנותק
                                      ראובן שבתי
                                      מדריכים
                                      כתב נערך לאחרונה על ידי
                                      #97
                                      פוסט זה נמחק!
                                      תגובה 1 תגובה אחרונה
                                      0
                                      • א מנותק
                                        א מנותק
                                        אהרן
                                        כתב נערך לאחרונה על ידי
                                        #98

                                        מישהו בדק שזה באמת לא מעביר אליהם נתונים כשהמחשב כן מחובר לרשת, ואולי אפילו באופליין הוא שומר הכל וברגע החיבור מעביר? פשוט זה סינים והם מאד חשודים בדברים האלו.

                                        נ תגובה 1 תגובה אחרונה
                                        0
                                        • A aiib

                                          @אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:

                                          האם מישהו חיצוני בדק שאכן הפיתוח עלה להם פחות?
                                          כי אם אני בעל קרן גידור, אני משקיע בחשאי 10 מיליארד דולר בפיתוח AI, רוכש מניות בחסר של נבידיה ועוד כמה חברות כאלה, מפרסם שעלות האימון של AI עלה רק 5 מיליון דולר וגורף 300 מיליארד דולר רווח

                                          יש כבר טענות חזקות כאלו עכשיו. מאסק הצטרף לטענות האלו.
                                          השאלה היא (שאלת בור...) האם אין הוכחה לכל הפחות חלקית מעלות השימוש לעלות האימון.

                                          ה מנותק
                                          ה מנותק
                                          הגיבן
                                          כתב נערך לאחרונה על ידי
                                          #99

                                          @aiib
                                          מה הבעיה חופשי הממשלה שלהם מממנת אותם,
                                          בשביל שינצחו בתחרות,
                                          בדיוק כמו אם הרכבים החשמליים הסינים

                                          A תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר