בקשת מידע | DeepSeek המודל הסיני

2580

@ראובן-שבתי אתה מדבר על הצ'אטבוט הוא לכאורה מדבר על זה----

https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B

אהרן

@ראובן-שבתי כתב בבקשת מידע | DeepSeek המודל הסיני:

@אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

פתוח בנטפרי [ולא נותן תשובה, לא יודע אם בגלל העומס / סייבר או בגלל נטפרי]

היה פתוח בעבר
כיום חסום

אז מה זה? [צולם עכשיו]

עריכה: ראיתי ש @2580 הקדימני וביאר את הסתירה [אבל לא ביאר לי למה אני לא מקבל תשובה]

2580

@אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:

[אבל לא ביאר לי למה אני לא מקבל תשובה]

פשוט לא נעים להודות אבל הוא כנראה לא יודע הככלללל....

נעזר1000

כתבו למעלה שהוא יוצר תמונות
איך?
הוא אומר לי שהוא לא יכול.

2580

@נעזר1000 זה שני פלטפורמות שונות אחת צ'אטבוט והשניה מודל שיוצר תמונות...

אלי ויל

האם מישהו חיצוני בדק שאכן הפיתוח עלה להם פחות?
כי אם אני בעל קרן גידור, אני משקיע בחשאי 10 מיליארד דולר בפיתוח AI, רוכש מניות בחסר של נבידיה ועוד כמה חברות כאלה, מפרסם שעלות האימון של AI עלה רק 5 מיליון דולר וגורף 300 מיליארד דולר רווח

2580

@אלי-ויל גם אם אתה צודק זה השיג את המטרה....... ירידה של 465 מליארד רק מאנבידיה... המחיקות של אתמול מסתמא סביבות ה1.5T דולר... והשאלה אם אי פעם יוכלו להוכיח שזה לא נכון...

אוהב לעזור 1

@2580

2580

@אוהב-לעזור-1 לפי הזמן ששלחת זה לפני פתיחת המסחר וללא החישוב של הפרה מרקט...

קצת תמונות עדכניות:

מייקרוסופט -

אנבידיה -

גוגל -

מטא -

אורחל

@2580
מיקרוסופט

אנבידיה

גוגל

מטא

א.מ.ד.

@2580 כתב בבקשת מידע | DeepSeek המודל הסיני:

@א-מ-ד בגדול זה כאן: https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B

אני בבנטפרי אז זה ממילא לא עובד אצלי כרגע כך שאני לא יכול לדעת בדיוק...

יש קישורים בגוף הכתבה...

את זה מצאתי מיד, אני מתכוון למה שכתוב בכתבה שהבאת לגבי הרצת המודל ב-hugging face - לא ראיתי כזאת אפשרות שם.

אברהם אברהם 1

רשום פה ברור שהוא עובד על open Ai

aiib

@אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:

האם מישהו חיצוני בדק שאכן הפיתוח עלה להם פחות?
כי אם אני בעל קרן גידור, אני משקיע בחשאי 10 מיליארד דולר בפיתוח AI, רוכש מניות בחסר של נבידיה ועוד כמה חברות כאלה, מפרסם שעלות האימון של AI עלה רק 5 מיליון דולר וגורף 300 מיליארד דולר רווח

יש כבר טענות חזקות כאלו עכשיו. מאסק הצטרף לטענות האלו.
השאלה היא (שאלת בור...) האם אין הוכחה לכל הפחות חלקית מעלות השימוש לעלות האימון.

A0533057932

@אברהם-אברהם-1 זה לא מה שרשום שם
אלא שAPI שלהם מועתק אחד לאחד מאופן AI

צדיק תמים

@אברהם-אברהם-1 כתוב שהAPI שלהם תואם למבנה של הAPI של OpenAPI כדי שיהיה אפשר לעבור אליהם בלי לגעת בקוד קיים
זה מאוד מקובל בתחום, לדוגמה לxAI, Groq, גוגל, יש גם API תואם לספרייה של OpenAI

2580

@א-מ-ד זה בדיוק זה תסתכל בדומיין...

א.מ.ד.

@2580 צודק, לא שמתי לב... לא מצאתי את זה בדף של המודל.

א.מ.ד.

@2580 איכות יצירת התמונות שלו גרועה!!!
ביקשתי (באנגלית!) שייצור תמונה של מטוס קרב, ואלו התוצאות:
image (4).webp image (3).webp image (2).webp image (1).webp

נורא!

א.מ.ד.

בתמונות נוף הוא יותר טוב (כנראה כי אין במה לפשל כמעט):
image (6).webp image (5).webp

2580

זה לא נגמר עד שזה לא נגמר... פרק ז'...

סם אלטמן, אנבידיה וטראמפ מגיבים לראשונה לטרפת של DeepSeek

ממנכ"ל OpenAI, דרך הנשיא טראמפ ועד NVIDIA - עולם הטכנולוגיה לא נשאר אדיש לפיתוחים של DeepSeek

videoframe_2585538-1-1024x576.jpg.webp

הבאזז סביב DeepSeek לא עוצר. לצד המודלים החדשים שהציגה החברה כדי להתחרות במודלי התמונות הפופולריים, חברות הענק, כולל המתחרים של הסטארטאפ הסיני, לא נשארים אדישים.

אחרי מחיקת הערך, אנבידיה מגיבה

ההכרזות של DeepSeek, שהתפוצצו בסוף השבוע, הובילו לתנועה רצינית בבורסה אמש – כולל מחיקת הערך הגדולה בהיסטוריה של נאסד"ק. אנבידיה, שהמניה שלה התרסקה ב-17% ואיבדה 600 מיליארד דולר מערכה, הגיבה לראשונה לסטארטאפ שהצליח להגיע להישגים שלו דווקא עם החומרה החלשה שלה – ועם מעט ממנה. "DeepSeek מציגה התקדמות מדהימה ב-AI והיא דוגמה מושלמת ל-Test-Time Scaling (שיטה לשיפור ביצועי המודלים בשלב ההיסק, א.א.)", מסר דובר מטעם NVIDIA, והוסיף כי "DeepSeek ממחישה כיצד ניתן לייצר מודלים חדשים באמצעות טכניקה זו, תוך מינוף של מודלים קיימים וטכנולוגיות מחשוב שעומדות בתקנות הייצוא (שאנבידיה מאוד לא מרוצה מהן, א.א.)". בחברה כמובן לא התייחסו למחיקת הערך האדירה שלה הוביל הסטארטאפ הסיני הקטן, ונשארו דיפלומטיים – לפחות בינתיים.

המתחרה הגדול מפרגן, בערך

אבל לא רק אנבידיה הגיבה לתופעה. גם המתחרה הגדול, מנכ"ל OpenAI סם אלטמן, פרסם שורת ציוצים ב-X בתגובה להשקה האחרונה של הסטארטאפ הסיני. "R1 של דיפסיק הוא מודל מרשים, במיוחד במחיר שבו הוא מוצע", כותב אלטמן, אבל לא מפספס הזדמנות לעקוץ – "אנחנו כמובן נייצר מודלים טובים יותר". לדבריו, הוא שמח מאוד על התחרות החדשה ואף מציין כי OpenAI תקדים את ההשקה של מודלים חדשים בתגובה.

עם זאת, אלטמן לא אומר כי OpenAI תאמץ את הטריקים של DeepSeek, ותנסה לפתח מודלים עם פחות כוח מחשוב (compute), אלא להיפך: "אנחנו מאמינים כי יותר כוח מחשוב הכרחי היום יותר מאי פעם, כדי שנוכל להשלים את המשימה שלנו", כתב אלטמן כשהוא טוען כי "העולם יופתע מהדור הבא של המודלים (שישוחררו)".

מי שעוד פרגן לחברה הסינית הוא פרופסור יאן לקון, אחד החוקרים הנחשבים בעולם ה-ML וה-AI, ומי שמרכז את מאמצי מטא בתחום שאמר בתגובה להשקה של המודל של DeepSeek: "אנשים שרואים את הביצועים של DeepSeek וחושבים: 'סין עוקפת את ארה"ב בתחום ה-AI' – אתם מפרשים זאת לא נכון. הפירוש הנכון הוא: 'מודלים בקוד פתוח עוקפים מודלים סגורים'… דיפסיק הרוויחו ממחקר פתוח וקוד פתוח (לדוגמה, PyTorch ו-Llama של Meta). הם פיתחו רעיונות חדשים ובנו אותם על בסיס עבודות של אחרים. מכיוון שעבודתם פורסמה והיא בקוד פתוח, כולם יכולים להרוויח מכך. זו העוצמה של מחקר פתוח וקוד פתוח".

גם הנשיא טראמפ, שידוע ביחס המיוחד שהוא מעניק לחברות טכנולוגיה סיניות, הגיב על הפיתוח. בריאיון ל-BBC אמר טראמפ שסטארטאפ ה-AI הסיני הוא "קריאת השכמה לתעשיה שלנו". טראמפ הוסיף שכדי לנצח, האמריקאים צריכים להיות ממוקדים בתחרות "כמו לייזר". טראמפ הוסיף שהוא רואה יתרון בעלות הנמוכה של המודלים הסיניים ואמר: "במקום להוציא מיליארדים על גבי מיליארדים, תוציאו פחות ותגיעו, בתקווה, לאותו פתרון".

גם מנכ"ל אינטל לשעבר מאמץ

לא רק אלטמן התרשם מהמודל הסיני. פאט גלסינגר, מנכ"ל אינטל לשעבר ומי שהוא יו"ר הדירקטוריון של סטארטאפ בשם Gloo – המפתח מערכת לתקשורת פנימית בין כנסיות (כן, זה אמיתי) – אמר: "המוצר הפתוח מנצח. דיפסיק יעזור לנקות את העולם של מודלי ה-AI הגדולים שהולך ונסגר", כתב גלסינגר ב-X. גלסינגר אמר ל-TechCrunch כי הוא ואנשי Gloo התרשמו כל כך מ-R1 – מודל ההיסק של דיפסיק שמתחרה ב-o1 של OpenAI – שהם מתכננים להטמיע אותו לתוך המוצר שלהם. "המהנדסים בגלו כבר מריצים את R1. הם יכלו לבחור ב-o1 – אך יכלו לעשות זאת רק דרך ה-API". לדבריו המהפכה הגדולה של דיפסיק תהיה לא רק ההנגשה של AI לכולם, אלא הנגשה של AI מוצלח יותר לכולם.

כל כך גדולים שמתקפת הסייבר הגיעה

אבל עם הגדילה, הפרסום והזינוק במשתמשים מגיעים גם כאבי ראש חדשים. אמש הכריז הסטארטאפ הסיני על עצירה זמנית של הרשמת משתמשים לאפליקציה ולצ'אט שלו "עקב שורה של מתקפות על שירותי דיפסיק". נכון לכתיבת שורות אלו, בהודעה שמופיעה בעמוד ההרשמה של דיפסיק מצוין כי בעקבות המתקפה המדוברת יש עומס על ההרשמות, אך הן לא סגורות. "תודה על ההבנה והתמיכה", נכתב בהודעה. בנוסף, אם כבר נרשמתם לשירות בימים האחרונים תוכלו להתחבר אליו כרגיל.

מקור - https://www.geektime.co.il/altman-says-openai-will-pull-up-new-models-and-nvidia-reacts-to-deepseek/