בקשת מידע | DeepSeek המודל הסיני
-
@נעזר1000 כתב בבקשת מידע | DeepSeek המודל הסיני:
@אהרן כתב בבקשת מידע | DeepSeek המודל הסיני:
מישהו בדק שזה באמת לא מעביר אליהם נתונים כשהמחשב כן מחובר לרשת, ואולי אפילו באופליין הוא שומר הכל וברגע החיבור מעביר? פשוט זה סינים והם מאד חשודים בדברים האלו.
ברור שאתה מעביר אליהם נתונים ארחת איך השרתים שלהם יעבדו את הבקשה שלך ויחזירו תשובה.
השאלה הגדולה היא איך הם מתנהלים עם הנתונים
וכמו כתבת על סינים א"א לסמוך (ולא רק עליהם) ולכן תיזהר עם המידע שאתה מכניס לו.התכוונתי לזה -
@gon-kandi כתב בבקשת מידע | DeepSeek המודל הסיני:
מי שלא רוצה שההודעות שלו ילכו לשרתי החברה הסינית הזאת אפשר לדבר איתו גם בלי שהנתונים עוברים לשרת https://huggingface.co/spaces/webml-community/deepseek-r1-webgpu
האם זה באמת בטוח ששום דבר לא עובר אליהם
-
3 פרקים מרתקים נוספים + עדכון מניות בספוילר...
פרק ח'
מיקרוסופט ו-OpenAI חוקרות: האם Deepseek גנבה מהן מידע?
הבאזז סביב DeepSeek מתחלף ביממה האחרונה בביקורת נגד הסטארטאפ הסיני
לצד השבחים על הטכנולוגיה ודרך הפיתוח של Deepseek, זה היה צפוי, אבל עכשיו גם עולים סימני שאלה ומגיעות ביקורות.
המשקיע האמריקאי דיוויד סאקס, ראש תחום ה-AI והקריפטו בממשל האמריקאי, עלה הלילה (ד') למתקפה נגד מפלצת הבאזז הסינית. "יש ראיות משמעותיות המצביעות על כך ש-DeepSeek השתמשו במידע מהמודלים של OpenAI ואני לא חושב ש-OpenAI מרוצה מכך", אמר סאקס בריאיון לרשת Fox News. סאקס טוען כי בסטארטאפ הסיני השתמשו בשיטה בשם Distillation, שבמסגרתה חוקרים או מפתחים לוקחים את הפלט שמגיע מהמודלים הגדולים של חברה אחת – במקרה הזה של OpenAI – כדי לאמן את המודלים הקטנים שלהם. הרעיון הוא לקחת את הפלט מהמודלים החזקים יותר כדי לייצר מראש בסיס אימון טוב יותר למודל הקטן, כדי שזה יוכל לפתח יכולות זהות למודל שממנו נלקח המידע. עם זאת, סאקס לא סיפק עובדות או הוכחות לטענות החמורות.
אבל על פי דיווחים של מספר כלי תקשורת אמריקאיים, הדברים של סאקס לא מגיעים יש מאין, וסם אלטמן כבר עדכן את עובדי OpenAI כי החברה מנסה להבין אם המודלים של DeepSeek אכן מוצלחים כל כך כי נעזרו במידע שהגיע מהמודלים שלהם. לחקירה של OpenAI הצטרפו גם חוקרי אבטחה במיקרוסופט, השותפה והמשקיעה המרכזית ב-OpenAI, שעל הענן שלה יושבים המודלים של OpenAI, בניסיון לפענח האם בדיפסיק אכן הצליחו להגיע למידע מהמודלים של OpenAI בדרך לא חוקית. על פי דיווח של בלומברג, חוקרים של מיקרוסופט זיהו לפני מספר חודשים כי גורמים, שכיום הם חושדים שיש להם קשר ל-DeepSeek, הוציאו בדרך לא חוקית כמויות גדולות של מידע מה-API של OpenAI.
חיל האמריקאי בהודעה לחיילים: אל תשתמשו במודלים הסיניים
אבל עוד לפני שהסטארטאפ הסיני עלה לכותרות, דווח כי חיל הים האמריקאי הקדים תרופה למכה ודרש מאנשיו: אל תשתמו במודל. ראש תחום אבטחת המידע של חיל הים האמריקאי שלח מייל בתפוצת ענק לאנשי החיל, שבו אמר להם כי אין להשתמש במודל מכיוון שהוא "מעלה חששות מבחינת אבטחה ואתיקה, הנובעים מהמקור (סין, א.א.) שלו". במייל נכתב כי על אנשי חיל הים להימנע מהורדה, הרצה או הפעלה של המודל דרך הדפדפן שלהם בכל היקף.
האיטלקים נותנים לו את טיפול ChatGPT
הביקורת לא עוצרת בארצות הברית, ו-DeepSeek מוצאת את עצמה בחברה טובה, לאחר שקיבלה פנייה ראשונה מרגולטור בתחום הפרטיות – זה של איטליה. רשות הפרטיות האיטלקית פנתה יחד עם ארגון להגנה על הצרכנים באיחוד האירופי ל-DeepSeek, כדי לוודא כי המודלים שלה עומדים בתקנות הפרטיות המחמירות של האיחוד – ה-GDPR. המידע של מיליוני איטלקים, נכתב בפנייה של רשות הפרטיות האיטלקית לדיפסיק, ואיתה דרישה למענה תוך 20 יום. נכון להיום, מדיניות הפרטיות של הסטארטאפ הסיני קובעת כי המידע של המשתמשים בו עובר לשרתים שלו, הנמצאים בסין – מה שאומר שהוא לא עומד בתקנות הפרטיות של האיחוד האירופי. עם זאת, חשוב להדגיש כי מדובר רק על שירות הצ'ט והאפליקציה – אם אתם מורידים את המודל הפתוח ומריצים אותו מקומית – כל המידע נשאר לכאורה על המחשב שלכם.
נזכיר כי זו לא הפעם הראשונה שרשות הפרטיות האיטלקית פונה לחברת ה-AI כדי לוודא שהיא מטפלת כראוי במידע של משתמשים איטלקים. מקרה דומה קרה בתחילת 2023, אז חקירה של הרשות הגיעה עד לכדי חסימה זמנית של ChatGPT במדינה מכיוון ש-OpenAI לא עמדה בתנאי ה-GDPR ועיבדה את המידע של משתמשים במדינה בשרתים בארה"ב.
החוקרים שרוצים ליצור גרסה "פתוחה באמת"
מלבד הביקורות הממסדיות, יש מי בקהילת ה-AI שטוענים כי למרות ש-DeepSeek שוחרר בקוד פתוח ברישיון שמאפשר הטמעה שלו במוצרים מסחריים ללא תשלום כלשהו לסטארטאפ הסיני – הוא לא פתוח באמת. חוקרים בפלטפורמת ה-AI המצליחה HuggingFace החליטו לנסות לייצר גרסה פתוחה באמת של המודל. ראש תחום המחקר של האגינג פייס, לאנדרו וון וורה, שחרר יחד עם חוקרים נוספים בחברה את Open-R1 – פרויקט שרוצה לשכפל את מודל ההיסק האובר-פופולרי של DeepSeek בתצורה פתוחה באמת.
החוקרים אומרים כי למרות שהמודל שוחרר לקהל הרחב הוא לא באמת בקוד פתוח, מכיוון שהוא עדיין "קופסה שחורה" שלתוכה נכנס מידע מסוים ויוצא מידע אחר – מבלי להבין מה התהליך שקורה בדרך. מה שנקרא בדרך כלל "הרוטב הסודי" של החברות. במקרה הזה, DeepSeek לא שונה מכל חברות ה-AI האחרות ששומרות את החלק הזה קרוב לחזה שלהן – ואת זה מנסים לשכפל החוקרים של HuggingFace. החוקרים אומרים כי מה שמעניין אותם זה מיקסום הפוטנציאל של המודל עבור קהילת המחקר והמשתמשים.
מקור - https://www.geektime.co.il/deepseek-criticism-in-on-the-rise/
פרק ט'
אל תטמיעו את DeepSeek בפיתוח לפני שאתם בודקים את הדברים האלו
המודל הסיני שעלה לכותרות השבוע העלה הרבה תהיות למפתחים. הינה כמה טיפים כדי לדעת אם הוא המודל הנכון עבורכם
מאת ניר גזית
הרשת מלאה בהשוואות וניתוחים של המודל הסיני החדש, DeepSeek R1. על פניו, נראה שהביצועים שלו משתווים ואף מתעלים על אלו של מודלים אמריקאיים מובילים כמו o1 של OpenAI ו-sonnet 3.6 של Anthropic במדדים מסוימים; כך למשל, R1 פותר תרגילי חשבון בדיוק של 97.3% (לעומת 96.4% של OpenAI). בנוסף, DeepSeek גם מציעים את המודל באלפית מהעלות של מודלים מקבילים – מה שגורם לכל מי שבונה היום מוצר על בסיס המודלים הללו לחשוב – האם כדאי לי לעבור מודל?
קודם כל, כדי להבין יותר טוב איך לבחון את המודל צריך להסביר איך המודל אומן ואיך הוא הגיע לביצועים כאלו טובים. אחת הטכניקות שבה השתמשו כדי לשפר את הביצועים של המודל נקראת Distillation. בשפה פשוטה, לקחו מודל חכם וגדול יותר כמו o1 של OpenAI, הזינו אותו בכמה מאות פרומפטים ואספו את התשובות שהוא נתן. לאחר מכן, DeepSeek השתמשו בדוגמאות האלו כדי לאמן ולשפר את המודל שלהם. באופן הזה, המודל שלהם למד לחקות את המודל של OpenAI ולענות בצורה דומה לאיך שהוא היה עונה לשאלות מסוימות. אבל כאן בדיוק טמונה הבעיה – זו קצת אשליה. המודל לא עובד טוב בכל משימה, אלא רק במשימות שקרובות לדוגמאות שניתנו לו במהלך האימון. וכך אנחנו מקבלים מודל שיעבוד טוב עבור משימות מסוימות, אבל לא על כולן.
למה חשוב לשים לב?
כשאנחנו בוחנים האם כדאי לעבור למודל החדש עבור המוצר שלכם, יש כמה דברים שאני ממליץ לבחון לפני ביצוע המעבר.
קודם כל, אני מציע לאסוף דוגמאות מגוונות של השימוש במוצר שלכם. ממש לקחת פרומפטים וקלטים שמוכנסים היום למודל שאתם עובדים איתו כחלק מהמוצר. בעקבות התחומים שבהם המודל עלול להיות חלש יותר (כפי שכתבתי למעלה) הדגש המשמעותי צריך להיות על הגיוון. ולכן כדאי לקחת דוגמאות אמיתיות, ממש מפרודקשן, מאיך שהלקוחות שלכם משתמשים במוצר. אל תסתפקו בפחות מכמה מאות דוגמאות כאלו.
נניח למשל שאנחנו משתמשים היום ב-o1 כדי לענות למשתמשים על שאלות על בסיס ספר החוקים הישראלי. בשלב הראשון, נאסוף דוגמאות של שאלות שהמשתמשים שלנו שאלו. כעת, נריץ את המודל הנוכחי שלנו (o1) ואת DeepSeek אחד לצד השני ונייצר השוואה. הגיוון בדוגמאות עשוי לחשוף את האזורים שבהם הוא פחות טוב או מתאים למוצר שלכם. כנראה שכבר בהסתכלות ראשונית ידנית תוכלו לבחון ולראות אם יש הבדלים משמעותיים.
כעת כדאי להשתמש בכלים אוטומטיים כדי לבחון ולהשוות בין הביצועים. אחת הטכניקות המקובלות בעולם נקראת LLM-as-a-Judge, בה משתמשים במודל אחר כדי להשוות ולבחון ביצועים של מודל אחד. השתמשו במודל חזק של OpenAI או Anthropic כדי להשוות בין התשובות שקיבלתם בכל אחת מהריצות, או לזהות את ההבדלים. אל תבקשו מהמודל פשוט לספר לכם על ההבדלים בין התשובות – תנסו לייצר השוואה מתמטית מדויקת שתאפשר לכם לבחון את הביצועים בצורה סכמטית.
נחזור לדוגמה שלנו. נריץ את המודלים זה לצד זה ונקבל אוסף של תשובות לשאלות מכל מודל. אפשר למשל להשתמש ב-LLM-as-a-Judge כדי לזהות Hallucinations – מקרים שבהם המודל המציא תשובה במקום להחזיר תשובה שהופיעה בספר החוקים. נוכל להשתמש ב-LLM כדי לוודא שאפשר למצוא את התשובה שהוחזרה אכן קיימת בטקסט המקורי מספר החוקים. נספור את כל הפעמים שזה לא המצב – וכך נוכל לייצר השוואות בין המודלים.
טכניקה נוספת שכדאי להטמיע בעת ההשוואה היא הרצה של המודל מספר פעמים. מודלי השפה הם לא דטרמינסטיים, ולכן הם יחזירו תשובות שונות על אותן שאלות אם נריץ אותם מספר פעמים. לכן כדאי להריץ את המודל מספר פעמים, לאסוף את התשובות שהתקבלו על כל השאלות ולבצע את השוואות כמו שתיארנו לעיל.
אם המודל הצטיין (או לפחות היה טוב כמו המודל הנוכחי שלכם) – מעולה. אפשר להחליף ל-DeepSeek ולחסוך בעלויות באופן משמעותי (ואולי אפילו לשפר את הביצועים). למרות זאת, לא מומלץ להשתמש במודל ישירות דרך DeepSeek, שמצהירים באופן גלוי שהם אוספים את כל המידע שנשלח אליהם לצרכים פנימיים שלהם. כיוון שהמודל שוחרר בפורמט קוד פתוח ברישיון חופשי (MIT), כל אחד יכול להריץ את המודל בעצמו. אתם יכולים להריץ אותו בעצמכם ב-Cloud Provider שלכם, או להשתמש באחד השירותים האמריקאים שכבר היום מציעים את המודלים האלה – למשל Groq ו-Together.ai.
רעש מוצדק ופחות
הרעש סביב המודל החדש מוצדק ולא מוצדק. מצד אחד, המודל מציג ביצועים מרשימים, הוא שוחרר כקוד פתוח והחברה מציעה אותו בעלויות מגוחכות. מצד שני, הטכניקה שבה הוא אומן מלמדת אותנו שהוא כנראה לא ישתווה למודלים המובילים היום עבור כל אפליקציה – וחייבים לבחון אותו לעומק לפני שרצים להחליף.
ניר גזית הוא מנכ"ל הסטארטאפ הישראלי traceloop
מקור - https://www.geektime.co.il/what-to-consider-before-moving-to-deepseek/
פרק י'
וויז חושפת פרצה מביכה ודליפת מידע ענקית ב-DeepSeek
חוקר ביוניקורן הסייבר הישראלי מצא תוך דקות ספורות דאטה-בייס חשוף לחלוטין שנתן לו גישה למידע רגיש ביותר ששמר הסטארטאפ הסיני
אחרי כל ההתפעלות וההייפ של DeepSeek, מגיע עכשיו גילוי שעלול להביך את החברה, והוא מגיע מצידה של ענקית הסייבר הישראלית Wiz של אסף רפפורט.
גישה לכמות אדירה של מידע תוך דקות
גל נגלי, חוקר ביוניקורן הסייבר הישראלי Wiz, הצליח למצוא פרצת אבטחה חמורה ביותר במפלצת ה-AI הסינית שמטריפה את העולם: DeepSeek. עם הפריצה של DeepSeek אחרי השקת מודל R1, עשה נגלי מה שכל חוקר סייבר טוב עשה, והתחיל לחפור בממשקים ובמערכות של החברה הסינית. די מהר גילה נגלי דאטה-בייס ClickHouse – כלי בקוד פתוח – ששייך לסטארטאפ הסיני והיה חשוף לחלוטין עם כמות אדירה של מידע רגיש.
"הפרצה כוללת יותר ממיליון שורות לוגים בהן היסטוריית שיחות, מפתחות סודיים, מידע על הבקאנד (של דיפסיק) ומידע רגיש נוסף", כותב נגלי בפוסט שפרסם בבלוג של חטיבת המחקר של Wiz. הוא מוסיף כי ברגע שגילה את הפרצה החמורה הוא וצוות המחקר ביצעו אסגרה מול DeepSeek – שדאגה לסגור אותה במהירות. נגלי מספר כי במסגרת החקירה הוא בדק כל דומיין ותת-דומיין הקשורים לדיפסיק – ותוך דקות ספורות מצא שני פורטים חשופים שהובילו אותו בסופו של דבר לדאטה-בייס שנמצא בכתובות
oauth2callback.deepseek.com:9000 ו-dev.deepseek.com:9000.
מלבד העובדה שהפרצה המדוברת איפשרה לכל תוקף לכל גישה לכמות אדירה של מידע רגיש ושליטה מלאה בדאטה-בייס, נגלי מדגיש כי אחת הבעיות בה הייתה העובדה שהיא יכלה להוביל גם ל-Privilege Escalation. מדובר במצב שבו התוקפים מעמיקים את האחיזה שלהם במערכות שאליהן פרצו, על ידי קבלת הרשאות גבוהות יותר שיאפשרו להם לגשת למידע נוסף או לבצע שינויים בתוך המערכות של החברה.
על פי החוקר של וויז, אחרי שהצליח לגשת בקלות לדאטה-בייס של DeepSeek, הוא הצליח לנצל את הממשק של ClickHouse כדי להריץ פקודות SQL דרך הדפדפן כדי לגשת למידע בדאטה-בייס שמצא. "רמת הגישה (שגילינו) היוותה סיכון משמעותי ל-DeepSeek ולמשתמשים שלה", כותב נגלי, "תוקף יכל לא רק לגשת ללוגים רגישים ושיחות שנשמרו אלא יכל גם לגשת לסיסמאות שנשמרו ב-plaintext וקבצים המכילים מידע קנייני של החברה על ידי שימוש בפקודת
SELECT * FROM file('filename')
נגלי מציין בפוסט כי נמנע בביצוע פקודות מסוג זה במסגרת המחקר.
נגלי אמר כי הוא לא יודע אם חוקרים או תוקפים אחרים הצליחו לגלות גם הם את הפרצה החמורה של דיפסיק, אך אמר כי זה לא היה מפתיע אותו בהתחשב בקלות שבה הוא מצא אותה. ואם גם אתם תוהים איך לעזאזל חוקרי וויז בכלל ביצעו אסגרה מול החברה הסינית, שאפופה בלא מעט ערפל של מסתורין? ובכן, הם פנו לכל כתובת מייל ומשתמש בלינקדאין שנראה שהיה לו קשר לחברה בשלב כלשהו.
מקור - https://www.geektime.co.il/wiz-finds-major-breaches-in-deepseek/
מדדי מניותמייקרוסופט צלחו בהתחלה את המשבר אבל אז...
לאנבידיה היו זמנים יותר טובים מתחילת המשבר...
גוגל התאוששו ואפי' עלו במקצת...
ומטא בעליה נמרצת...
-
@אהרן תראה האתר הזה הוא לא שלהם זה פלטפורמה חברתית וגם מי שהעלה את זה לשם הוא לכאורה לא קשור אליהם (אפשר לבדוק את זה יותר לעומק) כך שמסובך להם להכניס לשם מערכת שתאסוף עליך נתונים ותשלח. כלומר אני לא שולל את האפשרות שהם אוספים מידע אבל לכאורה זה לא יותר סיכון מלהוריד ולהריץ על המחשב
-
@צללית כתב בבקשת מידע | DeepSeek המודל הסיני:
@NH-LOCAL יש איזה גירסה מכווצת עם ביצועים סבירים שאפשר להריץ על מחשב ביתי?
יש גרסאות 7B ו-8B, אבל הם כמובן רחוקות מהרמה של המודל המלא
@אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:
לא נראה לי שהסינים יצליחו, פשוט כי חברות בעולם לא יסמכו עליהם
אבל בינתיים כל המשתמשים נהנים מהתחרות...המודל שלהם כבר נמצא על השרתים של החברות האמריקאיות הגדולות כמו Azure של מיקרוסופט ו-AWS של אמזון
את החברות בעולם לא מעניין שום דבר חוץ מעלות-תועלת, והמודל R1 מספק זאת בהחלט
-
@loom כתב בבקשת מידע | DeepSeek המודל הסיני:
@NH-LOCAL אני רוצה להבין, יש בעצם שירות אמריקאי שמתחרה ישירות בחברת DEEPSEEK ע"י שימוש באותו מודל שלהם כי הוא קוד פתוח?
לא, לפי הבנתי הוא התכוון שהסינים עצמם משתמשים בחברות שרתים אמריקאיות להרצת המודל.
@צללית כתב בבקשת מידע | DeepSeek המודל הסיני:
@NH-LOCAL יש איזה גירסה מכווצת עם ביצועים סבירים שאפשר להריץ על מחשב ביתי?
@NH-LOCAL
יש גם גרסאות 1.5B ששוקלות כמה מאות MB בלבד, אבל האיכות כמובן לא משהו... -
@א-מ-ד כתב בבקשת מידע | DeepSeek המודל הסיני:
לא, לפי הבנתי הוא התכוון שהסינים עצמם משתמשים בחברות שרתים אמריקאיות להרצת המודל.
חברות אמריקאיות מריצות את המודל על השרתים שלהם כי הוא קוד פתוח ומאפשרים למשתמשים וחברות להשתמש בו כמו שאמר @אלי-ויל:
יש בעצם שירות אמריקאי שמתחרה ישירות בחברת DEEPSEEK ע"י שימוש באותו מודל שלהם כי הוא קוד פתוח.
@אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:
@NH-LOCAL
B7 B8 יש להם דרישות מסוימות?לא ממש. אבל מומלץ מינימום של 16 גי'גה ראם ומעבד סביר+
@אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:
מאוד מהר משתמשים במערב שקשורים לממשלות צבא וכדומה יאסר עליהם להשתמש בבינה המלאכותית הזאת
יתכן, מטעמים פוליטיים ומלחמות סחר
הרבה אנשים לא מעונינים שהסינים ידעו עליהם הכל...
זה לא רלוונטי. כי מדובר בקוד פתוח שאפשר להריץ במנותק מה-API של deepseek
-
@NH-LOCAL כתב בבקשת מידע | DeepSeek המודל הסיני:
@א-מ-ד כתב בבקשת מידע | DeepSeek המודל הסיני:
לא, לפי הבנתי הוא התכוון שהסינים עצמם משתמשים בחברות שרתים אמריקאיות להרצת המודל.
חברות אמריקאיות מריצות את המודל על השרתים שלהם כי הוא קוד פתוח ומאפשרים למשתמשים וחברות להשתמש בו כמו שאמר @אלי-ויל:
יש בעצם שירות אמריקאי שמתחרה ישירות בחברת DEEPSEEK ע"י שימוש באותו מודל שלהם כי הוא קוד פתוח.
לשימוש הציבור? חינמי? יש קישור?
@אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:
@NH-LOCAL
B7 B8 יש להם דרישות מסוימות?לא ממש. אבל מומלץ מינימום של 16 גי'גה ראם ומעבד סביר+
איפה מורידים ואיך משתמשים? הואדובר עברית?
-
@NH-LOCAL כתב בבקשת מידע | DeepSeek המודל הסיני:
יש גרסאות 7B ו-8B, אבל הם כמובן רחוקות מהרמה של המודל המלא
ראיתי שיש גירסאות של 8B שהם מבוססות על דיפסיק ועל לאמה, השאלה היא אם זה יותר טוב מסתם מודל לאמה של 8B
למעשה השאלה היא כזו, המודל הזה יותר טוב גם מבחינת התוצאות, או רק מבחינת משאבי האימון הזולים שלו [לפחות לפי הטענות של הסינים]. -
@אלי-ויל כתב בבקשת מידע | DeepSeek המודל הסיני:
מאוד מהר משתמשים במערב שקשורים לממשלות צבא וכדומה יאסר עליהם להשתמש בבינה המלאכותית הזאת.
מושל טקסס כבר אסר את השימוש בדיפסיק (ובעוד מספר אפליקציות סיניות) בטקסס...
@NH-LOCAL כתב בבקשת מידע | DeepSeek המודל הסיני:
חברות אמריקאיות מריצות את המודל על השרתים שלהם כי הוא קוד פתוח ומאפשרים למשתמשים וחברות להשתמש בו כמו שאמר @אלי-ויל:
דרך אגב בעניין הזה סם אלטמן הודה שאופן AI נמצאים בצד הלא נכון של ההסטוריה (כלשונו) בכל הקשור לקוד פתוח...
-
@חטח כתב בבקשת מידע | DeepSeek המודל הסיני:
@aiib כתב בבקשת מידע | DeepSeek המודל הסיני:
רק אצלי GPT והמודל הסיני קרסו במקביל?
אצלי GPT עובד רגיל.
גם המודל החזק?
אצלי הוא מתחיל לכתוב לעצמו מה הוא אמור להגיב לי ומסתפק בזה