בירור | בירור עלויות מחשב עם RTX 3500 Ada

אהרון שלום

@css-0
בנייח של דל

הישבשר המלומד

אני גם בהתחלה חשבתי להשקיע וכו' אבל אז גילתי את זה https://openrouter.ai/ זה הכי שווה שיש אתה יכול לעשות API חינמי למודלים החזקים בעולם היום וכן לעשות שימוש בהרבה מודלים אני שמתי 5 דולר ויש לי שימוש במודל Llama 3.1 405B (אומרים שהוא הכי טוב בעולם בקוד פתוח לא מבין בזה כ"כ) ויש לך גם API חינמי לזה Gemma 4 31B שהוא חמוד לגמרי

א.מ.ד.

@הישבשר-המלומד כתב בבירור | בירור עלויות מחשב עם RTX 3500 Ada:

ויש לי שימוש במודל Llama 3.1 405B (אומרים שהוא הכי טוב בעולם בקוד פתוח לא מבין בזה כ"כ)

מסתבר ש-AI אמר לך את זה. הוא היה הכי טוב לפני שנתיים.

הישבשר המלומד

@א.מ.ד. נכון (כבר אמרתי שאני לא מבין בזה כ"כ) אז מה הכי טוב כיום?

א.מ.ד.

@הישבשר-המלומד כתב בבירור | בירור עלויות מחשב עם RTX 3500 Ada:

@א.מ.ד. נכון (כבר אמרתי שאני לא מבין בזה כ"כ) אז מה הכי טוב כיום?

נכון להרגע ככל הנראה דיפסיק 4 פרו.

הישבשר המלומד

@א.מ.ד. בקידוד כן?

א.מ.ד.

@הישבשר-המלומד הוא יצא רק לפני יומיים, כן? אבל בינתיים זה נראה שבהכל.

המלאך

@א.מ.ד. כתב בבירור | בירור עלויות מחשב עם RTX 3500 Ada:

נכון להרגע

אהבתי.
זה באמת מטורף. ככה לפחות הוא נשמע לפי הצהרות החברה.
רק דבר אחד לא ברור. מה היכולות שלו באבטחה? כמו אופוס וGPT5.5?

הישבשר המלומד

@א.מ.ד. לא יודע למה אבל גימני אומר שזה יותר טוב

איזה מודל יותר טוב דיפסיק 4 פרו או Llama 3.1 405B

השוואה בין DeepSeek-V3 (או הגרסאות המתקדמות שלו המכונה לעיתים "4" בהקשרים שיווקיים) לבין Llama 3.1 405B היא מרתקת, שכן שניהם מייצגים את קצה החנית של עולם הקוד הפתוח (או "משקולות פתוחות").

הבחירה בניהם תלויה מאוד בצרכים הספציפיים שלך:

Llama 3.1 405B: הסטנדרט של Meta
זהו המודל הגדול והחזק ביותר של Meta עד כה. הוא תוכנן להתחרות ראש בראש עם GPT-4o.

יתרונות:

יכולת הכללה: בזכות גודלו העצום (
405
מיליארד פרמטרים), הוא מצטיין בהבנה עמוקה של הקשרים מורכבים ובידע כללי נרחב מאוד.

כתיבת קוד ולוגיקה: הוא נחשב לאחד המודלים הטובים בעולם לפתרון בעיות לוגיות מורכבות.

תמיכה רב-לשונית: הוא אומן על דאטה-סטים עצומים במגוון שפות.

חסרונות: דורש משאבי מחשוב אדירים כדי להריץ אותו באופן מקומי.

DeepSeek (סדרת V3 / R1)
DeepSeek הסינית פרצה לתודעה עם ארכיטקטורה יעילה מאוד (MoE - Mixture of Experts).

יתרונות:

יעילות ומהירות: בזכות מבנה ה-MoE, המודל מפעיל רק חלק מהפרמטרים שלו בכל רגע נתון, מה שהופך אותו למהיר יותר וזול יותר להרצה ביחס לביצועים שלו.

תכנות ומתמטיקה: במבחני ביצועים (Benchmarks) מסוימים, DeepSeek עוקף את Llama ו-GPT בתחומי התכנות והמתמטיקה המורכבת.

Context Window: לעיתים קרובות מציע ניהול זיכרון (הקשר) ארוך ויעיל מאוד.

חסרונות: לעיתים פחות "רהוט" בכתיבת תוכן יצירתי בשפות מסוימות בהשוואה ל-Llama.

טבלת השוואה מהירה
מאפיין Llama 3.1 405B DeepSeek V3/R1
גודל/ארכיטקטורה Dense (
405
B) MoE (יעיל ומהיר)
חוזק עיקרי הבנה רחבה, לוגיקה, כתיבה קוד, מתמטיקה, יחס ביצועים/עלות
זמינות רחבה מאוד (ענן ומקומי) רחבה, פופולרי מאוד בקרב מפתחים
שפה (עברית) טובה מאוד טובה, אך לעיתים פחות טבעית מ-Meta
בשורה התחתונה:
אם אתה מחפש את המודל החכם והיציב ביותר למשימות כלליות, ניתוח טקסטים ארוכים והבנה עמוקה - Llama 3.1 405B הוא כנראה הבחירה הבטוחה יותר.

אם המטרה שלך היא כתיבת קוד, פתרון בעיות מתמטיות או שאתה מחפש ביצועים מעולים בעלות נמוכה יותר - DeepSeek עשוי להפתיע אותך לטובה.

לאיזה צורך ספציפי אתה מתכוון להשתמש במודל? (כתיבת קוד, ניתוח נתונים, או כתיבת תוכן?)

יכול להיות שזה בגלל שזה יצא לפני יומים אז הוא לא מעודכן כ"כ

המלאך

@הישבשר-המלומד כי הוא לא מעודכן. הוא מכיר רק את 3.
אחת מתוך מלייארדי הבעיות של ג'מיני.

המלאך

@הישבשר-המלומד כתב בבירור | בירור עלויות מחשב עם RTX 3500 Ada:

יכול להיות שזה בגלל שזה יצא לפני יומים אז הוא לא מעודכן כ"כ

לצערי גם בדברים שיצאו לפני חצי שנה הוא לא מעודכן.
הוא מעודכן לשעת האימון.

א.מ.ד.

@הישבשר-המלומד כתב בבירור | בירור עלויות מחשב עם RTX 3500 Ada:

@א.מ.ד. לא יודע למה אבל גימני אומר שזה יותר טוב

Spoiler

יכול להיות שזה בגלל שזה יצא לפני יומים אז הוא לא מעודכן כ"כ

עשרות שגיאות בתשובה אחת של ג'מיני

א.מ.ד.

@המלאך כתב בבירור | בירור עלויות מחשב עם RTX 3500 Ada:

לצערי גם בדברים שיצאו לפני חצי שנה הוא לא מעודכן.
הוא מעודכן לשעת האימון.

תלוי איזה מודל. מודל הפרו מחפש בצורה הרבה יותר יסודית. גם הפלאש אם אתה מבקש ממנו נכון עושה עבודה יפה.

המלאך

פוסט זה נמחק!

הישבשר המלומד

עכשיו שאני גם יורד לזה לעומק הוא ממש זול וטוב ה DeepSeek V4 Flash שווה ממש למשתמשים לאנדרואיד סטידו בתור תוספ סוכן זה יעשה עבודה מצוינת במחיר כמעט אפסי (0.13 אגורות למליון תווים באנגלית זה כלום)

א.מ.ד.

@הישבשר-המלומד כתב בבירור | בירור עלויות מחשב עם RTX 3500 Ada:

(0.13 אגורות למליון תווים באנגלית זה כלום)

למיליון טוקנים. זה בערך 0.7 מיליון מילים באנגלית.
אבל הפרו טוב הרבה יותר, תנסה אותו.

הישבשר המלומד

@א.מ.ד. אבל גם יותר יקר פי 3

א.מ.ד.

@הישבשר-המלומד כתב בבירור | בירור עלויות מחשב עם RTX 3500 Ada:

@א.מ.ד. אבל גם יותר יקר פי 3

עדיין אפסי. ורק הוא מתקרב ליכולות של המודלים הגדולים. מודל הפלאש נועד להתחרות במודלים הבינוניים הפתוחים, לא להיות מספר 1.

הישבשר המלומד

@א.מ.ד. נכון אבל למפתח קלאסי שמפתח אפליקציות קלאסי באנדרואיד סטדיו לא עכשיו בעיות סבוכות וכו' אין צורך להשקיע (באופן יחסי על המודל היותר יקר) לא?