הסבר | מה זה Vertex AI

א.מ.ד.

לא רעיון מומלץ בכלל.

לכל היותר אפשר לשלם על API של מודלים פתוחים, שהם זולים הרבה יותר ממודלים קנייניים.
למשל דרך openrouter

עלות של הרצה עם שרת אישי תהיה גבוהה הרבה יותר ופחות יציבה.

אי אפשר להתחרות בעלויות הזולות של התפעול של ספקי API גדולים

לא בטוח בכלל. הספקים גוזרים קופון שמן על הדרך לעצמם. הבנתי ממנו שהוא צריך כמויות גדולות, וגם RAG שותה טוקנים בקצב, אז עדיף לשכור שרת או חומרה פיזית.
יש גם נקודה חשובה של פרטיות, שהיא קריטית בעסקים. הספקים הגדולים מוכרים כל טוקן שעובר דרכם וזה המסבסד העיקרי.

אין לי משג מה גודל העסק שלו, אבל אם הוא יציב ועם מספיק לקוחות עדיף לו בהחלט לרכוש כרטיסי מסך יד 2 ולהקים שרת ביתי.

עידו300

@א.מ.ד. לא לא לא גדול בכלל, אבל מנסה להגדיל.

NH.LOCAL

@א.מ.ד. אני מתקשה להאמין שזה יצא זול יותר. מעבר לעלויות הרכישה הראשוניות.
לספקי API גדולים יש אפשרות לייעל ולחסוך בעלויות חשמל ותפעול, בצורה שאין למשתמש פרטי

לדוגמה, ב-1000$ ניתן לרכוש שימוש במודל Gemma 4 31B בסדר גודל הבא בערך:

7.69 מיליארד טוקני קלט
2.63 מיליארד טוקני פלט

א.מ.ד.

@עידו300 כתב בהסבר | מה זה Vertex AI:

@א.מ.ד. לא לא לא גדול בכלל, אבל מנסה להגדיל.

אז תתחיל מ-API של ספקים גדולים (תשווה כל הזמן כי הפערים גדולים) - זה הכי יציב כרגע וגם לא תשלם על זמן מת, כשתגדל עוד בעז"ה - תשכור שרת פרטי ותריץ בעצמך, וכשתגדל עוד תרכוש חומרה מתאימה. עלות כל ההקמה תעלה לך בין 15 ל-20 אלף, עם תשלום חודשי של כ-300 ש"ח לחודש על החשמל אם תשתמש נניח ב-10 מיליון טוקנים בחודש, וזה יכסה את עצמו תוך שנה.

א.מ.ד.

@NH.LOCAL כתב בהסבר | מה זה Vertex AI:

@א.מ.ד. אני מתקשה להאמין שזה יצא זול יותר. מעבר לעלויות הרכישה הראשוניות.
לספקי API גדולים יש אפשרות לייעל ולחסוך בעלויות חשמל ותפעול, בצורה שאין למשתמש פרטי

תחשב עלות API לעומת עלות חשמל... כמה מאות ש"ח לעומת כמה אלפי ש"ח בחודש...

NH.LOCAL

@א.מ.ד. כתב בהסבר | מה זה Vertex AI:

תחשב עלות API לעומת עלות חשמל... כמה מאות ש"ח לעומת כמה אלפי ש"ח בחודש...

@א.מ.ד. כתב בהסבר | מה זה Vertex AI:

אם תשתמש נניח ב-10 מיליון טוקנים בחודש, וזה יכסה את עצמו תוך שנה.

העלות של 10 מיליון טוקנים עם Gemma 4 31B היא בערך 7.5 שקל (!)

אפילו ג'מיני 3 פרו, יעלה בסביבות 210 ש"ח בלבד לכמות הזו.

ב-15 אלף ש"ח ניתן יהיה לרכוש כ-20 מליארד טוקנים, כמות שיכולה להחזיק את כל חברי הפורום למשך חודשים

חוששני שאתה לא מודע כמה מחירי המודלים הפתוחים (ומודלים בכלל) זולים דרך ממשקי API
וכמובן במקרה הנוכחי של @עידו300 זו הצעה לא רלוונטית כלל

א.מ.ד.

@NH.LOCAL אתה צודק, טעיתי עם הכמויות. חישבתי עכשיו, ועד 2-3 מיליארד טוקנים לחודש הכי משתלם זה API, יותר מזה הכי משתלם זה שכירת שרת, ומעל 8 מיליארד טוקנים כדאי לקנות חומרה יד 2.
כמובן זה כמויות אסטרונומיות של חברה גדולה. אז מסתבר שהכי יתאים כרגע זה אכן API עם מודל פתוח כמו שכתב @nh.local .
באמת הופתעתי מהמחירים ב-API. אני חושב להתחיל לשלם על זה במקום לרנדל בין ספקים חינמיים עם הגבלות קצב מציקות...

אני כנראה מושפע מההתלהבות של r/LocalLLaMA שהדבר האחרון שמעניין אותם זה עלות...

NH.LOCAL

@א.מ.ד. כתב בהסבר | מה זה Vertex AI:

אני כנראה מושפע מההתלהבות של r/LocalLLaMA שהדבר האחרון שמעניין אותם זה עלות...

למעשה מודלים מקומיים בהחלט משפיעים על העלות. רק בגלל שהם קיימים ניתן לרכוש API במחירים זולים כל כך...
וזה כמובן גם מכריח את החברות הגדולות להוריד מחירים על המודלים הקניניים

א.מ.ד.

@NH.LOCAL כתב בהסבר | מה זה Vertex AI:

וזה כמובן גם מכריח את החברות הגדולות להוריד מחירים על המודלים הקניניים

זו הייתה הטקטיקה של גוגל עם GEMMA נגד GPT, עד שג'מיני סגר את הפער.

עידו300

@NH.LOCAL כתב בהסבר | מה זה Vertex AI:

Gemma 4 31B

במה היא טובה?

NH.LOCAL

@עידו300 טוב בהכל, זה מודל ממש טוב בקטגוריית המודלים הפתוחים הקטנים

השאלה שוב - מה הצרכים שלך(

עידו300

@NH.LOCAL בעקרון RAG, אבל אם גם טוב בתכנות אז יותר טוב.
אני צריך גם שיהיה מהיר יבין ענין מהר ויענה נכון מהר (שירות לקוחות דרך ימות המשיח, SIP לתת הרגשה של שיחה, צריך שיענה רק לפי החומר שנותנים לו ולא יתחיל לחרטט או יענה על ידע כללי)