@א.מ. כתב בבקשת מידע | עבודה עם מודל להשלמת קוד אופליין:
@א.מ.ד. יש לי 8GB VRAM ו-64GB RAM, אני משתמש ב:
gpt oss 20B
Qwen3 30B A3B Q4_K_M
Mistral Small 3.1 24B Instruct Q4_K_M
אם אתה מכיר משהו יותר טוב - תעדכן.
קודם כל בטווח הגודל שהזכרת:
Devstral Small 2 24B, שמבוסס על Mistral Small 3.2 נועד לקידוד.
Mistral Small 3.2 24B - מעודכן יותר ממה שיש לך.
Qwen3.5 35B A3B - יצא היום, כולל יכולות ראייה, מהיר מאוד.
Qwen3.5 27B - יצא היום, כולל יכולות ראייה, אמור להיות טוב יותר כי הוא מודל "צפוף" (כל הפרמטרים פעילים) אבל לכן גם איטי יותר, וירוץ אצלך על ה-CPU בלבד.
LFM2 24B A2B - גם כן יצא היום, יכולות מפתיעות במהירות מטורפת.
GLM-4.7-Flash 30B A3B - יצא לפני כחודש.
Gemma 3 27B - די ישן אבל עדיין המלך הבלתי מעורער של כתיבה יוצרת ותחומים נוספים כמו רב לשוניות. גם כן מודל צפוף ואיטי.
אבל לפי החומרה שלך, לכאורה תוכל להריץ בקלות גם את Qwen Next Coder 80B A3B, שהוא אחד המודלים המדוברים.