בקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד
-
@המלאך אין לי בעיה עם אחד שלא פתוח בנט פרי רק אמרתי שבשביל אחד כזה מכיוון שחוקי הפורום אוסרים להעלות אחד כזה אשמח רק לדעת את שמו/ שמותיהם של המודלים המוצלחים ביותר להנ"ל.
יש לך אחד כזה?
ואגב נראה לי שאתה די מבין בזה תוכל לעשות לי סדר בכל מודלי האופליין כי אני רוצה לעבור עכשיו רק לאופליין ורוצה להחליף את כל השימוש שלי בגימיני עד היום השאילה אילו מודלים אצטרך לזה כי ממש לא ברור לי מה בדיוק היכולות של כל סוג מודל וכו'
נ.ב. די ברור לי שכל אלו לא יתחרו עם גימיני אך אשמח להתבדות.
תודה רבה לך!@שמואל-הסיני למיטב ידיעתי הכי טוב היום בתכנות הוא Qwen 3 Coder (האמת אולי Qwen 3.5 הרגיל עוקף את 3Coder)
-
@שמואל-הסיני למיטב ידיעתי הכי טוב היום בתכנות הוא Qwen 3 Coder (האמת אולי Qwen 3.5 הרגיל עוקף את 3Coder)
-
@רציונל מניסיון שלי איתו הוא נוראי לחלוטין.. (כמובן הוא כותב קוד עם מלא בעיות עיצוב נוראי קוד בעיתי) וכ"ו עזוב לקוד לעולם אם אין לך מחשב קוואנטי אל תשתמש באופליין...
-
@רציונל מניסיון שלי איתו הוא נוראי לחלוטין.. (כמובן הוא כותב קוד עם מלא בעיות עיצוב נוראי קוד בעיתי) וכ"ו עזוב לקוד לעולם אם אין לך מחשב קוואנטי אל תשתמש באופליין...
-
@המלאך אין לי בעיה עם אחד שלא פתוח בנט פרי רק אמרתי שבשביל אחד כזה מכיוון שחוקי הפורום אוסרים להעלות אחד כזה אשמח רק לדעת את שמו/ שמותיהם של המודלים המוצלחים ביותר להנ"ל.
יש לך אחד כזה?
ואגב נראה לי שאתה די מבין בזה תוכל לעשות לי סדר בכל מודלי האופליין כי אני רוצה לעבור עכשיו רק לאופליין ורוצה להחליף את כל השימוש שלי בגימיני עד היום השאילה אילו מודלים אצטרך לזה כי ממש לא ברור לי מה בדיוק היכולות של כל סוג מודל וכו'
נ.ב. די ברור לי שכל אלו לא יתחרו עם גימיני אך אשמח להתבדות.
תודה רבה לך!@שמואל-הסיני המודל הכי טוב לקידוד באופליין לחומרה כמו שלך הוא Qwen 3.5 9B. המודל הזה מסוגל אפילו להתמודד עם לולאת ניפוי שגיאות עצמיות בדומה לקלוד קוד (אני אישית חיברתי אותו לאופן-קוד).
אם הוא מידי כבד לך (לדוגמא אם במקביל פתוחות תוכנות כבדות כמו כרום), תרד לגרסת ה-4B. היא אומנם פחות טובה אבל עדיין הכי טובה בטווח הגודל הזה.אגב, הייתי ממליץ לך לנסות גרסאות מכווננות של גרסת ה-9B, כמו OmniCoder 9B, שכווננה במיוחד לקידוד סוכני, או Qwopus 3.5 9B V3 - כוונון של המודל המקורי על עקבות חשיבה של קלוד אופוס 4.6, שמקצר משמעותית את החשיבה המוגזמת של המודל המקורי, ולדעתי הוא יותר אמין ומדוייק.
אם חשוב לך עברית, יש את Gemma 4 E4B שיצא לפני כמה ימים, והעברית שלו מעולה והוא הכי אמין לשיחות כלליות עם שיעור הזיות מופחת, אבל הוא קצת פחות טוב בקידוד.
כל מודל תריץ בכימות של Q4_K_M, שחוסך לך רבע ממשאבי ה-RAM.
אם אתה משתמש ב-LM Studio, כברירת מחדל חשיבה מושבתת עבור המודל הזה. אם תזדקק תעדכן פה ואדריך אותך איך לגרום למודל לחשוב.
@CSS-0 כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
@רציונל מניסיון שלי איתו הוא נוראי לחלוטין.. (כמובן הוא כותב קוד עם מלא בעיות עיצוב נוראי קוד בעיתי)
Qwen 3 Coder הקטן ביותר הוא בגודל 30B, איך בדיוק הרצת אותו?
-
@המלאך אין לי בעיה עם אחד שלא פתוח בנט פרי רק אמרתי שבשביל אחד כזה מכיוון שחוקי הפורום אוסרים להעלות אחד כזה אשמח רק לדעת את שמו/ שמותיהם של המודלים המוצלחים ביותר להנ"ל.
יש לך אחד כזה?
ואגב נראה לי שאתה די מבין בזה תוכל לעשות לי סדר בכל מודלי האופליין כי אני רוצה לעבור עכשיו רק לאופליין ורוצה להחליף את כל השימוש שלי בגימיני עד היום השאילה אילו מודלים אצטרך לזה כי ממש לא ברור לי מה בדיוק היכולות של כל סוג מודל וכו'
נ.ב. די ברור לי שכל אלו לא יתחרו עם גימיני אך אשמח להתבדות.
תודה רבה לך!@שמואל-הסיני כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
ואגב נראה לי שאתה די מבין בזה תוכל לעשות לי סדר בכל מודלי האופליין כי אני רוצה לעבור עכשיו רק לאופליין ורוצה להחליף את כל השימוש שלי בגימיני עד היום השאילה אילו מודלים אצטרך לזה כי ממש לא ברור לי מה בדיוק היכולות של כל סוג מודל וכו'
אני חושב שהגיע הזמן שאכתוב פוסט על המודלים הקטנים...
-
@שמואל-הסיני כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
ואגב נראה לי שאתה די מבין בזה תוכל לעשות לי סדר בכל מודלי האופליין כי אני רוצה לעבור עכשיו רק לאופליין ורוצה להחליף את כל השימוש שלי בגימיני עד היום השאילה אילו מודלים אצטרך לזה כי ממש לא ברור לי מה בדיוק היכולות של כל סוג מודל וכו'
אני חושב שהגיע הזמן שאכתוב פוסט על המודלים הקטנים...
@א.מ.ד. אני נכנס עכשיו לאירוע כי אני עכשיו עובר למודלי אופליין אנסה להבין הכל תודה!
@א.מ.ד. כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
אני חושב שהגיע הזמן שאכתוב פוסט על המודלים הקטנים...
זה יכול להיות מאד יעיל לדעתי לפחות.
-
אשמח לדעת אם יש מודל כזה ואם יש כמה אז מה המומלץ ביותר אני לא צריך משהוא סוף עולם כי גם עד היום השתמשתי בעיקר בגימיני.
רק שהיום יש לי מחשב ללא אינטרנט ואני רוצה להשתמש בו גם עבור זה אז אם יש מודל כזה שמתאים לי אשמח לדעת עליו ואם הוא פתוח בנט פרי וממילא מאושר בפורום אשמח גם לקבל קישור ישיר להורדה שלו.
נ.ב. המחשב שלי 16 ראם ומעבד i7.
תודה רבה לכולם!!!!!מקווה שאין בעיה בחול המועד אשמח בכ"א שיודיעו לי אם יש בעיה כזו.
@שמואל-הסיני קח בחשבון - כל עוד אתה מריץ את זה על RAM ולא על VRAM - המודל יענה לך ממש לאט.
@א.מ.ד. כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
אם אתה משתמש ב-LM Studio, כברירת מחדל חשיבה מושבתת עבור המודל הזה. אם תזדקק תעדכן פה ואדריך אותך איך לגרום למודל לחשוב.
הצלחת להריץ את הgemma 4 על LM סטודיו? אני לא הצלחתי, ואני מריץ אותו על JAN
-
@שמואל-הסיני קח בחשבון - כל עוד אתה מריץ את זה על RAM ולא על VRAM - המודל יענה לך ממש לאט.
@א.מ.ד. כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
אם אתה משתמש ב-LM Studio, כברירת מחדל חשיבה מושבתת עבור המודל הזה. אם תזדקק תעדכן פה ואדריך אותך איך לגרום למודל לחשוב.
הצלחת להריץ את הgemma 4 על LM סטודיו? אני לא הצלחתי, ואני מריץ אותו על JAN
@חובבן-מקצועי כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
@שמואל-הסיני קח בחשבון - כל עוד אתה מריץ את זה על RAM ולא על VRAM - המודל יענה לך ממש לאט.
אני חדש באירוע ושואל: מסובך להריץ על VRAM אם לא למה יש אופציה שניה ואם כן יש איפשהוא דרך להבין את התהליך?
וגם מה ההבדל בכלל? -
@שמואל-הסיני המודל הכי טוב לקידוד באופליין לחומרה כמו שלך הוא Qwen 3.5 9B. המודל הזה מסוגל אפילו להתמודד עם לולאת ניפוי שגיאות עצמיות בדומה לקלוד קוד (אני אישית חיברתי אותו לאופן-קוד).
אם הוא מידי כבד לך (לדוגמא אם במקביל פתוחות תוכנות כבדות כמו כרום), תרד לגרסת ה-4B. היא אומנם פחות טובה אבל עדיין הכי טובה בטווח הגודל הזה.אגב, הייתי ממליץ לך לנסות גרסאות מכווננות של גרסת ה-9B, כמו OmniCoder 9B, שכווננה במיוחד לקידוד סוכני, או Qwopus 3.5 9B V3 - כוונון של המודל המקורי על עקבות חשיבה של קלוד אופוס 4.6, שמקצר משמעותית את החשיבה המוגזמת של המודל המקורי, ולדעתי הוא יותר אמין ומדוייק.
אם חשוב לך עברית, יש את Gemma 4 E4B שיצא לפני כמה ימים, והעברית שלו מעולה והוא הכי אמין לשיחות כלליות עם שיעור הזיות מופחת, אבל הוא קצת פחות טוב בקידוד.
כל מודל תריץ בכימות של Q4_K_M, שחוסך לך רבע ממשאבי ה-RAM.
אם אתה משתמש ב-LM Studio, כברירת מחדל חשיבה מושבתת עבור המודל הזה. אם תזדקק תעדכן פה ואדריך אותך איך לגרום למודל לחשוב.
@CSS-0 כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
@רציונל מניסיון שלי איתו הוא נוראי לחלוטין.. (כמובן הוא כותב קוד עם מלא בעיות עיצוב נוראי קוד בעיתי)
Qwen 3 Coder הקטן ביותר הוא בגודל 30B, איך בדיוק הרצת אותו?
@א.מ.ד. כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
כל מודל תריץ בכימות של Q4_K_M, שחוסך לך רבע ממשאבי ה-RAM.
מה דעתך על הכיווץ החדש? (מסוג NL)
-
@שמואל-הסיני קח בחשבון - כל עוד אתה מריץ את זה על RAM ולא על VRAM - המודל יענה לך ממש לאט.
@א.מ.ד. כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
אם אתה משתמש ב-LM Studio, כברירת מחדל חשיבה מושבתת עבור המודל הזה. אם תזדקק תעדכן פה ואדריך אותך איך לגרום למודל לחשוב.
הצלחת להריץ את הgemma 4 על LM סטודיו? אני לא הצלחתי, ואני מריץ אותו על JAN
@חובבן-מקצועי כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
הצלחת להריץ את הgemma 4 על LM סטודיו? אני לא הצלחתי, ואני מריץ אותו על JAN
אני הצלחתי תודה ל@א.מ.ד. שהדריך אותי בפתרון בעיות אחת אחרי השניה בסבלנות רבה...
@א.מ.ד. אם (והלוואי) תעשה מדריך למודלים קטנים-זעירים (gguf!) יהיה נהדר אם תכלול את פתרון הבעיות (בעיקר האחרונה)
תודה! -
@חובבן-מקצועי כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
@שמואל-הסיני קח בחשבון - כל עוד אתה מריץ את זה על RAM ולא על VRAM - המודל יענה לך ממש לאט.
אני חדש באירוע ושואל: מסובך להריץ על VRAM אם לא למה יש אופציה שניה ואם כן יש איפשהוא דרך להבין את התהליך?
וגם מה ההבדל בכלל?@שמואל-הסיני כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
אני חדש באירוע ושואל: מסובך להריץ על VRAM אם לא למה יש אופציה שניה ואם כן יש איפשהוא דרך להבין את התהליך?
וגם מה ההבדל בכלל?זיכרון RAM וזיכרון VRAM:
RAM רגיל (זיכרון המערכת):
זה הזיכרון הכללי של המחשב. הוא משמש לכל הדברים הרגילים – כרום, וורד, ומערכת ההפעלה. הוא די גדול (בדרך כלל 16GB או 32GB) ועובד מעולה עם המשימות היומיומית, אבל הוא איטי יחסית כשזה מגיע לבינה מלאכותית. אם תריצו עליו מודל, הוא יעבוד, אבל הוא יענה לכם בקצב של "מילה בשנייה".
VRAM (זיכרון כרטיס המסך):
זה הזיכרון ה"VIP" שנמצא בתוך כרטיס מסך. הוא הרבה יותר מהיר מה-RAM הרגיל.
המעבד הזה לא נמצא על כל מחשב, ונמצא בעיקר על מחשבי גיימינג.
הVRAM יכול להריץ דברים הרבה יותר מהר מהRAM, ולכן המודל שפה עובד עליו הרבה יותר מהרלקוח מהמדריך שאני באמצע לכתוב לאיך להריץ מודל שפה אופליין על המחשב.
הערה חשובה - אי אפשר להריץ את המערכת הפעלה על זיכרון הVRAM הוא מיועד למשימות ספציפיות.
-
@שמואל-הסיני קח בחשבון - כל עוד אתה מריץ את זה על RAM ולא על VRAM - המודל יענה לך ממש לאט.
@א.מ.ד. כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
אם אתה משתמש ב-LM Studio, כברירת מחדל חשיבה מושבתת עבור המודל הזה. אם תזדקק תעדכן פה ואדריך אותך איך לגרום למודל לחשוב.
הצלחת להריץ את הgemma 4 על LM סטודיו? אני לא הצלחתי, ואני מריץ אותו על JAN
@חובבן-מקצועי כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
הצלחת להריץ את הgemma 4 על LM סטודיו? אני לא הצלחתי, ואני מריץ אותו על JAN
אני יענה על זה מסודר בפוסט שאני אכתוב.
-
מה עם npu? מישהו יודע האם זה מוסיף משהו לעניין?
כי במנהל המשימות אני לא רואה שימוש בnpu בזמן הזה -
וואו.
שעה אני לא נמצא וזה מתקדם לכיוון מעניין.
@א.מ.ד. זה יהיה מעניין אם תעשה כזה מדריך..
אבל נראה לי @חובבן-מקצועי כבר באמצע לעשות כזה.
בכל מקרה @שמואל-הסיני זה תלוי מה המטרה שלך.
קידוד כמו שאמרו זה סדרת הקוואן.
בכל מקרה חברה אתם רק בילבלתם אותו יותר.
@שמואל-הסיני איפה אתה אוחז? איזה תוכנה בחרת להריץ את המודל ואיזה מודל?
ולגבי הראם והויראם, יש לך ויראם? תבדוק במפרט מחשב.
אם יש זה יכול לעזור.
@א.מ.ד. כימות זה רעיון גרוע. הוא לא מבין כלום בנושא.
אם יש מודלי קוואן מכומתים - תוריד.
אם לא אל תסתבך המפרט מחשב שלך טוב מספיק בשביל להריץ בלי.
דרך אגב הם בכלל טובים בעברית? @א.מ.ד.? -
@א.מ.ד. כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
כל מודל תריץ בכימות של Q4_K_M, שחוסך לך רבע ממשאבי ה-RAM.
מה דעתך על הכיווץ החדש? (מסוג NL)
@חובבן-מקצועי כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
מה דעתך על הכיווץ החדש? (מסוג NL)
השם של הכימות החדש הוא IQ, ה-NL הוא התת-סוג הכי יעיל בתוכו.
התוצאות הרבה יותר טובות ב-IQ מאשר Q, אבל ההרצה איטית יחסית. -
@חובבן-מקצועי כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
מה דעתך על הכיווץ החדש? (מסוג NL)
השם של הכימות החדש הוא IQ, ה-NL הוא התת-סוג הכי יעיל בתוכו.
התוצאות הרבה יותר טובות ב-IQ מאשר Q, אבל ההרצה איטית יחסית.@א.מ.ד. כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
אבל ההרצה איטית יחסית.
כלומר, החיסכון בVRAM שאני מנסה להשיג לא שווה את זה? (כי הוא רץ לאט יותר, ועדיף לי לתפוס עד חצי גיגה..)
-
וואו.
שעה אני לא נמצא וזה מתקדם לכיוון מעניין.
@א.מ.ד. זה יהיה מעניין אם תעשה כזה מדריך..
אבל נראה לי @חובבן-מקצועי כבר באמצע לעשות כזה.
בכל מקרה @שמואל-הסיני זה תלוי מה המטרה שלך.
קידוד כמו שאמרו זה סדרת הקוואן.
בכל מקרה חברה אתם רק בילבלתם אותו יותר.
@שמואל-הסיני איפה אתה אוחז? איזה תוכנה בחרת להריץ את המודל ואיזה מודל?
ולגבי הראם והויראם, יש לך ויראם? תבדוק במפרט מחשב.
אם יש זה יכול לעזור.
@א.מ.ד. כימות זה רעיון גרוע. הוא לא מבין כלום בנושא.
אם יש מודלי קוואן מכומתים - תוריד.
אם לא אל תסתבך המפרט מחשב שלך טוב מספיק בשביל להריץ בלי.
דרך אגב הם בכלל טובים בעברית? @א.מ.ד.?@המלאך כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
בכל מקרה חברה אתם רק בילבלתם אותו יותר.
יש בזה משהו אבל אני רוצה ללמוד ושמח ממה שהולך פה כי אני רוצה להכיר את האירוע!
@המלאך כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
@שמואל-הסיני איפה אתה אוחז? איזה תוכנה בחרת להריץ את המודל ואיזה מודל?
ולגבי הראם והויראם, יש לך ויראם? תבדוק במפרט מחשב.
אם יש זה יכול לעזור.אין לי ויראם זה מחשב נייד
@המלאך כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
@שמואל-הסיני איפה אתה אוחז? איזה תוכנה בחרת להריץ את המודל ואיזה מודל?
עוד לא בחרתי כלום!
-
מה עם npu? מישהו יודע האם זה מוסיף משהו לעניין?
כי במנהל המשימות אני לא רואה שימוש בnpu בזמן הזה@בנימין-מחשבים כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
מה עם npu? מישהו יודע האם זה מוסיף משהו לעניין?
כי במנהל המשימות אני לא רואה שימוש בnpu בזמן הזהה-NPU לא מוסיף למהירות בדרך כלל, אלא רק מעביר את המודל לפעילות ברקע ב-NPU במקום לבזבז משאבי CPU ו-GPU יקרים על חשבון הפעילות הסדירה של המחשב.
-
@בנימין-מחשבים כתב בבקשת מידע | מודל ai אופליין לכתיבה מלאה של קוד:
מה עם npu? מישהו יודע האם זה מוסיף משהו לעניין?
כי במנהל המשימות אני לא רואה שימוש בnpu בזמן הזהה-NPU לא מוסיף למהירות בדרך כלל, אלא רק מעביר את המודל לפעילות ברקע ב-NPU במקום לבזבז משאבי CPU ו-GPU יקרים על חשבון הפעילות הסדירה של המחשב.
@א.מ.ד. ההרגשה שלי - זה מה שאמור לקרות ולא קורה.
אולי צריך דרייבר מיוחד כדי שהתוכנה תדע לנצל את זה