שאלה | AI ללא חיבור לאינטרנט

בנימין מחשבים

@א.מ.ד. @י.-פל. @מישהו-אחר-שמבין
מוכן לקחת את תפקיד ההסברה במקומי?

@יענקיH כתב בשאלה | AI ללא חיבור לאינטרנט:

זה לא משנה
גם לוידאו.
אותו דבר כמו הקוונטי כמו שכתבתי למעלה.

הישבשר המלומד

@בנימין-מחשבים אני מסכים עם @המלאך אני בקושי מריץ מודלים קטנים הגב אהבתי "מחשב הוא לא מלאך" (גם גימני מסכים)

יענקיH

@הישבשר-המלומד
ואחרי בדיקה קטנה..
כל עוד יש לך ראם פיזי אתה יכול להריץ הכל

הישבשר המלומד

@יענקיH הלוואי

יענקיH

@הישבשר-המלומד
מניסיון..
מוזמן לנסות בבית..

הישבשר המלומד

@יענקיH אדרבה בא אני רוצה לאמן מודל קטנטן ליצור תמונות יש לי 16 ראם ו2 VRAM וכרטיס גרפי של אינטל מה יש לך להציע לגימני יש להציע כמה ימים של עבודה של אימון שבמחשב או אתרים מתאמים זה יקח 20 דקות וגם זה במקרה הטוב אם זה לא יפול

יענקיH

@הישבשר-המלומד
אתה מעוניין להריץ מודל AI או לאמן מודל AI?

הישבשר המלומד

@יענקיH לאמן אבל גם להריץ טוב

יענקיH

@הישבשר-המלומד
הבדל של שמיים וארץ..

המלאך

@יענקיH תוכל לאמן בשבילי מודל? יש לי מודל של גוגל, קוראים לו Switch Transformer, והוא לא שוקל הרבה.
רק איזה 1.6 טריליון פרמטרים,
בכלל לא רציני בשביל המחשב המלאכי שלך,
אחרי הכל וודאי שמחשב של 8 ג'יגה ראם יוכל להריץ מודל של בערך 3 טרליון TB ראם...

יענקיH

@המלאך
זה מתחיל להטריף אותי.
אימון מודל זה סיפור חסר קשר להרצת מודל AI

המלאך

@יענקיH לאלאלא.
דיברתי על הרצה.

הישבשר המלומד

@יענקיH OK טעות שלי

המלאך

ואם אתה רוצה יותר מזה, אז בשביל הרצה יש עוד דברים שלא חישבתי שצריך להוסיף לזיכרון.

יענקיH

@המלאך
יפה מאוד.
כתבתי במפורש שכל עוד יש לך ראם הכל הכל אפשרי.

המלאך

@יענקיH טוב, מחילה, סטינו מהדיון, בא נעצור כאן.
לעיניינו כן ניתן לאמן מודל אבל האימון לא יכול להעשות אופליין.

NH.LOCAL

@AZX מאפס? לא באמת מציאותי, אין מספיק דאטה באיכות גבוהה בעברית בשביל ליצור מודל שפה ברמה סבירה
קל וחומר לא מבוסס תוכן מסומן בלבד

האופציה היחידה היא ליישם סינון עם כוונון עדין על מודל קיים

המלאך

@NH.LOCAL הוא וודאי לא התכוון מאפס.
וכמו שכבר הצעתי, האפשרות היחדיה זה מה שאמד עשה, שזה לאמן על מודל קיים על סמך המשאבים החינמיים שגוגל מספקת.

NH.LOCAL

@המלאך דווקא סיכוי טוב שהוא כן התכוון מאפס
מי שלא מכיר את התחום, בהחלט עשוי לטעות כך

א.מ.ד.

קצת סדר:

ישנם עשרות אלפי מודלי AI שמסוגלים לרוץ אפילו על מחשבי אברכים פשוטים.
ככל שעובר הזמן המודלים משתפרים, וכיום ישנם מודלים בעלי 4B פרמטרים (2.5 GB בערך בכימות אופטימלי) שעוקפים את GPT 3.5 בסיבוב למרות שהם קטנים ממנו פי כמה עשרות, לדוגמא Qwen 3.5 4B שהושק לפני שבוע בדיוק יחד עם עוד 3 אחים מהאגף הצעיר של משפחת Qwen 3.5 - בעלי 0.8B, 2B ו-9B, כל אחד מהם עם יכולות מטורפות יחסית לגודל.
כל מודלי השפה חסומים להורדה בנטפרי ומכיוון שכך אסור להעלות קישורים שלהם בפורום.
אני עובד על פרוייקט לסינון מודלי שפה באמצעות כוונון עדין ממוקד ועוצמתי ע"י מערך נתונים איכותי. אני ממתין לתשובת נטפרי שיאשרו את המודל הניסיוני הראשון בסדרה להורדה והרצה מקומית.
צריכת ה-RAM ע"י המודלים נקבעת ע"י גודלם, בשילוב עם אורך ההקשר.
אימון של מודל שפה, אפילו זעיר מאוד בגודל כמה עשרות MB (יש כאלו! עם יכולות מפתיעות לגודלם) דורש משאבי חישוב אדירים, כמו GPU כתנאי בסיס. אחרת האימון ייקח חודשים למודל זעיר.
אימון מודלי שפה דורש גם מערכי נתונים עצומים, כך שלהסתמך רק על מאגרים קטנים כמו המכלול זה בדיחה. ועוד לא דיברנו על ניקוי וסידור מערכי הנתונים.
אפשר לבצע כוונון עדין על מודל שזה בעצם אימון קצר שנועד להתאים מודל קיים לצורך מסויים.
כוונון עדין עם הגדרות מתאימות וספריות אימון כמו QLoRA יכול לקחת בין כמה דקות לכמה שעות, אבל גם הוא דורש GPU חזק כנ"ל, ולצורך זה אפשר להשתמש (וככה גם אני עשיתי) במחברות גוגל קולאב (חסום בנטפרי) שמאפשרות כמה שעות GPU עם 16 VRAM בחינם בשבוע. גם כוונון עדין דורש ידע נרחב בתחום ומערכי נתונים איכותיים אפילו יותר מנתוני אימון רגיל.
Stable Diffusion הם סדרת מודלי דיפוזיה ליצירת תמונות, יחסית מיושנים אבל עדיין נחשבים לצעצוע מעניין וחביבים על קהילת המשקלים הפתוחים.
רוב הגרסאות של Stable Diffusion ניתנות להרצה מקומית בקלות על מחשבים פשוטים.
יש גם מודלי יצירת תמונות עדכניים כדוגמת Z Image Turbo 6B שמסוגלים לרוץ על מחשבים קלאסיים, והתוצאות ממש איכותיות - ברמה של מודלי מעבדות החזית לפני הופעת המודלים האוטו-רגרסיביים ואף יותר.
באופן עקרוני אפשר להריץ בכל מכשיר כל מודל שצורך בערך כמחצית מה-RAM שיש במכשיר המריץ, אפילו מודלי יצירת וידיאו מסויימים, רק שזה יכול לקחת אפילו כמה שבועות בהיעדר GPU חזק.

לצורך המחשת היכולת להרצת מודלים באופן מקומי, אני אישית מריץ על הפלאפון שלי - QIN F21 Pro עם 3 RAM בלבד (או ליתר דיוק 2.8) מודלי שפה מתקדמים יחסית למגוון שימושים ובמגוון גדלים (ממוצע של 500ms עד 1500ms לטוקן במודלים שמישים - תלוי בגודל), וכן מודלי יצירת תמונה (ממוצע של 10 דקות לתמונה - ב-10 צעדי יצירה).

אני נהנה להתפאר בכך שאני מחזיק ככל הנראה במכשיר החצי טאצ' החכם בעולם - מחזיק ביכולות LLM, יצירת תמונה, קיוויקס, גוגל טרנסלייט אופליין, מפות גוגל אופליין וכו'...