שיתוף | בוט ai לצורך ניסוי חברתי

Codex

@אהרון-שלום לא כזה מסובך לאמן מודל, אבל זה לא הקטע,
הרעיון זה טכניקות LLM להתלבש על מודל מאומן ובונה לו פרופיל עם סיסטם פרומפט מותאם

אהרון שלום

@codex
אתה מבין בזה ?

Codex

@אהרון-שלום יותר בתחום של ML וDL אבל גם בLLMS

NAV ANUTK

מטורף!!!!!!!!! רק קצת איטי

המלאך

@Codex כתב בשיתוף | בוט ai לצורך ניסוי חברתי:

לא כזה מסובך לאמן מודל, אבל זה לא הקטע,

כן? אימנת פעם?
לא נראה לי.
אתה יודע שאימון מודל זה תהליך ארוך ומורכב?
בתור התחלה אסיפת דאטה שזה תהליך של שבועות.
אחרי זה תהליך אימון שזה גם שבועות.
וכמובן זה תלוי אם אתה מאפס וברמה של רשתות נוירונים או לא..

אהרון שלום

@codex
אני פשוט רואה שהתחום הזה מתחזק פה
אני חושב שצריך מישהו שמבין בזה שירים את הכפפה לעשות מדריך בעניין
יש לזה ביקוש גדול מאוד!!

המלאך

@אהרון-שלום @א.מ.ד. עושה מדריך.
גם @חובבן-מקצועי עושה.
אולי אם הם לא יגעו בנקודה, אני אעשה מדריך על האופן שבו מודלים חושבים.
מאפס.

Codex

@המלאך בהחלט אימנתי כמו שכתבתי בעיקר ML - מודלי SVM,LR ועוד הרבה..
זה בהחלט דורש תהליך ולפעמים שעות השאלה מה המטרה שלך באימון,
אם לבנות מודל שימושי- יש מספיק מוכנים במאגרים,
לצורך למידה מספיק לקחת דאטה של 7GB ולנקות אותה

המלאך

@codex ערבבת פה קצת.
Lr זה לא נקרא מודל.
זה חיזוי מספרי או סיווג של כן ולא.
Svm זה מודל שאפשר לאמן אבל זה תהליך של ימים לאימון, וגם זה רק על גוגל קלואב ובשום אופן לא חומרה ביתית.
Lm זה הצ'אט בוטים הגדולים.

Codex

@המלאך ולגבי איסוף דאטה, יש לזה מאגרים כמו Huggin Face, Kuggle ועוד
ועל הדאטה הזה אתה יכול כל מיני טכניקות כמו הכפלה ויצירת דאטה פייק וכל מיני

Codex

@המלאך כאילו אתה מדבר על לאמן מודל מאפס ולא להשתמש בקיימים כדי ליצור מודל,
זה בהחלט נקרא גם ליצור מודל רק ההבדל שאתה משתמש בשיטות קימות,
המטרה של זה זה באמת חיזוי ופרדיקציה ועולם שונה לחלוטין מLLMS

המלאך

@Codex כתב בשיתוף | בוט ai לצורך ניסוי חברתי:

כאילו אתה מדבר על לאמן מודל מאפס ולא להשתמש בקיימים כדי ליצור מודל,
זה בהחלט נקרא גם ליצור מודל רק ההבדל שאתה משתמש בשיטות קימות,

לא הבנת.
הדרך שבה lr עונים זה לא משהו שאני מגדיר מודל.
וlm זה לא משהו שקשור לאימון יחיד.
זה ברמת החברות עולמיות והשקעה של מיליונים.
דרך אגב 7 ג'יגה זה לשימוש בסיסי,
והכפלה זה רעיון כשיש לך עשרות ג'יגה ואת רוצה למנף אותם לא לשימוש בסיסי.
וגם זה כמובן שדווקא הכפלה חכמה שזה ג"כ דורש עבודה על הדאטה.

Codex

@המלאך
נראה שיש פה ערבוב בין כמה רמות

ברור שלא מדברים על לאמן LLM מאפס- זה באמת פרויקטים של חברות עם משאבים כבדים ויותר מזה.
אבל כן יש היום שכבה שלמה באמצע:
fine-tuning /LoRA
אימון מודלים קטנים יותר (classification, embeddings וכו’)
ובעיקר עבודה על מודלים קיימים (prompting /RAG)
וזה דווקא כן אפשרי גם על חומרה יחסית ביתית, תלוי בגודל המודל והמטרה.
LR ו-SVM הם לגמרי מודלים קלאסיים ב-ML - פשוט לא באותו סדר גודל כמו LLMs.
בקיצור, השאלה היא לא "האם אפשר לאמן מודל", אלא איזה מודל ולמהץ

המלאך

@Codex אני לא בילבלתי כמה רמות.
אני קראתי את הפוסט שלך.
וודאי שיש שכבה של כלים קיימים.
אבל גם להם זה תהליך שלוקח זמן ומאמץ.
דרך אגב, אמרת שאימנת מודל, איזה אימנת?
ואמרתי מפורש שlr לדעתי לא מוגדר מודל.

Codex

@המלאך כן, ברור שגם עבודה עם מודלים קיימים זה לא "קליק וגמרנו" יש דאטה, ניקוי, ניסויים וכו’
עשיתי כמה פרויקטים של אימון מודלים, בין היתר גם זיהוי תמונות עם pipeline מלא (preprocessing, training, evaluation).
לא נכנס עכשיו לקוד פה
הנקודה שלי הייתה שיש כמה רמות שונות של "אימון", ולא כולם מדברים על אותו דבר

המלאך

@Codex תראה לא נעים לי.
אבל זה נראה כאילו אתה שואל את הבינה.
בלי לזלזל. רק להעיר.
כל מי שמאמן מודל משתמש ב pipeline.
אין הגיון לדרך אחרת.
בכל מקרה אתה אמרת שזה קל.
הבארתי שלא.
דרך אגב.
איזה מודל אימנת?

Codex

@המלאך לא נכנס להוכחות וזה לא הענין.
כתבתי מניסיון, לא מתוך צ'אט.
אם בכל אופן בא לך להיכנס לקטנות אחד המודלים שאימנתי הוא מודל סיווג לזיהוי תמונות ASL מבוסס על דאטה של 22K תמונות מKuggle של אותיות בשפת הסימנים (לחרשים)
הנקודה שלי הייתה ההבדל בין סוגי אימון והסקייל שלהם.

המלאך

@Codex קצת קשה להאמין שזה ניסיון.
מישהו עם ניסיון היה נכנס יותר לשמות והסוגים ופחות לתהליך אימון,
בכל מקרה איך עשית preprocessing לתמונות?

Codex

@המלאך כתב בשיתוף | בוט ai לצורך ניסוי חברתי:

@Codex קצת קשה להאמין שזה ניסיון.
מישהו עם ניסיון היה נכנס יותר לשמות והסוגים ופחות לתהליך אימון,
בכל מקרה איך עשית preprocessing לתמונות?

פרוססינג סטנדרטי: המרה לgrayscale, ריסייז לגודל אחיד, normalization, וflatten לפני ההזנה למודל
לא משהו חריג,
זה די בסיסי בפרויקטים האלה.
וכתבתי חלק בעברית כי קופץ כאן המושגים.

המלאך

@Codex שומע.
ייתכן שטעיתי.
בכל מקרה לגבי החומרה זה וודאי לא מומלץ לעשות על מחשב רגיל.
אני מתכוון, מה רע בגוגל קואלב?