שיתוף | בוט ai לצורך ניסוי חברתי
-
@המלאך
יש לי חומרה מתאימה
האם זה כ"כ מסובך?@אהרון-שלום לא כזה מסובך לאמן מודל, אבל זה לא הקטע,
הרעיון זה טכניקות LLM להתלבש על מודל מאומן ובונה לו פרופיל עם סיסטם פרומפט מותאם -
@codex
אתה מבין בזה ? -
@codex
אתה מבין בזה ?@אהרון-שלום יותר בתחום של ML וDL אבל גם בLLMS
-
@אהרון-שלום לא כזה מסובך לאמן מודל, אבל זה לא הקטע,
הרעיון זה טכניקות LLM להתלבש על מודל מאומן ובונה לו פרופיל עם סיסטם פרומפט מותאם@Codex כתב בשיתוף | בוט ai לצורך ניסוי חברתי:
לא כזה מסובך לאמן מודל, אבל זה לא הקטע,
כן? אימנת פעם?
לא נראה לי.
אתה יודע שאימון מודל זה תהליך ארוך ומורכב?
בתור התחלה אסיפת דאטה שזה תהליך של שבועות.
אחרי זה תהליך אימון שזה גם שבועות.
וכמובן זה תלוי אם אתה מאפס וברמה של רשתות נוירונים או לא.. -
@codex
אני פשוט רואה שהתחום הזה מתחזק פה
אני חושב שצריך מישהו שמבין בזה שירים את הכפפה לעשות מדריך בעניין
יש לזה ביקוש גדול מאוד!! -
@codex
אני פשוט רואה שהתחום הזה מתחזק פה
אני חושב שצריך מישהו שמבין בזה שירים את הכפפה לעשות מדריך בעניין
יש לזה ביקוש גדול מאוד!!@אהרון-שלום @א.מ.ד. עושה מדריך.
גם @חובבן-מקצועי עושה.
אולי אם הם לא יגעו בנקודה, אני אעשה מדריך על האופן שבו מודלים חושבים.
מאפס. -
@Codex כתב בשיתוף | בוט ai לצורך ניסוי חברתי:
לא כזה מסובך לאמן מודל, אבל זה לא הקטע,
כן? אימנת פעם?
לא נראה לי.
אתה יודע שאימון מודל זה תהליך ארוך ומורכב?
בתור התחלה אסיפת דאטה שזה תהליך של שבועות.
אחרי זה תהליך אימון שזה גם שבועות.
וכמובן זה תלוי אם אתה מאפס וברמה של רשתות נוירונים או לא.. -
@המלאך בהחלט אימנתי כמו שכתבתי בעיקר ML - מודלי SVM,LR ועוד הרבה..
זה בהחלט דורש תהליך ולפעמים שעות השאלה מה המטרה שלך באימון,
אם לבנות מודל שימושי- יש מספיק מוכנים במאגרים,
לצורך למידה מספיק לקחת דאטה של 7GB ולנקות אותה -
@Codex כתב בשיתוף | בוט ai לצורך ניסוי חברתי:
לא כזה מסובך לאמן מודל, אבל זה לא הקטע,
כן? אימנת פעם?
לא נראה לי.
אתה יודע שאימון מודל זה תהליך ארוך ומורכב?
בתור התחלה אסיפת דאטה שזה תהליך של שבועות.
אחרי זה תהליך אימון שזה גם שבועות.
וכמובן זה תלוי אם אתה מאפס וברמה של רשתות נוירונים או לא.. -
@codex ערבבת פה קצת.
Lr זה לא נקרא מודל.
זה חיזוי מספרי או סיווג של כן ולא.
Svm זה מודל שאפשר לאמן אבל זה תהליך של ימים לאימון, וגם זה רק על גוגל קלואב ובשום אופן לא חומרה ביתית.
Lm זה הצ'אט בוטים הגדולים. -
@המלאך כאילו אתה מדבר על לאמן מודל מאפס ולא להשתמש בקיימים כדי ליצור מודל,
זה בהחלט נקרא גם ליצור מודל רק ההבדל שאתה משתמש בשיטות קימות,
המטרה של זה זה באמת חיזוי ופרדיקציה ועולם שונה לחלוטין מLLMS@Codex כתב בשיתוף | בוט ai לצורך ניסוי חברתי:
כאילו אתה מדבר על לאמן מודל מאפס ולא להשתמש בקיימים כדי ליצור מודל,
זה בהחלט נקרא גם ליצור מודל רק ההבדל שאתה משתמש בשיטות קימות,לא הבנת.
הדרך שבה lr עונים זה לא משהו שאני מגדיר מודל.
וlm זה לא משהו שקשור לאימון יחיד.
זה ברמת החברות עולמיות והשקעה של מיליונים.
דרך אגב 7 ג'יגה זה לשימוש בסיסי,
והכפלה זה רעיון כשיש לך עשרות ג'יגה ואת רוצה למנף אותם לא לשימוש בסיסי.
וגם זה כמובן שדווקא הכפלה חכמה שזה ג"כ דורש עבודה על הדאטה. -
@Codex כתב בשיתוף | בוט ai לצורך ניסוי חברתי:
כאילו אתה מדבר על לאמן מודל מאפס ולא להשתמש בקיימים כדי ליצור מודל,
זה בהחלט נקרא גם ליצור מודל רק ההבדל שאתה משתמש בשיטות קימות,לא הבנת.
הדרך שבה lr עונים זה לא משהו שאני מגדיר מודל.
וlm זה לא משהו שקשור לאימון יחיד.
זה ברמת החברות עולמיות והשקעה של מיליונים.
דרך אגב 7 ג'יגה זה לשימוש בסיסי,
והכפלה זה רעיון כשיש לך עשרות ג'יגה ואת רוצה למנף אותם לא לשימוש בסיסי.
וגם זה כמובן שדווקא הכפלה חכמה שזה ג"כ דורש עבודה על הדאטה.@המלאך
נראה שיש פה ערבוב בין כמה רמותברור שלא מדברים על לאמן LLM מאפס- זה באמת פרויקטים של חברות עם משאבים כבדים ויותר מזה.
אבל כן יש היום שכבה שלמה באמצע:
fine-tuning /LoRA
אימון מודלים קטנים יותר (classification, embeddings וכו’)
ובעיקר עבודה על מודלים קיימים (prompting /RAG)
וזה דווקא כן אפשרי גם על חומרה יחסית ביתית, תלוי בגודל המודל והמטרה.
LR ו-SVM הם לגמרי מודלים קלאסיים ב-ML - פשוט לא באותו סדר גודל כמו LLMs.
בקיצור, השאלה היא לא "האם אפשר לאמן מודל", אלא איזה מודל ולמהץ -
@המלאך
נראה שיש פה ערבוב בין כמה רמותברור שלא מדברים על לאמן LLM מאפס- זה באמת פרויקטים של חברות עם משאבים כבדים ויותר מזה.
אבל כן יש היום שכבה שלמה באמצע:
fine-tuning /LoRA
אימון מודלים קטנים יותר (classification, embeddings וכו’)
ובעיקר עבודה על מודלים קיימים (prompting /RAG)
וזה דווקא כן אפשרי גם על חומרה יחסית ביתית, תלוי בגודל המודל והמטרה.
LR ו-SVM הם לגמרי מודלים קלאסיים ב-ML - פשוט לא באותו סדר גודל כמו LLMs.
בקיצור, השאלה היא לא "האם אפשר לאמן מודל", אלא איזה מודל ולמהץ -
@Codex
אני לא בילבלתי כמה רמות.
אני קראתי את הפוסט שלך.
וודאי שיש שכבה של כלים קיימים.
אבל גם להם זה תהליך שלוקח זמן ומאמץ.
דרך אגב, אמרת שאימנת מודל, איזה אימנת?
ואמרתי מפורש שlr לדעתי לא מוגדר מודל.@המלאך כן, ברור שגם עבודה עם מודלים קיימים זה לא "קליק וגמרנו" יש דאטה, ניקוי, ניסויים וכו’
עשיתי כמה פרויקטים של אימון מודלים, בין היתר גם זיהוי תמונות עם pipeline מלא (preprocessing, training, evaluation).
לא נכנס עכשיו לקוד פה
הנקודה שלי הייתה שיש כמה רמות שונות של "אימון", ולא כולם מדברים על אותו דבר -
@המלאך כן, ברור שגם עבודה עם מודלים קיימים זה לא "קליק וגמרנו" יש דאטה, ניקוי, ניסויים וכו’
עשיתי כמה פרויקטים של אימון מודלים, בין היתר גם זיהוי תמונות עם pipeline מלא (preprocessing, training, evaluation).
לא נכנס עכשיו לקוד פה
הנקודה שלי הייתה שיש כמה רמות שונות של "אימון", ולא כולם מדברים על אותו דבר -
@Codex תראה לא נעים לי.
אבל זה נראה כאילו אתה שואל את הבינה.
בלי לזלזל. רק להעיר.
כל מי שמאמן מודל משתמש ב pipeline.
אין הגיון לדרך אחרת.
בכל מקרה אתה אמרת שזה קל.
הבארתי שלא.
דרך אגב.
איזה מודל אימנת?@המלאך לא נכנס להוכחות וזה לא הענין.
כתבתי מניסיון, לא מתוך צ'אט.
אם בכל אופן בא לך להיכנס לקטנות אחד המודלים שאימנתי הוא מודל סיווג לזיהוי תמונות ASL מבוסס על דאטה של 22K תמונות מKuggle של אותיות בשפת הסימנים (לחרשים)
הנקודה שלי הייתה ההבדל בין סוגי אימון והסקייל שלהם. -
@המלאך לא נכנס להוכחות וזה לא הענין.
כתבתי מניסיון, לא מתוך צ'אט.
אם בכל אופן בא לך להיכנס לקטנות אחד המודלים שאימנתי הוא מודל סיווג לזיהוי תמונות ASL מבוסס על דאטה של 22K תמונות מKuggle של אותיות בשפת הסימנים (לחרשים)
הנקודה שלי הייתה ההבדל בין סוגי אימון והסקייל שלהם. -
@Codex קצת קשה להאמין שזה ניסיון.
מישהו עם ניסיון היה נכנס יותר לשמות והסוגים ופחות לתהליך אימון,
בכל מקרה איך עשית preprocessing לתמונות?@המלאך כתב בשיתוף | בוט ai לצורך ניסוי חברתי:
@Codex קצת קשה להאמין שזה ניסיון.
מישהו עם ניסיון היה נכנס יותר לשמות והסוגים ופחות לתהליך אימון,
בכל מקרה איך עשית preprocessing לתמונות?פרוססינג סטנדרטי: המרה לgrayscale, ריסייז לגודל אחיד, normalization, וflatten לפני ההזנה למודל
לא משהו חריג,
זה די בסיסי בפרויקטים האלה.
וכתבתי חלק בעברית כי קופץ כאן המושגים. -
@המלאך כתב בשיתוף | בוט ai לצורך ניסוי חברתי:
@Codex קצת קשה להאמין שזה ניסיון.
מישהו עם ניסיון היה נכנס יותר לשמות והסוגים ופחות לתהליך אימון,
בכל מקרה איך עשית preprocessing לתמונות?פרוססינג סטנדרטי: המרה לgrayscale, ריסייז לגודל אחיד, normalization, וflatten לפני ההזנה למודל
לא משהו חריג,
זה די בסיסי בפרויקטים האלה.
וכתבתי חלק בעברית כי קופץ כאן המושגים.