בקשת מידע | אימון מודל שפה
-
-
-
@א.מ.ד. התנסיתי בו קצת והוא הרגיש לא אפוי בעליל.
הרב דיקטה מציג תוצאות נחמדות, אבל יש צורך בשיפור משמעותי.
בעיקר צריך עוד דאטה בייס איכותי. -
@א.מ.ד. התנסיתי בו קצת והוא הרגיש לא אפוי בעליל.
הרב דיקטה מציג תוצאות נחמדות, אבל יש צורך בשיפור משמעותי.
בעיקר צריך עוד דאטה בייס איכותי. -
@אדיר כתב בבקשת מידע | אימון מודל שפה:
בקיצור, אתם אומרים שאין דרך לעבוד על דאטה בייס גדול, בלי לקחת משכנתא.
לא, אנחנו אומרים שיש לך הנחות מוקדמות מוטעות על הדרך הנכונה לעשות את זה (היא כנראה גם לא כוונון מודל)
מציע לך לפתוח נושא חדש ולפרט מה אתה מנסה לעשות, כלומר מה המטרה הסופית, ולא "איך לאמן מודל על אוצריא"@צדיק-תמים כתב בבקשת מידע | אימון מודל שפה:
לא, אנחנו אומרים שיש לך הנחות מוקדמות מוטעות על הדרך הנכונה לעשות את זה (היא כנראה גם לא כוונון מודל)
לכאורה מה שהוא רוצה זה לאמן את המודל להיות ת"ח... או יותר נכון לדעת לענות תשובות נכונות לפי מאגר הנתונים.
דבר כזה קיים היום, יש כל מיני חברות שזה עיקר העיסוק שלהם להטמיע AI במאגרי החברה כדי להפיק מהם נתונים ולשפר.
אבל גם זה כמה שזה לא עסק גדול ברמה של עשרות מיליונים עדיין זה עסק לכל דבר וקשה להאמין שמישהו כאן מהפורום יוכל לעשות את זה בעצמו...
אבל ברור שלאט לאט זה המקום שAI הולך. -
אשמח למדריכים בנושא.
ניסיתי לקחת את אוצריא:
א. להריץ כמה מודלי שפה לוקאלי, והאינדקס לא נוצר.
האם יש הגבלה על כמות הדאטה?ב. לבנות באמצעות גוגל קולאב מודל שפה, אבל באיזה שלב צצו באגים שGPT לא יודע לפתור.
@אדיר זה פתטי לחשוב שתוכל לאמן מודל שפה. לעולם לא תוכל להדביק את הקצב של המודלים הנוכחיים, שמאומנים בעלות של מיליארדים.
גם דיקטה הפסיקו לבזבז זמן וכסף על אימון מודלי שפה (הם כן מאמנים מודלים למשימות פשוטות יותר), הם פשוט משתמשים בקלוד.לעניינינו, אין צורך לאמן מודל, המודלים הנוכחיים ובפרט קלוד sonnet-3-7 יודעים יותר ידע תורני ממה שאתה הספקת לשכוח. הבעיה היא אחרת, הטשטוש בין דמיון למציאות.
הפתרון גם הוא יחסית פשוט, לחבר את המודל שפה למאגר תורני, באותו עיקרון שהיום ChatGPT מחובר לחיפוש גוגל.[אגב, הנושא לא נזנח, אני עובד כיום על פרוייקט מסויים בנושא הזה ממש.]
אבל זה באמת פשוט ונגיש יחסית, ואין שום סיבה לחשוב שזה מדי מסובך. איתוריא זו הדגמה נחמדה, אבל זה לא סוכן. בשימוש עם סוכן, התוצאות משתפרות פלאים, ואפשר גם להמשיך בצ'אט ולכוון אותו הלאה אם צריך.
אם רוצים להתנסות כמה מוצלח זה יכול להיות, אפשר לנסות להתקין את הMCP הזה בתוך עורך הקוד שלכם, לדוגמה cursor או cline ופשוט לשוחח עם צ'אט שמחובר למאגר תורני.
-
@אדיר זה פתטי לחשוב שתוכל לאמן מודל שפה. לעולם לא תוכל להדביק את הקצב של המודלים הנוכחיים, שמאומנים בעלות של מיליארדים.
גם דיקטה הפסיקו לבזבז זמן וכסף על אימון מודלי שפה (הם כן מאמנים מודלים למשימות פשוטות יותר), הם פשוט משתמשים בקלוד.לעניינינו, אין צורך לאמן מודל, המודלים הנוכחיים ובפרט קלוד sonnet-3-7 יודעים יותר ידע תורני ממה שאתה הספקת לשכוח. הבעיה היא אחרת, הטשטוש בין דמיון למציאות.
הפתרון גם הוא יחסית פשוט, לחבר את המודל שפה למאגר תורני, באותו עיקרון שהיום ChatGPT מחובר לחיפוש גוגל.[אגב, הנושא לא נזנח, אני עובד כיום על פרוייקט מסויים בנושא הזה ממש.]
אבל זה באמת פשוט ונגיש יחסית, ואין שום סיבה לחשוב שזה מדי מסובך. איתוריא זו הדגמה נחמדה, אבל זה לא סוכן. בשימוש עם סוכן, התוצאות משתפרות פלאים, ואפשר גם להמשיך בצ'אט ולכוון אותו הלאה אם צריך.
אם רוצים להתנסות כמה מוצלח זה יכול להיות, אפשר לנסות להתקין את הMCP הזה בתוך עורך הקוד שלכם, לדוגמה cursor או cline ופשוט לשוחח עם צ'אט שמחובר למאגר תורני.
-
@sivan22 אתה אומר בעצם שאפשר לחבר את קלוד לגיטהב של אוצריא (רק לא יודע איזה מנוי מאפשר כזו כמות). ואז פשוט נגיע לתוצאה הרצויה?
או שיותר פשוט להגדיר סוכן שמתמקד רק במאגרי תוכן תורניים?@אדיר כתב בבקשת מידע | אימון מודל שפה:
@sivan22 אתה אומר בעצם שאפשר לחבר את קלוד לגיטהב של אוצריא (רק לא יודע איזה מנוי מאפשר כזו כמות). ואז פשוט נגיע לתוצאה הרצויה?
או שיותר פשוט להגדיר סוכן שמתמקד רק במאגרי תוכן תורניים?תגדיר אותו שיחפש במאגר הגיטהאב הזה עבור מענה על שאלות.