בקשת מידע | מאגרי טקסט בעברית לאימון מודל
-
אני צריך כמה שיותר מאגרי טקסט בעברית, לצורך אימון מודל של בינה מלאכותית
יש לי כבר את פרויקט בן יהודה
אישית לא ממליץ עליו, בוודאי לא לבד,
הוא נועד רק למודלים יותר כמו gpt- 4o mini (למודלים של תשובות מובנות מראש)פרויקט בן יהודה כל הגרסאות:
val.json
val v1.1.json
train.json
train v1.1.json -
אני צריך כמה שיותר מאגרי טקסט בעברית, לצורך אימון מודל של בינה מלאכותית
יש לי כבר את פרויקט בן יהודה
אישית לא ממליץ עליו, בוודאי לא לבד,
הוא נועד רק למודלים יותר כמו gpt- 4o mini (למודלים של תשובות מובנות מראש) -
@CSS-0 יש לי כמה מערכי נתונים גדולים מאוד מבוססי אוצריא, פרויקט בן יהודה ועוד
ראה כאן:
https://huggingface.co/NHLOCAL -
@NH.LOCAL חסום בנטפרי....
אולי אתה תוכל להוריד את הטקסטים (לא של הקודש אותם כבר יש לי...) של הטקסטים העבריים? ולעלות בדרייב?