בקשה | תמלול שיעורי תורה עבור AI
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL
נכון אבל הצעת מקודם פתרון גאוני
כמה הוא אמור לעלות להערכתך?
[או יותר מדויק איזה שרת צריך לשכור, ולכמה זמן]סדר גודל של כמה עשרות אלפי שקלים.
אני לא ממש התנסיתי בכגון דא, אבל צריך שרתי GPU של NVIDIA, העלות שלהם היא לפי שימוש שעתי, זה לא עניין של השכרה לתקופה ממושכת (בשונה משרת רגיל של אתר)
Ivrit AI מסתמכים על תרומות של כל מיני גופים שמספקים להם GPU. אולי אפשר למצוא גוף כזה
אני מניח של-DICTA למשל יש משאבים כאלו@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL
אם כן זה נראה חסר סיכוי במצב הנוכחי,
אלא אם בקרוב יהיה לגוגל שבבים חדשים שיהיו זולים הרבה יותר ......
עם זאת אנסה לשאול את מיודעי שהוא מומחה גדול בשכירת שרתים עוצמתיים בזול, ונראה מה יצא.בכל מקרה, הסר דאגה מליבך. בכל שנה עלויות הרצת המודלים מתקטנות פי 10 ויותר.
ב-3 שנים האחרונות העלויות ירדו פי 1000!וגם לטווח הקצר, שימוש במודל של ג'מיני ליצירת מערכי נתונים בקלות ובעלויות זולות, במקום שימוש בשיטות אנושיות, עשוי לעניין את אנשי ivrit AI, לפחות עבור יצירת מודל לעברית סטנדרטית
-
@מתלמד-צעיר כתב בבקשה | תמלול שיעורי תורה עבור AI:
@צבי-דורש-ציון עדכנתי בסקריפט את האפשרות להתאים את הפרומפט באופן אישי
יישר כח עצום!!
מה הציבור אומר, אולי כמה מבינים בתחום הבינה יעזרו ויציעו נוסח הנחיה טובה להגיה האשכנזית ליטאית?
כמובן שאחר כך יהיה ניתן להתאים יותר לקול מסויים, נניח רב שמרבה לומר "חומיש" או שרואים בתמלול שיש מילה קבועה של טעות וכדו'. ככה ניצור נוסח הנחיה טוב שיהיה באופן קבוע יחסית (למי שרוצה כמובן...).
אולי אני טועה? תתקנו אותי.תודה רבה!!
-
@צבי-דורש-ציון
אני מציע בשלב ראשון לשאול את ג'מיני עצמו, מה הוא יודע בענין.
מחכים לציטוט שתעלו [מי שפתוח לו] -
אני לא מבין למה אתם מחשבנים לפי מספר המילים בשיעור
לשם מה יש צורך לתמלל את כל השיעור
מספיק שיהיה השיעור כתוב כמו שכותבים בספר
שזה 2-4 עמודים בלבד.
בערך 1/10 מהמילים בשיעור.כמו בקבצים כאן.
מדוע אסור לאכול בשר בחלב - קול תודה - גברים - יח' ניסן, תשע'ז1201059_סיכום.pdf
החודש הזה לכם 380.pdf -
@יהודה-טאוב כתב בבקשה | תמלול שיעורי תורה עבור AI:
מספיק שיהיה השיעור כתוב כמו שכותבים בספר
כי אף אחד לא סומך עליו שהוא לא הוזה.
אם אומרים לו לכתוב מה שהוא שומע, סביר שלא יהזה. אבל לסכם? צפה לצרות צרורות... -
@י-פל כתב בבקשה | תמלול שיעורי תורה עבור AI:
@יהודה-טאוב כתב בבקשה | תמלול שיעורי תורה עבור AI:
מספיק שיהיה השיעור כתוב כמו שכותבים בספר
כי אף אחד לא סומך עליו שהוא לא הוזה.
אם אומרים לו לכתוב מה שהוא שומע, סביר שלא יהזה. אבל לסכם? צפה לצרות צרורות...הוא יכול לסכם מצויין. אבל תנו לחרש שלא שומע טוב לסכם שיעור.
אם הוא מסכם אותו למרות שחצי מהמילים הוא בכלל לא הבין, אפשר לשער שהוא ממציא הרבה לפי ההקשר -
@NH-LOCAL כתב בבקשה | תמלול שיעורי תורה עבור AI:
סדר גודל של כמה עשרות אלפי שקלים.
אני לא ממש התנסיתי בכגון דא, אבל צריך שרתי GPU של NVIDIA, העלות שלהם היא לפי שימוש שעתי, זה לא עניין של השכרה לתקופה ממושכת (בשונה משרת רגיל של אתר)
Ivrit AI מסתמכים על תרומות של כל מיני גופים שמספקים להם GPU. אולי אפשר למצוא גוף כזה
אני מניח של-DICTA למשל יש משאבים כאלולהלן העתקה של תשובת המומחה אליו שלחתי את הרעיון שלך [לאמן מודל קלאסי על בסיס תוצאות מג'מיני]
מאיפה שתסובב את זה, יש כאן עניין של עלות
יש מנועים שיודעים לעבוד יותר חסכוני ויש שפחות
לייצר את הגלגל מאפס זה ממש חבל והרבה פחות יעיל
למה אתה קונה מחשב ולא בונה מחשב לבד? -
@י-פל כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL כתב בבקשה | תמלול שיעורי תורה עבור AI:
הוא יכול לסכם מצויין.
חוץ שמיעה וראיה, לא מצאתי אותו טוב.
לא יודע מה אומרים הבנצ'מרקים, זו החוויה שלי.
לא בקידוד, לא בניתוח טקסט.המציאות היא הפוכה בדיוק. הוא הרבה יותר טוב בקידוד וניתוח טקסט מאשר שמיעה וראיה.
החוויה שלך לא משקפת את המציאות -
@NH-LOCAL
העלו מספר רעיונות חדשים ומוצלחים לגבי תמלול קול הלשון,
הראשון שבהם הוא שהתמלול יהיה ניתן כאופציה בשעת הורדת השיעור עצמו,
וכמובן ישמר במאגרי קול הלשון עבור המשתמשים הבאים,
כך התמלול יתמקד בשיעורים הפופלאריים יותר,כעת אני מעונין להתחיל פיילוט ראשוני של 1,000 שיעורים באורך כשעה כל אחד,
כמה זה עולה נכון להיום בג'מיני?
תודה רבה! -
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
כעת אני מעונין להתחיל פיילוט ראשוני של 1,000 שיעורים באורך כשעה כל אחד,
כמה זה עולה נכון להיום בג'מיניאין עלות. כפי שנכתב לעיל, מכיוון שמדובר בדגם נסיוני, אין עדיין אופציה של תפעול שלו בתשלום עבור כמויות גדולות
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
ניתן כאופציה בשעת הורדת השיעור עצמו
ואז המשתמש יחכה 4 דקות?
בסיס הרעיון מוצלח, צריך לחשוב קצת אחרת...
אם ניתן לקבל מקול הלשון דוחות, אולי הם יתנו לך לרגל הפרוייקט, תוכל כל יום להריץ סקריפטים על 100 השיעורים הפופולרים של 7 הימים שלפניו, נניח. -
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL
מחיפוש ברשת לא העליתי דבר [חוץ מזה שאין לי מושג אם זה מוסמך].אבל בוא נניח רגע לפי ממוצע [חישוב גס + ניחוש] כ40 דקות לשיעור
כפול 4 מיליוןהשאלה גם כמה מתוך זה שיעורים באידיש (להשערתי לע"ע התמלול שם יהיה נחות מהתמלול לעברית)
-
@צדיק-וטוב-לו-0
אתחיל בשיעורים בעברית בכל אופן@י-פל כתב בבקשה | תמלול שיעורי תורה עבור AI:
ואז המשתמש יחכה 4 דקות?
או שיהיה כתוב לו: התמלול בעיבוד, בעוד מספר דקות תוכל להוריד אותו בכל עמדה של קול הלשון,
אנא פנה בינתיים את העמדה לבא אחריך בתור......@י-פל כתב בבקשה | תמלול שיעורי תורה עבור AI:
אם ניתן לקבל מקול הלשון דוחות, אולי הם יתנו לך לרגל הפרוייקט, תוכל כל יום להריץ סקריפטים על 100 השיעורים הפופולרים של 7 הימים שלפניו, נניח.
חשבתי להתחיל רק עם שיעורים מלפני 15 שנה ומעלה.
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@צדיק-וטוב-לו-0
אתחיל בשיעורים בעברית בכל אופןאני סה"כ באתי לומר שזה פחות כמות ממה שחשבת.
(כמו"כ יש חלק בשפות נוספות כמו אנגלית, שם אני מאמין התמלול יהיה מוצלח יותר
אגב, חלק לא קטן זה שיעורים בעברית צחה (בעיקר רבנים ספרדיים) - מה שגם יגדיל את האיכות.) -
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
שיעורים מלפני 15 שנה ומעלה.
חשבתי שאתה רוצה ש
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
כך התמלול יתמקד בשיעורים הפופלאריים יותר,