בקשה | תמלול שיעורי תורה עבור AI
-
@MusiCode המודל החדש של גוגל, ג'מיני 2.5 פרו, מציג התקדמות מדהימה בפענוח טקסטים תורניים.
זה לא מושלם, אבל עדיין ממש טוב, וניתן לשפר זאת עוד עם הנחייה מתאימה ומורחבת יותר.
בשיחה המצורפת, נתתי לו שיעור בלשון הקודש כבדה, עם איכות הקלטה נמוכה, והברה חסידית פה ושם לקינוח. התוצאות מרשימות מדי באופן יחסי.
זה בוודאי יכול להיות נהדר בשביל ליצור נתוני אימון בקלות עם תיקונים קלים בלבד
https://aistudio.google.com/prompts/1yLNsTWfnDEqcV9Eck_yLELtR5S7s4Ka6
שימו לב להנחיית המערכת בשיחה!
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL
יש 3 כלים הכי נחשבים בעברית,1] המודל החדש של גוגל, ג'מיני 2.5 פרו, כמו שכתבת,
2] עבריתAI
3] אילבן לאבס
מה הכי טוב?
מישהוא יכול להשוות מספר קבצים [אשמח להביא כמה..]יש גם את sofer.ai שמיועד לתמלול תורני...
-
@אלף-שין לא ניסיתי את המודל העדכני של ivrit AI, אבל הסברא נותנת ש-LLM משופר יהיה הטוב ביותר עבור דבר מורכב עם מעט מידע כמו שיעורי תורה.
הוא ככל הנראה גם הטוב ביותר עבור תוכן ארוך בעברית. (תנסה לבקש מכל אחד מהמודלים לתמלל שירים ותראה את התוצאות...)
@מתלמד-צעיר כתב בבקשה | תמלול שיעורי תורה עבור AI:
יש גם את sofer.ai שמיועד לתמלול תורני...
כמדומני שזה מותאם לשיעורי תורה באנגלית...
-
@NH-LOCAL כתב בבקשה | תמלול שיעורי תורה עבור AI:
כמדומני שזה מותאם לשיעורי תורה באנגלית...
בעיקר אבל עובד היטב גם על שאר השפות
הסברא שלך על LLM משופר תופסת פה הרבה יותר... -
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
מסברא נראה לי שלפחות פי 5 מג'מיני
ולכן האו אמור להיות יותר מדויק,לא בהכרח. לפי זה גוגל טרנסלייט אמור להיות הכי טוב עבור ארמית ואידיש. בפועל מודלי AI מתקדמים טובים ממנו בהרבה בתרגום (הם רק יותר יקרים לתפעול)
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL
אשמח להתייחסותך לגבי אילבן לאבסלא מכיר
-
@NH-LOCAL
טוב אז אפתח פה בניסוי
שבסופו יוכרע באופן סופי וחד משמעי, מה הכלי הטוב ביותר לעת הזאת,
אני מתחיל להכין קבצים,
תוכלו גם להעלות בינתיים.כל אחד שרוצה יעלה פה קובץ שמע קטן [כמה דקות] בעברית בלבד
עדיף שהאיכות תהיה בינונית מינוס
ובאיזה כלי מתוך ה3 כבר תומלל, ומי שיוכל יעלה לשאר הכלים.
@י-פל יש לך קבצים מסודרים לניסוי? [אם לא, ננסה לבינתיים מקול הלשון]. -
@NH-LOCAL כתב בבקשה | תמלול שיעורי תורה עבור AI:
המודל החדש של גוגל, ג'מיני 2.5 פרו, מציג התקדמות מדהימה בפענוח טקסטים תורניים.
אתה גנבת לי את החשיפה!!!!
אגב, האם נתינת דוגמאות נוספות להגייה תורנית, תועיל, לדעתך?@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
3] אילבן לאבס
יש להם בעיה עצומה בשליחה עם API - בחלק מהקבצים, לא ברור מתי, הסיום נחתך. זה קורה המון!
@אלף-שין @NH-LOCAL
לפני כ3 שבועות קיבלתי מייל מכינרת, אחת האחראיות בעברית AI, הנה המייל:
אחדשה"ט,
פניתם אלינו בתקופה האחרונה בנוגע לפיתוח מודל תמלול שיזהה טוב יותר את השפה התורנית וההגייה האשכנזית. סברנו שאולי תרצו לקדם את הנושא יחדיו, ואנחנו נוכל לייעץ כמיטב יכולתנו.
לשם הבדיקה הראשונית, טוב להכין קובץ שמע וקובץ טקסט עם התמלול בפורמט של כתוביות (למשל vtt) הכולל גם תזמונים.
ויה"ר שיתקיים בנו "כתבוני לדורות" בימי הפורים האלה,
חילכם לאורייתא,
כנרת וצוות ivrit.aiעבדתי די קשה, תמללתי שיעור בן 30 דקות, ושלחתי.
נעניתי:
יישר כח!
לגבי "עשו עם זה כהבנתכם" נסביר שוב - לנו כמיזם אין כוונה לפתח בעצמנו כעת מנוע כזה, אלא יכולת לתמוך בכם בייעוץ והכוונה. מציעה שתשלח זאת לכלל הקבוצה מהמייל הראשון כדי שתוכלו להתקדם משם, ואנחנו נתמוך בשאלות והכוונות ככל שתעלו כאלה, אך לא נעשה זאת בעצמנו.שאלתי שוב, ושוב נעניתי:
שבוע טוב,
לא. הכוונה היתה לקשר בין מי שזכרנו שפנה אלינו בעניין פיתוח מודל לזיהוי הגייה אשכנזית, כדי שתתארגנו יחד. אנחנו לא מתכננים לפתח זאת בעצמנו, רק לייעץ במענה לשאלות מכם. הנה מן המייל הראשון: פניתם אלינו בתקופה האחרונה בנוגע לפיתוח מודל תמלול שיזהה טוב יותר את השפה התורנית וההגייה האשכנזית. סברנו שאולי תרצו לקדם את הנושא יחדיו, ואנחנו נוכל לייעץ כמיטב יכולתנו.
בהצלחה!יש אחד בשם 'אבי בריטמן', יש לו ידע, אך אין לו זמן. אולי יצליחו כמה להתאגד ולעשות משהו...
אם כי, כשראיתי את התוצאות של ג'מיני 2.5, הפסיק לעניין אותי, למען האמת... -
@י-פל כתב בבקשה | תמלול שיעורי תורה עבור AI:
אגב, האם נתינת דוגמאות נוספות להגייה תורנית, תועיל, לדעתך?
מאמין שכן. מדהים לראות את הכוח שיש להנדסה מהירה (כלומר במקום לאמן מודל במיוחד עבור המשימה, רק נותנים הנחייה מותאמת למודל ואת השאר הוא כבר עושה לבד!)
@מתלמד-צעיר כתב בבקשה | תמלול שיעורי תורה עבור AI:
כל מה שזמין ב-AI STUDIO זמין ב-API. אבל מכיוון שזה מודל נסיוני אין לו עדיין מחיר לשימוש מסחרי בכמות גדולה
-
@י-פל כתב בבקשה | תמלול שיעורי תורה עבור AI:
יש אחד בשם 'אבי בריטמן', יש לו ידע, אך אין לו זמן. אולי יצליחו כמה להתאגד ולעשות משהו...
אם כי, כשראיתי את התוצאות של ג'מיני 2.5, הפסיק לעניין אותי, למען האמת...חבל
אני חושב שכדאי להמשיך במקביל
אי אפשר לדעת מה יהיה בסוף 'הסוס המנצח', ואדרבה יתכן שיהיה אפשר לשלב בין הדברים ונגיע ל99.99% דיוק -
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
הם מסכימים כפי שציינת,
כמו שציינתי,
@י-פל כתב בבקשה | תמלול שיעורי תורה עבור AI:
אנחנו לא מתכננים לפתח זאת בעצמנו, רק לייעץ במענה לשאלות מכם.
-