בקשה | תמלול שיעורי תורה עבור AI
-
@צדיק-תמים לא הצלחתי להעלות את זה כקישור.
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
איך כל אחד יוכל לאמן את הAI על הקול האישי
לצערי אני לא מבין באימון.
אבל בנושא איסוף המידע, ראיתי הזדמנות וקפצתי עליה...
לידיעתי זה לא כל כך קשה, אבל ידרוש הרבה ידע.
הידע הזה זמין בעברית ובאנגלית בפורומים שונים, ואני מניח שאפשר גם להשתמש בכוח העיבוד של גוגל קולאב עבור זה.
מוזמן לחפש...
מראה מקום אחד שאני זוכר ככה "בשלוף" - הבלוג של MDLI:
https://machinelearning.co.il@יעקב_אליה כתב בבקשה | תמלול שיעורי תורה עבור AI:
שלח לי הודעה בבקשה
אני שולח.
אני עדיין מנסה לתפוס את קול הלשון.
אם יש פה מישהו שמכיר אנשי מפתח שם, אשמח לעזרה.יש קבוצת ווטסאפ של מנהלי פרוייקט Ivrit.AI, שזה הפרוייקט שאליו אני רוצה להביא את המידע.
אני חושב לפתוח קבוצה בפלטפורמה כלשהי שפתוחה בנטפרי עבור הפרוייקט התורני.
איזו פלטפורמה עדיפה, סלאק או גוגל צ'אט?
הפרוייקט המקורי הוא כזה: המתנדבים אספו אישורים מפודקאסטים ישראליים, לאחר מכן הם חתכו אותם לרצועות של 2 - 25 שניות, הזינו למודל תמלול Whisper (L v2), ומתנדבים מתקנים את השגיאות בדף ייעודי.
למי שרוצה לראות את דף הפרוייקט המקורי - הנה הוא:
https://www.ivrit.ai/he/עברים-דברו-עברית/ -
ככל הנראה, נתחיל בקרוב עם ממשק זהה לממשק הקיים של עברית.AI.
נשכפל את הממשק הקיים תחת תת דומיין נפרד.
אני מקווה שבהמשך, נעשה התאמות, וממשק חדש וטוב יותר. -
@צללית כתב בבקשה | תמלול שיעורי תורה עבור AI:
@MusiCode השאלה היא האם אימון על הגיות ומבטאים של רבנים שונים יהיה תועלתי או שצריך לאמן על הרבה הקלטות של רב מסוים
זו שאלה למבינים באימון מודלים.
אולי @sivan22 ידע לענות?בהחלט יש עדיפות לאימון על מגוון של קולות ומבטאים שונים
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@MusiCode כתב בבקשה | תמלול שיעורי תורה עבור AI:
אני חושב לפתוח קבוצה בפלטפורמה כלשהי שפתוחה בנטפרי עבור הפרוייקט התורני.
האתר שלהם פתוח בנטפרי
רק צריך למצוא דרך להכניס לשם הקלטות תורניות.ברגע שיהיה אישור מהרבה רבנים, או מקול הלשון, נבקש ממשק מקביל עבור תכנים תורניים.
אחד ממנהלי הפרוייקט אמר לי שהם רוצים מינ' 20 דוברים, ו 100 שעות.
@MusiCode יישר כח על היוזמה
כמה הערות:
היתרון של קול הלשון הוא במסה העצומה של המידע שנמצא אצלם אבל יש להם כמה חסרונות:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
2)איכות הקול היא לכל היותר איכות קו טלפון שכן זהו מקור ההקלטה על פי רוב
-
@צללית כתב בבקשה | תמלול שיעורי תורה עבור AI:
@MusiCode השאלה היא האם אימון על הגיות ומבטאים של רבנים שונים יהיה תועלתי או שצריך לאמן על הרבה הקלטות של רב מסוים
זו שאלה למבינים באימון מודלים.
אולי @sivan22 ידע לענות?בהחלט יש עדיפות לאימון על מגוון של קולות ומבטאים שונים
-
@MusiCode יישר כח על היוזמה
כמה הערות:
היתרון של קול הלשון הוא במסה העצומה של המידע שנמצא אצלם אבל יש להם כמה חסרונות:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
2)איכות הקול היא לכל היותר איכות קו טלפון שכן זהו מקור ההקלטה על פי רוב
@jack כתב בבקשה | תמלול שיעורי תורה עבור AI:
@MusiCode יישר כח על היוזמה
כמה הערות:
היתרון של קול הלשון הוא במסה העצומה של המידע שנמצא אצלם אבל יש להם כמה חסרונות:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
מה הקשר?
הוא יתמלל גם אותו.2)איכות הקול היא לכל היותר איכות קו טלפון שכן זהו מקור ההקלטה על פי רוב
לא ממש, יש שם המון דאטה של סרטי וידיאו איכותיים מאד.
-
@MusiCode יישר כח על היוזמה
כמה הערות:
היתרון של קול הלשון הוא במסה העצומה של המידע שנמצא אצלם אבל יש להם כמה חסרונות:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
2)איכות הקול היא לכל היותר איכות קו טלפון שכן זהו מקור ההקלטה על פי רוב
@jack כתב בבקשה | תמלול שיעורי תורה עבור AI:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
@MusiCode כתב בבקשה | תמלול שיעורי תורה עבור AI:
הפרוייקט המקורי הוא כזה: המתנדבים אספו אישורים מפודקאסטים ישראליים, לאחר מכן הם חתכו אותם לרצועות של 2 - 25 שניות, הזינו למודל תמלול Whisper (L v2), ומתנדבים מתקנים את השגיאות בדף ייעודי.
לא תוכל למצוא 25 שניות ללא החתימה הנ"ל???
-
@NH-LOCAL א
אבל יש היגיון לאמן דווקא עם רבנים פופולרים ומבוקשים שכן ככל שהמודל ייתאמן עליו יותר הוא גם ידייק אותו יותר
@jack כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL א
אבל יש היגיון לאמן דווקא עם רבנים פופולרים ומבוקשים שכן ככל שהמודל ייתאמן עליו יותר הוא גם ידייק אותו יותר
עקרונית זה נכון. אבל בא נאמר שהמטרה של יצירת מודל כזה, היא ממש לא להיות מותאם לרב מסויים, ככה שבפועל, אין שום עניין לאמן דוקא עם הקלטות של רב זה או אחר
בהערת אגב, לגוגל היה בעבר פרוייקט של זיהוי דיבור לאנשים עם בעיות בדיבור וכו', באחד המקרים הם בנו זיהוי דיבור לאדם ספציפי באופן מיוחד
https://www.laptopmag.com/features/project-euphonia-help-people-with-atypical-speech
-
נדמה לי שבדקתי פעם וראיתי שזה לא ממש נמצא בתוך הקובץ, אלא בתוך הנגן,
כלומר אם מורידים את הקובץ עצמו דרךF12 למשל, אין את חתימת הקול. -
@MusiCode יישר כח על היוזמה
כמה הערות:
היתרון של קול הלשון הוא במסה העצומה של המידע שנמצא אצלם אבל יש להם כמה חסרונות:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
2)איכות הקול היא לכל היותר איכות קו טלפון שכן זהו מקור ההקלטה על פי רוב
@jack כתב בבקשה | תמלול שיעורי תורה עבור AI:
איכות הקול היא לכל היותר איכות קו טלפון שכן זהו מקור ההקלטה על פי רוב
גם אם אכן כך, יש להם מערכת בקרת איכות שיעורים, והם מגיעים לרמה גבוהה במיוחד (כמובן לא איכות של הקלטת סאונד באולפן, אבל זה לא יורד מרמת הקלטה קלאסית של שיעורים
-
@MusiCode יישר כח על היוזמה
כמה הערות:
היתרון של קול הלשון הוא במסה העצומה של המידע שנמצא אצלם אבל יש להם כמה חסרונות:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
2)איכות הקול היא לכל היותר איכות קו טלפון שכן זהו מקור ההקלטה על פי רוב
-
@jack כתב בבקשה | תמלול שיעורי תורה עבור AI:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
@MusiCode כתב בבקשה | תמלול שיעורי תורה עבור AI:
הפרוייקט המקורי הוא כזה: המתנדבים אספו אישורים מפודקאסטים ישראליים, לאחר מכן הם חתכו אותם לרצועות של 2 - 25 שניות, הזינו למודל תמלול Whisper (L v2), ומתנדבים מתקנים את השגיאות בדף ייעודי.
לא תוכל למצוא 25 שניות ללא החתימה הנ"ל???
@2580 כתב בבקשה | תמלול שיעורי תורה עבור AI:
@jack כתב בבקשה | תמלול שיעורי תורה עבור AI:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
@MusiCode כתב בבקשה | תמלול שיעורי תורה עבור AI:
הפרוייקט המקורי הוא כזה: המתנדבים אספו אישורים מפודקאסטים ישראליים, לאחר מכן הם חתכו אותם לרצועות של 2 - 25 שניות, הזינו למודל תמלול Whisper (L v2), ומתנדבים מתקנים את השגיאות בדף ייעודי.
לא תוכל למצוא 25 שניות ללא החתימה הנ"ל???
ברור שאפשר למצוא אבל נראה לי שהם לא בוחרים את הקטעים אלא חותכים אותם באופן אוטומטי כך שהבעיה נשארת.
-
@2580 כתב בבקשה | תמלול שיעורי תורה עבור AI:
@jack כתב בבקשה | תמלול שיעורי תורה עבור AI:
1)הקבצים עוברים עיבוד ויש מעין "חתימת מים" שמכריז בשקט "קול הלשון" שמוסיפים לכל קובץ שיש בקול הלשון ויכול להיות שקצת "מלכלך" את המידע -ייתכן שאם קול הלשון יאשרו לכם להשתמש במאגר יורידו את זה
@MusiCode כתב בבקשה | תמלול שיעורי תורה עבור AI:
הפרוייקט המקורי הוא כזה: המתנדבים אספו אישורים מפודקאסטים ישראליים, לאחר מכן הם חתכו אותם לרצועות של 2 - 25 שניות, הזינו למודל תמלול Whisper (L v2), ומתנדבים מתקנים את השגיאות בדף ייעודי.
לא תוכל למצוא 25 שניות ללא החתימה הנ"ל???
ברור שאפשר למצוא אבל נראה לי שהם לא בוחרים את הקטעים אלא חותכים אותם באופן אוטומטי כך שהבעיה נשארת.
-
@jack כתב בבקשה | תמלול שיעורי תורה עבור AI:
2)איכות הקול היא לכל היותר איכות קו טלפון שכן זהו מקור ההקלטה על פי רוב
גם אם זה נכון זה בדיוק מה שצריך שהמודל יתאמן גם על הקלטות לא איכותיות כיון שהוא אמור לפענח גם הקלטות לא איכותיות...
@2580 כתב בבקשה | תמלול שיעורי תורה עבור AI:
@jack כתב בבקשה | תמלול שיעורי תורה עבור AI:
2)איכות הקול היא לכל היותר איכות קו טלפון שכן זהו מקור ההקלטה על פי רוב
גם אם זה נכון זה בדיוק מה שצריך שהמודל יתאמן גם על הקלטות לא איכותיות כיון שהוא אמור לפענח גם הקלטות לא איכותיות...
בעקרון אתה צודק ,אבל :
1.קל יותר "למאמנים האנושיים" לשקלט קבצי קול ברורים יותר
2.בראיה צופה פני עתיד ,בדור 4 VOLTE איכות הקול אמורה להיות יותר גבוהה אז הגיוני לאמן את המודל ברמת האיכות הגבוהה ביותר שאפשר
ולכן לדעתי עדיף לנסות לקבל מאנשים פרטיים את ההקלטות ישר ממכשיר ההקלטה