בקשה | תמלול שיעורי תורה עבור AI
-
סליחה על כך שנעלמתי פתאום.
אני רוצה להתחיל את פרוייקט התמלול.
כעת עדיין אין ממשק מיוחד עבור התמלול התורני, לצערי.
אבל חשבתי להתחיל בינתיים, מכיוון אחר.חשבתי על כך, שבשלב הקרוב כדאי לנסות כך: המתנדבים יתמללו שיעורים שלמים, או חלקי שיעורים. ולא קטעים קצרים, כמו בפרוייקט Ivrit.AI. יש סיפוק גדול יותר בלסיים שיעור שלם, או קטע ארוך בתוך שיעור. גם כשיש את ההקשר השלם, יותר קל להבין מילים לא ברורות או מקוטעות.
כל מתנדב יבחר שיעור שמעניין אותו, יקבל או יתמלל בעצמו (ראה בהמשך) ע"י Whisper לקובץ SRT (זה פורמט קובץ של כיתוביות), ולאחר מכן יתקן את התמלול של השיעור ביישום תיקון קבצי SRT.
יש לנו הסכמה כרגע מאתר "בינינו - שיעורי תורה".
יש באתר הזה מעל ל 1,500 רבנים, ויותר מ 32,000 שיעורים.
זה לא הרבה כמו ב'קול הלשון', אבל זו כמות גדולה.כרגע הממשק עדיין לא מותאם לעברית, ולכן נדרשים מתנדבים עם כישרון או ניסיון טכני.
אז אם אתה רוצה לבוא ולעזור:
איך מתמללים
-
בחר לך שיעור בנושא שמעניין אותך באתר "בינינו".
-
בקש שיתמללו עבורך את השיעור הזה, בקבוצה המיועדת לעניין, כאן, פתוח בנטפרי.
-
עבור על התמלול של השיעור, ותקן אותו, בממשק הזה. מדריך כיצד להשתמש בממשק - כאן.
-
הורד את קובץ ה SRT ושלח אותו לפרוייקט.
התמלול הוא ע"י וויספר בקאגל. מי שמעוניין לתמלל שיעורים עבורו או עבור אחרים, יש מחברת כאן.
קאגל הוא אתר (פתוח בנטפרי) המאפשר להריץ קוד פייתון של מודלי AI על גבי כרטיסי GPU חזקים, בחינם. הוא כמעט זהה לגוגל קולאב, למי שמכיר.
האתר מורכב מעט, ודורש ידע קודם. הוא גם דורש אימות SMS. אני מקווה שנמצא פיתרון לבעיות אלו בהמשך.לכל ענייני הפרוייקט, יש פורום עבור הפרוייקט כאן.
אשמח להשתתפות, הערות והארות.
-
-
@MusiCode כתב
עבור על התמלול של השיעור, ותקן אותו, בממשק הזה.
מי שמעוניין לתמלל שיעורים עבורו או עבור אחרים, יש מחברת כאן.
קודם כל תודה רבה שחזרת, חיכיתי מאוד על הפרוייקט הזה,
נשמח אם תוסיף הדרכה, לשתי הקישורים ששיתפת איך בדיוק עובדים איתם.
יישר כח והמון הצלחה!! -
הנה מדריך כיצד לתמלל שיעורים.
https://tora-transcript.madrichim.ovh/topic/10 -
@jack
אני מבין.
אז אני אנסה לגרום לכל התהליך להיות פשוט ככל האפשר.
אני לא מאמין שאוכל לפתח ממשקים שלמים למען הפרוייקט הזה, כי אלו דברים שלוקחים הרבה מאוד זמן. אבל חייב להיות משהו שאפשר לעשות.ממשק זהה לממשק של Ivrit.AI (תמלול של קטעים קצרים ואקראיים, של עד 30 שניות), יגיע אי"ה בהמשך, כשאחד מיוזמי פרוייקט עברית יחלים מדלקת ריאות.
אבל אני חושב שיש יתרון גדול בתמלול רצוף של קטע שיעור אחד. כך המתמלל מבין את ההקשר של כל מלה. ולכן חשוב לי גם למצוא את הדרך, לתת למתנדבים לעבוד בצורה הזו.
ולכם הקוראים של השרשור הזה: יש לכם רעיון איך ניתן לעשות את זה בצורה פשוטה יותר?
-
@MusiCode כתב בבקשה | תמלול שיעורי תורה עבור AI:
אם אני אתן רק קובץ טקסט של התמלול, וקובץ של שיעור וידאו.
זה יהיה יותר פשוט?
נראה לכם שבצורה כזו תוכלו לתמלל את השיעורים?Zזה נשמע הרבה יותר הגיוני אם יהיה כבר שיעורים מתומללים ואנשים יתקנו וישלחו
-
@דוד-משה-1 כתב בבקשה | תמלול שיעורי תורה עבור AI:
זה נשמע הרבה יותר הגיוני אם יהיה כבר שיעורים מתומללים ואנשים יתקנו וישלחו
זה מצויין, רק שאני צריך לדעת איזה סוג שיעורים אנשים רוצים...
תביאו פה קישורים לשיעורים, ואני אתמלל אותם.
-
הנה שיעור לדוגמא של הרב רוזנבלום.
יש שם קובץ וידאו, קובץ כיתוביות (srt), וקובץ טקסט.
קחו את הוידאו וקובץ הטקסט.
אפשר לתקן גם חלק מהשיעור, לא חייבים את הכל.
https://drive.google.com/open?id=1uMDHXIZPYJdt4v1gX7_EGlUR0f3h9rHP&usp=drive_fs
עקרונית פתוח בנטפרי, אבל איני יודע לגבי קהילות. -
אפשר בעיקרון לפתוח ערוץ יוטיוב משלך (פרטי)
אחרי שאתה מעלה את הסירטון יש אפשרות של כתוביות
שם אתה יכול לתקן את הכתוביות האוטומטיות וגם להוריד את הקובץ של הכתוביותאולי יצליח גם באידיש
בהצלחה בדקתי את זה בסתם שיעור ויצא די מוצלח
מי שיש לו נטפרי יכול לבקש הרשאה מנטפרי לערוץ משלו על פי התנאים שלהם
לא כ"כ מסובך