בקשה | תמלול שיעורי תורה עבור AI
-
דבר אחד לא הבנתי, מי אמור להתנגד למהלך? מה העיקרון של "לבקש אישור" זה סה״כ שימוש פרטי ולא הפצה מסחרית של ספר למשל...
-
@Ykingsmart מבחינה חוקית לא בדיוק ברור כל הקטע של שימוש בדאטה ששייך לאנשים לאימון מודלים של AI יש על זה דיונים משפטיים בארץ ובעולם לכאורה הרעיון הוא למנוע אח"כ תביעות משפטיות מכל סוג שהוא
-
@2580 כתב בבקשה | תמלול שיעורי תורה עבור AI:
@Ykingsmart מבחינה חוקית לא בדיוק ברור כל הקטע של שימוש בדאטה ששייך לאנשים לאימון מודלים של AI יש על זה דיונים משפטיים בארץ ובעולם לכאורה הרעיון הוא למנוע אח"כ תביעות משפטיות מכל סוג שהוא
https://www.gov.il/he/departments/legalInfo/machine-learning
-
@Ykingsmart חוץ מהקטע החוקי יש גם את הענין הפרקטי של שת"פ טכני שנדרשים כמו קבלת API ישיר למשל
-
2 דברים 1. לפני כחצי שנה רציתי להוריד מקל הלשון את כל החזנות אז יצרתי סקריפט python שיוריד תיקיה שאתה נותן לה אפשר לנסות לראות אם זה עדיין עובד
2. יש לי שרת טוב לאמן מודול אם אתה צריך, רק אני רוצה להשיג אותו בצורה מסודרת מכיוון שאין לי הרבה זמן עכשיו לפרויקטים צדדיים נוספים (רק צריך להיות פשוט כדי שאוכל להעלות אותו ולהפעיל) -
@10110000 כתב בבקשה | תמלול שיעורי תורה עבור AI:
לפני כחצי שנה רציתי להוריד מקל הלשון את כל החזנות אז יצרתי סקריפט python שיוריד תיקיה שאתה נותן לה אפשר לנסות לראות אם זה עדיין עובד
האמת שבינתיים עם קול הלשון יש בעיות...
אתה רוצה להתאים את הסקריפט לאתר "בינינו"?
-
@י-פל
אגב,
אעיר כבר מראש,
אולי זה מוקדם מדאי....
אבל עדיף מאשר שלא יקרה.....
שחוץ מהשלמת הפרויקט,
חשוב שבנוסף מישהוא יתנדב אח"כ להעלות לדרייב את המודל
כי בינתיים עד היום פורסמו בפורום עשרות פעמים מודלים של AI
ואף אחד לא התנדב להעלותם לדרייב, [חוץ ממודל תמלול [המהדורה הישנה] שהעלית לנו, וזה מאד עוזר!...] -
סליחה על כך שנעלמתי פתאום.
אני רוצה להתחיל את פרוייקט התמלול.
כעת עדיין אין ממשק מיוחד עבור התמלול התורני, לצערי.
אבל חשבתי להתחיל בינתיים, מכיוון אחר.חשבתי על כך, שבשלב הקרוב כדאי לנסות כך: המתנדבים יתמללו שיעורים שלמים, או חלקי שיעורים. ולא קטעים קצרים, כמו בפרוייקט Ivrit.AI. יש סיפוק גדול יותר בלסיים שיעור שלם, או קטע ארוך בתוך שיעור. גם כשיש את ההקשר השלם, יותר קל להבין מילים לא ברורות או מקוטעות.
כל מתנדב יבחר שיעור שמעניין אותו, יקבל או יתמלל בעצמו (ראה בהמשך) ע"י Whisper לקובץ SRT (זה פורמט קובץ של כיתוביות), ולאחר מכן יתקן את התמלול של השיעור ביישום תיקון קבצי SRT.
יש לנו הסכמה כרגע מאתר "בינינו - שיעורי תורה".
יש באתר הזה מעל ל 1,500 רבנים, ויותר מ 32,000 שיעורים.
זה לא הרבה כמו ב'קול הלשון', אבל זו כמות גדולה.כרגע הממשק עדיין לא מותאם לעברית, ולכן נדרשים מתנדבים עם כישרון או ניסיון טכני.
אז אם אתה רוצה לבוא ולעזור:
איך מתמללים
-
בחר לך שיעור בנושא שמעניין אותך באתר "בינינו".
-
בקש שיתמללו עבורך את השיעור הזה, בקבוצה המיועדת לעניין, כאן, פתוח בנטפרי.
-
עבור על התמלול של השיעור, ותקן אותו, בממשק הזה. מדריך כיצד להשתמש בממשק - כאן.
-
הורד את קובץ ה SRT ושלח אותו לפרוייקט.
התמלול הוא ע"י וויספר בקאגל. מי שמעוניין לתמלל שיעורים עבורו או עבור אחרים, יש מחברת כאן.
קאגל הוא אתר (פתוח בנטפרי) המאפשר להריץ קוד פייתון של מודלי AI על גבי כרטיסי GPU חזקים, בחינם. הוא כמעט זהה לגוגל קולאב, למי שמכיר.
האתר מורכב מעט, ודורש ידע קודם. הוא גם דורש אימות SMS. אני מקווה שנמצא פיתרון לבעיות אלו בהמשך.לכל ענייני הפרוייקט, יש פורום עבור הפרוייקט כאן.
אשמח להשתתפות, הערות והארות.
-