בקשה | תמלול שיעורי תורה עבור AI
-
@מתלמד-צעיר כתב בבקשה | תמלול שיעורי תורה עבור AI:
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@מתלמד-צעיר
מדהים מה שעשית!!זה מהיר מדויק ומועיל מאד!
תוצאות התמלול של השיעור הנ"ל.txtזה ממש בשורה גדולה ומיוחדת!!
תזכה למצוות! ייש"כ גדול!!
תודה לך
הודעות כאלה נותנות לי כח לתכנן ולכתוב את הסקריפט הבא...מה ההנחייה הסופית שנתת לו?
-
תצטרך לבחור גם בהגייה חסידית, ולפי איזו קהילה.
וגם בהגייה הליטאית יש הבדל בין הישיבתית הרגילה או הכבדה, וכיו"ב... -
@איש-שלו @צבי-דורש-ציון
נראה לי מדאי מורכב, בסוף זה רק יכביד על כל הפיתוח,
@מתלמד-צעיר @NH-LOCAL
אולי כדאי באמת לנסח הנחיות שמקיפות את כלל ההגיות התורניות בבת אחת,
[כמובן להוסיף הנחיה שהמודל יזהה [לפי מספר משפטים ראשונים] מהי ההגייה שבה השתמשו בשיעור הזה]
אולי כדאי גם להוסיף סיכום של AI בסוף
זה ישדרג פלאים!!וכך מהיום גם אם מישהוא הפסיד שמיעת שיעור, או שאין באפשרותו להשתתף
יהיה פתרון פשוט!
הוא יעלה את ההקלטה לדרייב, יפעיל את הסקריפט של @מתלמד-צעיר
ולאחר כמה דקות יקבל את התמלול + הסיכום המתומצת
ממש ימות המשיח!!.....[ואולי בהמשך יהיה גם אפשרות דרך הקלטה ישירה לטלפון בימות המשיח.....]
והנה רעיון מהפכני [כל הזכויות שמורות....]
אני ממליץ בחום ל @קול הלשון לתמלל את כלל השיעורים [בג'מיני כמובן]
ולהעלות לאתר שלהם גם את התמלול של השיעורים +הסיכום,
[בשלב השני זה יאפשר להוסיף את כל השיעורים למאגר תורני מוקלד, ויהיה אופציה של חיפוש מהיר, וכן מיון לפי נושאים]......אדיר!!!!!!!!!!
אמנם אני הראשון שזיהיתי.....
אבל ברור שיש כאן פוטנצייאל אדיר!
זה אחוזי דיוק גבוהים מאד מאד!@י-פל יש לך מושג למי ניתן לפנות ב"קול הלשון"?
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
[ואולי בהמשך יהיה גם אפשרות דרך הקלטה ישירה לטלפון בימות המשיח.....]
יש לי כבר כזה סקריפט... עוד לא פרסמתי אותו
-
@צבי-דורש-ציון עדכנתי בסקריפט את האפשרות להתאים את הפרומפט באופן אישי
-
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
ואם תחשוב קצת תבין שהוא רעיון אדיר שיעשה מהפך היסטורי בעולם התורה ....
אתה מבין את המשמעות של חיפוש טקסטואלי בכל מאגר השיעורים הגדול בעולם?עם זה אני מסכים לגמרי. וגם משתוקק שזה יקרה.
יעזרנו ה'.המנגינה של דבריך הניחה רושם כאילו יוכלו להחליף את צורת הלימוד..
כאילו לא דיינו שבמקום לבוא לשיעור אנו יושבים ושמועים [או צופים] בו
במה שאינו מוגדר אפילו 'כלי שני' ואינו מבשל
כי אין החכמה עוברת אלא דרך חכם חי, בהארה פנים אל פנים.ואמנם מדוחק השעה ולהגדיל תורה אנו משתמשים בכלי ה'הֶעתק', בהקלטות למיניהן,
[וזה טוב מאוד !!!]
אבל אוי לנו אם יהפך הכל לשכתוב כללי מתוך הקלטה והסרטה...
אפילו צונן זה לא יהיה. -
@NH-LOCAL
נו לא התכוונתי בשניה הזאת.....
באופן כללי כדאי ש@קול הלשון יתחילו להיערך לזה
כי ברגע שיש מודול כל כך מדויק זה נהיה השקעה ממש משתלמת [בהמשך כמובן],
אני מניח שיש להם מקורות מימון לזה, כמו לכל הפרויקט שלהם,
לענ"ד זה יהיה מהפך גדול מאד בעולם התורה כולו!
ברמה של אוצר החכמה וכדומה....@איש-שלו כתב בבקשה | תמלול שיעורי תורה עבור AI:המנגינה של דבריך הניחה רושם כאילו יוכלו להחליף את צורת הלימוד..
איך שלא יהיה את צורת הלימוד זה לא מחליף כי בכל אופן העמל הוא עצמי.....
אני חושב שלא גרע מאוצר החכמה
מישהוא יודע כמה גיגה/שעות יש לקול הלשון?
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL
נו לא התכוונתי בשניה הזאת.....
באופן כללי כדאי ש@קול הלשון יתחילו להיערך לזה
כי ברגע שיש מודול כל כך מדויק זה נהיה השקעה ממש משתלמת [בהמשך כמובן],
אני מניח שיש להם מקורות מימון לזה, כמו לכל הפרויקט שלהם,
לענ"ד זה יהיה מהפך גדול מאד בעולם התורה כולו!
ברמה של אוצר החכמה וכדומה....@איש-שלו כתב בבקשה | תמלול שיעורי תורה עבור AI:המנגינה של דבריך הניחה רושם כאילו יוכלו להחליף את צורת הלימוד..
איך שלא יהיה את צורת הלימוד זה לא מחליף כי בכל אופן העמל הוא עצמי.....
אני חושב שלא גרע מאוצר החכמה
מישהוא יודע כמה גיגה/שעות יש לקול הלשון?
הדרך הנכונה לעשות את זה, היא ליצור מערך נתונים איכותי עבור כמה אלפי-עשרות אלפי שעות באמצעות ג'מיני וכדו', ואחר כך לאמן מודל קטן סטנדרטי על הנתונים הללו ולהשתמש בו לשאר התוכן
-
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL
איזה משאבים דרוש לזה [בהנחה שיש להם כ2 טרה של MP3 {כך שמעתי פעם אם אני זוכר נכון}.]
עריכה- יש להם 4,000,000 קבצי אודיוזה דורש חישוב קצת מורכב להערכה משוערת. פרטים בהמשך
מה שחשוב זה מספר השעות של האודיו, לא מספר הקבצים
חישוב ראשוני (בתהליך):
מחירים משוערים עבור ג'מיני 1.5 PRO (עבור 2.5 המחירים עשויים להיות גבוהים יותר):
קלט אודיו = $0.00003125 לשנייה (10 שעות = דולר אחד)
קלט טקסט = $0.0003125 ל-1000 טוקנים (3.2 מיליון טוקנים = דולר אחד)פלט טקסט = $0.00125 ל-1000 מילה (800,000 טוקנים = דולר אחד)
עבור תוכן ארוך (מעל 128,000 טוקנים) העלות מוכפלת!
עבור שיעור דוגמה קצרצר באורך 6 דקות, העלויות הן כלדלהן:
קלט טקסט = 0.0003 דולר. (הנחיית מערכת איכותית היא כ-1000 אסימונים)
קלט אודיו = 0.01 דולר.
פלט טקסט = 0.0125 דולר.
(בדוגמה שבדקתי, המודל השתמש ב-10,000 אסימונים.)סה"כ = בערך 0.023 דולר, או במילים אחרות: פחות מעשר אגורות.
בקיצור: עבור שיעור של שעה, העלות התיאורטית היא שקל אחד - שניים.
עבור 4,000,000 שיעורים:
העלות המשוערת היא לכל הפחות, מיליון ש"חחשוב לשים לב שאלו נתונים חלקיים מאוד, לא כוללים מידע על עלות המודל החדש, על עלות של פלט ארוך מאוד, שיטות לחיסכון (באמצעות סכמת json, שמירה במטמון), עלויות הפעלת שרת ועוד
-
@NH-LOCAL כתב בבקשה | תמלול שיעורי תורה עבור AI:
השעות של האודיו
אתה יכול לצאת מנקודת ייחוס של 35 דקות לקובץ.
למה אני חושב כך?
כי מעטים השיעורים בני השעתיים, מרובים בני השעה, והמוניים בני ה15 שעה בערך, להתרשמותי במערכת [והיא לא גדולה, ההתרשמות]. -
@אלף-שין כתב בבקשה | תמלול שיעורי תורה עבור AI:
@NH-LOCAL
מחיפוש ברשת לא העליתי דבר [חוץ מזה שאין לי מושג אם זה מוסמך].אבל בוא נניח רגע לפי ממוצע [חישוב גס + ניחוש] כ40 דקות לשיעור
כפול 4 מיליוןעריכה יש דיון על זה בפורום שלנו
ופתחתי על זה שרשור מסודרלפי החשבון שלך, מדובר על בין 2.5 ל-5 מיליון ש"ח עבור תמלול כלל השיעורים
נ.ב. תערוך את ההודעה שלך. השאלה כמה המאגר שוקל כמעט לא משנה, אלא מה האורך של השיעורים בדקות/שעות