להורדה תוכנה לתמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין
-
@מישהו12 כתב במדריך | CobaltTranscriber - ממשק חצי גרפי לתמלול אופליין באמצעות faster whisper:
לא חשבתי על זה שאנגלית לא טובה כאן לכולם...
תרגמתי את הסקריפט, מצורף:
cobalttranscriber מתורגם.bat -
@האדם-החושב
תודה רבה!
יש פתרון לזה שהמילים הפוכות? -
-
@מישהו12 כתב במדריך | תמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין:
חסר לו רכיב בשם CUDA להרצת התוכנה הזו על GPU.
לא!
התקנתי את הרכיב הזה!
ובצילו"מ רואים במפורש שהוא עובד על CUDA!
[איפה שלכולם כתוב: ON CPU, אצלי כתוב ON CUDA]. -
@מישהו12 @כבוד-הרב @י-פל @A0533057932 @צדיק-תמים @כולם
הריני מתכבד להודיעכם
כי לאחר עבודה רבה ויסודית
ולאחר שהשוויתי את התוצאות של התמלול בפלטפורמות השונות הקיימות,
אפרט את היעילות:1] בהקלטה ברורה וחדה, ושהדובר מדבר בה בעברית רהוטה צחה ותקנית עם מבטא עברי ובלי שגיאות וכו' וכו',
במקרה כזה אין הבדל ביניהם, וכולם מצליחים לזהות כמעט 100% מהמילים כולל פסיקים וסימני שאלה וכו',2] בהקלטה שהדובר לא ברור, מבליע מילים מדבר מהר, במבטא עמום, יש סביבו רעשי רקע, חסר חיתוך אותיות, קול מונטוני אחיד או הגייה לא אחידה ומעורבלת, גם במקרה כזה אין הבדל ביניהם, וכולם ממציאים, או לא מצליחים בכמעט 100% מהמילים.
3] מתי ההבדל? כמובן בהקלטות סטנדרטיות, שהם משהו באמצע, אני בחרתי להתמקד בבדיקת והשוואת התמלול בהקלטות תורניות ובהגייה ליטאית, אך כשהדיבור יחסית ברור, וכמובן בלי רעשי רקע רבים, השוויתי אותם בהקלטה של 25 דקות לפחות,
ההשוואה היתה ב4 פלטפורמות חלקם מהמובילות והמפורסמות ביותר,1] זיהוי דיבור של גוגל,
2] זיהוי דיבור של מייקרוסופט
3] התוכנה הנוכחית,
4] אתר חינמי מוגבל.האתר הרביעי אכזב מיד, הוא מרבה מאד בהמצאות ומכניס לך המון משפטים לתוך הפה, נראה שהוא בנוי על מילון של משפטים והוא מנסה להבין איזה מתוכם הכי הגיוני שאמרת.......
גוגל ממול מייקרוסופוט - ההשוואה קצת קשה, בסוף יש נטיה מסוימת למייקרוסופט שמדייקת יותר פעמים,
מה שהכריע לבסוף את הכף... שגוגל זה חינמי רק בהתחלה [בAPI] אבל מייקרוסופוט זה לכל חודש 5 שעות חינם.... לשימוש רגיל זה לפעמים מספיק..... וזה וודאי לא פחות מגוגל, בכל אופן לא משהו שרואים, אם כבר זה רק יותר,התוכנה הזאת ממול מייקרוסופוט - התלבטתי מאד הרבה זמן, כי בדרך כלל התוצאה זהה.... היו פה ושם מילים שאחד מהם יותר קלט, בדרך כלל מייקרוספוט יותר מדייקים בכל הקשור למילים תקניות, כנראה יש להם זיהוי רחב ועמוק מובנה מילון ועל פי ניקוד! [למשל כשאמרתי "מטה" [של מרע"ה] הוא לא חשב שאמרתי "מתה" כי זה לא תקני בניקוד הזה, אבל התוכנה הזאת לא חישבנה את זה, וחשבה שאמרתי "מתה" בסגו"ל...] , לעומת זה כשהדיבור לא היה מספיק חד וברור, או כשהיה הגייה למדנית וכדומה שאין לשום תוכנה, בזה לפעמים דווקא התוכנה הנוכחית דייקה יותר ממיקרוסופוט!! כנראה היא יותר 'מתאמצת' לדייק לפענח לפי הצלילים ולא רק לפי מילים קלאסיות שהיא מכירה....]
ולכן הרבה זמן בדקתי וניסיתי את ההבדלים בטקסט רב,
ואני חייב לומר שלמעשה שתיהם מזהים מאד יפה! אפילו שזה לא בהגייה עברית תקינה... כולל פסיק, אתנחתא, וסימן שאלה, [,.?]
ואפשר בעבודה פשוטה יחסית לעבור על הכל ולתקן,
בסופו של דבר כמובן יש מעלה במייקרוספוט שהשרתים שלה המפלצתיים מפענחים בזמן קצר יחסית,
מצד שני כאן זה חינמי... וגם יוצא מחולק יפה לפי שניות,
בסופו של יום ולאחר השוואות רבות, מסקנתי היא כך: אם המילים של הדובר ברורות חדות, עם הפסקות נורמליות ביניהם- וההגייה שלו היא כעברית תקינה- מייקרוספוט היא הטובה ביותר! כיון שכל מילה מפוענחת בהתאם לאפשרויות התקניות בלבד, [וכמו שהבאתי דוגמא 'מטה' היא לא תטעה שאמרת 'מתה' כי זה ניקוד אחר], אבל בכל הקלטה שהדובר לא הכי ברור, או בהגייה למדנית וכדומה- בזה עדיף התוכנה שלנו כי היא מדייקת לפי הצלילים גם אם זה לא מדאי הגיוני בשבילה, והיא לא מבינה מה אמרת, למשל כשאמרתי "אברה-קדברה" רק התוכנה זיהתה נכון.... כנ"ל בהרבה מילים למשל "חפצא של אנשים", כי מייקרוסופוט מעדיפה לשפר את המילה לפי מילון הגיוני יותר, ובסופו של דבר לדעתי יש בהחלט נטייה לטובת התוכנה שלנו!!!! [גם כי זה יוצא יותר מובן לקורא, וגם כי למעשה מדייק יותר פעמים]
[רק צריך מחשב חזק, הכי טוב לפחות G16 RAM]בעז"ה נקווה שהתוכנה תתאמן גם על קולות תורניים, ובכל ההגיות,
ואסיים בתודה לכל מי שעזר עד כה וסייע בדברים
זה דבר חשוב ותועלתי ועד היום נכתבו עשרות[!] שרשורים מלאי פוסטים רק בחיפוש אחר תוכנה כזאת.......@KINGYOS האם עכשיו תוכל להעלות זאת לשרת בצורה מסודרת? תראה ש-@אלישי רצה את זה כבר כאן.
נ"ב: דוגמא נחמדה שהביאו פה פעם ממייקרוסופט [מזיהוי דיבור בוורד]....
-
-
@אלף-שין תיכף מעלה תוכנה + מדריך לתוכנה אחרת.
גם היא לתמלול אופליין, והבשורה לכל אלו שהסתבכו עם הקיצורים השונים.
ובפרט לאלו שיש להם כרטיס nvidia ולעת עתה לא נמצא פתרון מתאים. וכו' וכו'..
התוכנה שאני משתף עוד מעט היא עם ממשק גרפי פשוט וקל להפעלה, ללא צורך בעריכת קבצי באט וכדומה.יהיה לך עוד עבודה של השוואה.. מול התוכנה שגיליתי, שגם היא משתמשת במודל מודל Whisper large-v2
עריכה:
עלה בעז"ה ובס"ד!!
-
@תודה-לבורא-עולם האמת שנתקלתי בתוכנה הזו (Buzz) ואף מצאתי אחת נוחה אפילו יותר (בעיני).
הבעיה - בשתיהן לא מצאתי איפה ממקמים ידנית את קובץ המודל, וההורדה לא עבדה לי (נטפרי) -
@מישהו12 אני יכתוב עוד מעט איפה מעבירים את קובץ המודול.
אחרי שאני יעלה את זה לדרייב. -
@תודה-לבורא-עולם הקובץ כבר קיים בדרייב, במדריך של הסקריפט שלי
-
@מישהו12 המודול לתוכנה שהעליתי משתמש בפורמט אחר.
לכן זה לא מתאים.עריכה:
הקובץ בתוכנה כאן זה עם סיומת bin ובתוכנה שהבאתי זה עם סיומת pt -
פוסט זה נמחק!
-
פוסט זה נמחק!
-
פוסט זה נמחק!
-
פוסט זה נמחק!
-
@כבוד-הרב באיזה פרמטר השתמשת כדי להוריד את חותמות הזמן כי אני משתמש ב
--without_timestamps
וזה נותן לי שגיאה
Error: --without_timestamps and --word_timestamps doesn't work together.
הפקודה המלאה היא
whisper-faster.exe --task transcribe --language he --output_format txt --without_timestamps audio1.mp3
אשמח אם תוכל לעזור
פוסט 306 מתוך 388