להורדה | תוכנה לתמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין
-
@כבוד-הרב כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
- יש להוריד את הקובץ zip הזה
- לחלץ באמצעות לחיצה על מקש ימני על הקובץ שירד ואז ללחוץ על "חלץ כאן"
- להוריד את הקובץ exe של התוכנה מכאן
(למחשבי מאק יש להוריד את הקובץ הזה ולמחשבי לינוקס את הקובץ הזה) - ללחוץ מקש ימיני על הקובץ zip שירד ולבחור ב- "חלץ כאן"
- יש להוריד את הקובץ ההפעלה של המודל תמלול (הוא תופס 2.9 GB)
- לשים את הקובץ שהורדנו בתוך התקייה "faster-whisper-large-v2" שבתוך תקייה "_models" .
דוגמה לצורת שמירת הקבצים בספוילר:
Spoiler
שלב ב' ביצוע התמלול:
עכשיו אחרי ששמרתם את כל הקבצים תוכלו לגרור קובץ שמע/וידיאו מעל הקיצור דרך "whisper-faster - קיצור דרך" שנמצא בתקיית "Whisper-Faster" ואז יפתח חלון של שורת הפקודה והקובץ יתומלל אוטמטית.מומלץ מאוד להעתיק את הקיצור דרך "whisper-faster - קיצור דרך" לנתיב הבא:
מכיוון שהפקודות מופעלות ע"י קיצור דרך
חשוב לציין שכל זה רק למי שתקיית ההורדות שלו בכונן C, וגם הוא לא שינה את הברירת מחדל להורדות.
כי הרבה טכנאים מחלקים את הכונן לכמה מחיצות ומעבירים את תקיות המתשמש כולל "הורדות" למחיצה אחרת, (כדי שבמקרה הצורך יהיה קל להתקין מחדש בלי למחוק את קבצי המשתמש)
למי שזה לא כך הקיצור דרך לא תקף אלא אם יערוך אותו או יצור חדש
-
-
@ישראל-142 כתב במדריך | תמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין:
מכיוון שהפקודות מופעלות ע"י קיצור דרך
חשוב לציין שכל זה רק למי שתקיית ההורדות שלו בכונן C, וגם הוא לא שינה את הברירת מחדל להורדות.
כי הרבה טכנאים מחלקים את הכונן לכמה מחיצות ומעבירים את תקיות המתשמש כולל "הורדות" למחיצה אחרת, (כדי שבמקרה הצורך יהיה קל להתקין מחדש בלי למחוק את קבצי המשתמש)למי שזה לא כך הקיצור דרך לא תקף אלא אם יערוך אותו או יצור חדש
תיקניתי את זה במדריך
שימו לב! המדריך נכתב בהנחה שתקיית ההורדות שלכם בכונן C וכן ששמרתם את הקבצים בתקייה "Whisper-Faster" שבתוך תקיית ההורדות. אם אצלכם זה לא ככה צריך לשנות את הנתיבים במאפינים של הקיצורי דרך.
-
@מישהו12 כתב במדריך | CobaltTranscriber - ממשק חצי גרפי לתמלול אופליין באמצעות faster whisper:
לא חשבתי על זה שאנגלית לא טובה כאן לכולם...
תרגמתי את הסקריפט, מצורף:
cobalttranscriber מתורגם.bat -
@האדם-החושב
תודה רבה!
יש פתרון לזה שהמילים הפוכות? -
@מישהו12 כתב במדריך | תמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין:
חסר לו רכיב בשם CUDA להרצת התוכנה הזו על GPU.
לא!
התקנתי את הרכיב הזה!
ובצילו"מ רואים במפורש שהוא עובד על CUDA!
[איפה שלכולם כתוב: ON CPU, אצלי כתוב ON CUDA]. -
@מישהו12 @כבוד-הרב @י-פל @A0533057932 @צדיק-תמים @כולם
הריני מתכבד להודיעכם
כי לאחר עבודה רבה ויסודית
ולאחר שהשוויתי את התוצאות של התמלול בפלטפורמות השונות הקיימות,
אפרט את היעילות:1] בהקלטה ברורה וחדה, ושהדובר מדבר בה בעברית רהוטה צחה ותקנית עם מבטא עברי ובלי שגיאות וכו' וכו',
במקרה כזה אין הבדל ביניהם, וכולם מצליחים לזהות כמעט 100% מהמילים כולל פסיקים וסימני שאלה וכו',2] בהקלטה שהדובר לא ברור, מבליע מילים מדבר מהר, במבטא עמום, יש סביבו רעשי רקע, חסר חיתוך אותיות, קול מונטוני אחיד או הגייה לא אחידה ומעורבלת, גם במקרה כזה אין הבדל ביניהם, וכולם ממציאים, או לא מצליחים בכמעט 100% מהמילים.
3] מתי ההבדל? כמובן בהקלטות סטנדרטיות, שהם משהו באמצע, אני בחרתי להתמקד בבדיקת והשוואת התמלול בהקלטות תורניות ובהגייה ליטאית, אך כשהדיבור יחסית ברור, וכמובן בלי רעשי רקע רבים, השוויתי אותם בהקלטה של 25 דקות לפחות,
ההשוואה היתה ב4 פלטפורמות חלקם מהמובילות והמפורסמות ביותר,1] זיהוי דיבור של גוגל,
2] זיהוי דיבור של מייקרוסופט
3] התוכנה הנוכחית,
4] אתר חינמי מוגבל.האתר הרביעי אכזב מיד, הוא מרבה מאד בהמצאות ומכניס לך המון משפטים לתוך הפה, נראה שהוא בנוי על מילון של משפטים והוא מנסה להבין איזה מתוכם הכי הגיוני שאמרת.......
גוגל ממול מייקרוסופוט - ההשוואה קצת קשה, בסוף יש נטיה מסוימת למייקרוסופט שמדייקת יותר פעמים,
מה שהכריע לבסוף את הכף... שגוגל זה חינמי רק בהתחלה [בAPI] אבל מייקרוסופוט זה לכל חודש 5 שעות חינם.... לשימוש רגיל זה לפעמים מספיק..... וזה וודאי לא פחות מגוגל, בכל אופן לא משהו שרואים, אם כבר זה רק יותר,התוכנה הזאת ממול מייקרוסופוט - התלבטתי מאד הרבה זמן, כי בדרך כלל התוצאה זהה.... היו פה ושם מילים שאחד מהם יותר קלט, בדרך כלל מייקרוספוט יותר מדייקים בכל הקשור למילים תקניות, כנראה יש להם זיהוי רחב ועמוק מובנה מילון ועל פי ניקוד! [למשל כשאמרתי "מטה" [של מרע"ה] הוא לא חשב שאמרתי "מתה" כי זה לא תקני בניקוד הזה, אבל התוכנה הזאת לא חישבנה את זה, וחשבה שאמרתי "מתה" בסגו"ל...] , לעומת זה כשהדיבור לא היה מספיק חד וברור, או כשהיה הגייה למדנית וכדומה שאין לשום תוכנה, בזה לפעמים דווקא התוכנה הנוכחית דייקה יותר ממיקרוסופוט!! כנראה היא יותר 'מתאמצת' לדייק לפענח לפי הצלילים ולא רק לפי מילים קלאסיות שהיא מכירה....]
ולכן הרבה זמן בדקתי וניסיתי את ההבדלים בטקסט רב,
ואני חייב לומר שלמעשה שתיהם מזהים מאד יפה! אפילו שזה לא בהגייה עברית תקינה... כולל פסיק, אתנחתא, וסימן שאלה, [,.?]
ואפשר בעבודה פשוטה יחסית לעבור על הכל ולתקן,
בסופו של דבר כמובן יש מעלה במייקרוספוט שהשרתים שלה המפלצתיים מפענחים בזמן קצר יחסית,
מצד שני כאן זה חינמי... וגם יוצא מחולק יפה לפי שניות,
בסופו של יום ולאחר השוואות רבות, מסקנתי היא כך: אם המילים של הדובר ברורות חדות, עם הפסקות נורמליות ביניהם- וההגייה שלו היא כעברית תקינה- מייקרוספוט היא הטובה ביותר! כיון שכל מילה מפוענחת בהתאם לאפשרויות התקניות בלבד, [וכמו שהבאתי דוגמא 'מטה' היא לא תטעה שאמרת 'מתה' כי זה ניקוד אחר], אבל בכל הקלטה שהדובר לא הכי ברור, או בהגייה למדנית וכדומה- בזה עדיף התוכנה שלנו כי היא מדייקת לפי הצלילים גם אם זה לא מדאי הגיוני בשבילה, והיא לא מבינה מה אמרת, למשל כשאמרתי "אברה-קדברה" רק התוכנה זיהתה נכון.... כנ"ל בהרבה מילים למשל "חפצא של אנשים", כי מייקרוסופוט מעדיפה לשפר את המילה לפי מילון הגיוני יותר, ובסופו של דבר לדעתי יש בהחלט נטייה לטובת התוכנה שלנו!!!! [גם כי זה יוצא יותר מובן לקורא, וגם כי למעשה מדייק יותר פעמים]
[רק צריך מחשב חזק, הכי טוב לפחות G16 RAM]בעז"ה נקווה שהתוכנה תתאמן גם על קולות תורניים, ובכל ההגיות,
ואסיים בתודה לכל מי שעזר עד כה וסייע בדברים
זה דבר חשוב ותועלתי ועד היום נכתבו עשרות[!] שרשורים מלאי פוסטים רק בחיפוש אחר תוכנה כזאת.......@KINGYOS האם עכשיו תוכל להעלות זאת לשרת בצורה מסודרת? תראה ש-@אלישי רצה את זה כבר כאן.
נ"ב: דוגמא נחמדה שהביאו פה פעם ממייקרוסופט [מזיהוי דיבור בוורד]....
-