להורדה | תוכנה לתמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין
-
@האדם-החושב יחסית תמלול מצויין [סו״ס זה לא הרצאה שהשפה יותר קולחת]
@gogo בהחלט, לא באתי להתלונן, רק לראות אם אפשר לשפר את זה קצת יותר [שבמקום "לבונה" יהיה לבנה, וכן ע"ז הדרך]
אגב תמללתי גם את השיר הזה:
אחים.mp3
וחוץ מזה שהוא פעם חוזר על הפזמון ופעם לא יש שם גם כמה פאשלות
תמלול 2.txt -
@י-פל כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
יש סיכוי אולי לתמלול מיידי? כמו שיש בוורד 365?
כן, אבל... רק אם יהיה לך שרתים ברמה של מיקרוסופט
-
@gogo בהחלט, לא באתי להתלונן, רק לראות אם אפשר לשפר את זה קצת יותר [שבמקום "לבונה" יהיה לבנה, וכן ע"ז הדרך]
אגב תמללתי גם את השיר הזה:
אחים.mp3
וחוץ מזה שהוא פעם חוזר על הפזמון ופעם לא יש שם גם כמה פאשלות
תמלול 2.txt@האדם-החושב עדיין תמלול מצויין
אני מתלבט אם לשים את זה על מק או שיכול לעשות בעיות? -
א' הייתי מציג שאת הנתיב לתוכנה יכניסו לתוך קובץ הbat עצמו
ב' לבחור את קובץ השמע על ידי file picker dialog
https://stackoverflow.com/questions/15644511/open-the-open-dialogbox-from-cmd
ג' יש אופציה לשמור את הפלט כקובץ טקסט ללא החותמת זמן?
ד' יש דרך לאמן את המודול על קול ספציפי? @sivan22 [פשוט ניסיתי לתמלל הקלטה של ר' אשר וייס, זה הקובץ: פרשת בא.mp3
וזאת התוצאה [של הכמה דקות הראשונות]
תמלול 1.txt
מה לעשות, כנראה הוא לא אומן על דוברי יידיש...] -
@אלף-שין כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
כמו"כ אני חוזר ושואל אם מישהוא יוכל להעלות את הספרייה למגיקוד בלי לפרסם פה?
העלתי מה עכשיו איך רואים את זה?
-
א' הייתי מציג שאת הנתיב לתוכנה יכניסו לתוך קובץ הbat עצמו
ב' לבחור את קובץ השמע על ידי file picker dialog
https://stackoverflow.com/questions/15644511/open-the-open-dialogbox-from-cmd
ג' יש אופציה לשמור את הפלט כקובץ טקסט ללא החותמת זמן?
ד' יש דרך לאמן את המודול על קול ספציפי? @sivan22 [פשוט ניסיתי לתמלל הקלטה של ר' אשר וייס, זה הקובץ: פרשת בא.mp3
וזאת התוצאה [של הכמה דקות הראשונות]
תמלול 1.txt
מה לעשות, כנראה הוא לא אומן על דוברי יידיש...]@האדם-החושב כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
ג' יש אופציה לשמור את הפלט כקובץ טקסט ללא החותמת זמן?
יש אפשרות אני יבדוק את זה ויעדכן
ד' יש דרך לאמן את המודול על קול ספציפי? @sivan22 [פשוט ניסיתי לתמלל הקלטה של ר' אשר וייס, זה הקובץ: פרשת בא.mp3
וזאת התוצאה [של הכמה דקות הראשונות]
תמלול 1.txt
מה לעשות, כנראה הוא לא אומן על דוברי יידיש...]יש אפשרות אבל זה לא בשבילי עיין במדריך הזה
-
OpenAi הוציאו ספרייה בקוד פתוח לתמלול הקלטות וסרטונים חינם בעשרות שפות ובינהם עברית!.
התמלול עם הספרייה שלהם הוא מההכי איכותים שקימים כיום בשוק, הוא אמן על 680,000 שעות! של דיבור.
במדריך זה אני יביא תוכנה שמתמללת הקלטות עם אחד המודלים שהוכן לזה, שלא מצריך התקנות למינהם וסיבוכים מיותרים.
שימו לב שזה צריך מחשב סטנדרטי ומעלה. וכן שזה להוריד למחשב קובץ ששוקל בערך 3 GB.שימו לב מצאתי תוכנה עם ממשק גרפי בעברית בפוסט הזה
להתקנה יש לפעול עפ"י השלבים הבאים:
-
הורידו את תוכנית ההתקנה מכאן.
-
יש לחלץ את התוכנה, הסיסמה היא: "מתמחים"
-
להפעיל את קובץ ההתקנה וללחוץ על התקן.
הקבצים ישמרו בתקיית "Program Files" עדיף שלא לשנות נתיב כי אז הקיצורים בשלח אל לא יעבדו.
שימו לב! מכיוון שזה שומר את התקייה של התוכנה בכונן C, יש לתת הרשאות מנהל כשיתבקש.ביצוע התמלול:
- יש ללחוץ על לחצן ימני בעכבר על הקובץ שאתם רוצים לתמלל ולבחור ב "שלח אל"-"תמלול בעברית"
אם אתם רוצים לתמלל הקלטה באנגלית יש לבחור ב-"שלח אל"-"Transcript in English"
יקח כמה דקות שבסופם תקבלו את התמלול של ההקלטה/סרטון שהכנסתם, והחלון שנפתח ישמיע צליל ויסגר.
התמלול ישמר בקובץ טקסט בתקייה שבה נמצא הקובץ שתומלל, ושמו יהיה כשם הקובץ שתומלל.
לאלו שיש להם כרטיס מסך של NVIDIA צריך להתקין CUDA. כדי שהתמלול יעבוד.
פרטים בספוילר:כדי להשתמש בתוכנה למי שיש לוכרטיס מסך של NVIDIA צריך להתקין CUDA.
יש לפעול לפי השלבים הבאים:- להוריד את התוכנה מכאן ולהתקין אותה על המחשב.
- להוריד את הקובץ הזה.
- לחלץ את הקובץ שהורדנו (בשלב 2) ולשים אותו בנתיב הבא: "toolkit\cuda\bin"
אם עדיין יש לכם בעיות עם זה אפשר תמיד להגיב בשרשור.
מקורות לעיון בבעיות כאן
קרדיט-@י-פלתוכנות ואתרים נוספים:
- התוכנה הזאת רק עם ממשק חצי גרפי עפ"י מה ש-@מישהו12 כתב כאן.
- תוכנה עם ממשק גרפי אמיתי ש-@תודה-לבורא-עולם פרסם עליה מדריך כאן.
- תוכנה ש-@מישהו12 הביא כאן (לא ראיתי מישהו שבדק אותה בפועל).
- אתר שאני כתבתי עליו מדריך כאן
- האתר הזה בעבר ראיתי שיש לו תוצאות די טובות (כרגע זה נראה שהוא עושה בעיות)
מקור:
https://github.com/Purfview/whisper-standalone-win/tree/main
פרטים נוספים למפתחים בפוסט הזה -
-
@כבוד-הרב ערכתי בפנים לאנגלית וזה עשה לי שגיאה
עריכה: הייתי צריך את האות הראשונה לעשות אות גדולה. הסתדר הענין. יישר כח ל @כבוד-הרב ול @ישראל-142
-
@אלף-שין כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
תוכל לפרט יותר?
אני בעצמי לא מבין בזה, רק הבאתי מ"מ, אולי @NH-LOCAL יוכל לעזור
שיניתי קצת את קובץ הbat, בשורה 3 צריך להכניס את הנתיב של התוכנה ,הקובץ המיוצא הוא בפורמט txt והוא נוצר באותה תיקייה של קובץ האודיו
whisper-faster (2).bat
אגב אפשר גם לגרור את קובץ האודיו מעל חלון המסוף הפתוח וזה מכניס את הנתיב אוטומטית
לגבי הסרת החותמת זמן ראיתי בהוראות את זה:--word_timestamps WORD_TIMESTAMPS, -wt WORD_TIMESTAMPS (experimental) extract word-level timestamps and refine the results based on them (default: True)
ואת זה:
--without_timestamps WITHOUT_TIMESTAMPS Only sample text tokens. (default: False)
ניסיתי כך:
--without_timestamps
והוא מצריך ארגומנטים, ניסיתי
--without_timestamps=True
והוא מחזיר לי את השגיאה הזו:
Error: --without_timestamps and --word_timestamps doesn't work together.
אז ניסיתי כך:
--word_timestamps=False
והכל תקין, רק ש... כשאני מגיע לקובץ הטקסט יש שם חותמת זמן
ניסיתי גם כך:--word_timestamps=False --without_timestamps=True
וקיבלתי את אותה התוצאה [אם כי נראה שבמקרה הזה הוא עוקף על משפטים כפולים]
יש עוד הרבה אופציות להרצה [יש שם גם תרגום ועוד], צריך להריץ מתוך תיקיית התוכנה את התוכנה עם הארגומנט --help, מצרף את הטקסט:
help.txt
למשל ניתן גם לתמלל ביידיש על ידי החלפת Hebrew ב Yiddish -
@אלף-שין כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
תוכל לפרט יותר?
אני בעצמי לא מבין בזה, רק הבאתי מ"מ, אולי @NH-LOCAL יוכל לעזור
שיניתי קצת את קובץ הbat, בשורה 3 צריך להכניס את הנתיב של התוכנה ,הקובץ המיוצא הוא בפורמט txt והוא נוצר באותה תיקייה של קובץ האודיו
whisper-faster (2).bat
אגב אפשר גם לגרור את קובץ האודיו מעל חלון המסוף הפתוח וזה מכניס את הנתיב אוטומטית
לגבי הסרת החותמת זמן ראיתי בהוראות את זה:--word_timestamps WORD_TIMESTAMPS, -wt WORD_TIMESTAMPS (experimental) extract word-level timestamps and refine the results based on them (default: True)
ואת זה:
--without_timestamps WITHOUT_TIMESTAMPS Only sample text tokens. (default: False)
ניסיתי כך:
--without_timestamps
והוא מצריך ארגומנטים, ניסיתי
--without_timestamps=True
והוא מחזיר לי את השגיאה הזו:
Error: --without_timestamps and --word_timestamps doesn't work together.
אז ניסיתי כך:
--word_timestamps=False
והכל תקין, רק ש... כשאני מגיע לקובץ הטקסט יש שם חותמת זמן
ניסיתי גם כך:--word_timestamps=False --without_timestamps=True
וקיבלתי את אותה התוצאה [אם כי נראה שבמקרה הזה הוא עוקף על משפטים כפולים]
יש עוד הרבה אופציות להרצה [יש שם גם תרגום ועוד], צריך להריץ מתוך תיקיית התוכנה את התוכנה עם הארגומנט --help, מצרף את הטקסט:
help.txt
למשל ניתן גם לתמלל ביידיש על ידי החלפת Hebrew ב Yiddish@האדם-החושב אולי אם אתה מבין בנושא (כי אני כמעט ולא) אם תוכל להכין קובץ bat מרובה אפשרויות לטובת הציבור
וכן לפתור בו את הבעיה שהוא לא מציג תווים בעברית (פעם ידעתי איך פותרים את זה אני לא מצליח להיזכר איך) -
@כבוד-הרב זה עובד אבל יחסית לאט. יש לי סרטון של רבע שעה והוא עובד עליו כבר למעלה מחצי שעה.. אם במקום וידיאו אני אשים הקלטה זה יעבוד מהר יותר?
-
@האדם-החושב אולי אם אתה מבין בנושא (כי אני כמעט ולא) אם תוכל להכין קובץ bat מרובה אפשרויות לטובת הציבור
וכן לפתור בו את הבעיה שהוא לא מציג תווים בעברית (פעם ידעתי איך פותרים את זה אני לא מצליח להיזכר איך)@כבוד-הרב כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
וכן לפתור בו את הבעיה שהוא לא מציג תווים בעברית (פעם ידעתי איך פותרים את זה אני לא מצליח להיזכר איך)
https://mitmachim.top/topic/484/עברית-ב-cmd
https://mitmachim.top/topic/43694/מדריך-הוספת-עברית-ל-cmd-שורת-הפקודה