להורדה | תוכנה לתמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין
-
@דאנציג כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
או שהקיצור דרך צריך להיות באותה תיקייה של התוכנה.
זה
-
למעשה, יש פתרון למי שיש כרטיס גרפי של NVIDIA?
(נכנסתי לקישור שהובא למעלה, לא יצאתי ברור.)
אגב, לה אין אפשרות 'לדרוש' ממנו לעבוד על המעבר הרגיל של אינטל? -
@צדיק-וטוב-לו-0 תבדוק כאן
-
@כבוד-הרב כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
לאחרונה OpenAi הוציאו ספרייה בקוד פתוח לתמלול הקלטות וסרטונים חינם בעשרות שפות ובינהם עברית!.
התמלול עם הספרייה שלהם הוא הכי איכותי שקיים כיום בשוק הוא אמן על 680,000 שעות! של דיבור.
במדריך זה אני יסביר איך לתמלל הקלטות דרך שורת הפקודה עם אחד המודלים שהוכן לזה שלא מצריך התקנות למינהם וסיבוכים מיותרים.
יש לציין שהוא מתמלל גם וידאו, וקובץ הפלט הוא קובץ כתוביות (SRT) שאפשר לצרף לוידאו.
אני לדוגמה הורדתי את הקבצים ושמרתי אותם על דיסק אונקי ואני משתמש עם זה כתוכנה ניידת.
שימו לב שזה צריך מחשב סטנדרתי ומעלה וכן שזה להוריד למחשב קובץ ששוקל בערך 3 GBשלב א' הורדת הקבצים:
- יש להוריד את הקובץ exe של התוכנה מכאן ולחלץ אותו
(למחשבי מאק יש להוריד את הקובץ הזה ולמחשבי לינוקס את הקובץ הזה) - להוריד את הקובץ rar הזה לחלץ ולשמור את הקבצים בתקייה בשם "faster-whisper-large-v2" שתיהיה בתוך תקייה בשם "_models" ולשמור את התקייה "_models" באותה תקייה ששמרתם את הקובץ exe
- יש להוריד את הקובץ ההפעלה של המודל תמלול (הוא תופס 2.9 GB)
- לשים את הקובץ שהורדנו בתוך התקייה "faster-whisper-large-v2" שאליה חילצנו את שאר הקבצים.
- יש ליצור קיצור דרך לקובץ "whisper-faster.exe" שהורדנו באותה תקייה שהקובץ exe נמצא.
דוגמה לצורת שמירת הקבצים בספוילר:
דוגמה לשמירת הקבצים:
נקח לדוגמה שהקובץ exe בתקיית "תמלול" שבתוך תקיית "הורדות" וקוראים לו whisper-faster.exe
בתוך תקיית הורדות אתה צריך שיהיה תקייה בשם "_models" ובתוכה יהיה את התקייה בשם: "faster-whisper-large-v2"
בתוך התקייה הזו שמים את הקבצים הבאים: config.json, model.bin, tokenizer.json, vocabulary.txt
מצו"ב הדגמה בצילומי מסך
- להיכנס למאפינים של הקיצור דרך.
- להוסיף בתא "יעד" אחרי הנתיב שרשום כבר את הפקודות הרצויות עם רווח בינהם.
הפקודות שיש להכניס:
--language=Hebrew --model=large-v2
דוגמה בספוילר:
C:\Users\user\Downloads\whisper-faster\whisper-faster\whisper-faster.exe --language=Hebrew --model=large-v2
בדוגמה הזו הקטע הזה הוא הכתובת של הקובץ exe.
C:\Users\user\Downloads\whisper-faster\whisper-faster\whisper-faster.exe
הקטע הזה הוא הפקודה שיתמלל לעברית.
--language=Hebrew
והקטע הזה הוא הפקודה שישתמש במודל V2.
--model=large-v2
הפקודות נכתבות בצורה הבאה: רווח--הפקודה=ערך
למי שרוצה יש את הקובץ הזה שכתוב בו את כל הפקודות הקיימותשלב ב' ביצוע התמלול:
עכשיו אחרי ששמרתם את המאפינים שהגדרתם בקיצור דרך תוכלו לגרור קובץ שמע/וידיאו מעל הקיצור דרך שיצרתם ואז הוא יתומלל אוטמטית.שימו לב!!! זה יקח כמה דקות שבסופם תקבלו את התמלול של ההקלטה שהכנסתם כולל חתימת זמן על כל מקטע בההקלטה.
התמלול ישמר בקובץ טקסט בתקייה שבה נמצא הקובץ exe ושמו יהיה כשם ההקלטה/סרטון שתומלל.ישנם מחשבים ששורת הפקודה אצלהם לא מציגה מילים בעברית אבל אם תעתיקו את הטקסט משם ותדביקו אותו לדוגמה ל"פנקס רשימות" הוא יוצג בצורה תקינה
מקורות והסברים נוספים:
https://huggingface.co/Systran
https://github.com/Purfview/whisper-standalone-win/tree/main
פרטים נוספים למפתחים בפוסט הזהלא קראתי את כל הקשור אז אולי ציינו את זה אבל זה ממש לא חדש (אם אני לא טועה זה בערך שנה) וזה לא כל כך טוב בעברית (גם במודלים הגדולים)
אפשר להשתמש בפונקציית ההכתבה הוורד שלדעתי יותר מוצלחת בעברית
בכל אופן שאפו על ההנגשה של זה לציבור - יש להוריד את הקובץ exe של התוכנה מכאן ולחלץ אותו
-
@מתכנת-חובב אתה צודק שהלאחרונה לא מדוייק בכלל תיקנתי את זה
אבל אני יגיד את האמת שזה נכתב בניסיון לעלות את הנושא למודעות הציבור וב"ה זה הצליח
מה גם שזה אופליין שזה דבר חשוב להרבה אנשים
וגם זה פתח לתוכנות יותר נוחות ופשוטות שאפשר להכין בקלות עם זה
לגבי הדיוק ממה שאני בדקתי לפחות עם ה-API של OpenAI הוא הרבה יותר טוב בעברית מגוגל ואפי' ממיקרוסופט -
@צדיק-וטוב-לו-0 כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
למעשה, יש פתרון למי שיש כרטיס גרפי של NVIDIA?
יש אפשרות במנהל התקנים להשבית את הכרטיס גרפי והכל יעבוד לך על המעבד הרגיל
-
@כבוד-הרב
ברגע שזה קיצור דרך כפי שכתב @האדם-החושב כאן, ניתן להוסיף את הקיצור (המוכן) ל'שלח אל' שבתפריט קליק ימני, על ידי הוספתו כאן:%AppData%\Microsoft\Windows\SendTo
וכך ניתן להקליק על הקובץ שרוצים לתמלל, ולשלוח לתוכנה!
בחסדי ה' אצלי זה עובד נפלא!!!
תודה רבה ויישר כח
למגלה האוצר @כבוד-הרב
ולשאר המסייעים ובפרט ל @A0533057932 שהעלה את כל הקבצים הנצרכים בצורה נוחה שעובדת. -
@הדובדבן-שבקצפת תודה רבה, ממש @הדובדבן-שבקצפת ...
זה אכן פתר את הבעי' הקודמת.
כעת צצה בעי' חדשה, למרות שהוא על המעבד גרפי הרגיל:אנא הזן את הנתיב לקובץ האודיו או הוידאו:C:\Users\משפחה\Documents\תמלול\SpeechForTheBachurim1Shvat5784_640x360_AACAudio_753.mp4 Standalone Faster-Whisper r167.4 running on: CPU Starting transcription on: C:\Users\משפחה\Documents\תמלול\SpeechForTheBachurim1Shvat5784_640x360_AACAudio_753.mp4 Multiple frames in a packet. Traceback (most recent call last): File "D:\whisper-fast\__main__.py", line 1104, in <module> File "D:\whisper-fast\__main__.py", line 1044, in cli File "faster_whisper\transcribe.py", line 1145, in restore_speech_timestamps File "faster_whisper\transcribe.py", line 590, in generate_segments File "faster_whisper\transcribe.py", line 814, in encode ValueError: Invalid input features shape: expected an input with shape (1, 80, 3000), but got an input with shape (1, 128, 3000) instead [15128] Failed to execute script '__main__' due to unhandled exception! Press any key to continue . . .
-
@צדיק-וטוב-לו-0 @yosef368
במה אתם משתמשים?
במה שהובא בפוסט הראשון, לא אמור להיות בעיות. -
אז...
בשביל הפשטות.
תודה ל @A0533057932 על הקבצים, ול @י-פל על האחסון.
להוריד את הקובץ הזה
https://drive.go***************************ogle.com/file/d/1pCmXKJJGFYbZwFA8ThJtduHLytba9NXT/view?ts=65a636ca
לחלץ.
לאחר מכן, תלחצו על קובץ קיצור הדרך קליק ימני - מאפיינים:
רואים איפה שכתוב "יעד"?
תשנו לנתיב אצלכם (אצלי זהC:\Users\Ashi\Downloads\whisper-faster\whisper-faster.exe --language=Hebrew --model=large-v2 --output_format=txt --output_dir=source
)
בלי נדר בהמשך אכתוב סקריפט (לא יעזור למי שאין לו גישה לשורת הפקודה) שיתן לזה ממשק "גרפי" מינימלי.
אבל לא יודע מתי בדיוק, נא לא לחפור תהנו.לשימוש - פשוט גוררים את קובץ האודיו על קיצור הדרך.
נ.ב - לאנשים ללא כרטיס מסך (GPU).