להורדה | תוכנה לתמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין
-
@ישראל-142 כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
האם מישהו הצליח לתמלל במחשב עם כרטיס מסך
שאלה ראשונה.
@ישראל-142 כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
Nvidia?
שאלה שנייה.
אני לא הצלחתי לא בזה ולא בזה.@י-פל כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
Nvidia?
שאלה שנייה.
אני לא הצלחתי לא בזה ולא בזה.במחשב עם כרטיס מסך Nvidia יש גם את השגיאה הבאה
Could not load library cudnn_ops_infer64_8.dll. Error code 126 Please make sure cudnn_ops_infer64_8.dll is in your library path!
-
@י-פל כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
Nvidia?
שאלה שנייה.
אני לא הצלחתי לא בזה ולא בזה.במחשב עם כרטיס מסך Nvidia יש גם את השגיאה הבאה
Could not load library cudnn_ops_infer64_8.dll. Error code 126 Please make sure cudnn_ops_infer64_8.dll is in your library path!
@ישראל-142 כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
@י-פל כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
Nvidia?
שאלה שנייה.
אני לא הצלחתי לא בזה ולא בזה.במחשב עם כרטיס מסך Nvidia יש גם את השגיאה הבאה
Could not load library cudnn_ops_infer64_8.dll. Error code 126 Please make sure cudnn_ops_infer64_8.dll is in your library path!
קצת [הרבה] לפני מישהו הביא פתרון ל126.
-
@מישהו12 אני כרגע עובד על להכניס לקובץ vocabulary.txt את כל המילים בעברית וכן את כל המילים התורניות וכן את כל המילים בארמית
נראה לך שזה יעזור? -
@מישהו12 באיזה מהם
היחיד שאני מסתפק עליו זה המאגר מילים מויקיפדיה
כל השאר זה מאגרים חופשיים -
@כבוד-הרב כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
כל השאר זה מאגרים חופשיים
אני מכיר אחד מהם - המאגר מגיטהאב.
הוא בתנאי רישיון מסויימים, לא זוכר איזה רישיון.
לא כל מה שבגיטהאב מותר לכל שימוש שהוא -
@מישהו12 המאגרים הממשלתים ודאי נוצרו למטרות כאלה ואין בהם שום בעיה
המאגר של המושגים ביהדות זה מאגר שאני הכנתי מכל מני מקומות שונים -
@כבוד-הרב כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
פשוט מאוד כי זה לא נמצא באותו כונן כמו שאצלו
אצלי זה שונה, ואף על פי כן כאשר הקיצור דרך הוא באותה תיקייה, התוכנה פועלת.
יכול להיות שזה צריך להיות דווקא בכונן C, או שהקיצור דרך צריך להיות באותה תיקייה של התוכנה.@דאנציג כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
או שהקיצור דרך צריך להיות באותה תיקייה של התוכנה.
זה
-
למעשה, יש פתרון למי שיש כרטיס גרפי של NVIDIA?
(נכנסתי לקישור שהובא למעלה, לא יצאתי ברור.)
אגב, לה אין אפשרות 'לדרוש' ממנו לעבוד על המעבר הרגיל של אינטל? -
למעשה, יש פתרון למי שיש כרטיס גרפי של NVIDIA?
(נכנסתי לקישור שהובא למעלה, לא יצאתי ברור.)
אגב, לה אין אפשרות 'לדרוש' ממנו לעבוד על המעבר הרגיל של אינטל? -
OpenAi הוציאו ספרייה בקוד פתוח לתמלול הקלטות וסרטונים חינם בעשרות שפות ובינהם עברית!.
התמלול עם הספרייה שלהם הוא מההכי איכותים שקימים כיום בשוק, הוא אמן על 680,000 שעות! של דיבור.
במדריך זה אני יביא תוכנה שמתמללת הקלטות עם אחד המודלים שהוכן לזה, שלא מצריך התקנות למינהם וסיבוכים מיותרים.
שימו לב שזה צריך מחשב סטנדרטי ומעלה. וכן שזה להוריד למחשב קובץ ששוקל בערך 3 GB.שימו לב מצאתי תוכנה עם ממשק גרפי בעברית בפוסט הזה
להתקנה יש לפעול עפ"י השלבים הבאים:
-
הורידו את תוכנית ההתקנה מכאן.
-
יש לחלץ את התוכנה, הסיסמה היא: "מתמחים"
-
להפעיל את קובץ ההתקנה וללחוץ על התקן.
הקבצים ישמרו בתקיית "Program Files" עדיף שלא לשנות נתיב כי אז הקיצורים בשלח אל לא יעבדו.
שימו לב! מכיוון שזה שומר את התקייה של התוכנה בכונן C, יש לתת הרשאות מנהל כשיתבקש.ביצוע התמלול:
- יש ללחוץ על לחצן ימני בעכבר על הקובץ שאתם רוצים לתמלל ולבחור ב "שלח אל"-"תמלול בעברית"
אם אתם רוצים לתמלל הקלטה באנגלית יש לבחור ב-"שלח אל"-"Transcript in English"
יקח כמה דקות שבסופם תקבלו את התמלול של ההקלטה/סרטון שהכנסתם, והחלון שנפתח ישמיע צליל ויסגר.
התמלול ישמר בקובץ טקסט בתקייה שבה נמצא הקובץ שתומלל, ושמו יהיה כשם הקובץ שתומלל.
לאלו שיש להם כרטיס מסך של NVIDIA צריך להתקין CUDA. כדי שהתמלול יעבוד.
פרטים בספוילר:כדי להשתמש בתוכנה למי שיש לוכרטיס מסך של NVIDIA צריך להתקין CUDA.
יש לפעול לפי השלבים הבאים:- להוריד את התוכנה מכאן ולהתקין אותה על המחשב.
- להוריד את הקובץ הזה.
- לחלץ את הקובץ שהורדנו (בשלב 2) ולשים אותו בנתיב הבא: "toolkit\cuda\bin"
אם עדיין יש לכם בעיות עם זה אפשר תמיד להגיב בשרשור.
מקורות לעיון בבעיות כאן
קרדיט-@י-פלתוכנות ואתרים נוספים:
- התוכנה הזאת רק עם ממשק חצי גרפי עפ"י מה ש-@מישהו12 כתב כאן.
- תוכנה עם ממשק גרפי אמיתי ש-@תודה-לבורא-עולם פרסם עליה מדריך כאן.
- תוכנה ש-@מישהו12 הביא כאן (לא ראיתי מישהו שבדק אותה בפועל).
- אתר שאני כתבתי עליו מדריך כאן
- האתר הזה בעבר ראיתי שיש לו תוצאות די טובות (כרגע זה נראה שהוא עושה בעיות)
מקור:
https://github.com/Purfview/whisper-standalone-win/tree/main
פרטים נוספים למפתחים בפוסט הזה@כבוד-הרב כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
לאחרונה OpenAi הוציאו ספרייה בקוד פתוח לתמלול הקלטות וסרטונים חינם בעשרות שפות ובינהם עברית!.
התמלול עם הספרייה שלהם הוא הכי איכותי שקיים כיום בשוק הוא אמן על 680,000 שעות! של דיבור.
במדריך זה אני יסביר איך לתמלל הקלטות דרך שורת הפקודה עם אחד המודלים שהוכן לזה שלא מצריך התקנות למינהם וסיבוכים מיותרים.
יש לציין שהוא מתמלל גם וידאו, וקובץ הפלט הוא קובץ כתוביות (SRT) שאפשר לצרף לוידאו.
אני לדוגמה הורדתי את הקבצים ושמרתי אותם על דיסק אונקי ואני משתמש עם זה כתוכנה ניידת.
שימו לב שזה צריך מחשב סטנדרתי ומעלה וכן שזה להוריד למחשב קובץ ששוקל בערך 3 GBשלב א' הורדת הקבצים:
- יש להוריד את הקובץ exe של התוכנה מכאן ולחלץ אותו
(למחשבי מאק יש להוריד את הקובץ הזה ולמחשבי לינוקס את הקובץ הזה) - להוריד את הקובץ rar הזה לחלץ ולשמור את הקבצים בתקייה בשם "faster-whisper-large-v2" שתיהיה בתוך תקייה בשם "_models" ולשמור את התקייה "_models" באותה תקייה ששמרתם את הקובץ exe
- יש להוריד את הקובץ ההפעלה של המודל תמלול (הוא תופס 2.9 GB)
- לשים את הקובץ שהורדנו בתוך התקייה "faster-whisper-large-v2" שאליה חילצנו את שאר הקבצים.
- יש ליצור קיצור דרך לקובץ "whisper-faster.exe" שהורדנו באותה תקייה שהקובץ exe נמצא.
דוגמה לצורת שמירת הקבצים בספוילר:
דוגמה לשמירת הקבצים:
נקח לדוגמה שהקובץ exe בתקיית "תמלול" שבתוך תקיית "הורדות" וקוראים לו whisper-faster.exe
בתוך תקיית הורדות אתה צריך שיהיה תקייה בשם "_models" ובתוכה יהיה את התקייה בשם: "faster-whisper-large-v2"
בתוך התקייה הזו שמים את הקבצים הבאים: config.json, model.bin, tokenizer.json, vocabulary.txt
מצו"ב הדגמה בצילומי מסך
- להיכנס למאפינים של הקיצור דרך.
- להוסיף בתא "יעד" אחרי הנתיב שרשום כבר את הפקודות הרצויות עם רווח בינהם.
הפקודות שיש להכניס:
--language=Hebrew --model=large-v2
דוגמה בספוילר:
C:\Users\user\Downloads\whisper-faster\whisper-faster\whisper-faster.exe --language=Hebrew --model=large-v2
בדוגמה הזו הקטע הזה הוא הכתובת של הקובץ exe.
C:\Users\user\Downloads\whisper-faster\whisper-faster\whisper-faster.exe
הקטע הזה הוא הפקודה שיתמלל לעברית.
--language=Hebrew
והקטע הזה הוא הפקודה שישתמש במודל V2.
--model=large-v2
הפקודות נכתבות בצורה הבאה: רווח--הפקודה=ערך
למי שרוצה יש את הקובץ הזה שכתוב בו את כל הפקודות הקיימותשלב ב' ביצוע התמלול:
עכשיו אחרי ששמרתם את המאפינים שהגדרתם בקיצור דרך תוכלו לגרור קובץ שמע/וידיאו מעל הקיצור דרך שיצרתם ואז הוא יתומלל אוטמטית.שימו לב!!! זה יקח כמה דקות שבסופם תקבלו את התמלול של ההקלטה שהכנסתם כולל חתימת זמן על כל מקטע בההקלטה.
התמלול ישמר בקובץ טקסט בתקייה שבה נמצא הקובץ exe ושמו יהיה כשם ההקלטה/סרטון שתומלל.ישנם מחשבים ששורת הפקודה אצלהם לא מציגה מילים בעברית אבל אם תעתיקו את הטקסט משם ותדביקו אותו לדוגמה ל"פנקס רשימות" הוא יוצג בצורה תקינה
מקורות והסברים נוספים:
https://huggingface.co/Systran
https://github.com/Purfview/whisper-standalone-win/tree/main
פרטים נוספים למפתחים בפוסט הזהלא קראתי את כל הקשור אז אולי ציינו את זה אבל זה ממש לא חדש (אם אני לא טועה זה בערך שנה) וזה לא כל כך טוב בעברית (גם במודלים הגדולים)
אפשר להשתמש בפונקציית ההכתבה הוורד שלדעתי יותר מוצלחת בעברית
בכל אופן שאפו על ההנגשה של זה לציבור -
-
@כבוד-הרב כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:
לאחרונה OpenAi הוציאו ספרייה בקוד פתוח לתמלול הקלטות וסרטונים חינם בעשרות שפות ובינהם עברית!.
התמלול עם הספרייה שלהם הוא הכי איכותי שקיים כיום בשוק הוא אמן על 680,000 שעות! של דיבור.
במדריך זה אני יסביר איך לתמלל הקלטות דרך שורת הפקודה עם אחד המודלים שהוכן לזה שלא מצריך התקנות למינהם וסיבוכים מיותרים.
יש לציין שהוא מתמלל גם וידאו, וקובץ הפלט הוא קובץ כתוביות (SRT) שאפשר לצרף לוידאו.
אני לדוגמה הורדתי את הקבצים ושמרתי אותם על דיסק אונקי ואני משתמש עם זה כתוכנה ניידת.
שימו לב שזה צריך מחשב סטנדרתי ומעלה וכן שזה להוריד למחשב קובץ ששוקל בערך 3 GBשלב א' הורדת הקבצים:
- יש להוריד את הקובץ exe של התוכנה מכאן ולחלץ אותו
(למחשבי מאק יש להוריד את הקובץ הזה ולמחשבי לינוקס את הקובץ הזה) - להוריד את הקובץ rar הזה לחלץ ולשמור את הקבצים בתקייה בשם "faster-whisper-large-v2" שתיהיה בתוך תקייה בשם "_models" ולשמור את התקייה "_models" באותה תקייה ששמרתם את הקובץ exe
- יש להוריד את הקובץ ההפעלה של המודל תמלול (הוא תופס 2.9 GB)
- לשים את הקובץ שהורדנו בתוך התקייה "faster-whisper-large-v2" שאליה חילצנו את שאר הקבצים.
- יש ליצור קיצור דרך לקובץ "whisper-faster.exe" שהורדנו באותה תקייה שהקובץ exe נמצא.
דוגמה לצורת שמירת הקבצים בספוילר:
דוגמה לשמירת הקבצים:
נקח לדוגמה שהקובץ exe בתקיית "תמלול" שבתוך תקיית "הורדות" וקוראים לו whisper-faster.exe
בתוך תקיית הורדות אתה צריך שיהיה תקייה בשם "_models" ובתוכה יהיה את התקייה בשם: "faster-whisper-large-v2"
בתוך התקייה הזו שמים את הקבצים הבאים: config.json, model.bin, tokenizer.json, vocabulary.txt
מצו"ב הדגמה בצילומי מסך
- להיכנס למאפינים של הקיצור דרך.
- להוסיף בתא "יעד" אחרי הנתיב שרשום כבר את הפקודות הרצויות עם רווח בינהם.
הפקודות שיש להכניס:
--language=Hebrew --model=large-v2
דוגמה בספוילר:
C:\Users\user\Downloads\whisper-faster\whisper-faster\whisper-faster.exe --language=Hebrew --model=large-v2
בדוגמה הזו הקטע הזה הוא הכתובת של הקובץ exe.
C:\Users\user\Downloads\whisper-faster\whisper-faster\whisper-faster.exe
הקטע הזה הוא הפקודה שיתמלל לעברית.
--language=Hebrew
והקטע הזה הוא הפקודה שישתמש במודל V2.
--model=large-v2
הפקודות נכתבות בצורה הבאה: רווח--הפקודה=ערך
למי שרוצה יש את הקובץ הזה שכתוב בו את כל הפקודות הקיימותשלב ב' ביצוע התמלול:
עכשיו אחרי ששמרתם את המאפינים שהגדרתם בקיצור דרך תוכלו לגרור קובץ שמע/וידיאו מעל הקיצור דרך שיצרתם ואז הוא יתומלל אוטמטית.שימו לב!!! זה יקח כמה דקות שבסופם תקבלו את התמלול של ההקלטה שהכנסתם כולל חתימת זמן על כל מקטע בההקלטה.
התמלול ישמר בקובץ טקסט בתקייה שבה נמצא הקובץ exe ושמו יהיה כשם ההקלטה/סרטון שתומלל.ישנם מחשבים ששורת הפקודה אצלהם לא מציגה מילים בעברית אבל אם תעתיקו את הטקסט משם ותדביקו אותו לדוגמה ל"פנקס רשימות" הוא יוצג בצורה תקינה
מקורות והסברים נוספים:
https://huggingface.co/Systran
https://github.com/Purfview/whisper-standalone-win/tree/main
פרטים נוספים למפתחים בפוסט הזהלא קראתי את כל הקשור אז אולי ציינו את זה אבל זה ממש לא חדש (אם אני לא טועה זה בערך שנה) וזה לא כל כך טוב בעברית (גם במודלים הגדולים)
אפשר להשתמש בפונקציית ההכתבה הוורד שלדעתי יותר מוצלחת בעברית
בכל אופן שאפו על ההנגשה של זה לציבור@מתכנת-חובב אתה צודק שהלאחרונה לא מדוייק בכלל תיקנתי את זה
אבל אני יגיד את האמת שזה נכתב בניסיון לעלות את הנושא למודעות הציבור וב"ה זה הצליח
מה גם שזה אופליין שזה דבר חשוב להרבה אנשים
וגם זה פתח לתוכנות יותר נוחות ופשוטות שאפשר להכין בקלות עם זה
לגבי הדיוק ממה שאני בדקתי לפחות עם ה-API של OpenAI הוא הרבה יותר טוב בעברית מגוגל ואפי' ממיקרוסופט - יש להוריד את הקובץ exe של התוכנה מכאן ולחלץ אותו