דילוג לתוכן
  • חוקי הפורום
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. מחשבים וטכנולוגיה
  3. עזרה הדדית - מחשבים וטכנולוגיה
  4. להורדה | תוכנה לתמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין

להורדה | תוכנה לתמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין

מתוזמן נעוץ נעול הועבר עזרה הדדית - מחשבים וטכנולוגיה
388 פוסטים 42 כותבים 23.2k צפיות 40 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • כ כבוד הרב

    OpenAi הוציאו ספרייה בקוד פתוח לתמלול הקלטות וסרטונים חינם בעשרות שפות ובינהם עברית!.
    התמלול עם הספרייה שלהם הוא מההכי איכותים שקימים כיום בשוק, הוא אמן על 680,000 שעות! של דיבור.
    במדריך זה אני יביא תוכנה שמתמללת הקלטות עם אחד המודלים שהוכן לזה, שלא מצריך התקנות למינהם וסיבוכים מיותרים.
    שימו לב שזה צריך מחשב סטנדרטי ומעלה. וכן שזה להוריד למחשב קובץ ששוקל בערך 3 GB.

    שימו לב מצאתי תוכנה עם ממשק גרפי בעברית בפוסט הזה

    להתקנה יש לפעול עפ"י השלבים הבאים:

    1. הורידו את תוכנית ההתקנה מכאן.

    2. יש לחלץ את התוכנה, הסיסמה היא: "מתמחים"

    3. להפעיל את קובץ ההתקנה וללחוץ על התקן.

    הקבצים ישמרו בתקיית "Program Files" עדיף שלא לשנות נתיב כי אז הקיצורים בשלח אל לא יעבדו.
    שימו לב! מכיוון שזה שומר את התקייה של התוכנה בכונן C, יש לתת הרשאות מנהל כשיתבקש.

    ביצוע התמלול:

    1. יש ללחוץ על לחצן ימני בעכבר על הקובץ שאתם רוצים לתמלל ולבחור ב "שלח אל"-"תמלול בעברית"
      אם אתם רוצים לתמלל הקלטה באנגלית יש לבחור ב-"שלח אל"-"Transcript in English"
      יקח כמה דקות שבסופם תקבלו את התמלול של ההקלטה/סרטון שהכנסתם, והחלון שנפתח ישמיע צליל ויסגר.
      התמלול ישמר בקובץ טקסט בתקייה שבה נמצא הקובץ שתומלל, ושמו יהיה כשם הקובץ שתומלל.

    לאלו שיש להם כרטיס מסך של NVIDIA צריך להתקין CUDA. כדי שהתמלול יעבוד.
    פרטים בספוילר:

    כדי להשתמש בתוכנה למי שיש לוכרטיס מסך של NVIDIA צריך להתקין CUDA.
    יש לפעול לפי השלבים הבאים:

    1. להוריד את התוכנה מכאן ולהתקין אותה על המחשב.
    2. להוריד את הקובץ הזה.
    3. לחלץ את הקובץ שהורדנו (בשלב 2) ולשים אותו בנתיב הבא: "toolkit\cuda\bin"

    אם עדיין יש לכם בעיות עם זה אפשר תמיד להגיב בשרשור.
    מקורות לעיון בבעיות כאן
    קרדיט-@י-פל

    תוכנות ואתרים נוספים:

    1. התוכנה הזאת רק עם ממשק חצי גרפי עפ"י מה ש-@מישהו12 כתב כאן.
    2. תוכנה עם ממשק גרפי אמיתי ש-@תודה-לבורא-עולם פרסם עליה מדריך כאן.
    3. תוכנה ש-@מישהו12 הביא כאן (לא ראיתי מישהו שבדק אותה בפועל).
    4. אתר שאני כתבתי עליו מדריך כאן
    5. האתר הזה בעבר ראיתי שיש לו תוצאות די טובות (כרגע זה נראה שהוא עושה בעיות)

    מקור:
    https://github.com/Purfview/whisper-standalone-win/tree/main
    פרטים נוספים למפתחים בפוסט הזה

    כ מנותק
    כ מנותק
    כבוד הרב
    כתב ב נערך לאחרונה על ידי
    #287

    @מישהו12 הוספתי את האפשרות הזו במדריך

    יש להוריד את הקובץ הזה ולפתוח אותו וללחוץ על חלץ.
    וכך כשתלחצו עם מקש ימני על קובץ במחשב תיהיה לכם את האפשרות של "שלח אל"-"whisper-faster" וכך תוכלו בקלות לתמלל כל קובץ שמע במחשב שלכם. (קרדיט-@דאנציג)

    תגובה 1 תגובה אחרונה
    1
    • מישהו12מ מישהו12

      @yosef368 כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:

      אבל זה לא הענין החשוב, מה שחשוב זה שגם אחרי ששיניתי לsrt או vtt זה לא עובד ולא הבנתי למה

      איפה שינית?

      Y מנותק
      Y מנותק
      yosef368
      כתב ב נערך לאחרונה על ידי
      #288

      @מישהו12 ידנית

      א תגובה 1 תגובה אחרונה
      0
      • Y yosef368

        @מישהו12 ידנית

        א מנותק
        א מנותק
        אלף שין
        כתב ב נערך לאחרונה על ידי אלף שין
        #289

        @yosef368
        אתה מתכוון ששינת במחשב באמצעות שינוי האותיות של סוג הקובץ?

        Y תגובה 1 תגובה אחרונה
        0
        • א אלף שין

          @yosef368
          אתה מתכוון ששינת במחשב באמצעות שינוי האותיות של סוג הקובץ?

          Y מנותק
          Y מנותק
          yosef368
          כתב ב נערך לאחרונה על ידי yosef368
          #290

          @אלף-שין כן. לא טוב?
          עריכה: המרתי דרך איזה אתר וזה כן עובד. אבל פעם שמתחלפת שורה כתוביות יש סוגריים הפוכות בתחילת כל משפט. קצת מעצבן אבל אפשר לחיות עם זה

          א תגובה 1 תגובה אחרונה
          0
          • Y yosef368

            @אלף-שין כן. לא טוב?
            עריכה: המרתי דרך איזה אתר וזה כן עובד. אבל פעם שמתחלפת שורה כתוביות יש סוגריים הפוכות בתחילת כל משפט. קצת מעצבן אבל אפשר לחיות עם זה

            א מנותק
            א מנותק
            אלף שין
            כתב ב נערך לאחרונה על ידי
            #291

            @yosef368 כתב במדריך | תמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין:

            דרך איזה אתר

            איזה?

            Y תגובה 1 תגובה אחרונה
            0
            • M מנותק
              M מנותק
              MC46131
              כתב ב נערך לאחרונה על ידי
              #292

              סליחה על הבורות,
              לאיפה צריך להעתיק את הקוד שמובא בהתחלה בהודעה של @כבוד-הרב ,
              אשמח לדעת למעשה מה צריך לעשות כדי להוריד את התוכנה

              כ תגובה 1 תגובה אחרונה
              0
              • א אלף שין

                @yosef368 כתב במדריך | תמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין:

                דרך איזה אתר

                איזה?

                Y מנותק
                Y מנותק
                yosef368
                כתב ב נערך לאחרונה על ידי
                #293

                @אלף-שין זה https://gotranscript.com/convert/txt-to-srt

                תגובה 1 תגובה אחרונה
                0
                • M MC46131

                  סליחה על הבורות,
                  לאיפה צריך להעתיק את הקוד שמובא בהתחלה בהודעה של @כבוד-הרב ,
                  אשמח לדעת למעשה מה צריך לעשות כדי להוריד את התוכנה

                  כ מנותק
                  כ מנותק
                  כבוד הרב
                  כתב ב נערך לאחרונה על ידי כבוד הרב
                  #294

                  @MC46131 זה לא קוד זה קישור
                  צריך להיכנס לקישור וזה יתן לך להוריד את זה דרך הדרייב
                  (עריכה תלחץ על המילים "הקישור הזה" וזה יכנס לך לקישור)

                  תגובה 1 תגובה אחרונה
                  0
                  • ישראל 142י ישראל 142

                    @כבוד-הרב כתב במדריך | תמלול הקלטות לטקסט חינם על המחשב באופליין דרך שורת הפקודה:

                    1. יש להוריד את הקובץ zip הזה
                    2. לחלץ באמצעות לחיצה על מקש ימני על הקובץ שירד ואז ללחוץ על "חלץ כאן"
                    3. להוריד את הקובץ exe של התוכנה מכאן
                      (למחשבי מאק יש להוריד את הקובץ הזה ולמחשבי לינוקס את הקובץ הזה)
                    4. ללחוץ מקש ימיני על הקובץ zip שירד ולבחור ב- "חלץ כאן"
                    5. יש להוריד את הקובץ ההפעלה של המודל תמלול (הוא תופס 2.9 GB)
                    6. לשים את הקובץ שהורדנו בתוך התקייה "faster-whisper-large-v2" שבתוך תקייה "_models" .
                      דוגמה לצורת שמירת הקבצים בספוילר:

                    Spoiler

                    שלב ב' ביצוע התמלול:
                    עכשיו אחרי ששמרתם את כל הקבצים תוכלו לגרור קובץ שמע/וידיאו מעל הקיצור דרך "‏‏whisper-faster - קיצור דרך" שנמצא בתקיית "Whisper-Faster" ואז יפתח חלון של שורת הפקודה והקובץ יתומלל אוטמטית.

                    מומלץ מאוד להעתיק את הקיצור דרך "‏‏whisper-faster - קיצור דרך" לנתיב הבא:

                    מכיוון שהפקודות מופעלות ע"י קיצור דרך

                    חשוב לציין שכל זה רק למי שתקיית ההורדות שלו בכונן C, וגם הוא לא שינה את הברירת מחדל להורדות.

                    כי הרבה טכנאים מחלקים את הכונן לכמה מחיצות ומעבירים את תקיות המתשמש כולל "הורדות" למחיצה אחרת, (כדי שבמקרה הצורך יהיה קל להתקין מחדש בלי למחוק את קבצי המשתמש)

                    למי שזה לא כך הקיצור דרך לא תקף אלא אם יערוך אותו או יצור חדש

                    כ מנותק
                    כ מנותק
                    כבוד הרב
                    כתב ב נערך לאחרונה על ידי
                    #295

                    @ישראל-142 כתב במדריך | תמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין:

                    מכיוון שהפקודות מופעלות ע"י קיצור דרך
                    חשוב לציין שכל זה רק למי שתקיית ההורדות שלו בכונן C, וגם הוא לא שינה את הברירת מחדל להורדות.
                    כי הרבה טכנאים מחלקים את הכונן לכמה מחיצות ומעבירים את תקיות המתשמש כולל "הורדות" למחיצה אחרת, (כדי שבמקרה הצורך יהיה קל להתקין מחדש בלי למחוק את קבצי המשתמש)

                    למי שזה לא כך הקיצור דרך לא תקף אלא אם יערוך אותו או יצור חדש

                    תיקניתי את זה במדריך

                    שימו לב! המדריך נכתב בהנחה שתקיית ההורדות שלכם בכונן C וכן ששמרתם את הקבצים בתקייה "Whisper-Faster" שבתוך תקיית ההורדות. אם אצלכם זה לא ככה צריך לשנות את הנתיבים במאפינים של הקיצורי דרך.

                    A0533057932A תגובה 1 תגובה אחרונה
                    0
                    • כ כבוד הרב

                      @ישראל-142 כתב במדריך | תמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין:

                      מכיוון שהפקודות מופעלות ע"י קיצור דרך
                      חשוב לציין שכל זה רק למי שתקיית ההורדות שלו בכונן C, וגם הוא לא שינה את הברירת מחדל להורדות.
                      כי הרבה טכנאים מחלקים את הכונן לכמה מחיצות ומעבירים את תקיות המתשמש כולל "הורדות" למחיצה אחרת, (כדי שבמקרה הצורך יהיה קל להתקין מחדש בלי למחוק את קבצי המשתמש)

                      למי שזה לא כך הקיצור דרך לא תקף אלא אם יערוך אותו או יצור חדש

                      תיקניתי את זה במדריך

                      שימו לב! המדריך נכתב בהנחה שתקיית ההורדות שלכם בכונן C וכן ששמרתם את הקבצים בתקייה "Whisper-Faster" שבתוך תקיית ההורדות. אם אצלכם זה לא ככה צריך לשנות את הנתיבים במאפינים של הקיצורי דרך.

                      A0533057932A מנותק
                      A0533057932A מנותק
                      A0533057932
                      כתב ב נערך לאחרונה על ידי
                      #296

                      @כבוד-הרב יותר פשוט לבקש להעביר את התיקיה עצמה לכונן C
                      וזהו
                      מאשר להתחיל עם תיקיית הורדות בתנאי שהיא לא שונה
                      כי כל מי שמשתמש בIDM התוכנה לא יורדת להורדות

                      תגובה 1 תגובה אחרונה
                      0
                      • האדם החושבה מנותק
                        האדם החושבה מנותק
                        האדם החושב
                        מדריכים
                        כתב ב נערך לאחרונה על ידי
                        #297

                        @מישהו12 כתב במדריך | CobaltTranscriber - ממשק חצי גרפי לתמלול אופליין באמצעות faster whisper:

                        לא חשבתי על זה שאנגלית לא טובה כאן לכולם...

                        תרגמתי את הסקריפט, מצורף:
                        cobalttranscriber מתורגם.bat

                        א תגובה 1 תגובה אחרונה
                        2
                        • האדם החושבה האדם החושב

                          @מישהו12 כתב במדריך | CobaltTranscriber - ממשק חצי גרפי לתמלול אופליין באמצעות faster whisper:

                          לא חשבתי על זה שאנגלית לא טובה כאן לכולם...

                          תרגמתי את הסקריפט, מצורף:
                          cobalttranscriber מתורגם.bat

                          א מנותק
                          א מנותק
                          אלף שין
                          כתב ב נערך לאחרונה על ידי
                          #298

                          @האדם-החושב
                          תודה רבה!
                          יש פתרון לזה שהמילים הפוכות?

                          תגובה 1 תגובה אחרונה
                          0
                          • י. פל.י מנותק
                            י. פל.י מנותק
                            י. פל.
                            כתב ב נערך לאחרונה על ידי
                            #299

                            טוב.
                            העכבר הגיע...
                            וזה באמת רץ על GPU, אחרי התקנת התוכנה [גם רואים את הGPU קופץ לרגע], אבל:
                            צילום מסך 2023-10-29 220221.png
                            למישהו יש פתרון?

                            מישהו12מ א ישראל 142י 3 תגובות תגובה אחרונה
                            1
                            • י. פל.י י. פל.

                              טוב.
                              העכבר הגיע...
                              וזה באמת רץ על GPU, אחרי התקנת התוכנה [גם רואים את הGPU קופץ לרגע], אבל:
                              צילום מסך 2023-10-29 220221.png
                              למישהו יש פתרון?

                              מישהו12מ מנותק
                              מישהו12מ מנותק
                              מישהו12
                              מדריכים
                              כתב ב נערך לאחרונה על ידי
                              #300

                              @י-פל רבי, מטונך.

                              תגובה 1 תגובה אחרונה
                              1
                              • י. פל.י י. פל.

                                טוב.
                                העכבר הגיע...
                                וזה באמת רץ על GPU, אחרי התקנת התוכנה [גם רואים את הGPU קופץ לרגע], אבל:
                                צילום מסך 2023-10-29 220221.png
                                למישהו יש פתרון?

                                א מנותק
                                א מנותק
                                אלף שין
                                כתב ב נערך לאחרונה על ידי
                                #301

                                @י-פל
                                העתקת עם ""
                                חוצמזה תוכל לנסות רגע את הקיצור דרך שמופיע במדריך,
                                אולי דווקא הוא יצליח לך?

                                מישהו12מ תגובה 1 תגובה אחרונה
                                0
                                • א אלף שין

                                  @י-פל
                                  העתקת עם ""
                                  חוצמזה תוכל לנסות רגע את הקיצור דרך שמופיע במדריך,
                                  אולי דווקא הוא יצליח לך?

                                  מישהו12מ מנותק
                                  מישהו12מ מנותק
                                  מישהו12
                                  מדריכים
                                  כתב ב נערך לאחרונה על ידי
                                  #302

                                  @אלף-שין לא, הבעיה שם כתובה.
                                  חסר לו רכיב בשם CUDA להרצת התוכנה הזו על GPU.

                                  י. פל.י תגובה 1 תגובה אחרונה
                                  1
                                  • מישהו12מ מישהו12

                                    @אלף-שין לא, הבעיה שם כתובה.
                                    חסר לו רכיב בשם CUDA להרצת התוכנה הזו על GPU.

                                    י. פל.י מנותק
                                    י. פל.י מנותק
                                    י. פל.
                                    כתב ב נערך לאחרונה על ידי י. פל.
                                    #303

                                    @מישהו12 כתב במדריך | תמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין:

                                    חסר לו רכיב בשם CUDA להרצת התוכנה הזו על GPU.

                                    לא!
                                    התקנתי את הרכיב הזה!
                                    ובצילו"מ רואים במפורש שהוא עובד על CUDA!
                                    [איפה שלכולם כתוב: ON CPU, אצלי כתוב ON CUDA].

                                    מישהו12מ ישראל 142י 2 תגובות תגובה אחרונה
                                    0
                                    • י. פל.י י. פל.

                                      @מישהו12 כתב במדריך | תמלול הקלטות/סרטונים בעברית! לטקסט בחינם על המחשב באופליין:

                                      חסר לו רכיב בשם CUDA להרצת התוכנה הזו על GPU.

                                      לא!
                                      התקנתי את הרכיב הזה!
                                      ובצילו"מ רואים במפורש שהוא עובד על CUDA!
                                      [איפה שלכולם כתוב: ON CPU, אצלי כתוב ON CUDA].

                                      מישהו12מ מנותק
                                      מישהו12מ מנותק
                                      מישהו12
                                      מדריכים
                                      כתב ב נערך לאחרונה על ידי
                                      #304

                                      @י-פל אתה צודק.
                                      הסתכלתי שוב.
                                      הבעיה היא out of memory - בעיית RAM לכאורה.
                                      אבל אין לי שום ניסיון והבנה בזה

                                      א תגובה 1 תגובה אחרונה
                                      0
                                      • מישהו12מ מישהו12

                                        @י-פל אתה צודק.
                                        הסתכלתי שוב.
                                        הבעיה היא out of memory - בעיית RAM לכאורה.
                                        אבל אין לי שום ניסיון והבנה בזה

                                        א מנותק
                                        א מנותק
                                        אלף שין
                                        כתב ב נערך לאחרונה על ידי אלף שין
                                        #305

                                        @מישהו12 @כבוד-הרב @י-פל @A0533057932 @צדיק-תמים @כולם
                                        הריני מתכבד להודיעכם
                                        כי לאחר עבודה רבה ויסודית
                                        ולאחר שהשוויתי את התוצאות של התמלול בפלטפורמות השונות הקיימות,
                                        אפרט את היעילות:

                                        1] בהקלטה ברורה וחדה, ושהדובר מדבר בה בעברית רהוטה צחה ותקנית עם מבטא עברי ובלי שגיאות וכו' וכו',
                                        במקרה כזה אין הבדל ביניהם, וכולם מצליחים לזהות כמעט 100% מהמילים כולל פסיקים וסימני שאלה וכו',

                                        2] בהקלטה שהדובר לא ברור, מבליע מילים מדבר מהר, במבטא עמום, יש סביבו רעשי רקע, חסר חיתוך אותיות, קול מונטוני אחיד או הגייה לא אחידה ומעורבלת, גם במקרה כזה אין הבדל ביניהם, וכולם ממציאים, או לא מצליחים בכמעט 100% מהמילים.

                                        3] מתי ההבדל? כמובן בהקלטות סטנדרטיות, שהם משהו באמצע, אני בחרתי להתמקד בבדיקת והשוואת התמלול בהקלטות תורניות ובהגייה ליטאית, אך כשהדיבור יחסית ברור, וכמובן בלי רעשי רקע רבים, השוויתי אותם בהקלטה של 25 דקות לפחות,
                                        ההשוואה היתה ב4 פלטפורמות חלקם מהמובילות והמפורסמות ביותר,

                                        1] זיהוי דיבור של גוגל,
                                        2] זיהוי דיבור של מייקרוסופט
                                        3] התוכנה הנוכחית,
                                        4] אתר חינמי מוגבל.

                                        האתר הרביעי אכזב מיד, הוא מרבה מאד בהמצאות ומכניס לך המון משפטים לתוך הפה, נראה שהוא בנוי על מילון של משפטים והוא מנסה להבין איזה מתוכם הכי הגיוני שאמרת.......

                                        גוגל ממול מייקרוסופוט - ההשוואה קצת קשה, בסוף יש נטיה מסוימת למייקרוסופט שמדייקת יותר פעמים,
                                        מה שהכריע לבסוף את הכף... שגוגל זה חינמי רק בהתחלה [בAPI] אבל מייקרוסופוט זה לכל חודש 5 שעות חינם.... לשימוש רגיל זה לפעמים מספיק..... וזה וודאי לא פחות מגוגל, בכל אופן לא משהו שרואים, אם כבר זה רק יותר,

                                        התוכנה הזאת ממול מייקרוסופוט - התלבטתי מאד הרבה זמן, כי בדרך כלל התוצאה זהה.... היו פה ושם מילים שאחד מהם יותר קלט, בדרך כלל מייקרוספוט יותר מדייקים בכל הקשור למילים תקניות, כנראה יש להם זיהוי רחב ועמוק מובנה מילון ועל פי ניקוד! [למשל כשאמרתי "מטה" [של מרע"ה] הוא לא חשב שאמרתי "מתה" כי זה לא תקני בניקוד הזה, אבל התוכנה הזאת לא חישבנה את זה, וחשבה שאמרתי "מתה" בסגו"ל...] , לעומת זה כשהדיבור לא היה מספיק חד וברור, או כשהיה הגייה למדנית וכדומה שאין לשום תוכנה, בזה לפעמים דווקא התוכנה הנוכחית דייקה יותר ממיקרוסופוט!! כנראה היא יותר 'מתאמצת' לדייק לפענח לפי הצלילים ולא רק לפי מילים קלאסיות שהיא מכירה....]

                                        ולכן הרבה זמן בדקתי וניסיתי את ההבדלים בטקסט רב,
                                        ואני חייב לומר שלמעשה שתיהם מזהים מאד יפה! אפילו שזה לא בהגייה עברית תקינה... כולל פסיק, אתנחתא, וסימן שאלה, [,.?]
                                        ואפשר בעבודה פשוטה יחסית לעבור על הכל ולתקן,
                                        בסופו של דבר כמובן יש מעלה במייקרוספוט שהשרתים שלה המפלצתיים מפענחים בזמן קצר יחסית,
                                        מצד שני כאן זה חינמי... וגם יוצא מחולק יפה לפי שניות,
                                        בסופו של יום ולאחר השוואות רבות, מסקנתי היא כך: אם המילים של הדובר ברורות חדות, עם הפסקות נורמליות ביניהם- וההגייה שלו היא כעברית תקינה- מייקרוספוט היא הטובה ביותר! כיון שכל מילה מפוענחת בהתאם לאפשרויות התקניות בלבד, [וכמו שהבאתי דוגמא 'מטה' היא לא תטעה שאמרת 'מתה' כי זה ניקוד אחר], אבל בכל הקלטה שהדובר לא הכי ברור, או בהגייה למדנית וכדומה- בזה עדיף התוכנה שלנו כי היא מדייקת לפי הצלילים גם אם זה לא מדאי הגיוני בשבילה, והיא לא מבינה מה אמרת, למשל כשאמרתי "אברה-קדברה" רק התוכנה זיהתה נכון.... כנ"ל בהרבה מילים למשל "חפצא של אנשים", כי מייקרוסופוט מעדיפה לשפר את המילה לפי מילון הגיוני יותר, ובסופו של דבר לדעתי יש בהחלט נטייה לטובת התוכנה שלנו!!!! [גם כי זה יוצא יותר מובן לקורא, וגם כי למעשה מדייק יותר פעמים]
                                        [רק צריך מחשב חזק, הכי טוב לפחות G16 RAM]

                                        בעז"ה נקווה שהתוכנה תתאמן גם על קולות תורניים, ובכל ההגיות,
                                        ואסיים בתודה לכל מי שעזר עד כה וסייע בדברים
                                        זה דבר חשוב ותועלתי ועד היום נכתבו עשרות[!] שרשורים מלאי פוסטים רק בחיפוש אחר תוכנה כזאת.......

                                        @KINGYOS האם עכשיו תוכל להעלות זאת לשרת בצורה מסודרת? תראה ש-@אלישי רצה את זה כבר כאן.

                                        נ"ב: דוגמא נחמדה שהביאו פה פעם ממייקרוסופט [מזיהוי דיבור בוורד]....

                                        מישהו12מ ת 2 תגובות תגובה אחרונה
                                        4
                                        • א אלף שין התייחס לנושא זה ב
                                        • א אלף שין

                                          @מישהו12 @כבוד-הרב @י-פל @A0533057932 @צדיק-תמים @כולם
                                          הריני מתכבד להודיעכם
                                          כי לאחר עבודה רבה ויסודית
                                          ולאחר שהשוויתי את התוצאות של התמלול בפלטפורמות השונות הקיימות,
                                          אפרט את היעילות:

                                          1] בהקלטה ברורה וחדה, ושהדובר מדבר בה בעברית רהוטה צחה ותקנית עם מבטא עברי ובלי שגיאות וכו' וכו',
                                          במקרה כזה אין הבדל ביניהם, וכולם מצליחים לזהות כמעט 100% מהמילים כולל פסיקים וסימני שאלה וכו',

                                          2] בהקלטה שהדובר לא ברור, מבליע מילים מדבר מהר, במבטא עמום, יש סביבו רעשי רקע, חסר חיתוך אותיות, קול מונטוני אחיד או הגייה לא אחידה ומעורבלת, גם במקרה כזה אין הבדל ביניהם, וכולם ממציאים, או לא מצליחים בכמעט 100% מהמילים.

                                          3] מתי ההבדל? כמובן בהקלטות סטנדרטיות, שהם משהו באמצע, אני בחרתי להתמקד בבדיקת והשוואת התמלול בהקלטות תורניות ובהגייה ליטאית, אך כשהדיבור יחסית ברור, וכמובן בלי רעשי רקע רבים, השוויתי אותם בהקלטה של 25 דקות לפחות,
                                          ההשוואה היתה ב4 פלטפורמות חלקם מהמובילות והמפורסמות ביותר,

                                          1] זיהוי דיבור של גוגל,
                                          2] זיהוי דיבור של מייקרוסופט
                                          3] התוכנה הנוכחית,
                                          4] אתר חינמי מוגבל.

                                          האתר הרביעי אכזב מיד, הוא מרבה מאד בהמצאות ומכניס לך המון משפטים לתוך הפה, נראה שהוא בנוי על מילון של משפטים והוא מנסה להבין איזה מתוכם הכי הגיוני שאמרת.......

                                          גוגל ממול מייקרוסופוט - ההשוואה קצת קשה, בסוף יש נטיה מסוימת למייקרוסופט שמדייקת יותר פעמים,
                                          מה שהכריע לבסוף את הכף... שגוגל זה חינמי רק בהתחלה [בAPI] אבל מייקרוסופוט זה לכל חודש 5 שעות חינם.... לשימוש רגיל זה לפעמים מספיק..... וזה וודאי לא פחות מגוגל, בכל אופן לא משהו שרואים, אם כבר זה רק יותר,

                                          התוכנה הזאת ממול מייקרוסופוט - התלבטתי מאד הרבה זמן, כי בדרך כלל התוצאה זהה.... היו פה ושם מילים שאחד מהם יותר קלט, בדרך כלל מייקרוספוט יותר מדייקים בכל הקשור למילים תקניות, כנראה יש להם זיהוי רחב ועמוק מובנה מילון ועל פי ניקוד! [למשל כשאמרתי "מטה" [של מרע"ה] הוא לא חשב שאמרתי "מתה" כי זה לא תקני בניקוד הזה, אבל התוכנה הזאת לא חישבנה את זה, וחשבה שאמרתי "מתה" בסגו"ל...] , לעומת זה כשהדיבור לא היה מספיק חד וברור, או כשהיה הגייה למדנית וכדומה שאין לשום תוכנה, בזה לפעמים דווקא התוכנה הנוכחית דייקה יותר ממיקרוסופוט!! כנראה היא יותר 'מתאמצת' לדייק לפענח לפי הצלילים ולא רק לפי מילים קלאסיות שהיא מכירה....]

                                          ולכן הרבה זמן בדקתי וניסיתי את ההבדלים בטקסט רב,
                                          ואני חייב לומר שלמעשה שתיהם מזהים מאד יפה! אפילו שזה לא בהגייה עברית תקינה... כולל פסיק, אתנחתא, וסימן שאלה, [,.?]
                                          ואפשר בעבודה פשוטה יחסית לעבור על הכל ולתקן,
                                          בסופו של דבר כמובן יש מעלה במייקרוספוט שהשרתים שלה המפלצתיים מפענחים בזמן קצר יחסית,
                                          מצד שני כאן זה חינמי... וגם יוצא מחולק יפה לפי שניות,
                                          בסופו של יום ולאחר השוואות רבות, מסקנתי היא כך: אם המילים של הדובר ברורות חדות, עם הפסקות נורמליות ביניהם- וההגייה שלו היא כעברית תקינה- מייקרוספוט היא הטובה ביותר! כיון שכל מילה מפוענחת בהתאם לאפשרויות התקניות בלבד, [וכמו שהבאתי דוגמא 'מטה' היא לא תטעה שאמרת 'מתה' כי זה ניקוד אחר], אבל בכל הקלטה שהדובר לא הכי ברור, או בהגייה למדנית וכדומה- בזה עדיף התוכנה שלנו כי היא מדייקת לפי הצלילים גם אם זה לא מדאי הגיוני בשבילה, והיא לא מבינה מה אמרת, למשל כשאמרתי "אברה-קדברה" רק התוכנה זיהתה נכון.... כנ"ל בהרבה מילים למשל "חפצא של אנשים", כי מייקרוסופוט מעדיפה לשפר את המילה לפי מילון הגיוני יותר, ובסופו של דבר לדעתי יש בהחלט נטייה לטובת התוכנה שלנו!!!! [גם כי זה יוצא יותר מובן לקורא, וגם כי למעשה מדייק יותר פעמים]
                                          [רק צריך מחשב חזק, הכי טוב לפחות G16 RAM]

                                          בעז"ה נקווה שהתוכנה תתאמן גם על קולות תורניים, ובכל ההגיות,
                                          ואסיים בתודה לכל מי שעזר עד כה וסייע בדברים
                                          זה דבר חשוב ותועלתי ועד היום נכתבו עשרות[!] שרשורים מלאי פוסטים רק בחיפוש אחר תוכנה כזאת.......

                                          @KINGYOS האם עכשיו תוכל להעלות זאת לשרת בצורה מסודרת? תראה ש-@אלישי רצה את זה כבר כאן.

                                          נ"ב: דוגמא נחמדה שהביאו פה פעם ממייקרוסופט [מזיהוי דיבור בוורד]....

                                          מישהו12מ מנותק
                                          מישהו12מ מנותק
                                          מישהו12
                                          מדריכים
                                          כתב ב נערך לאחרונה על ידי
                                          #306
                                          פוסט זה נמחק!
                                          תגובה 1 תגובה אחרונה
                                          1

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר