דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • בהיר
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • כהה
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. כללי - עזרה הדדית
  3. תמלול שיחות STT עם aws api

תמלול שיחות STT עם aws api

מתוזמן נעוץ נעול הועבר כללי - עזרה הדדית
9 פוסטים 2 כותבים 310 צפיות 2 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • A מנותק
    A מנותק
    A jew
    כתב ב נערך לאחרונה על ידי
    #1

    אני מתכנת וצריך לשלוח שיחות מוקלטות לAPI של אמזון ולקבל חזרה תמלול.
    מכיון שההקלטות הם שיחות טלפון - יש 2 דוברים בשיחה.
    הבעיה שאמזון לא מזהה נכון את 2 הדוברים.

    יהודי אף פעם לא לבד

    chvC תגובה 1 תגובה אחרונה
    2
    • A A jew

      אני מתכנת וצריך לשלוח שיחות מוקלטות לAPI של אמזון ולקבל חזרה תמלול.
      מכיון שההקלטות הם שיחות טלפון - יש 2 דוברים בשיחה.
      הבעיה שאמזון לא מזהה נכון את 2 הדוברים.

      chvC מנותק
      chvC מנותק
      chv
      כתב ב נערך לאחרונה על ידי
      #2

      @a-jew
      https://docs.aws.amazon.com/transcribe/latest/dg/diarization-batch.html

      בלוג

      A 2 תגובות תגובה אחרונה
      0
      • chvC chv

        @a-jew
        https://docs.aws.amazon.com/transcribe/latest/dg/diarization-batch.html

        A מנותק
        A מנותק
        A jew
        כתב ב נערך לאחרונה על ידי
        #3

        @chv
        תודה,
        ניסיתי כבר את זה והבעיה שהוא מזהה כמה דוברים גם כאשר מדובר רק בדובר אחד.

        יהודי אף פעם לא לבד

        chvC תגובה 1 תגובה אחרונה
        2
        • chvC chv

          @a-jew
          https://docs.aws.amazon.com/transcribe/latest/dg/diarization-batch.html

          A מנותק
          A מנותק
          A jew
          כתב ב נערך לאחרונה על ידי
          #4

          יש למשהו הצעה לשירות API שנותן תמלול של שיחות טלפון עם 2 דוברים ברמה גבוהה?

          יהודי אף פעם לא לבד

          תגובה 1 תגובה אחרונה
          2
          • A A jew

            @chv
            תודה,
            ניסיתי כבר את זה והבעיה שהוא מזהה כמה דוברים גם כאשר מדובר רק בדובר אחד.

            chvC מנותק
            chvC מנותק
            chv
            כתב ב נערך לאחרונה על ידי
            #5

            @a-jew אמר בתמלול שיחות STT עם aws api:

            ניסיתי כבר את זה והבעיה שהוא מזהה כמה דוברים גם כאשר מדובר רק בדובר אחד.

            טוב.. לא יודע. אולי צריך להגדיר יותר? תבדוק

            @a-jew אמר בתמלול שיחות STT עם aws api:

            יש למשהו הצעה לשירות API שנותן תמלול של שיחות טלפון עם 2 דוברים ברמה גבוהה?

            יש לכל החברות הגדולות.
            AWS מה שהבאת
            לגוגל יש https://cloud.google.com/speech-to-text/docs/multiple-voices#speech_transcribe_diarization_beta-nodejs
            למייקרוסופט יש https://azure.microsoft.com/en-us/services/cognitive-services/speaker-recognition/

            גם ל-IBM יש בשירותי קלאוד שלהם https://console.ng.bluemix.net/catalog/services/speech-to-text?taxonomyNavigation=apps

            אני חושב שזה עניין של הגדרה + אולי תעשה איזו מניפולציה לאודיו שהAWS ישמע אותו יותר ברור? לא יודע
            (אני השתמשתי בגוגל קלאוד בפיצ'ר הזה ועבד מעולה, זיהה 2 דוברים רק כשהיה שניים באמת)

            בלוג

            A תגובה 1 תגובה אחרונה
            0
            • chvC chv

              @a-jew אמר בתמלול שיחות STT עם aws api:

              ניסיתי כבר את זה והבעיה שהוא מזהה כמה דוברים גם כאשר מדובר רק בדובר אחד.

              טוב.. לא יודע. אולי צריך להגדיר יותר? תבדוק

              @a-jew אמר בתמלול שיחות STT עם aws api:

              יש למשהו הצעה לשירות API שנותן תמלול של שיחות טלפון עם 2 דוברים ברמה גבוהה?

              יש לכל החברות הגדולות.
              AWS מה שהבאת
              לגוגל יש https://cloud.google.com/speech-to-text/docs/multiple-voices#speech_transcribe_diarization_beta-nodejs
              למייקרוסופט יש https://azure.microsoft.com/en-us/services/cognitive-services/speaker-recognition/

              גם ל-IBM יש בשירותי קלאוד שלהם https://console.ng.bluemix.net/catalog/services/speech-to-text?taxonomyNavigation=apps

              אני חושב שזה עניין של הגדרה + אולי תעשה איזו מניפולציה לאודיו שהAWS ישמע אותו יותר ברור? לא יודע
              (אני השתמשתי בגוגל קלאוד בפיצ'ר הזה ועבד מעולה, זיהה 2 דוברים רק כשהיה שניים באמת)

              A מנותק
              A מנותק
              A jew
              כתב ב נערך לאחרונה על ידי
              #6

              @chv
              תודה רבה על הפירוט.
              אני צריך שירות של תמלול שיחות גם בעברית.
              google מזהה דוברים גם בעברית?

              יהודי אף פעם לא לבד

              chvC תגובה 1 תגובה אחרונה
              2
              • A A jew

                @chv
                תודה רבה על הפירוט.
                אני צריך שירות של תמלול שיחות גם בעברית.
                google מזהה דוברים גם בעברית?

                chvC מנותק
                chvC מנותק
                chv
                כתב ב נערך לאחרונה על ידי
                #7

                @a-jew אמר בתמלול שיחות STT עם aws api:

                google מזהה דוברים גם בעברית?

                כן, לי הוא זיהה (כך לפחות על פי הזיכרון הקצר שלי. מה שעשיתי היה לתמלל כמה ראיונות עבודה - והוא חילק בין המראיינת למרואיינת)

                בלוג

                A תגובה 1 תגובה אחרונה
                0
                • chvC chv

                  @a-jew אמר בתמלול שיחות STT עם aws api:

                  google מזהה דוברים גם בעברית?

                  כן, לי הוא זיהה (כך לפחות על פי הזיכרון הקצר שלי. מה שעשיתי היה לתמלל כמה ראיונות עבודה - והוא חילק בין המראיינת למרואיינת)

                  A מנותק
                  A מנותק
                  A jew
                  כתב ב נערך לאחרונה על ידי
                  #8

                  @chv
                  תודה!
                  פנית לAPI דרך קוד?
                  אם כן יש מצב שאתה שולח לי דוגמא של הקוד?

                  יהודי אף פעם לא לבד

                  chvC תגובה 1 תגובה אחרונה
                  2
                  • A A jew

                    @chv
                    תודה!
                    פנית לAPI דרך קוד?
                    אם כן יש מצב שאתה שולח לי דוגמא של הקוד?

                    chvC מנותק
                    chvC מנותק
                    chv
                    כתב ב נערך לאחרונה על ידי
                    #9

                    @a-jew אין לי את הקוד
                    אבל ממה שאני זוכר זה היה CURL פשוט

                    קובץ השמע היה מצורף לבקשה
                    וחזר תשובה עם כל הנתונים שהוצאתי אותה לתוך קובץ טקסט

                    בלוג

                    תגובה 1 תגובה אחרונה
                    0

                    שלום! נראה שהשיחה הזו מעניינת אותך, אבל עדיין אין לך חשבון.

                    נמאס לכם לגלול בין אותם הפוסטים בכל ביקור? כשנרשמים לחשבון, תמיד תחזרו בדיוק למקום שבו הייתם קודם, ותוכלו לבחור לקבל התראות על תגובות חדשות (בין אם במייל, ובין אם בהתראת פוש). תוכלו גם לשמור סימניות ולפרגן ב-upvote לפוסטים כדי להביע הערכה לחברי קהילה אחרים.

                    בעזרת התרומה שלך, הפוסט הזה יכול להיות אפילו טוב יותר 💗

                    הרשמה התחברות

                    • התחברות

                    • אין לך חשבון עדיין? הרשמה

                    • התחברו או הירשמו כדי לחפש.
                    • פוסט ראשון
                      פוסט אחרון
                    0
                    • חוקי הפורום
                    • פופולרי
                    • לא נפתר
                    • משתמשים
                    • חיפוש גוגל בפורום
                    • צור קשר