דילוג לתוכן
  • חוקי הפורום
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. כללי - עזרה הדדית
  3. תמלול שיחות STT עם aws api

תמלול שיחות STT עם aws api

מתוזמן נעוץ נעול הועבר כללי - עזרה הדדית
9 פוסטים 2 כותבים 213 צפיות
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • A מנותק
    A מנותק
    A jew
    כתב ב נערך לאחרונה על ידי
    #1

    אני מתכנת וצריך לשלוח שיחות מוקלטות לAPI של אמזון ולקבל חזרה תמלול.
    מכיון שההקלטות הם שיחות טלפון - יש 2 דוברים בשיחה.
    הבעיה שאמזון לא מזהה נכון את 2 הדוברים.

    יהודי אף פעם לא לבד

    chvC תגובה 1 תגובה אחרונה
    2
    • chvC מנותק
      chvC מנותק
      chv
      השיב לA jew ב נערך לאחרונה על ידי
      #2

      @a-jew
      https://docs.aws.amazon.com/transcribe/latest/dg/diarization-batch.html

      בלוג

      A 2 תגובות תגובה אחרונה
      0
      • A מנותק
        A מנותק
        A jew
        השיב לchv ב נערך לאחרונה על ידי
        #3

        @chv
        תודה,
        ניסיתי כבר את זה והבעיה שהוא מזהה כמה דוברים גם כאשר מדובר רק בדובר אחד.

        יהודי אף פעם לא לבד

        chvC תגובה 1 תגובה אחרונה
        2
        • A מנותק
          A מנותק
          A jew
          השיב לchv ב נערך לאחרונה על ידי
          #4

          יש למשהו הצעה לשירות API שנותן תמלול של שיחות טלפון עם 2 דוברים ברמה גבוהה?

          יהודי אף פעם לא לבד

          תגובה 1 תגובה אחרונה
          2
          • chvC מנותק
            chvC מנותק
            chv
            השיב לA jew ב נערך לאחרונה על ידי
            #5

            @a-jew אמר בתמלול שיחות STT עם aws api:

            ניסיתי כבר את זה והבעיה שהוא מזהה כמה דוברים גם כאשר מדובר רק בדובר אחד.

            טוב.. לא יודע. אולי צריך להגדיר יותר? תבדוק

            @a-jew אמר בתמלול שיחות STT עם aws api:

            יש למשהו הצעה לשירות API שנותן תמלול של שיחות טלפון עם 2 דוברים ברמה גבוהה?

            יש לכל החברות הגדולות.
            AWS מה שהבאת
            לגוגל יש https://cloud.google.com/speech-to-text/docs/multiple-voices#speech_transcribe_diarization_beta-nodejs
            למייקרוסופט יש https://azure.microsoft.com/en-us/services/cognitive-services/speaker-recognition/

            גם ל-IBM יש בשירותי קלאוד שלהם https://console.ng.bluemix.net/catalog/services/speech-to-text?taxonomyNavigation=apps

            אני חושב שזה עניין של הגדרה + אולי תעשה איזו מניפולציה לאודיו שהAWS ישמע אותו יותר ברור? לא יודע
            (אני השתמשתי בגוגל קלאוד בפיצ'ר הזה ועבד מעולה, זיהה 2 דוברים רק כשהיה שניים באמת)

            בלוג

            A תגובה 1 תגובה אחרונה
            0
            • A מנותק
              A מנותק
              A jew
              השיב לchv ב נערך לאחרונה על ידי
              #6

              @chv
              תודה רבה על הפירוט.
              אני צריך שירות של תמלול שיחות גם בעברית.
              google מזהה דוברים גם בעברית?

              יהודי אף פעם לא לבד

              chvC תגובה 1 תגובה אחרונה
              2
              • chvC מנותק
                chvC מנותק
                chv
                השיב לA jew ב נערך לאחרונה על ידי
                #7

                @a-jew אמר בתמלול שיחות STT עם aws api:

                google מזהה דוברים גם בעברית?

                כן, לי הוא זיהה (כך לפחות על פי הזיכרון הקצר שלי. מה שעשיתי היה לתמלל כמה ראיונות עבודה - והוא חילק בין המראיינת למרואיינת)

                בלוג

                A תגובה 1 תגובה אחרונה
                0
                • A מנותק
                  A מנותק
                  A jew
                  השיב לchv ב נערך לאחרונה על ידי
                  #8

                  @chv
                  תודה!
                  פנית לAPI דרך קוד?
                  אם כן יש מצב שאתה שולח לי דוגמא של הקוד?

                  יהודי אף פעם לא לבד

                  chvC תגובה 1 תגובה אחרונה
                  2
                  • chvC מנותק
                    chvC מנותק
                    chv
                    השיב לA jew ב נערך לאחרונה על ידי
                    #9

                    @a-jew אין לי את הקוד
                    אבל ממה שאני זוכר זה היה CURL פשוט

                    קובץ השמע היה מצורף לבקשה
                    וחזר תשובה עם כל הנתונים שהוצאתי אותה לתוך קובץ טקסט

                    בלוג

                    תגובה 1 תגובה אחרונה
                    0

                    • התחברות

                    • אין לך חשבון עדיין? הרשמה

                    • התחברו או הירשמו כדי לחפש.
                    • פוסט ראשון
                      פוסט אחרון
                    0
                    • חוקי הפורום
                    • לא נפתר
                    • משתמשים
                    • חיפוש גוגל בפורום
                    • צור קשר