בקשת מידע | הקראת קבצי TTS בעברית באמצעות פייתון

Yehuda 1

@K-O-G הספרייה לא באמת תומכת בעברית. (הבאת מchatGPT?)

K.O.G

@Yehuda-1 כתב בבקשת מידע | הקראת קבצי TTS בעברית באמצעות פייתון:

@K-O-G הספרייה לא באמת תומכת בעברית. (הבאת מchatGPT?)

אתה צודק, נראה שהספרייה gtts בפועל לא באמת תומכת היטב בשפה העברית כרגע.

יש כמה דרכים חלופיות להשיג הקראת טקסט בעברית בפייתון:

השתמש ב-Google Cloud Text-to-Speech. זה שירות מצוין של גוגל שתומך בעברית:

from google.cloud import texttospeech

client = texttospeech.TextToSpeechClient()

synthesis_input = texttospeech.SynthesisInput(text="שלום ישראל")

voice = texttospeech.VoiceSelectionParams(
    language_code="he-IL", 
    ssml_gender=texttospeech.SsmlVoiceGender.FEMALE
)

audio_config = texttospeech.AudioConfig(
    audio_encoding=texttospeech.AudioEncoding.MP3
)

response = client.synthesize_speech(
    input=synthesis_input, voice=voice, audio_config=audio_config
)

with open("hebrew.mp3", "wb") as out:
    out.write(response.audio_content)

השתמש בספריית pyttsx3 שתומכת במנועי TTS שונים, כולל כאלה שתומכים בעברית.

אז יש מספר אופציות טובות יותר מאשר gtts להשגת הקראת טקסט בעברית בפייתון!

Yehuda 1

@K-O-G כתב בבקשת מידע | הקראת קבצי TTS בעברית באמצעות פייתון:

Google Cloud Text-

זה דורש תשלום לגוגל cloud. אם אתה לא יודע לעזור, אל תשאל את צ'אט ג'יפיטי. תודה

MGM IVR

@K-O-G מי ששואל פה, לא מעוניין בתשובות כאלה על פי רוב... הוא יכול לחפש לבד.
הוא מעוניין לדעת מאנשים עם ידע, ולא עם בוטים שממצאים תשובות.

MGM IVR

@Yehuda-1 כתב בבקשת מידע | הקראת קבצי TTS בעברית באמצעות פייתון:

מישהו יכול לעזור לי למצוא דרך?

תבדוק את זה
https://github.com/Sharonio/roboshaul/blob/main/roboshaul_usage_colab.ipynb

sivan22

@Yehuda-1 כתב בבקשת מידע | הקראת קבצי TTS בעברית באמצעות פייתון:

מישהו יכול לעזור לי למצוא דרך?

אני חושב שזו הספרייה הנכונה, בהמשך בלי נדר אני ימצא את הקוד המדוייק.

Yehuda 1

@MGM-IVR זה לא עוזר לי יש שם משהו שתואם רק ללינוקס, תודה בכל אופן

sivan22

@Yehuda-1 טעיתי, זו לא הספריה הנכונה!

אבל בסוף מצאתי משהו אחר:

ראשית החבילות:

pip install --upgrade transformers accelerate

אחר כך הקוד:

from transformers import VitsModel, AutoTokenizer
import torch

model = VitsModel.from_pretrained("facebook/mms-tts-heb")
tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-heb")

text = "כאן הטקסט שהוא מקריא"
inputs = tokenizer(text, return_tensors="pt")

with torch.no_grad():
    output = model(**inputs).waveform

אחר כך אפשר לשמור את הקובץ:

import scipy

scipy.io.wavfile.write("techno.wav", rate=model.config.sampling_rate, data=output)

או לחילופין להריץ אותו במחברת ג'ופיטר:

from IPython.display import Audio

Audio(output, rate=model.config.sampling_rate)

sivan22

@sivan22 והנה התוצאה:
הורדה.wav

Yehuda 1

@sivan22 תודה, אבל זה נכשל (פייתון 3.11.5)

לך זה עבד? אם כן באיזה גרסה של פייתון?

Yehuda 1

@sivan22 זה היה קצת מלחיץ

sivan22

@Yehuda-1 תנסה להריץ בcolab או בkaggle, יש סיכוי שצריך gpu רציני.

אני הרצתי בpaperspace.

Yehuda 1

פוסט זה נמחק!

sivan22

@sivan22 עבד מצויין, לא הצלחתי למצוא עדיין את הגירסה של פייתון, אני לא מצליח לקרוא את השגיאה שלך, התמונה חסומה בנטפרי. תצטט את התוכן.
שלא תשתעמם בינתיים:
הורדה (1).wav

Yehuda 1

@sivan22 חחחחח יש בזה משהו, אני מנסה להריץ את זה בkaggle לוקח לו זמן, עכשיו זה לא ממש עוזר לי אם צריך מחשב חזק, וזמן אני צריך את זה לאינטרקציה עם תוכנה שאני בונה אז זה בעייתי יהיה טוב משהו עם API או משהו קליל יותר

sivan22

@Yehuda-1 האמת בדקתי הרגע שוב, לא צריך GPU בכלל, ירוץ יפה על CPU המודל כולו הוא 150 מגה בייט, קטן מאד יחסית.

Yehuda 1

@sivan22
אז... הוא לא משמיע לי כלום, כתוב פה שצריך לאמן את מודל לך זה עבד רגיל לא?

Yehuda 1

@sivan22 תיקון כשאני מריץ את זה בפלטפורמה של גוגל (colab) זה עובד, אבל אצלי במחשב זה לא עובד. הוא מסיים לרוץ מבלי להשמיע כלום (מעבד i5-7400, כרטיס מסך 1050TI)

sivan22

@Yehuda-1 הוא לא אמור להשמיע כי אין בקוד פקודה להשמעה רק לשמירה. כדי להשמיע צריך את הקוד הבא:

from playsound import playsound

playsound('myfile.wav')

והאזהרה, גם אצלי היתה, אפשר להתעלם.

Yehuda 1

@sivan22 תודה עזרת לי מאד! מעריך