בקשת מידע | הקראת קבצי TTS בעברית באמצעות פייתון
-
@Yehuda-1 טעיתי, זו לא הספריה הנכונה!
אבל בסוף מצאתי משהו אחר:
ראשית החבילות:
pip install --upgrade transformers accelerate
אחר כך הקוד:
from transformers import VitsModel, AutoTokenizer import torch model = VitsModel.from_pretrained("facebook/mms-tts-heb") tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-heb") text = "כאן הטקסט שהוא מקריא" inputs = tokenizer(text, return_tensors="pt") with torch.no_grad(): output = model(**inputs).waveform
אחר כך אפשר לשמור את הקובץ:
import scipy scipy.io.wavfile.write("techno.wav", rate=model.config.sampling_rate, data=output)
או לחילופין להריץ אותו במחברת ג'ופיטר:
from IPython.display import Audio Audio(output, rate=model.config.sampling_rate)
-
@sivan22 עבד מצויין, לא הצלחתי למצוא עדיין את הגירסה של פייתון, אני לא מצליח לקרוא את השגיאה שלך, התמונה חסומה בנטפרי. תצטט את התוכן.
שלא תשתעמם בינתיים:
הורדה (1).wav -
@sivan22 חחחחח יש בזה משהו, אני מנסה להריץ את זה בkaggle לוקח לו זמן, עכשיו זה לא ממש עוזר לי אם צריך מחשב חזק, וזמן אני צריך את זה לאינטרקציה עם תוכנה שאני בונה אז זה בעייתי יהיה טוב משהו עם API או משהו קליל יותר
-
@Yehuda-1 האמת בדקתי הרגע שוב, לא צריך GPU בכלל, ירוץ יפה על CPU המודל כולו הוא 150 מגה בייט, קטן מאד יחסית.
-
@Yehuda-1 האמת בדקתי הרגע שוב, לא צריך GPU בכלל, ירוץ יפה על CPU המודל כולו הוא 150 מגה בייט, קטן מאד יחסית.
-
@sivan22 תיקון כשאני מריץ את זה בפלטפורמה של גוגל (colab) זה עובד, אבל אצלי במחשב זה לא עובד. הוא מסיים לרוץ מבלי להשמיע כלום (מעבד i5-7400, כרטיס מסך 1050TI)
-
@Yehuda-1 הוא לא אמור להשמיע כי אין בקוד פקודה להשמעה רק לשמירה. כדי להשמיע צריך את הקוד הבא:
from playsound import playsound playsound('myfile.wav')
והאזהרה, גם אצלי היתה, אפשר להתעלם.