שיתוף | 'פלאפון מייל' - הגירסא המשופרת של מייל לפלאפון, כולל קבלת ושליחת מיילים דרך הפלאפון, קריינות מקצועית, ועוד...
-
@פלמנמוני למה שלא תעשה tts דרך gemini?
(מודלgemini-2.5-flash-preview-ttsgemini-2.5-pro-preview-tts הוא חינמי עד 15 בקשות ביום).
דרך גוגל קלאוד זה חינמי רק עד 3 חודשים ולדעתי הוא מביא תוצאות פחות טובות.@האדם-החושב כתב בשיתוף | 'פלאפון מייל' - הגירסא המשופרת של מייל לפלאפון, כולל קבלת ושליחת מיילים דרך הפלאפון, קריינות מקצועית, ועוד...:
@פלמנמוני למה שלא תעשה tts דרך gemini?
אפשר הדרכה? אני לא מצליח
-
@חסיד-פשוט מה עושים
@חסיד-פשוט כתב בשיתוף | 'פלאפון מייל' - הגירסא המשופרת של מייל לפלאפון, כולל קבלת ושליחת מיילים דרך הפלאפון, קריינות מקצועית, ועוד...:
נתקבל בשגיאה למה ?
(אולי בגלל נטפרי ) אם אין לי נקודות אין מה לעשות? -
@חסיד-פשוט מה עושים
@חסיד-פשוט כתב בשיתוף | 'פלאפון מייל' - הגירסא המשופרת של מייל לפלאפון, כולל קבלת ושליחת מיילים דרך הפלאפון, קריינות מקצועית, ועוד...:
נתקבל בשגיאה למה ?
(אולי בגלל נטפרי ) אם אין לי נקודות אין מה לעשות? -
@חסיד-פשוט גם לי אין נקודות, פניה כזו איננה דורשת נקודות
פשוט להסריט את המסך עם הקלטת תעבורה דרך האזור האישי ולשלוח להם -
@מוגן כתב בשיתוף | 'פלאפון מייל' - הגירסא המשופרת של מייל לפלאפון, כולל קבלת ושליחת מיילים דרך הפלאפון, קריינות מקצועית, ועוד...:
יש כאן משהו שהצליח לעשות קריינות של גוגל קלאד בשמיעת המיילים?
אני...
עריכה: וכעת גם אתה... -
@האדם-החושב כתב בשיתוף | 'פלאפון מייל' - הגירסא המשופרת של מייל לפלאפון, כולל קבלת ושליחת מיילים דרך הפלאפון, קריינות מקצועית, ועוד...:
@פלמנמוני למה שלא תעשה tts דרך gemini?
אפשר הדרכה? אני לא מצליח
@פלמנמוני בpython זה נראה כך:
import io import wave from google import genai from google.genai import types def tts_single_speaker(token: str, text: str, model: str = "gemini-2.5-flash-preview-tts", voice: str = "Zephyr") -> bytes | None: client = genai.Client(api_key=token) response = client.models.generate_content( model=model, contents=[types.Part.from_text(text=text)], config=types.GenerateContentConfig( response_modalities=["AUDIO"], speech_config=types.SpeechConfig( voice_config=types.VoiceConfig( prebuilt_voice_config=types.PrebuiltVoiceConfig( voice_name=voice ) ) ), ) ) if response and response.candidates and response.candidates[0] and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data: return response.candidates[0].content.parts[0].inline_data.data return None def wave_file(pcm, channels=1, rate=24000, sample_width=2) -> bytes: buf = io.BytesIO() with wave.open(buf, "wb") as wf: wf.setnchannels(channels) wf.setsampwidth(sample_width) wf.setframerate(rate) wf.writeframes(pcm) return buf.getvalue() def main(): text = "שלום, זהו מבחן של המערכת להמרת טקסט לדיבור." token = "YOUR_API_KEY_HERE" audio_pcm = tts_single_speaker(token, text) if audio_pcm: audio_bytes = wave_file(audio_pcm) with open("output.wav", "wb") as f: f.write(audio_bytes) print("Audio content written to output.wav") else: print("Failed to generate audio.")פעם ניסיתי לעשות את זה בgoogle script אבל לא הצלחתי לתרגם את החלק של המרת הpcm לwav.
-
@פלמנמוני בpython זה נראה כך:
import io import wave from google import genai from google.genai import types def tts_single_speaker(token: str, text: str, model: str = "gemini-2.5-flash-preview-tts", voice: str = "Zephyr") -> bytes | None: client = genai.Client(api_key=token) response = client.models.generate_content( model=model, contents=[types.Part.from_text(text=text)], config=types.GenerateContentConfig( response_modalities=["AUDIO"], speech_config=types.SpeechConfig( voice_config=types.VoiceConfig( prebuilt_voice_config=types.PrebuiltVoiceConfig( voice_name=voice ) ) ), ) ) if response and response.candidates and response.candidates[0] and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data: return response.candidates[0].content.parts[0].inline_data.data return None def wave_file(pcm, channels=1, rate=24000, sample_width=2) -> bytes: buf = io.BytesIO() with wave.open(buf, "wb") as wf: wf.setnchannels(channels) wf.setsampwidth(sample_width) wf.setframerate(rate) wf.writeframes(pcm) return buf.getvalue() def main(): text = "שלום, זהו מבחן של המערכת להמרת טקסט לדיבור." token = "YOUR_API_KEY_HERE" audio_pcm = tts_single_speaker(token, text) if audio_pcm: audio_bytes = wave_file(audio_pcm) with open("output.wav", "wb") as f: f.write(audio_bytes) print("Audio content written to output.wav") else: print("Failed to generate audio.")פעם ניסיתי לעשות את זה בgoogle script אבל לא הצלחתי לתרגם את החלק של המרת הpcm לwav.
-
@האדם-החושב מהו הקישור דרכו מתבצע התקשורת?
-
@פלמנמוני זאת ספרייה לpython, הבקשות מאחורי הקלעים.
לכאו' זה הלינק הזה:https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-preview-tts:generateContent?key=