בירור | AI בימות המשיח - איך לעשות?
-
@אופיר123 יש גם את החלק של שליפת ההקלטה מימות, אלא אם כן אתה רוצה רק הקשה.
בתשובת שרת עדיף פשוט ליצור tts חדש כדי שהוא לא יסתבך עם עברית אנגלית תווים לא חוקיים בהקראת התשובה.
@oryadaniely
ניתן לעשות שלוחת API.
גם בחלק של הכנרת דיבור לטקסט אין בכך צורך, יש מודלים שמקבלים אודיו כinput.
את התשובה אפשר להחזיר כטקסט, אין צורך בהמרה לאודיו.@האדם-החושב זה הרבה יותר יקר מודל שמקבל מאודיו... וודאי שפחות איכותי מהתמלול של גוגל (שגם יותר איכותי לדעתי מTTS של ימות
-
@אופיר123 יש גם את החלק של שליפת ההקלטה מימות, אלא אם כן אתה רוצה רק הקשה.
בתשובת שרת עדיף פשוט ליצור tts חדש כדי שהוא לא יסתבך עם עברית אנגלית תווים לא חוקיים בהקראת התשובה.
@oryadaniely
ניתן לעשות שלוחת API.
גם בחלק של הכנרת דיבור לטקסט אין בכך צורך, יש מודלים שמקבלים אודיו כinput.
את התשובה אפשר להחזיר כטקסט, אין צורך בהמרה לאודיו.@האדם-החושב כתב בבירור | AI בימות המשיח - איך לעשות?:
יש גם את החלק של שליפת ההקלטה מימות, אלא אם כן אתה רוצה רק הקשה.
התכוונתי לזיהוי דיבור של ימות, וזה מייתר את כל הצורך בזיהוי דיבור של גוגל שדובר פה
לא יודע להשוות מבחינת עלויות, אבל בהנחה שזה לשימוש פרטי כמו שהוא אמר, הדרך הזו תחסוך לו הרבה כאב ראש@אביי כתב בבירור | AI בימות המשיח - איך לעשות?:
אם אתה לא מתכנת, אין לך איך לעשות את זה,
אני גם לא מתכנת... אבל בכ"ז אשמח שתסביר לי מה רע בפתרון שהצעתי
-
שלום, יש לי קו בימות המשיח, ואני רוצה לעשות שהוא יהיה קו של בינה מלאכותית (כמו שעשו פה).
מישהו יודע איך אפשר לעשות את זה\איפה אפשר ללמוד את הנושא?
[עם API של Gemini או משהו...]
תודה רבה!@רפאל-vnkl אתה יכול לתת את המספר לטובת הציבור
תודה -
@אופיר123 כתב בבירור | AI בימות המשיח - איך לעשות?:
התכוונתי לזיהוי דיבור של ימות, וזה מייתר את כל הצורך בזיהוי דיבור של גוגל שדובר פה
זה עולה כסף...
מה שאני עשיתי לעצמי לשימושי האישי זה שעשיתי שלוחת api עם הקלטה (בלי תמלול של ימות), נשלח וובהוק לשרת שלי והוא מוריד את הקובץ מימות ושולח אותו בתוספת פרומפט מערכת למודל של gemini שתומך בקלט אודיו, ואת התשובה הוא מכניס כtts למערכת.
השתמשתי במודל gemini-2.0-flash שיש לו עד 1,500 בקשות ליום במסלול החינמי והתוצאות די משביעות רצון.
לשימוש מרובה משתמשים אני מאמין שצריך למצוא פיתרון אחר. -
@אופיר123 כתב בבירור | AI בימות המשיח - איך לעשות?:
התכוונתי לזיהוי דיבור של ימות, וזה מייתר את כל הצורך בזיהוי דיבור של גוגל שדובר פה
זה עולה כסף...
מה שאני עשיתי לעצמי לשימושי האישי זה שעשיתי שלוחת api עם הקלטה (בלי תמלול של ימות), נשלח וובהוק לשרת שלי והוא מוריד את הקובץ מימות ושולח אותו בתוספת פרומפט מערכת למודל של gemini שתומך בקלט אודיו, ואת התשובה הוא מכניס כtts למערכת.
השתמשתי במודל gemini-2.0-flash שיש לו עד 1,500 בקשות ליום במסלול החינמי והתוצאות די משביעות רצון.
לשימוש מרובה משתמשים אני מאמין שצריך למצוא פיתרון אחר.@האדם-החושב כתב בבירור | AI בימות המשיח - איך לעשות?:
מה שאני עשיתי לעצמי לשימושי האישי זה שעשיתי שלוחת api עם הקלטה (בלי תמלול של ימות), נשלח וובהוק לשרת שלי והוא מוריד את הקובץ מימות ושולח אותו בתוספת פרומפט מערכת למודל של gemini שתומך בקלט אודיו, ואת התשובה הוא מכניס כtts למערכת.
השתמשתי במודל gemini-2.0-flash שיש לו עד 1,500 בקשות ליום במסלול החינמי והתוצאות די משביעות רצון.ובשלב כלשהו השתמשת בשרת משלך\שילמת כסף?
-
@האדם-החושב כתב בבירור | AI בימות המשיח - איך לעשות?:
מה שאני עשיתי לעצמי לשימושי האישי זה שעשיתי שלוחת api עם הקלטה (בלי תמלול של ימות), נשלח וובהוק לשרת שלי והוא מוריד את הקובץ מימות ושולח אותו בתוספת פרומפט מערכת למודל של gemini שתומך בקלט אודיו, ואת התשובה הוא מכניס כtts למערכת.
השתמשתי במודל gemini-2.0-flash שיש לו עד 1,500 בקשות ליום במסלול החינמי והתוצאות די משביעות רצון.ובשלב כלשהו השתמשת בשרת משלך\שילמת כסף?
@רפאל-vnkl לא, מצאתי שרת חינמי