בירור | בינה מלאכותית שאפשר לאמן/להכניס טקסט ויש לה API
-
@עידו300 תשתמש בנוטבוק אל אמ אבל רק לארגונים יש לו API ישיר סתם ככה צריך לפנות לגוגל כארגון כדיי שיאשרו לך API זה הדבר הכי מדוייק וטוב שאני מכיר לזה https://notebooklm.google/ סתם בשביל העניין תוכל להתנסות עם הנוטבוק אל אמ שיצרתי שיודע את רוב התורה תוכל לנסות ולבחון אם בא לך https://notebooklm.google.com/notebook/de931f3c-205b-4beb-b6e0-1d7be0a93f4e
@yehokarpel האמת שהוא היה האופציה הראשונה שלי, אבל לא מצאתי שיש לו api, טוב שאתה אומר.
-
@yehokarpel האמת שהוא היה האופציה הראשונה שלי, אבל לא מצאתי שיש לו api, טוב שאתה אומר.
-
@עידו300 לא יודע
-
@עידו300 תשתמש בנוטבוק אל אמ אבל רק לארגונים יש לו API ישיר סתם ככה צריך לפנות לגוגל כארגון כדיי שיאשרו לך API זה הדבר הכי מדוייק וטוב שאני מכיר לזה https://notebooklm.google/ סתם בשביל העניין תוכל להתנסות עם הנוטבוק אל אמ שיצרתי שיודע את רוב התורה תוכל לנסות ולבחון אם בא לך https://notebooklm.google.com/notebook/de931f3c-205b-4beb-b6e0-1d7be0a93f4e
@yehokarpel כתב בבירור | בינה מלאכותית שאפשר לאמן/להכניס טקסט ויש לה API:
API ישיר סתם ככה לא צריך לפנות לגוגל כארגון כדיי שיאשרו לך API
איך משיגים API?
-
@yehokarpel כתב בבירור | בינה מלאכותית שאפשר לאמן/להכניס טקסט ויש לה API:
API ישיר סתם ככה לא צריך לפנות לגוגל כארגון כדיי שיאשרו לך API
איך משיגים API?
@עידו300 טעיתי שרשמתי לא צריך כן צריך לפנות אליהם כארגון תקנתי את זה בהודעה
-
@yehokarpel האמת שהוא היה האופציה הראשונה שלי, אבל לא מצאתי שיש לו api, טוב שאתה אומר.
@עידו300 יש API לא רשמי לnotebooklm כאן https://github.com/teng-lin/notebooklm-py
וכאן https://github.com/tmc/nlm?tab=readme-ov-file -
@cubase אפשר שאלה על טקיוצ'ר?
מעולם לא השתמשתי בו אבל זה נשמע מאוד איכותי ומהיר, חשוב לי החלק של המהיר.איך עושים את זה?
בשביל לחסוך כמה שיותר זמן חשבתי להתקין שרת עם אסטריסק + בינה מלאכותית + מנוע TTS.
ככה לא אשתמש במודל API אלא SIP שהוא אונליין ופשוט שיחת טלפון שאפשר לעשות עליה מניפולציות (רק אצטרך לעשות STT משירות חיצוני... שזה יקח זמן), אשאל את הבינה מלאכותית על השרת ואחסוך את הזמן של שליחת וקבלת התשובה ואצור את הTTS על השרת בחלקים קטנים (שוב חוסך זמן) ואשמיע ישירות בשיחה ככה לא צריך להעלות את ההקלטה לקו ולא יקח את הזמן עד שהשרת של ימות בונה את הTTS בעצמו.
ואם כל זה, לדעתי יהיה דיליי רציני, איך עושים שיהיה כמה שיותר רציף?
אם זה בסדר מבחינתך לענות על זה, תוכל לשלוח לי גם במייל stamandsefer של ג'ימייל
-
@cubase אפשר שאלה על טקיוצ'ר?
מעולם לא השתמשתי בו אבל זה נשמע מאוד איכותי ומהיר, חשוב לי החלק של המהיר.איך עושים את זה?
בשביל לחסוך כמה שיותר זמן חשבתי להתקין שרת עם אסטריסק + בינה מלאכותית + מנוע TTS.
ככה לא אשתמש במודל API אלא SIP שהוא אונליין ופשוט שיחת טלפון שאפשר לעשות עליה מניפולציות (רק אצטרך לעשות STT משירות חיצוני... שזה יקח זמן), אשאל את הבינה מלאכותית על השרת ואחסוך את הזמן של שליחת וקבלת התשובה ואצור את הTTS על השרת בחלקים קטנים (שוב חוסך זמן) ואשמיע ישירות בשיחה ככה לא צריך להעלות את ההקלטה לקו ולא יקח את הזמן עד שהשרת של ימות בונה את הTTS בעצמו.
ואם כל זה, לדעתי יהיה דיליי רציני, איך עושים שיהיה כמה שיותר רציף?
אם זה בסדר מבחינתך לענות על זה, תוכל לשלוח לי גם במייל stamandsefer של ג'ימייל
-
@CUBASE בעיקר מחיר, ואני לא יודע איך זה יעבוד מבחינת זמן תגובה. לכן שאלתי מישהו מנוסה.
היית חסר לנו כאן משהו כמו 4 ימים
@עידו300 לגבי המחיר - נדבר במייל, זמן תגובה - בוודאי מהיר בהרבה מ-STT ואז שליחה לג׳מיני ו-TTS, ב-LiveAPI אתה מקבל הכל בחבילה אחת - גם המודל מקבל את ההקלטה כקלט שמע וגם מחזיר פלט שמע כך שכל מה שעליך לעשות זה לחבר בין המערכת הטלפונית ל-Gemini (וכמובן להגדיר נכון איך שיקרקע נתונים על פי קובץ פרטים על העסק ופרומפט מתאים שישאיר לו אפס מקום לסטיות)
אני באמת בשבוע האחרון (ובתקופה הקרובה) על המחשב פחות בתכיפות
-
@עידו300 לגבי המחיר - נדבר במייל, זמן תגובה - בוודאי מהיר בהרבה מ-STT ואז שליחה לג׳מיני ו-TTS, ב-LiveAPI אתה מקבל הכל בחבילה אחת - גם המודל מקבל את ההקלטה כקלט שמע וגם מחזיר פלט שמע כך שכל מה שעליך לעשות זה לחבר בין המערכת הטלפונית ל-Gemini (וכמובן להגדיר נכון איך שיקרקע נתונים על פי קובץ פרטים על העסק ופרומפט מתאים שישאיר לו אפס מקום לסטיות)
אני באמת בשבוע האחרון (ובתקופה הקרובה) על המחשב פחות בתכיפות