בירור | הוצאת טקסט מנוקד בשלמות מהקלטה
-
שלום לכולם
אני מעוניין למצוא כלי שיכול להוציא לי טקסט מנוקד מקובץ שמע, בלי לתקן את הטקסט
שיהיה עם כל הטעויות והשגיאות
ישנו כלי שיכול לעשות דבר כזה?
התנסיתי בגימני בגרסת הפרו, הוא מביא תוצאה יחסית טובה אבל ממש לא מספיקתודה רבה…
-
שלום לכולם
אני מעוניין למצוא כלי שיכול להוציא לי טקסט מנוקד מקובץ שמע, בלי לתקן את הטקסט
שיהיה עם כל הטעויות והשגיאות
ישנו כלי שיכול לעשות דבר כזה?
התנסיתי בגימני בגרסת הפרו, הוא מביא תוצאה יחסית טובה אבל ממש לא מספיקתודה רבה…
-
@mefateach כתב בבירור | הוצאת טקסט מנוקד בשלמות מהקלטה:
לענ"ד לא קיים כזה מוצר (זה ממש משהו שלא עובדים עליו...)
תתפלא אבל יכול להיות לזה הרבה שימושים
איבחונים וכדומה -
@יודע-ספר כתב בבירור | הוצאת טקסט מנוקד בשלמות מהקלטה:
@פרוזי נסה בגוגל סטודיו
אמור להיות יותר טוב מגימני עצמו ?
-
@פרוזי כן, למרות ששניהם יושבים על אותם המודלים והמנועי יצירה, עובדתית התוצאות בסטודיו בהקשר זה מרשימות יותר בפער
-
@יודע-ספר כתב בבירור | הוצאת טקסט מנוקד בשלמות מהקלטה:
@פרוזי כן, זה המשאב של גמיני
אתה מבין מה שאתה כותב???
-
@א.מ.ד. כן.
כמו שפלאו זה ה'שרת' של VOD של יצירת סרטונים של גימיני, מה לא נכון?
עובדה שבסטודיו יש את כל הכלים בצורה הכי מושלמת, היכן אני טועה, כולל כל מפתחות הAPI,
בסוף הכל יושב על גוגל קלאווד.@יודע-ספר כתב בבירור | הוצאת טקסט מנוקד בשלמות מהקלטה:
@א.מ.ד. כן.
כמו שפלאו זה ה'שרת' של VOD של יצירת סרטונים של גימיני, מה לא נכון?
עובדה שבסטודיו יש את כל הכלים בצורה הכי מושלמת, היכן אני טועה, כולל כל מפתחות הAPI,
בסוף הכל יושב על גוגל קלאווד.ממש לא. AI Studio וג'מיני באתר ובאפליקציה הם בסך הכל שני ממשקים שונים עבור אותם מודלים, כשב-AI Studio יש יותר שליטה על הגדרות ההסקה. זה לא מודל יותר טוב. אותו דבר עם הממשקים השונים ליצירת וידאו של גוגל עבור מודל VEO, עם גוגל קלאוד. זה רק שמות מסחריים שונים עבור אותו מנוע.
למעשה, הנטיה של המודל לתקן טקסט היא נטיה מובנית במודל ולא יעזור לעבור ל-AI Studio. -
@יודע-ספר כתב בבירור | הוצאת טקסט מנוקד בשלמות מהקלטה:
@א.מ.ד. כן.
כמו שפלאו זה ה'שרת' של VOD של יצירת סרטונים של גימיני, מה לא נכון?
עובדה שבסטודיו יש את כל הכלים בצורה הכי מושלמת, היכן אני טועה, כולל כל מפתחות הAPI,
בסוף הכל יושב על גוגל קלאווד.ממש לא. AI Studio וג'מיני באתר ובאפליקציה הם בסך הכל שני ממשקים שונים עבור אותם מודלים, כשב-AI Studio יש יותר שליטה על הגדרות ההסקה. זה לא מודל יותר טוב. אותו דבר עם הממשקים השונים ליצירת וידאו של גוגל עבור מודל VEO, עם גוגל קלאוד. זה רק שמות מסחריים שונים עבור אותו מנוע.
למעשה, הנטיה של המודל לתקן טקסט היא נטיה מובנית במודל ולא יעזור לעבור ל-AI Studio.@א.מ.ד. אין ספק אבל המציאות שבסטודיו יש תוצאות ברמה הרבה יותר גבוהה כברירת מחדל, לזה התכוונתי - שזה אותו המנוע והמודלים.
אבל נסיתי עשרות פעמים לתמלל הקלטות עם סטודיו ועם גמיני ואין מה להשוות בכלל מבחינת רמת מקצועיות ודיוק, וכנ"ל לגבי כת"י שפעמים רבות כבר נסיתי, אין לי איך להסביר את זה אבל התוצאות בסטודיו הרבה יותר מרשימות הן מבחינת אורך התשובה והן מבחינת הדיוק
אלו עובדות
וכל זה עוד לפני ששחקתי בטמפרטורה של הסטודיו -
@א.מ.ד. אין ספק אבל המציאות שבסטודיו יש תוצאות ברמה הרבה יותר גבוהה כברירת מחדל, לזה התכוונתי - שזה אותו המנוע והמודלים.
אבל נסיתי עשרות פעמים לתמלל הקלטות עם סטודיו ועם גמיני ואין מה להשוות בכלל מבחינת רמת מקצועיות ודיוק, וכנ"ל לגבי כת"י שפעמים רבות כבר נסיתי, אין לי איך להסביר את זה אבל התוצאות בסטודיו הרבה יותר מרשימות הן מבחינת אורך התשובה והן מבחינת הדיוק
אלו עובדות
וכל זה עוד לפני ששחקתי בטמפרטורה של הסטודיו -
@יודע-ספר לא אמור להיות הבדל אולי לג'ימיני הרגיל יש אופצייה להשתמש בכלים מה שיכול לפעמים לשנות תוצאות, ואולי הנחיית מערכת אחרת אבל ברור שזה לא "שרת" או "משאב" שונים....
-
@mefateach כתב בבירור | הוצאת טקסט מנוקד בשלמות מהקלטה:
לענ"ד לא קיים כזה מוצר (זה ממש משהו שלא עובדים עליו...)
תתפלא אבל יכול להיות לזה הרבה שימושים
איבחונים וכדומה -
@mefateach כתב בבירור | הוצאת טקסט מנוקד בשלמות מהקלטה:
לענ"ד לא קיים כזה מוצר (זה ממש משהו שלא עובדים עליו...)
תתפלא אבל יכול להיות לזה הרבה שימושים
איבחונים וכדומה@פרוזי כתב בבירור | הוצאת טקסט מנוקד בשלמות מהקלטה:
תתפלא אבל יכול להיות לזה הרבה שימושים
איבחונים וכדומהגם במבטא, בתמלול הוא יכול לשמוע מילה שהוא לא יודע איך להגות אז הוא כותב משהו שנראה לו ואחרי זה לא מבינים מה הוא רוצה אבל אם הוא ינקד אז הרבה יותר מובן