שיתוף | מערכת תמלול מהמדוייקות בעולם (משולבת גמיני - קלוד) עם מערכת לבלימת הזיות - מערכת דומה להמרת סריקות דפוס וכתב יד
-
המערכת מבוססת על עבודה ממושכת שלי על המתמלל של גמיני אחרי ששילמתי אלפי ש"ח לעורכים שיעברו על התמלול של גמיני מול ההקלטות ויתקנו הזיות, כלומר הוספות שהגמיני מוסיף וחסרונות שהוא מחסיר, עד שהבנתי שלא עוד, ואפשר לחסוך בעלויות באופן משמעותי, וגם בטירדת הדעת הנגרמת מההזיות.
המערכת בנויה על לוגיקה שכשיש הזיות הם על פי רוב לא אותם הזיות בכל סבב (לכה"פ כשאין בעיה שיש מלל לא ברור), ומבוססת גם על הידיעה שנכון להיום ידוע שהקלוד הרבה פחות הוזה מגמיני, ולכן הוא נבחר להיות הדיין להכריע כאן.
התוכנה מבוססת על הידיעה ששליחת קבצים בכמה סבבים היא יקרה אבל עבודה אנושית עלולה להיות יקרה יותר ולקחת זמן יותר.
מכיון ויש כמה דרגות בצורך לדיוק ויש עבודות עסקיות שדורשות שדורשות דיוק גבוה ויש שצריכות דיוק בסיסי, לכן ניתן לבחור בין כמות מחזורי תמלול בין 3 מינימום, כאשר במקרה שיש סתירה בין האפשרויות הרוב הוא הקובע, לבין 10 מחזורי תמלול.
כידוע שאחת המנועים המומלצים ביותר לשימוש לתמלול תורני כיום הוא גמיני, ובצירוף תוספת הנחיות מותאמות היא מומלצת עוד יותר, הבעיה היא שהגמיני נכון להיום הוא הוזה בהקיץ כך שצריך עבודה אנושית להשוואה, או להשאיר את ההזיות בתוך הטקסט, שני האפשרויות לא נוחות.
ההנחיות בחלק של תמלול אודיו עברו ליטוש לשימוש עצמי ויוצרות טקסט בסגנון עריכה תורני.
חשוב לדעת, הדיוק הוא יחסית ואי אפשר להבטיח דיוק מלא נכון להיום לתמלול בבינה מלאכותית (ובודאי לא בכתבי יד שעוד צריך לעבור כברת דרך להיקראות "מדוייק"), כמו כן חשוב לדעת שהמדובר הוא אם התוכנה / כתב היד שלכם ברור, אך אם זה ברור - לא ניתן להסתמך על מערכת כזו.

אפשרות להכניס מפתחות ידנית של ספקי הבינה המלאכותית גמיני וקלוד (או מפתח API שלי במסך הקודם).

בחירת קובץ ובחירת מצב

סוגי תמלול

כמה פעמים לשלוח לתמלול מקביל

הנחיות מותאמות אישית

אפשרות לבחור את ההכרעה באמצעות גמיני - זול יותר (פחות אפשר להסתמך על זה בוודאות)

סיום ושליחה

משתמשים ראשונים שיפנו אלי מכאן יקבלו ממני את התוכנה בחינם, זה אמור להיות בהמשך חלק מתוכנת רב טקסט לוורד AI -
@נוכחות בדקת אפשרות לתמלל עם: elevenlabs.io ולתקן עם קלוד?
-
@נוכחות אם אני מבין נכון הם נחשבים לכלי התמלול המדויק בעולם.
ממה שאני בדקתי את זה על שיעורים תורנים היה לו טעויות בודדות מתוך שיעור ענק וזה היה רק במקומות של הבהרה אשכנזית כבדה ואת זה קלוד מתקן בקל.
אני חושב שהכל שיש לג'מני מאחורה פחות טוב מזה אז במילא פחות איכותי.
את אותם הקלטות שלחתי גם לג'מני והתוצאה הייתה פחות טובה בהרבה.
אתה יכול לנסות שם כמה תמלולים בחינם. -
המערכת מבוססת על עבודה ממושכת שלי על המתמלל של גמיני אחרי ששילמתי אלפי ש"ח לעורכים שיעברו על התמלול של גמיני מול ההקלטות ויתקנו הזיות, כלומר הוספות שהגמיני מוסיף וחסרונות שהוא מחסיר, עד שהבנתי שלא עוד, ואפשר לחסוך בעלויות באופן משמעותי, וגם בטירדת הדעת הנגרמת מההזיות.
המערכת בנויה על לוגיקה שכשיש הזיות הם על פי רוב לא אותם הזיות בכל סבב (לכה"פ כשאין בעיה שיש מלל לא ברור), ומבוססת גם על הידיעה שנכון להיום ידוע שהקלוד הרבה פחות הוזה מגמיני, ולכן הוא נבחר להיות הדיין להכריע כאן.
התוכנה מבוססת על הידיעה ששליחת קבצים בכמה סבבים היא יקרה אבל עבודה אנושית עלולה להיות יקרה יותר ולקחת זמן יותר.
מכיון ויש כמה דרגות בצורך לדיוק ויש עבודות עסקיות שדורשות שדורשות דיוק גבוה ויש שצריכות דיוק בסיסי, לכן ניתן לבחור בין כמות מחזורי תמלול בין 3 מינימום, כאשר במקרה שיש סתירה בין האפשרויות הרוב הוא הקובע, לבין 10 מחזורי תמלול.
כידוע שאחת המנועים המומלצים ביותר לשימוש לתמלול תורני כיום הוא גמיני, ובצירוף תוספת הנחיות מותאמות היא מומלצת עוד יותר, הבעיה היא שהגמיני נכון להיום הוא הוזה בהקיץ כך שצריך עבודה אנושית להשוואה, או להשאיר את ההזיות בתוך הטקסט, שני האפשרויות לא נוחות.
ההנחיות בחלק של תמלול אודיו עברו ליטוש לשימוש עצמי ויוצרות טקסט בסגנון עריכה תורני.
חשוב לדעת, הדיוק הוא יחסית ואי אפשר להבטיח דיוק מלא נכון להיום לתמלול בבינה מלאכותית (ובודאי לא בכתבי יד שעוד צריך לעבור כברת דרך להיקראות "מדוייק"), כמו כן חשוב לדעת שהמדובר הוא אם התוכנה / כתב היד שלכם ברור, אך אם זה ברור - לא ניתן להסתמך על מערכת כזו.

אפשרות להכניס מפתחות ידנית של ספקי הבינה המלאכותית גמיני וקלוד (או מפתח API שלי במסך הקודם).

בחירת קובץ ובחירת מצב

סוגי תמלול

כמה פעמים לשלוח לתמלול מקביל

הנחיות מותאמות אישית

אפשרות לבחור את ההכרעה באמצעות גמיני - זול יותר (פחות אפשר להסתמך על זה בוודאות)

סיום ושליחה

משתמשים ראשונים שיפנו אלי מכאן יקבלו ממני את התוכנה בחינם, זה אמור להיות בהמשך חלק מתוכנת רב טקסט לוורד AI -
- היתה היענות מאוד גדולה, ולא ציפיתי לכזה סדר גודל, אך בכל אופן לאחר מעשה מכיון שראיתי שהיתה היענות גדולה מאוד מצד הציבור החלטתי באופן זמני לחלק את התוכנה כאן לכל מאן דבעי שיהיה לתועלת.
- כרגע התוכנה עדיין לא יציבה ולא בהכרח מצליחה להתקין את עצמה בכל המחשבים, אבל יש מהמשתמשים שהצליחו להתקין את התוכנה, ולכן מי שבכל זאת פתוח להתנסויות יכול להתקין את הגירסה הנוכחית, אפשר לכתוב לי "התנסות" ואשלח את הקישור.
- התוכנה היא תוכנה מקיפה לעריכה תורנית ורב טקסט, אך תכונה זו באופן זמני היא חינמית לגמרי.
(להבהיר שגם בתכונות האחרות שם יש שימושים אחדים חינמיים וכן תקופת חינם). - אסור בתכלית האיסור להמשיך לפרסם את התוכנה בעתיד לרבים בגירסתה הנוכחית מא' סיון ואילך.
- מכיון ולא היה ברור הריני להבהיר, תוכנה זו גם מתמללת קבצים וגם כתבי יד, אם כי בכתבי יד לא ברורים לגמרי אי אפשר לצפות מה תהיינה התוצאות.
-
מחילה מכל אלו באישי שלא הספקתי להגיב,
בל''נ אגיב לכולם.
מכיון שהתוכנה היא חלק ממשהו גדול לכן יש באגים שצצו ועדיין לא סיימתי לתקן את כולם, מקווה להגיע בהקדם למצב שיאפשר שליחה של התוכנה. -
-
@נוכחות בדקת אפשרות לתמלל עם: elevenlabs.io ולתקן עם קלוד?
@כבוד-הרב בדקתי קצת על הפלטפורמה הזו ונראה לכאורה שזה מצדיק להטמיע גם את הAPI שלהם בתוכנה.
אגב יש איזה ספק לגבי הלוגיקה איך לחשב את התמלול שלהם בהכרעה הסופית, כי מצד אחד גם אם הם הכי דייקנים והכי פחות טעויות אבל עדיין אי אפשר לומר שהוא ינצח בכל הכרעה, כי סוף סוף גם זה לא מושלם, ובפרט כשיש סתירות למנועים האחרים, מצד שני יתכן שזה באמת יותר מדוייק ואי אפשר להחשיבו רק כיותר עד נוסח, אבל צריך לתת לו משקל מכריע יותר במקרה שאין רוב נגדו.
יצטרכו לתת בהגדרות המשתמש להחליט על איזה מודל הוא הכי סומך בתור המודל החשוב וזה יהיה כלול במידע שיעבור לדיין המכריע. -
הדבר פותח ונוספו ההגדרות דלהלן:
- אפשרות להכניס מפתח של השירות הנ"ל ולקבל עד נוסח אחד או יותר מהשירות הנ"ל.
- אפשרות להחשיב את הנוסח של השירות הנ"ל כנוסח החשוב במקרה של תיקו - לגבי הדיין המכריע.
- מכיון שהשירות הנ"ל אינו תומך בניסוח סגנון כתיבה תורני (בשונה מגמיני), לכן הוכנסה הוראה גורפת לדיין המכריע להתחשב רק בנוסח שלו ולא בסגנון הכתיבה שלו.



כרגע הפיתוח בקוד המקור של התוכנה בגיטהאב (מאגר פרטי) ויופץ לציבור בשחרור הבא.