שיתוף | תוסף וסקריפט לתמלול דיבור לטקסט בכל אתר - ללא API
-
@טופ-שבמתמחים לי לא עובד, כנראה בגלל נטפרי.
@אהרן לא קשור לנטפרי.
זהה רכיב מובנה בדפדפן בשם window.webkitSpeechRecognition.
קשה לי להאמין שנטפרי יכולים לבטל אותו.
הם שולטים ברמה כזו במחשב? יכולים למנוע מתוכנות לעבוד?Avraham + ChatGPTחשבתי שהקרדיט רק לו? ולא קשור אליך? או שהפרומפט כן נחשב עבודה..?

-
@אברהם-גלסר יפה מאוד!
אולי כדאי בשביל הסקריפט לעשות התקנה בלחיצה באמצעות המדריך הזה@מייבין-במקצת תודה, אני מעדכן בפוסט הראשי.
-
@מייבין-במקצת תודה, אני מעדכן בפוסט הראשי.
@אברהם-גלסר עד כמה האיכות של התמלול?
-
@אברהם-גלסר עד כמה האיכות של התמלול?
@טופ-שבמתמחים הכי טובה שאני מכיר... של גוגל
-
@טופ-שבמתמחים הכי טובה שאני מכיר... של גוגל
@אברהם-גלסר זה יעבוד אופליין?
-
@אברהם-גלסר זה יעבוד אופליין?
@טופ-שבמתמחים לא.
-
@אהרן לא קשור לנטפרי.
זהה רכיב מובנה בדפדפן בשם window.webkitSpeechRecognition.
קשה לי להאמין שנטפרי יכולים לבטל אותו.
הם שולטים ברמה כזו במחשב? יכולים למנוע מתוכנות לעבוד?Avraham + ChatGPTחשבתי שהקרדיט רק לו? ולא קשור אליך? או שהפרומפט כן נחשב עבודה..?

@המלאך שלנו ביחד. הרעיון ושיפוץ קצת שלי אבל הוא כתב את העיקר (רובו ככולו).
-
@אהרן לא קשור לנטפרי.
זהה רכיב מובנה בדפדפן בשם window.webkitSpeechRecognition.
קשה לי להאמין שנטפרי יכולים לבטל אותו.
הם שולטים ברמה כזו במחשב? יכולים למנוע מתוכנות לעבוד?Avraham + ChatGPTחשבתי שהקרדיט רק לו? ולא קשור אליך? או שהפרומפט כן נחשב עבודה..?

@המלאך אשמח לשמוע שיש דרך להפעיל את זה בנטפרי. זה מה שיצא בהקלטת תעבורה: [גמיני טען שזה בגלל נטפרי]

תשובת גמיני:
כן, הבעיה אכן קשורה באופן ישיר לסינון של נטפרי.להלן הסבר מפורט על מה שקורה ברקע, מדוע זה נחסם וכיצד ניתן להתמודד עם זה:
- מהם האתרים/כתובות ה-IP האלו?
כתובת ה-IP שמופיעה בצילום המסך שלך (142.251.153.119) שייכת ל-Google.
בסקריפט שצירפת נעשה שימוש בפונקציית התמלול המובנית של הדפדפן:
window.SpeechRecognition || window.webkitSpeechRecognition
בדפדפני כרום (Chrome) ודפדפנים מבוססי כרומיום, כאשר משתמשים במנגנון זה, הדפדפן
אינו מבצע את פענוח הדיבור לטקסט באופן מקומי על המחשב שלך. במקום זאת, הדפדפן
מקליט את השמע מהמיקרופון ושולח אותו בזמן אמת לשרתים של גוגל (בפורט 443 המוצג
בצילום) כדי ששרתי הבינה המלאכותית של גוגל יתרגמו את הקול למילים ויחזירו אותם
לדפדפן כטקסט.- מדוע נטפרי חוסמת זאת?
סימני האזהרה האדומים (
️) בעמוד "הקלטת תעבורה" מעידים שנטפרי חסמה את התקשורת הזו
באופן יזום. נטפרי חוסמת את הגישה לשרתי התמלול והקול הלא-מבוקרים של גוגל. מכיוון
שמדובר בהזרמת שמע מוצפנת בזמן אמת (encrypted audio stream), מערכת הסינון
האוטומטית של נטפרי אינה יכולה לבדוק או לסנן את התוכן הקולי שנשלח ומתקבל,
ולכן ברירת המחדל היא חסימת הגישה לשירותים אלו.מה ניתן לעשות?
-
שליחת פנייה לנטפרי: תוכל לשלוח פנייה למערכת הפניות של נטפרי ולצרף לה את
הקלטת התעבורה הזו. לפעמים, עבור צרכי עבודה מוגדרים ובקשות ספציפיות, הם
יכולים לאשר נקודת קצה (endpoint) מסוימת, אם כי בנושא תמלול קולי מול גוגל הם
נוטים להקשות מכיוון שלא ניתן לסנן את השמע. -
שימוש בכלי תמלול מקומיים (אופליין): מאחר שהחסימה היא ברשת האינטרנט, הפתרון
היעיל ביותר עבור משתמשי סינון הוא שימוש בתוכנות המבצעות תמלול על גבי המחשב
עצמו ללא צורך באינטרנט. למשל, כלים מבוססי Whisper (של OpenAI) שיכולים לרוץ
באופן מקומי (Local) על המעבד או כרטיס המסך של המחשב שלך יפעלו בצורה חלקה
לחלוטין וללא שום תלות בסינון הרשת.
-
@המלאך אשמח לשמוע שיש דרך להפעיל את זה בנטפרי. זה מה שיצא בהקלטת תעבורה: [גמיני טען שזה בגלל נטפרי]

תשובת גמיני:
כן, הבעיה אכן קשורה באופן ישיר לסינון של נטפרי.להלן הסבר מפורט על מה שקורה ברקע, מדוע זה נחסם וכיצד ניתן להתמודד עם זה:
- מהם האתרים/כתובות ה-IP האלו?
כתובת ה-IP שמופיעה בצילום המסך שלך (142.251.153.119) שייכת ל-Google.
בסקריפט שצירפת נעשה שימוש בפונקציית התמלול המובנית של הדפדפן:
window.SpeechRecognition || window.webkitSpeechRecognition
בדפדפני כרום (Chrome) ודפדפנים מבוססי כרומיום, כאשר משתמשים במנגנון זה, הדפדפן
אינו מבצע את פענוח הדיבור לטקסט באופן מקומי על המחשב שלך. במקום זאת, הדפדפן
מקליט את השמע מהמיקרופון ושולח אותו בזמן אמת לשרתים של גוגל (בפורט 443 המוצג
בצילום) כדי ששרתי הבינה המלאכותית של גוגל יתרגמו את הקול למילים ויחזירו אותם
לדפדפן כטקסט.- מדוע נטפרי חוסמת זאת?
סימני האזהרה האדומים (
️) בעמוד "הקלטת תעבורה" מעידים שנטפרי חסמה את התקשורת הזו
באופן יזום. נטפרי חוסמת את הגישה לשרתי התמלול והקול הלא-מבוקרים של גוגל. מכיוון
שמדובר בהזרמת שמע מוצפנת בזמן אמת (encrypted audio stream), מערכת הסינון
האוטומטית של נטפרי אינה יכולה לבדוק או לסנן את התוכן הקולי שנשלח ומתקבל,
ולכן ברירת המחדל היא חסימת הגישה לשירותים אלו.מה ניתן לעשות?
-
שליחת פנייה לנטפרי: תוכל לשלוח פנייה למערכת הפניות של נטפרי ולצרף לה את
הקלטת התעבורה הזו. לפעמים, עבור צרכי עבודה מוגדרים ובקשות ספציפיות, הם
יכולים לאשר נקודת קצה (endpoint) מסוימת, אם כי בנושא תמלול קולי מול גוגל הם
נוטים להקשות מכיוון שלא ניתן לסנן את השמע. -
שימוש בכלי תמלול מקומיים (אופליין): מאחר שהחסימה היא ברשת האינטרנט, הפתרון
היעיל ביותר עבור משתמשי סינון הוא שימוש בתוכנות המבצעות תמלול על גבי המחשב
עצמו ללא צורך באינטרנט. למשל, כלים מבוססי Whisper (של OpenAI) שיכולים לרוץ
באופן מקומי (Local) על המעבד או כרטיס המסך של המחשב שלך יפעלו בצורה חלקה
לחלוטין וללא שום תלות בסינון הרשת.
-
M menajemmendel התייחס לנושא זה
-
@אהרן אכן.
זה באמת שייך לנטפרי, זה מוזר, כי כל התכנים האלה מוזרמים באמצעות המקירופון, אז ממה החשש? שאתה תגיד מילים מסוימות וגוגל יקריאו אותם?@המלאך דבר זה עובד בנטפרי מצויין
https://mitmachim.top/topic/97481/שיתוף-שיתוף-תוסף-לתמלול-דיבור-לטקסט -
לי זה עובד מצויין בנטפרי
דרך אגב את זה כתבתי באמצעות התוסף
-
עובד גם במק?
-
עובד גם במק?
@מנסה-לעבוד-את-ה לא יודע, לכאורה אמור. אתה מוזמן לנסות ולעדכן אותנו.
