בקשה | OCR לכתב יד בעברית
-
@ejay כתב בבקשה | OCR לכתב יד בעברית:
תודה, אבל הוא לא תומך בעברית
@י-פל כתב בבקשה | OCR לכתב יד בעברית:
@THMHE כתב בבקשה | OCR לכתב יד בעברית:
מקפיץ
אף אחד לא נתקל לא שמע לא ראה?
מישהו בדק יסודי ויכול לאשר אולי שלא קיים?
מישהו ניסה את גוגל קלוד ויסיון?הנה, של סיון22!
https://huggingface.co/spaces/sivan22/TrOCR-handwritten-hebrewסתם...
הוא כתב לי שזה לא יצא מוצלח...יש שגיאה בקישור או באתר
@אלף-שין כתב בבקשה | OCR לכתב יד בעברית:
@THMHE
הריני לחדש לך ולכל מי שלא ידע,
שבאנגלית כבר קיים מערכת פיענות לכתבי יד באמצעות AI
יתכן שבתוך מספר שנים גם יהיה בעברית.תודה, אני בדיוק עכשיו סיימתי לוודא שבכתב יד באנגלית יש לו הצלחה של כ95 אחוזים ומעלה
אבל בעברית הצלחה של 10 אחוזים לפי בדיקוה שלי, ולא כתבתי 0 אחוז כדי שלא יגידו שאני מגזים -
@ejay כתב בבקשה | OCR לכתב יד בעברית:
תודה, אבל הוא לא תומך בעברית
@י-פל כתב בבקשה | OCR לכתב יד בעברית:
@THMHE כתב בבקשה | OCR לכתב יד בעברית:
מקפיץ
אף אחד לא נתקל לא שמע לא ראה?
מישהו בדק יסודי ויכול לאשר אולי שלא קיים?
מישהו ניסה את גוגל קלוד ויסיון?הנה, של סיון22!
https://huggingface.co/spaces/sivan22/TrOCR-handwritten-hebrewסתם...
הוא כתב לי שזה לא יצא מוצלח...יש שגיאה בקישור או באתר
@אלף-שין כתב בבקשה | OCR לכתב יד בעברית:
@THMHE
הריני לחדש לך ולכל מי שלא ידע,
שבאנגלית כבר קיים מערכת פיענות לכתבי יד באמצעות AI
יתכן שבתוך מספר שנים גם יהיה בעברית.תודה, אני בדיוק עכשיו סיימתי לוודא שבכתב יד באנגלית יש לו הצלחה של כ95 אחוזים ומעלה
אבל בעברית הצלחה של 10 אחוזים לפי בדיקוה שלי, ולא כתבתי 0 אחוז כדי שלא יגידו שאני מגזים -
-
@אלף-שין שאלתי בעבר את רחמים, והוא הפנה אותי לשו"ת באתר שלו, וז"ל:
האם התוכנה יכולה לפענח כתב יד?
תוכנת "זיהוי תוים OCR" לא מיועדת לכתב יד שנכתב על ידי אדם, רק לכתב מרובע ולכתב יד של מחשב
יתכן שבעתיד נשכלל את התוכנה שתוכל לפענח גם כתבי יד אנושיים. אם אתם זקוקים לתכונה זו פנו אלינו, וכאשר יתאספו מספיק דורשים - נעבוד על זה. -
צהריים טובים
יש אפשרות לאמן מודול של בינה מלאכותית שיקרא ויתמלל רק סוגי כתב יד ספציפיים?
כלומר רק של התלמידים במוסד שלי לדוגמה?
אם מישהו יוכל לכוון אותי יותר איך זה עובד או מי מבין בזה- תודה מראש -
חיפשתי בפורום ואף תוצאה לא הביאה לי הישג
אני מחפש שירות API כלשהו שמאפשר לשלוח אליו קובץ שמכיל כתב יד בעברית, ולקבל את אותו כתב יד בטקסט כתוב.
עדיף בתשלום.
או שלמישהו יש פרומפט מתאים בשביל GPT או קלוד, כי אני לא הצלחתי לקבל מהם תמלול@THMHE כתב בבקשה | OCR לכתב יד בעברית:
חיפשתי בפורום ואף תוצאה לא הביאה לי הישג
אני מחפש שירות API כלשהו שמאפשר לשלוח אליו קובץ שמכיל כתב יד בעברית, ולקבל את אותו כתב יד בטקסט כתוב.
עדיף בתשלום.
או שלמישהו יש פרומפט מתאים בשביל GPT או קלוד, כי אני לא הצלחתי לקבל מהם תמלולהאופציה הכי טובה בשוק כיום היא Google vision שזה אומר להשתמש בAPI דרך גוגל קלאוד , הם קוראים כתב יד בעברית ברמה סבירה בהחלט, זה אומנם עולה כסף (אפשר להתנסות קצת בחינם), אבל להבנתי אין עוד משהו ברמה הזו כרגע.
אתה צריך לפתוח חשבון גוגל קלאוד ולאפשר את הAPI של ויז'ון, ואז לכתוב קוד בשפה לפי בחירתך או להשתמש בREST API. הסברים נוספים כאן: https://cloud.google.com/vision?hl=he
האופציה השנייה היא להשתמש בtrankribus אבל שם תצטרך הרבה עבודה כדי לאמן אותו ברמה סבירה על הכתב שאתה מציג לו. [כרגע אין שם מודל מוכן אפ' בסיסי בעברית, רק באידיש.] -
@THMHE כתב בבקשה | OCR לכתב יד בעברית:
חיפשתי בפורום ואף תוצאה לא הביאה לי הישג
אני מחפש שירות API כלשהו שמאפשר לשלוח אליו קובץ שמכיל כתב יד בעברית, ולקבל את אותו כתב יד בטקסט כתוב.
עדיף בתשלום.
או שלמישהו יש פרומפט מתאים בשביל GPT או קלוד, כי אני לא הצלחתי לקבל מהם תמלולהאופציה הכי טובה בשוק כיום היא Google vision שזה אומר להשתמש בAPI דרך גוגל קלאוד , הם קוראים כתב יד בעברית ברמה סבירה בהחלט, זה אומנם עולה כסף (אפשר להתנסות קצת בחינם), אבל להבנתי אין עוד משהו ברמה הזו כרגע.
אתה צריך לפתוח חשבון גוגל קלאוד ולאפשר את הAPI של ויז'ון, ואז לכתוב קוד בשפה לפי בחירתך או להשתמש בREST API. הסברים נוספים כאן: https://cloud.google.com/vision?hl=he
האופציה השנייה היא להשתמש בtrankribus אבל שם תצטרך הרבה עבודה כדי לאמן אותו ברמה סבירה על הכתב שאתה מציג לו. [כרגע אין שם מודל מוכן אפ' בסיסי בעברית, רק באידיש.]@sivan22 כתב בבקשה | OCR לכתב יד בעברית:
האופציה הכי טובה בשוק כיום היא Google vision שזה אומר להשתמש בAPI דרך גוגל קלאוד , הם קוראים כתב יד בעברית ברמה סבירה בהחלט, זה אומנם עולה כסף (אפשר להתנסות קצת בחינם), אבל להבנתי אין עוד משהו ברמה הזו כרגע.
אתה צריך לפתוח חשבון גוגל קלאוד ולאפשר את הAPI של ויז'ון, ואז לכתוב קוד בשפה לפי בחירתך או להשתמש בREST API. הסברים נוספים כאן: https://cloud.google.com/vision?hl=heבוקר טוב
את האופציה הזאת ניסיתי, והוא נכשל בלהבין גופני מחשב בכתב יד, הוא לא אמין -
@THMHE כתב בבקשה | OCR לכתב יד בעברית:
חיפשתי בפורום ואף תוצאה לא הביאה לי הישג
אני מחפש שירות API כלשהו שמאפשר לשלוח אליו קובץ שמכיל כתב יד בעברית, ולקבל את אותו כתב יד בטקסט כתוב.
עדיף בתשלום.
או שלמישהו יש פרומפט מתאים בשביל GPT או קלוד, כי אני לא הצלחתי לקבל מהם תמלולהאופציה הכי טובה בשוק כיום היא Google vision שזה אומר להשתמש בAPI דרך גוגל קלאוד , הם קוראים כתב יד בעברית ברמה סבירה בהחלט, זה אומנם עולה כסף (אפשר להתנסות קצת בחינם), אבל להבנתי אין עוד משהו ברמה הזו כרגע.
אתה צריך לפתוח חשבון גוגל קלאוד ולאפשר את הAPI של ויז'ון, ואז לכתוב קוד בשפה לפי בחירתך או להשתמש בREST API. הסברים נוספים כאן: https://cloud.google.com/vision?hl=he
האופציה השנייה היא להשתמש בtrankribus אבל שם תצטרך הרבה עבודה כדי לאמן אותו ברמה סבירה על הכתב שאתה מציג לו. [כרגע אין שם מודל מוכן אפ' בסיסי בעברית, רק באידיש.]@sivan22
בעבר [הרחוק] היתה אפשרות ב'פאלם' לכתוב בעט הייעודי ע"ג המסך במשבצת מסויימת והוא זיהה את כתב היד די בדקדוק.
האם - בכל ההתקדמות מאז ועד היום - אי אפשר לשחזר ולשדרג את זה ?
או שכל זה בכתיבה של אות אות במשבצת בפני עצמה, משא"כ בכתיבה רציפה שהאותיות מתקרבות ומתחברות? -
@sivan22
בעבר [הרחוק] היתה אפשרות ב'פאלם' לכתוב בעט הייעודי ע"ג המסך במשבצת מסויימת והוא זיהה את כתב היד די בדקדוק.
האם - בכל ההתקדמות מאז ועד היום - אי אפשר לשחזר ולשדרג את זה ?
או שכל זה בכתיבה של אות אות במשבצת בפני עצמה, משא"כ בכתיבה רציפה שהאותיות מתקרבות ומתחברות? -
@איש-שלו אכן מדובר בשתי בעיות שונות, האחת נקראת "אונליין" כמו פאלם, והשנייה "אופליין" כלומר לאחר שהכתב קיים.
@sivan22 כתב בבקשה | OCR לכתב יד בעברית:
@איש-שלו אכן מדובר בשתי בעיות שונות, האחת נקראת "אונליין" כמו פאלם, והשנייה "אופליין" כלומר לאחר שהכתב קיים.
ומה ההסבר לחילוק, קח את האופליין ותשרטט אותו בצורה וירטואלית באונליין, או בקיצור מה הבעיה לעשות את מה שעושים באונליין אופליין, כשמדובר בכתב ברור וקריא?
-
@sivan22 כתב בבקשה | OCR לכתב יד בעברית:
@איש-שלו אכן מדובר בשתי בעיות שונות, האחת נקראת "אונליין" כמו פאלם, והשנייה "אופליין" כלומר לאחר שהכתב קיים.
ומה ההסבר לחילוק, קח את האופליין ותשרטט אותו בצורה וירטואלית באונליין, או בקיצור מה הבעיה לעשות את מה שעושים באונליין אופליין, כשמדובר בכתב ברור וקריא?
@אהרן אין כוונתו לאינטרנט או לא.
אלא האם הזיהוי הוא על שעת הכתיבה, או על הדף הכתוב לאחר מעשה. -
@sivan22
בעבר [הרחוק] היתה אפשרות ב'פאלם' לכתוב בעט הייעודי ע"ג המסך במשבצת מסויימת והוא זיהה את כתב היד די בדקדוק.
האם - בכל ההתקדמות מאז ועד היום - אי אפשר לשחזר ולשדרג את זה ?
או שכל זה בכתיבה של אות אות במשבצת בפני עצמה, משא"כ בכתיבה רציפה שהאותיות מתקרבות ומתחברות? -
@אהרן אין כוונתו לאינטרנט או לא.
אלא האם הזיהוי הוא על שעת הכתיבה, או על הדף הכתוב לאחר מעשה. -
@איש-שלו כתב בבקשה | OCR לכתב יד בעברית:
האם - בכל ההתקדמות מאז ועד היום - אי אפשר לשחזר ולשדרג את זה ?
יש את זה בהרבה מקלדות לאנדרואיד, בין השאר בשל גוגל
ואפילו בגרסת הווב של גוגל טרנסלייט:
@צדיק-תמים
מדהים! לא שמתי לב עד היום!
יש אפשרות להעלות לשם כתב יד ממסמך שכתב כתוב? -
@איש-שלו כתב בבקשה | OCR לכתב יד בעברית:
האם - בכל ההתקדמות מאז ועד היום - אי אפשר לשחזר ולשדרג את זה ?
יש את זה בהרבה מקלדות לאנדרואיד, בין השאר בשל גוגל
ואפילו בגרסת הווב של גוגל טרנסלייט:
תודה רבה.
ובאמת הוא מזהה גם כתיבות בצורות רחוקות וקלושות.
כמו שאפשר לראות בקבצים המצורפים.
אכן, כאשר כתבתי מימין לשמאל - את הי' ואח"כ את הנ' ואח"כ את הא' - הוא התבלבל. וזו ראייה כמובן למה שהעיר והסביר הרב @sivan22 שהמחשב עוקב אחר התהליך.
אלא שיש מקום להציע לשלב שני פתרונות:
הא' - שהזיהוי יהיה עוקב תהליך, היינו שהמערכת לא לא תקרא את הכל בבת אחת, אלא תסרוק את הסימנים והצורות שבשורה כאילו הם נוצרים בצורה הגיונית.
לדוגמא - להגדיר לו לסרוק את קו הכתיבה מנקודת הקצה העליונה [השמאלית] ולעקוב לאורך הקו. כך במדה מסויימת תהיה למחשב 'תפיסה' באופן התהוות האות.הב' - שתהליך הזיהוי יהיה מגובה בבינה מלאכותית,
(1) כמו שהטרנסלייט של גוגל מציע כמה אפשרויות.
(2) לפי ההקשר.
ברור שיש בזה הרבה מורכבות, וכמו כל זיהוי ביחס להקשר, שהוא תלוי גם בסגנון הכתוב ותקופתו וכו' וכו'.
אבל זה יכול להוביל את היכולות בצעדים נרחבים קדימה. -
תודה רבה.
ובאמת הוא מזהה גם כתיבות בצורות רחוקות וקלושות.
כמו שאפשר לראות בקבצים המצורפים.
אכן, כאשר כתבתי מימין לשמאל - את הי' ואח"כ את הנ' ואח"כ את הא' - הוא התבלבל. וזו ראייה כמובן למה שהעיר והסביר הרב @sivan22 שהמחשב עוקב אחר התהליך.
אלא שיש מקום להציע לשלב שני פתרונות:
הא' - שהזיהוי יהיה עוקב תהליך, היינו שהמערכת לא לא תקרא את הכל בבת אחת, אלא תסרוק את הסימנים והצורות שבשורה כאילו הם נוצרים בצורה הגיונית.
לדוגמא - להגדיר לו לסרוק את קו הכתיבה מנקודת הקצה העליונה [השמאלית] ולעקוב לאורך הקו. כך במדה מסויימת תהיה למחשב 'תפיסה' באופן התהוות האות.הב' - שתהליך הזיהוי יהיה מגובה בבינה מלאכותית,
(1) כמו שהטרנסלייט של גוגל מציע כמה אפשרויות.
(2) לפי ההקשר.
ברור שיש בזה הרבה מורכבות, וכמו כל זיהוי ביחס להקשר, שהוא תלוי גם בסגנון הכתוב ותקופתו וכו' וכו'.
אבל זה יכול להוביל את היכולות בצעדים נרחבים קדימה.@איש-שלו למעשה יש היום מודלים מבוססי בינה מלאכותית שקוראים כתב יד באנגלית אפ' כתב חרטומים משובש ביותר, פשוט לעשות כזה דבר בעברית דורש משאבים גדולים ועדיין לא קם מי שיעשה זאת.
לשם המחשה, כדי לייצר את המודל trOCR שהיה פורץ דרך בזמנו, השתמשו בכמה מאות מיליונים של שורות טקסט שנוצרו ע"י כלי אוטומטי, ועוד כמה מיליונים של כתבים אמיתיים שמישהו כבר פענח אותם. -
@איש-שלו למעשה יש היום מודלים מבוססי בינה מלאכותית שקוראים כתב יד באנגלית אפ' כתב חרטומים משובש ביותר, פשוט לעשות כזה דבר בעברית דורש משאבים גדולים ועדיין לא קם מי שיעשה זאת.
לשם המחשה, כדי לייצר את המודל trOCR שהיה פורץ דרך בזמנו, השתמשו בכמה מאות מיליונים של שורות טקסט שנוצרו ע"י כלי אוטומטי, ועוד כמה מיליונים של כתבים אמיתיים שמישהו כבר פענח אותם.