בקשה | OCR לכתב יד בעברית
-
@אלף-שין שאלתי בעבר את רחמים, והוא הפנה אותי לשו"ת באתר שלו, וז"ל:
האם התוכנה יכולה לפענח כתב יד?
תוכנת "זיהוי תוים OCR" לא מיועדת לכתב יד שנכתב על ידי אדם, רק לכתב מרובע ולכתב יד של מחשב
יתכן שבעתיד נשכלל את התוכנה שתוכל לפענח גם כתבי יד אנושיים. אם אתם זקוקים לתכונה זו פנו אלינו, וכאשר יתאספו מספיק דורשים - נעבוד על זה. -
@THMHE כתב בבקשה | OCR לכתב יד בעברית:
חיפשתי בפורום ואף תוצאה לא הביאה לי הישג
אני מחפש שירות API כלשהו שמאפשר לשלוח אליו קובץ שמכיל כתב יד בעברית, ולקבל את אותו כתב יד בטקסט כתוב.
עדיף בתשלום.
או שלמישהו יש פרומפט מתאים בשביל GPT או קלוד, כי אני לא הצלחתי לקבל מהם תמלולהאופציה הכי טובה בשוק כיום היא Google vision שזה אומר להשתמש בAPI דרך גוגל קלאוד , הם קוראים כתב יד בעברית ברמה סבירה בהחלט, זה אומנם עולה כסף (אפשר להתנסות קצת בחינם), אבל להבנתי אין עוד משהו ברמה הזו כרגע.
אתה צריך לפתוח חשבון גוגל קלאוד ולאפשר את הAPI של ויז'ון, ואז לכתוב קוד בשפה לפי בחירתך או להשתמש בREST API. הסברים נוספים כאן: https://cloud.google.com/vision?hl=he
האופציה השנייה היא להשתמש בtrankribus אבל שם תצטרך הרבה עבודה כדי לאמן אותו ברמה סבירה על הכתב שאתה מציג לו. [כרגע אין שם מודל מוכן אפ' בסיסי בעברית, רק באידיש.] -
@sivan22 כתב בבקשה | OCR לכתב יד בעברית:
האופציה הכי טובה בשוק כיום היא Google vision שזה אומר להשתמש בAPI דרך גוגל קלאוד , הם קוראים כתב יד בעברית ברמה סבירה בהחלט, זה אומנם עולה כסף (אפשר להתנסות קצת בחינם), אבל להבנתי אין עוד משהו ברמה הזו כרגע.
אתה צריך לפתוח חשבון גוגל קלאוד ולאפשר את הAPI של ויז'ון, ואז לכתוב קוד בשפה לפי בחירתך או להשתמש בREST API. הסברים נוספים כאן: https://cloud.google.com/vision?hl=heבוקר טוב
את האופציה הזאת ניסיתי, והוא נכשל בלהבין גופני מחשב בכתב יד, הוא לא אמין -
@sivan22
בעבר [הרחוק] היתה אפשרות ב'פאלם' לכתוב בעט הייעודי ע"ג המסך במשבצת מסויימת והוא זיהה את כתב היד די בדקדוק.
האם - בכל ההתקדמות מאז ועד היום - אי אפשר לשחזר ולשדרג את זה ?
או שכל זה בכתיבה של אות אות במשבצת בפני עצמה, משא"כ בכתיבה רציפה שהאותיות מתקרבות ומתחברות? -
@sivan22 כתב בבקשה | OCR לכתב יד בעברית:
@איש-שלו אכן מדובר בשתי בעיות שונות, האחת נקראת "אונליין" כמו פאלם, והשנייה "אופליין" כלומר לאחר שהכתב קיים.
ומה ההסבר לחילוק, קח את האופליין ותשרטט אותו בצורה וירטואלית באונליין, או בקיצור מה הבעיה לעשות את מה שעושים באונליין אופליין, כשמדובר בכתב ברור וקריא?
-
@צדיק-וטוב-לו-0
אם הבנתי נכון - כוונתך להסביר דברי @sivan22 שהוא מזהה את תהליך הכתיבה, ע"י זיהוי התנועה והכיוון וסדר הכתיבה,
מה שאין כאן כאשר הוא צריך לזהות את האות השלמה לאחר גמר יצירתה - ?
אם כן הרי זה ממש חילוק בין גברא לחפצא.. -
תודה רבה.
ובאמת הוא מזהה גם כתיבות בצורות רחוקות וקלושות.
כמו שאפשר לראות בקבצים המצורפים.
אכן, כאשר כתבתי מימין לשמאל - את הי' ואח"כ את הנ' ואח"כ את הא' - הוא התבלבל. וזו ראייה כמובן למה שהעיר והסביר הרב @sivan22 שהמחשב עוקב אחר התהליך.
אלא שיש מקום להציע לשלב שני פתרונות:
הא' - שהזיהוי יהיה עוקב תהליך, היינו שהמערכת לא לא תקרא את הכל בבת אחת, אלא תסרוק את הסימנים והצורות שבשורה כאילו הם נוצרים בצורה הגיונית.
לדוגמא - להגדיר לו לסרוק את קו הכתיבה מנקודת הקצה העליונה [השמאלית] ולעקוב לאורך הקו. כך במדה מסויימת תהיה למחשב 'תפיסה' באופן התהוות האות.הב' - שתהליך הזיהוי יהיה מגובה בבינה מלאכותית,
(1) כמו שהטרנסלייט של גוגל מציע כמה אפשרויות.
(2) לפי ההקשר.
ברור שיש בזה הרבה מורכבות, וכמו כל זיהוי ביחס להקשר, שהוא תלוי גם בסגנון הכתוב ותקופתו וכו' וכו'.
אבל זה יכול להוביל את היכולות בצעדים נרחבים קדימה. -
@איש-שלו למעשה יש היום מודלים מבוססי בינה מלאכותית שקוראים כתב יד באנגלית אפ' כתב חרטומים משובש ביותר, פשוט לעשות כזה דבר בעברית דורש משאבים גדולים ועדיין לא קם מי שיעשה זאת.
לשם המחשה, כדי לייצר את המודל trOCR שהיה פורץ דרך בזמנו, השתמשו בכמה מאות מיליונים של שורות טקסט שנוצרו ע"י כלי אוטומטי, ועוד כמה מיליונים של כתבים אמיתיים שמישהו כבר פענח אותם.