בקשה | OCR לכתב יד בעברית
-
@sivan22 כתב בבקשה | OCR לכתב יד בעברית:
@איש-שלו אכן מדובר בשתי בעיות שונות, האחת נקראת "אונליין" כמו פאלם, והשנייה "אופליין" כלומר לאחר שהכתב קיים.
ומה ההסבר לחילוק, קח את האופליין ותשרטט אותו בצורה וירטואלית באונליין, או בקיצור מה הבעיה לעשות את מה שעושים באונליין אופליין, כשמדובר בכתב ברור וקריא?
-
@צדיק-וטוב-לו-0
אם הבנתי נכון - כוונתך להסביר דברי @sivan22 שהוא מזהה את תהליך הכתיבה, ע"י זיהוי התנועה והכיוון וסדר הכתיבה,
מה שאין כאן כאשר הוא צריך לזהות את האות השלמה לאחר גמר יצירתה - ?
אם כן הרי זה ממש חילוק בין גברא לחפצא.. -
תודה רבה.
ובאמת הוא מזהה גם כתיבות בצורות רחוקות וקלושות.
כמו שאפשר לראות בקבצים המצורפים.
אכן, כאשר כתבתי מימין לשמאל - את הי' ואח"כ את הנ' ואח"כ את הא' - הוא התבלבל. וזו ראייה כמובן למה שהעיר והסביר הרב @sivan22 שהמחשב עוקב אחר התהליך.
אלא שיש מקום להציע לשלב שני פתרונות:
הא' - שהזיהוי יהיה עוקב תהליך, היינו שהמערכת לא לא תקרא את הכל בבת אחת, אלא תסרוק את הסימנים והצורות שבשורה כאילו הם נוצרים בצורה הגיונית.
לדוגמא - להגדיר לו לסרוק את קו הכתיבה מנקודת הקצה העליונה [השמאלית] ולעקוב לאורך הקו. כך במדה מסויימת תהיה למחשב 'תפיסה' באופן התהוות האות.הב' - שתהליך הזיהוי יהיה מגובה בבינה מלאכותית,
(1) כמו שהטרנסלייט של גוגל מציע כמה אפשרויות.
(2) לפי ההקשר.
ברור שיש בזה הרבה מורכבות, וכמו כל זיהוי ביחס להקשר, שהוא תלוי גם בסגנון הכתוב ותקופתו וכו' וכו'.
אבל זה יכול להוביל את היכולות בצעדים נרחבים קדימה. -
@איש-שלו למעשה יש היום מודלים מבוססי בינה מלאכותית שקוראים כתב יד באנגלית אפ' כתב חרטומים משובש ביותר, פשוט לעשות כזה דבר בעברית דורש משאבים גדולים ועדיין לא קם מי שיעשה זאת.
לשם המחשה, כדי לייצר את המודל trOCR שהיה פורץ דרך בזמנו, השתמשו בכמה מאות מיליונים של שורות טקסט שנוצרו ע"י כלי אוטומטי, ועוד כמה מיליונים של כתבים אמיתיים שמישהו כבר פענח אותם. -
@איש-שלו כתב בבקשה | OCR לכתב יד בעברית:
@sivan22
אז איך טרנסלייט מזהה כתב יד כפי שהראנו לדעת?כבר הבנת לעיל:
@איש-שלו כתב בבקשה | OCR לכתב יד בעברית:
אם הבנתי נכון - כוונתך להסביר דברי @sivan22 שהוא מזהה את תהליך הכתיבה, ע"י זיהוי התנועה והכיוון וסדר הכתיבה,
מה שאין כאן כאשר הוא צריך לזהות את האות השלמה לאחר גמר יצירתה - ?
אם כן הרי זה ממש חילוק בין גברא לחפצא.. -
אכן.
אבל:
א. הרב סיוון לא אישר שזו כוונתו.
ב. בכל זאת הרי העלתי רעיון איך יוכל לנתח את הכתב כאילו הוא רואה בהתהוותו.
וא"כ - אם נכונה השערתי בהבנת התהליך - חשבתי אולי אפשר לקדם את יכולת הזיהוי גם בלי לאמן על מיליוני כתבים.
[וכאמור שוב ושוב - הכל רעיונות באויר. אבל סו"ס הרבה פיתוחים והמצאות צמחו מרעיונות מחוץ לקופסא...]