בקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!
-
@shalomke זה ocr שזה ML ואתה רוצה להשתמש בai ולשניהם אין לך את המחשוב
בטח שלא כדי להשיג תוצאה סבירה + לא נראה לי אתה רוצה או יודע לפתח מודל מאפס.ככה שכנראה עדיף לך לקחת מודל קיים ולעשות לו fune tuning לעברית לא שאני תלה בזה הרבה תקוות
שים לגודל של התמונות שמשתמשים במאגר שהבאת מה שמצביע על מודל קטן
בנוסף הם לא משתמשים בpytorch ככה שהביצועים לא יהיו ברמה כנראה -
אני מדבר רק על פיין טיונינג TensorFlow/Keras
ולאמן לא רק על אותיות אלא גם על מילים ושורות
עם סגימנטציה מאוד מקצועית שמתייגת לקבוצות בצורה מואד מוצלחת -
בניתי אגב פיצול מסך כמו בפיין רידר
כשאתה לוחץ על הקבוצה המסוגמנטת - סליחה על המילה -
אתה רואה בכחול בצד שמאל היכן היא בתמונה

-
בנוסף הוספתי גזירה אוטומטית של שורות ואימון על פי שורות
בתקווה שהוא בכלל מתאמן על שורות...

-
@shalomke כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:
בתקווה שהוא בכלל מתאמן על שורות...
מתאמן על אותיות.
(הרי זה המטרה שלך בסוף שיזהה כול אות לגופה גם אם מעולם לא כתבת את המילה הזאת בעבר) -
model_v20260208_083151.keras
המודל הזה אומן על התמונה המצורפת כעת אני מנסה לפענח את התמונה באמצעות המודל
נראה אם ייצא טקסט קריא

-
@איש-גמזו הבעיה האמיתית במה שהוא העלה, זה שמדובר בפונט מחשב (שמבוסס על כתב יד).
מה שאומר שהאותיות זהות אחת לרעותה ב 100%.
זה לא רלוונטי לכתב יד חי ונושם. -
ברור
המבחן הגדול יהיה בכתב יד רגיל
אבל סבלנות
אני בסוף אכשל בכל מקרה
אז לפחות תנו לי את הכמה ימים לסבול
עד שיש אדם שמוכן לסבול בחינם וגם לחיות בשביל לספר על כך
