בקשת מידע | OCR בעברית בקרוב? תלוי בכם...
-
@צדיק-וטוב-לו-0 המממ... לדעתי הם לא כי דבר כזה יגנוב להם את העבודה
-
@צדיק-וטוב-לו-0 כתב בבקשת מידע | OCR בעברית בקרוב? תלוי בכם...:
הרי תסתדר בלעדיהם
בדיוק
אמנם אם ממש אצתרך -
@10110000 מה עם התוכנה של רחמים יעקובוב
https://yakobov-dev.co.il/מדריכים/זיהוי תוים/זיהוי_תוים.aspx
היא לא טובה מספיק? -
@hvusvmchsuby התוכנה אינה מיועדת לכתב יד וע"כ כנראה שלא תעבוד כלל לכתב יד. מלבד הבעיה של המחיר. (מי שרוצה תוכנה כזאת הייתי ממליץ על דברים אחרים כגון ABBYY)
@חייים-א אמרת לפניכן(אך ברעיון אני ארצה אולי שיהיה בתשלום תלוי בכמה מאמץ יקח לי. אך אנשים שעזרו וודאי שיקבלו )
-
@צור כתב בבקשת מידע | OCR בעברית בקרוב? תלוי בכם...:
יש תוכנת OCR מעולה וחדשה והכי טוב שהיא חינמית...
הרכיב נמצא בכל תוכנת כלי החיתוך שבווינדוס 11
יש לעדכן את התוכנה בחנות למי שלא פעיל לו
זה נראה כך
התוכנה הזו רק מזהה היכן יש טקסט מודפס, ונותנת להשחיר אותו.
לא ממש קשור לתוכנה ש-@10110000 רוצה לפתח. -
@הייתי-שמח-להבין לא, ניתן להעתיק את הטקסט
אך אני מאמין שהוא התכוון לומר למה שאמרתי להשתמש באבי (לא לגבי התוכנה). והוא צודק אבל בabbyy אתה יכול להריץ מספר קבצים ארוכים ואתה יכול לבחור באיזה
פונט זה כתוב וזה עוזר לכתב רשי וכדו' -
@10110000 כתב בבקשת מידע | OCR בעברית בקרוב? תלוי בכם...:
@הייתי-שמח-להבין לא, ניתן להעתיק את הטקסט
צודק, התכוונתי שאי אפשר לערוך שם את הטקסט, וכמו שהוסבר בקישור זה.
אך אני מאמין שהוא התכוון לומר למה שאמרתי להשתמש באבי (לא לגבי התוכנה). והוא צודק אבל בabbyy אתה יכול להריץ מספר קבצים ארוכים ואתה יכול לבחור באיזה
פונט זה כתוב וזה עוזר לכתב רשי וכדו'אני לא מכיר את abbyy, אבל בתוכנה של רחמים הוא מזהה גם כתבי יד מאוד ישנים ולא עדכניים, מה שאין כן בכלי החיתוך.
-
@10110000 יש כתבים שנראים יותר אמיתיים מאחרים, ואני מסכים איתך שזה עדיין לא כמו כתב יד ממש, אבל האימון הראשוני לדעתי כדאי להשתמש בזה כי תוכל ליצור דאטה סט עצום שלא תשיג בדרך אחרת (נגיד כמה מיליונים של שורות), ואחר כך תמשיך לכוונן על דאטה סט קטן יותר של כתב יד אמיתי.
אגב, בנייר האקדמי של TrOCR הם מציינים כי את המודל שמזהה כתב יד באנגלית הם אימנו בהתחלה על אנגלית מודפסת (684 מיליון שורות) ואחר כך אימנו אותו על פונטים של כתב יד מTRDG (כ 17 מיליון שורות מ5427 פונטים), כמו כן הוסיפו 53 אלף מרשמים בכתב יד שפוענחו על ידי כלי OCR מסחריים.
אבל אל תתייאש מהמספרים! יש עדויות שהצליחו להגיע לתוצאות יפות גם עם הרבה פחות נתונים.