היו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!
-
@אלף-שין
@י-פל
מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם, אולי אפשר למצוא את המנוע / תוכנה שאיתה הוא משתמש, ולהפיק מכך תוכנת OCR המדוייקת ביותר בשוק.אמנם זה לא יעזור לכתב רש"י, שעד כמה שידוע לי ABBYY עם הגדרה רק עברית, ועם גופן רש"י שהכי קרוב לקיים בספר, מזוהה בינתיים עם הכי פחות שגיאות.
-
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם,
קיים באופליין?
כן.
-
@אמיר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
תראה את הניסוי שהעלתי לעיל
בדיוק בשביל זה הלכתי לבדוק אם אפשר לחלק את המשימה ל2 - זיהוי טקסט עם LENS, והוספתו לקובץ. בדיוק בגלל הפוסט שלך [והגיט שהביאו שם]!
האם תוכל לנסות את השיטה שהוא הביא לי?
אני ממש לחוץ בזמן. יש לי כמה דברים על הראש כעת, אחרת לא הייתי זורק זאת עליך... -
חיפשתי קצת אחר הכלי הזה OCRmyPDF ומצאתי את ה GUI הזה שאמור לבצע זיהוי והטמעה
הורדתי והרצתי והוא דורש התקנה של שני הכלים
עוד לא הצלחתי להבין איך (המתכנתים שכאן בטח יסתדרו יותר טוב)https://forum.xojo.com/t/open-source-ocrjob-an-ocrmypdf-gui-front-end/75654
https://github.com/ocrmypdf/OCRmyPDF
https://github.com/tesseract-ocr/tesseract
בהתקנה הזו צריך לסמן גם מערכת זיהוי עברית
https://yer.dl.sourceforge.net/project/tesseract-ocr.mirror/5.5.0/tesseract-ocr-w64-setup-5.5.0.20241111.exe?viasf=1 -
@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אולי אפשר למצוא את המנוע / תוכנה שאיתה הוא משתמש, ולהפיק מכך תוכנת OCR המדוייקת ביותר בשוק.
ראה כאן:
https://github.com/microsoft/PowerToys/issues/30159#issuecomment-1886341385