היו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!
-
@אלף-שין
@י-פל
מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם, אולי אפשר למצוא את המנוע / תוכנה שאיתה הוא משתמש, ולהפיק מכך תוכנת OCR המדוייקת ביותר בשוק.אמנם זה לא יעזור לכתב רש"י, שעד כמה שידוע לי ABBYY עם הגדרה רק עברית, ועם גופן רש"י שהכי קרוב לקיים בספר, מזוהה בינתיים עם הכי פחות שגיאות.
-
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אתה חושב שגוגל לאנס וכדו' יעשו עבודה יותר טובה אחרי שנצליח לחבר את הטקסט מאחורה?
יותר טוב וה-ר-ב-ה יותר מהר!
-
@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם,
קיים באופליין?
-
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם,
קיים באופליין?
כן.
-
@aiib
@י-פל
תראה את הניסוי שהעלתי לעיל
https://mitmachim.top/topic/80826/היו-שותפים-בפרוייקט-זיהוי-תווים-גדול-וחשוב-מאד/12אתמול המרתי כך 32 דפים אחד אחד
נראה שיש 0 טעויות -
@אמיר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
תראה את הניסוי שהעלתי לעיל
בדיוק בשביל זה הלכתי לבדוק אם אפשר לחלק את המשימה ל2 - זיהוי טקסט עם LENS, והוספתו לקובץ. בדיוק בגלל הפוסט שלך [והגיט שהביאו שם]!
האם תוכל לנסות את השיטה שהוא הביא לי?
אני ממש לחוץ בזמן. יש לי כמה דברים על הראש כעת, אחרת לא הייתי זורק זאת עליך... -
@י-פל אני לא מבין בזה כלום, אבל כעת כשפתחתי את כרום הוא הציג לי
את זה chrome://whats-new/ (קישור כזה בכרום של מה חדש) אמור לעזור איכשהו? ייתכן גם שאני סתם מבלבל במוח... -
חיפשתי קצת אחר הכלי הזה OCRmyPDF ומצאתי את ה GUI הזה שאמור לבצע זיהוי והטמעה
הורדתי והרצתי והוא דורש התקנה של שני הכלים
עוד לא הצלחתי להבין איך (המתכנתים שכאן בטח יסתדרו יותר טוב)https://forum.xojo.com/t/open-source-ocrjob-an-ocrmypdf-gui-front-end/75654
https://github.com/ocrmypdf/OCRmyPDF
https://github.com/tesseract-ocr/tesseract
בהתקנה הזו צריך לסמן גם מערכת זיהוי עברית
https://yer.dl.sourceforge.net/project/tesseract-ocr.mirror/5.5.0/tesseract-ocr-w64-setup-5.5.0.20241111.exe?viasf=1 -
@אמיר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
חיפשתי קצת אחר הכלי הזה OCRmyPDF ומצאתי את ה GUI הזה שאמור לבצע זיהוי והטמעה
אבל מה האיכות שלו?
יותר מאבי? -
@אמיר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אבל עדיין לא הבנתי איפה לספק לו את שני הכלים הנוספים
משתני סביבה.
-
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
2] בתוכנת PDF-XChange מכאן {בכלי בשם טולס} [יש להגדיר שיהיה OCR משופר].
האם ישנה דרך להמיר כמות קבצים בבת אחת?
-
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@aiib
כן
בטולס.
זה מותקן על שולחן העבודה.מקבל שגיאה:
-
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@aiib
אפשר צילום מסך משלב קודם?בחרתי גוגל דרייב
-
@aiib בנטפרי? כנראה נושא של תעודת אבטחה.
אבל אם יש לך דרייב לשולחן עבודה, אתה פשט בוחר את התיקיי' בצורה רגילה כמו כל תיקיי'. -
@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אולי אפשר למצוא את המנוע / תוכנה שאיתה הוא משתמש, ולהפיק מכך תוכנת OCR המדוייקת ביותר בשוק.
ראה כאן:
https://github.com/microsoft/PowerToys/issues/30159#issuecomment-1886341385
103/113