היו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!

אלף שין

@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם,

קיים באופליין?

י. פל.

@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם,

קיים באופליין?

כן.

אמיר

@aiib
@י-פל
תראה את הניסוי שהעלתי לעיל
https://mitmachim.top/topic/80826/היו-שותפים-בפרוייקט-זיהוי-תווים-גדול-וחשוב-מאד/12

אתמול המרתי כך 32 דפים אחד אחד
נראה שיש 0 טעויות

י. פל.

@אמיר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

תראה את הניסוי שהעלתי לעיל

בדיוק בשביל זה הלכתי לבדוק אם אפשר לחלק את המשימה ל2 - זיהוי טקסט עם LENS, והוספתו לקובץ. בדיוק בגלל הפוסט שלך [והגיט שהביאו שם]!
האם תוכל לנסות את השיטה שהוא הביא לי?
אני ממש לחוץ בזמן. יש לי כמה דברים על הראש כעת, אחרת לא הייתי זורק זאת עליך...

צבי דורש ציון

@י-פל אני לא מבין בזה כלום, אבל כעת כשפתחתי את כרום הוא הציג לי
את זה chrome://whats-new/ (קישור כזה בכרום של מה חדש) אמור לעזור איכשהו? ייתכן גם שאני סתם מבלבל במוח...

אמיר

@אלף-שין

חיפשתי קצת אחר הכלי הזה OCRmyPDF ומצאתי את ה GUI הזה שאמור לבצע זיהוי והטמעה
הורדתי והרצתי והוא דורש התקנה של שני הכלים
עוד לא הצלחתי להבין איך (המתכנתים שכאן בטח יסתדרו יותר טוב)

https://forum.xojo.com/t/open-source-ocrjob-an-ocrmypdf-gui-front-end/75654

https://github.com/ocrmypdf/OCRmyPDF

https://github.com/tesseract-ocr/tesseract

בהתקנה הזו צריך לסמן גם מערכת זיהוי עברית
https://yer.dl.sourceforge.net/project/tesseract-ocr.mirror/5.5.0/tesseract-ocr-w64-setup-5.5.0.20241111.exe?viasf=1

י. פל.

@אמיר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

חיפשתי קצת אחר הכלי הזה OCRmyPDF ומצאתי את ה GUI הזה שאמור לבצע זיהוי והטמעה

אבל מה האיכות שלו?
יותר מאבי?

אמיר

@י-פל

בגלל ש CLI לא נוח חיפשתי ממשק גרפי GUI
אבל עדיין לא הבנתי איפה לספק לו את שני הכלים הנוספים
עדיין כותב לי שהם לא מותקנים במחשב

י. פל.

@אמיר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

אבל עדיין לא הבנתי איפה לספק לו את שני הכלים הנוספים

משתני סביבה.

aiib

@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

2] בתוכנת PDF-XChange מכאן {בכלי בשם טולס} [יש להגדיר שיהיה OCR משופר].

האם ישנה דרך להמיר כמות קבצים בבת אחת?

אלף שין

@aiib
כן
בטולס.
זה מותקן על שולחן העבודה.

aiib

@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

@aiib
כן
בטולס.
זה מותקן על שולחן העבודה.

מקבל שגיאה:

אלף שין

@aiib
אפשר צילום מסך משלב קודם?

aiib

@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

@aiib
אפשר צילום מסך משלב קודם?

בחרתי גוגל דרייב

אלף שין

@aiib
אני היום מתמקד בלנסות לעשות הוראות מסודרות,
אז אמשיך את הבדיקות מחר,
תודה רבה!

יום חדש מתחיל

@aiib בנטפרי? כנראה נושא של תעודת אבטחה.
אבל אם יש לך דרייב לשולחן עבודה, אתה פשט בוחר את התיקיי' בצורה רגילה כמו כל תיקיי'.

אלכסון

@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:

אולי אפשר למצוא את המנוע / תוכנה שאיתה הוא משתמש, ולהפיק מכך תוכנת OCR המדוייקת ביותר בשוק.

ראה כאן:
https://github.com/microsoft/PowerToys/issues/30159#issuecomment-1886341385

אמיר

@אלכסון

אפשר אולי ע"י אוטומציה כמו מאקרו שיבצע את הפעולה בלולאה
יקח תמונה יפענח בגוגל לנס, יעתיק וידביק

פלמנמוני

@אלף-שין שימו לב למדריך החדש והמפורט של @אלישי לזיהוי התווים!
https://mitmachim.top/post/929469

אלישי

@פלמנמוני אכן זוהי בינתיים התוכנה היחידה בווינדוס שיודעת בשעת הפיענוח לסובב את העמודים ואת ההטייה כדי לפענח בצורה טובה, ואז בשעת השמירה להשאיר את התמונה המקורית, לצערי abbyy לא יודע לעשות זאת (הם כותבים שזה ידוע להם וזה בפיתוח), ולכן כרגע, זה התוכנה היחידה שמתאימה לפרויקט הזה.

יש חיסרון בתוכנה זו, שהוא לא מנהל את התור של הקבצים בצורה טובה, אלא רק בסיום כל הסריקה הוא מעביר את הקבצים, אני בונה עכשיו סקריפט מותאם לפרויקט הזה שינהל את זה בצורה טובה ויעילה.