היו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!
-
@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אולי אפשר למצוא את המנוע / תוכנה שאיתה הוא משתמש, ולהפיק מכך תוכנת OCR המדוייקת ביותר בשוק.
ראה כאן:
https://github.com/microsoft/PowerToys/issues/30159#issuecomment-1886341385 -
שלום רב,
כהמשך לרעיון שהעלו בשרשור שם
אני פותח פה את הפרוייקט המיוחד בצורה מסודרת וברורה.[פרוייקט שיתופי של OCR ל60,000 קבצים המכילים 11.7 מיליון עמודים!]
תחילה יש להתקין תוכנה של OCR
כל אחד יוכל לבחור באחד מבין 3 אפשרויות איך לבצע את הזיהוי אצלו,1] בתוכנת ABBYY מכאן או באחד מהכלים האחרים שלהם [SDK /סרבר/עוד]
2] בתוכנת PDF-XChange מכאן {בכלי בשם טולס} [יש להגדיר שיהיה OCR משופר].
3] בתוכנה של רחמים זה מיועד רק למי שקנה את התוכנה מרחמים [ורק אם הרישיון שהוא נותן הוא ללא הגבלה].
בשלושתם יהיה תוצאה טובה שמספיקה לעניינינו.בכל האפשרויות יש צורך גדול להגדיר ששפת הזיהוי היא עברית בלבד!
וזה כדי שלא יהיה פיענוחים שגויים בעשרות שפות אחרות, וגם זה יקצר את העבודה מאד!לאחר מכן כל אחד בוחר את כמות הקבצים שהוא מעונין להמיר,
ומעדכן כאן, או במייל 0556781863A@GMAIL.COM או באישי ואנו נשלח לו למייל קישור לדרייב המכיל תיקייה עם כמות הקבצים שהוא ציין,
בנוסף נשלח לו קישור לתיקייה נוספת בדרייב לשם הוא יעלה את הקבצים לאחר העיבוד,יצוין כי אם מתקינים דרייב לשולחן עבודה,
אפשר לבצע את כל ההמרה כולל ההעלאה לדרייב בלחיצת כפתור אחת!
פשוט כל לילה 'לפני השינה' לוחצים על כפתור אחד וכל הלילה המחשב מעבד עוד ועוד קבצים ומעלה אותם בעצמו לתיקייה הרצויה בדרייב!
מי שרוצה נוכל להדריכו כאן.אם מישהו מוכן לעבוד על כמות גדולה אבל לא מתאים לו להוריד מהדרייב,
ישלח לנו את מיקום מגוריו, ונראה אם שייך להעביר לו את הקבצים ידנית.בהצלחה לכולנו!!
ושיהיה בעז"ה ס"ד גדולה לטובת כולם!!
@אלישי @aiib @האדם-החושב @י-פל @יעקב-מ-פינס @יהודה-12 @אמיר @דאנציג @משה-מזרחי @A0533057932 @NH-LOCAL
לכל תגובה/רעיון לשדרוג נא להגיב רק כאן,
זה נושא מסודר וחדש!כל אחד יכול לעזור ולהוסיף!!
בלי שום התחייבות!
בסוף הכל מצטרף לחשבון גדול!! -
@אלף-שין שימו לב למדריך החדש והמפורט של @אלישי לזיהוי התווים!
https://mitmachim.top/post/929469@פלמנמוני אכן זוהי בינתיים התוכנה היחידה בווינדוס שיודעת בשעת הפיענוח לסובב את העמודים ואת ההטייה כדי לפענח בצורה טובה, ואז בשעת השמירה להשאיר את התמונה המקורית, לצערי abbyy לא יודע לעשות זאת (הם כותבים שזה ידוע להם וזה בפיתוח), ולכן כרגע, זה התוכנה היחידה שמתאימה לפרויקט הזה.
יש חיסרון בתוכנה זו, שהוא לא מנהל את התור של הקבצים בצורה טובה, אלא רק בסיום כל הסריקה הוא מעביר את הקבצים, אני בונה עכשיו סקריפט מותאם לפרויקט הזה שינהל את זה בצורה טובה ויעילה.
-
@פלמנמוני אכן זוהי בינתיים התוכנה היחידה בווינדוס שיודעת בשעת הפיענוח לסובב את העמודים ואת ההטייה כדי לפענח בצורה טובה, ואז בשעת השמירה להשאיר את התמונה המקורית, לצערי abbyy לא יודע לעשות זאת (הם כותבים שזה ידוע להם וזה בפיתוח), ולכן כרגע, זה התוכנה היחידה שמתאימה לפרויקט הזה.
יש חיסרון בתוכנה זו, שהוא לא מנהל את התור של הקבצים בצורה טובה, אלא רק בסיום כל הסריקה הוא מעביר את הקבצים, אני בונה עכשיו סקריפט מותאם לפרויקט הזה שינהל את זה בצורה טובה ויעילה.
-
@אלישי האם יש אפשרות לגרום לתוכנה להשתמש יורת במעבד/RAM/מעבד גרפי?
כי א"כ זה יהיה יעיל עבור מחשבים חזקים שיהיה ניתן לשחק בהגדרות ולנצל יותר את כח המחשוב. -
שלום רב,
כהמשך לרעיון שהעלו בשרשור שם
אני פותח פה את הפרוייקט המיוחד בצורה מסודרת וברורה.[פרוייקט שיתופי של OCR ל60,000 קבצים המכילים 11.7 מיליון עמודים!]
תחילה יש להתקין תוכנה של OCR
כל אחד יוכל לבחור באחד מבין 3 אפשרויות איך לבצע את הזיהוי אצלו,1] בתוכנת ABBYY מכאן או באחד מהכלים האחרים שלהם [SDK /סרבר/עוד]
2] בתוכנת PDF-XChange מכאן {בכלי בשם טולס} [יש להגדיר שיהיה OCR משופר].
3] בתוכנה של רחמים זה מיועד רק למי שקנה את התוכנה מרחמים [ורק אם הרישיון שהוא נותן הוא ללא הגבלה].
בשלושתם יהיה תוצאה טובה שמספיקה לעניינינו.בכל האפשרויות יש צורך גדול להגדיר ששפת הזיהוי היא עברית בלבד!
וזה כדי שלא יהיה פיענוחים שגויים בעשרות שפות אחרות, וגם זה יקצר את העבודה מאד!לאחר מכן כל אחד בוחר את כמות הקבצים שהוא מעונין להמיר,
ומעדכן כאן, או במייל 0556781863A@GMAIL.COM או באישי ואנו נשלח לו למייל קישור לדרייב המכיל תיקייה עם כמות הקבצים שהוא ציין,
בנוסף נשלח לו קישור לתיקייה נוספת בדרייב לשם הוא יעלה את הקבצים לאחר העיבוד,יצוין כי אם מתקינים דרייב לשולחן עבודה,
אפשר לבצע את כל ההמרה כולל ההעלאה לדרייב בלחיצת כפתור אחת!
פשוט כל לילה 'לפני השינה' לוחצים על כפתור אחד וכל הלילה המחשב מעבד עוד ועוד קבצים ומעלה אותם בעצמו לתיקייה הרצויה בדרייב!
מי שרוצה נוכל להדריכו כאן.אם מישהו מוכן לעבוד על כמות גדולה אבל לא מתאים לו להוריד מהדרייב,
ישלח לנו את מיקום מגוריו, ונראה אם שייך להעביר לו את הקבצים ידנית.בהצלחה לכולנו!!
ושיהיה בעז"ה ס"ד גדולה לטובת כולם!!
@אלישי @aiib @האדם-החושב @י-פל @יעקב-מ-פינס @יהודה-12 @אמיר @דאנציג @משה-מזרחי @A0533057932 @NH-LOCAL
לכל תגובה/רעיון לשדרוג נא להגיב רק כאן,
זה נושא מסודר וחדש!כל אחד יכול לעזור ולהוסיף!!
בלי שום התחייבות!
בסוף הכל מצטרף לחשבון גדול!!@אלף-שין
שלום רב לכולם
אם אני מבין נכון מדובר במערכת המתרגמת כתב יד לטקסט מוקלד
אני עובד על הפיתוח של זה זמן רב ויש לי כשר אם מספר מתכנתים
בעזרת ה' בקרוב אני עומד לפתוח אטר שבה יהיה ניתן להאמיר תקבצים (כמובן שהוא רחוק מי מושלם ויצטרכו עוד הרבה את עזרת הציבור ) -
@אלף-שין
שלום רב לכולם
אם אני מבין נכון מדובר במערכת המתרגמת כתב יד לטקסט מוקלד
אני עובד על הפיתוח של זה זמן רב ויש לי כשר אם מספר מתכנתים
בעזרת ה' בקרוב אני עומד לפתוח אטר שבה יהיה ניתן להאמיר תקבצים (כמובן שהוא רחוק מי מושלם ויצטרכו עוד הרבה את עזרת הציבור ) -
@אלף-שין
שלום רב לכולם
אם אני מבין נכון מדובר במערכת המתרגמת כתב יד לטקסט מוקלד
אני עובד על הפיתוח של זה זמן רב ויש לי כשר אם מספר מתכנתים
בעזרת ה' בקרוב אני עומד לפתוח אטר שבה יהיה ניתן להאמיר תקבצים (כמובן שהוא רחוק מי מושלם ויצטרכו עוד הרבה את עזרת הציבור ) -
@ירוחם-0 כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
בעזרת ה' בקרוב אני עומד לפתוח אטר שבה יהיה ניתן להאמיר תקבצים (כמובן שהוא רחוק מי מושלם ויצטרכו עוד הרבה את עזרת הציבור )
כמה אתה מתכנן לקחת על זה?
-
@אביעד כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אממ אני מוכן לנסות (יש לי i9 14900HX '32GB RAM DDR5 , 990 PRO SSD NVMe PCIe4, RTX 4060
זה קשור אלי? או שזה תגובה לנושא של @ירוחם-0
[ואגב @ירוחם-0 יותר נכון לכתוב "אתר" ולא "אטר" וגם "שזה" ולא "זב" וגם "קשר" ולא "כשר" וגם "להמיר" ולא "להאמיר" וגם "את הקבצים" ואל "תקבצים" וגם "ממושלם" ולא "מי מושלם"].
-
@אמיר, תוכל להסביר איך בצעת את הסריקה עם גוגל Lens?
-
@אמיר, תוכל להסביר איך בצעת את הסריקה עם גוגל Lens?
אפשר דרך האפליקציה עצמה lens
לעמוד על הדף ולהעתיק את הטקסט המזוההמה שאני עשיתי זה צילום כל העמודים
ואז מתוך הגלריה יש לחצן עיגול שבתוכו 3 נקודות
ושם יש google lens
ומתוכו לעבור אחד אחד ולהעתיק את הטקסט -
@אביעד כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אממ אני מוכן לנסות (יש לי i9 14900HX '32GB RAM DDR5 , 990 PRO SSD NVMe PCIe4, RTX 4060
מפרט מרשים. אבל למיטב הבנתי החלק כמעט היחיד שיהיה בפעולה זה הram