מדריך | תוכנות ואתרים ל OCR...כל הדרכים.
-
@צדיק-וטוב-לו-0
הבעיה שאוצה"ח כלל לא מזהה נקודות ופסיקים, ולא מזהה סוגריים או נקודתיים או מקף, ומעוות חלק מהמילים...
רצ"ב דוגמא אקראית מספר לא מי יודע מה ישן, ובכ"ז מי שירצה להגיה את הקטע יראה כמה עבודה יש לו בהוספת הנקודות הפסיקים הגרשיים הסוגריים וכו' [לא סימנתי את זה, אין לי כוח...].
ל"ב ירט הדרך לנגדי עפ"י הערבית כיתוהותה'ק"ז מ' דרכךבעיגישם קי"ט קס"ח או כי כוזבת דרכך בעיני הקבלרנזב"ןכי ההולך ירט דרכו ועיוות אותה לנגד עיני כי אנוכי היודע ועד או לנגדי שירט הדרך לעשות כנגד רצונו כי ההליכה היה בה רשות מאת ה' הנכבד אבל בלעם עיוות אותם בלכתו עמהם על דעתם שיקלל את העם רש"י רבותינו חכמי המשנה דרשוהו נוטריקון יראה ראתה נטתה בשביל שהדרך לנגדי כלומר לקנאתי ולהקניטני@דוכי אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
@צדיק-וטוב-לו-0
הבעיה שאוצה"ח כלל לא מזהה נקודות ופסיקים, ולא מזהה סוגריים או נקודתיים או מקף, ומעוות חלק מהמילים...
רצ"ב דוגמא אקראית מספר לא מי יודע מה ישן, ובכ"ז מי שירצה להגיה את הקטע יראה כמה עבודה יש לו בהוספת הנקודות הפסיקים הגרשיים הסוגריים וכו' [לא סימנתי את זה, אין לי כוח...].
ל"ב ירט הדרך לנגדי עפ"י הערבית כיתוהותה'ק"ז מ' דרכךבעיגישם קי"ט קס"ח או כי כוזבת דרכך בעיני הקבלרנזב"ןכי ההולך ירט דרכו ועיוות אותה לנגד עיני כי אנוכי היודע ועד או לנגדי שירט הדרך לעשות כנגד רצונו כי ההליכה היה בה רשות מאת ה' הנכבד אבל בלעם עיוות אותם בלכתו עמהם על דעתם שיקלל את העם רש"י רבותינו חכמי המשנה דרשוהו נוטריקון יראה ראתה נטתה בשביל שהדרך לנגדי כלומר לקנאתי ולהקניטניולהלן הפענוח של ABBYY - בלי שום עריכה שלי-
-
@דוכי אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
@צדיק-וטוב-לו-0
הבעיה שאוצה"ח כלל לא מזהה נקודות ופסיקים, ולא מזהה סוגריים או נקודתיים או מקף, ומעוות חלק מהמילים...
רצ"ב דוגמא אקראית מספר לא מי יודע מה ישן, ובכ"ז מי שירצה להגיה את הקטע יראה כמה עבודה יש לו בהוספת הנקודות הפסיקים הגרשיים הסוגריים וכו' [לא סימנתי את זה, אין לי כוח...].
ל"ב ירט הדרך לנגדי עפ"י הערבית כיתוהותה'ק"ז מ' דרכךבעיגישם קי"ט קס"ח או כי כוזבת דרכך בעיני הקבלרנזב"ןכי ההולך ירט דרכו ועיוות אותה לנגד עיני כי אנוכי היודע ועד או לנגדי שירט הדרך לעשות כנגד רצונו כי ההליכה היה בה רשות מאת ה' הנכבד אבל בלעם עיוות אותם בלכתו עמהם על דעתם שיקלל את העם רש"י רבותינו חכמי המשנה דרשוהו נוטריקון יראה ראתה נטתה בשביל שהדרך לנגדי כלומר לקנאתי ולהקניטניולהלן הפענוח של ABBYY - בלי שום עריכה שלי-
@אלף-שין מדהים!
אני תמיד משתמש עם ABBYY, וזה אחד הדברים המעולים בה - שהיא מביאה את כל הסימונים, ולא רק מפענחת טקסט. הצרה שלה היא בכתב מנוקד.[אגב, באוצה"ח לכתחילה זה בנוי בצורה שלא יפענח את הסימונים, כדי שהחיפוש ייערך כראוי, כי אם יש נקודה או פסיק או מקף או סוגר ואתה לא כתבת אותו בחיפוש - הוא לא ימצא את המילה. וכעת שהורידו את הסימונים - בכל אופן המילה / המשפט יופיעו. רק גרשיים שהדרך היא כן לציין בחיפוש, הם השאירו. זה ההגיון לכאורה בפענוח שלהם].
-
@אלף-שין מדהים!
אני תמיד משתמש עם ABBYY, וזה אחד הדברים המעולים בה - שהיא מביאה את כל הסימונים, ולא רק מפענחת טקסט. הצרה שלה היא בכתב מנוקד.[אגב, באוצה"ח לכתחילה זה בנוי בצורה שלא יפענח את הסימונים, כדי שהחיפוש ייערך כראוי, כי אם יש נקודה או פסיק או מקף או סוגר ואתה לא כתבת אותו בחיפוש - הוא לא ימצא את המילה. וכעת שהורידו את הסימונים - בכל אופן המילה / המשפט יופיעו. רק גרשיים שהדרך היא כן לציין בחיפוש, הם השאירו. זה ההגיון לכאורה בפענוח שלהם].
אף אחד לא דיבר פה על הדיוק של גוגל דוקס (גוגל יש להם OCR שמשמש בגוגל דוקס קייפ ו LENS ותרגום וכו').
גם דיוק יותר מפיין רידר וגם ניקוד מזהה - אמנם עם טעויות יחסית הרבה בניקוד אבל בלי ניקוד הוא מדייק מאד. רק שאינו מפענח כתב רשי -
אף אחד לא דיבר פה על הדיוק של גוגל דוקס (גוגל יש להם OCR שמשמש בגוגל דוקס קייפ ו LENS ותרגום וכו').
גם דיוק יותר מפיין רידר וגם ניקוד מזהה - אמנם עם טעויות יחסית הרבה בניקוד אבל בלי ניקוד הוא מדייק מאד. רק שאינו מפענח כתב רשי -
אף אחד לא דיבר פה על הדיוק של גוגל דוקס (גוגל יש להם OCR שמשמש בגוגל דוקס קייפ ו LENS ותרגום וכו').
גם דיוק יותר מפיין רידר וגם ניקוד מזהה - אמנם עם טעויות יחסית הרבה בניקוד אבל בלי ניקוד הוא מדייק מאד. רק שאינו מפענח כתב רשי@שעטנ-ז-ג-ץ אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
אף אחד לא דיבר פה על הדיוק של גוגל דוקס (גוגל יש להם OCR שמשמש בגוגל דוקס קייפ ו LENS ותרגום וכו').
גם דיוק יותר מפיין רידר וגם ניקוד מזהה - אמנם עם טעויות יחסית הרבה בניקוד אבל בלי ניקוד הוא מדייק מאד. רק שאינו מפענח כתב רשידווקא כן.
https://mitmachim.top/topic/42156/מדריך-תוכנות-ואתרים-ל-ocr-כל-הדרכים/2 -
-
@אלף-שין מדהים!
אני תמיד משתמש עם ABBYY, וזה אחד הדברים המעולים בה - שהיא מביאה את כל הסימונים, ולא רק מפענחת טקסט. הצרה שלה היא בכתב מנוקד.[אגב, באוצה"ח לכתחילה זה בנוי בצורה שלא יפענח את הסימונים, כדי שהחיפוש ייערך כראוי, כי אם יש נקודה או פסיק או מקף או סוגר ואתה לא כתבת אותו בחיפוש - הוא לא ימצא את המילה. וכעת שהורידו את הסימונים - בכל אופן המילה / המשפט יופיעו. רק גרשיים שהדרך היא כן לציין בחיפוש, הם השאירו. זה ההגיון לכאורה בפענוח שלהם].
@דוכי אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
אני תמיד משתמש עם ABBYY, וזה אחד הדברים המעולים בה - שהיא מביאה את כל הסימונים, ולא רק מפענחת טקסט. הצרה שלה היא בכתב מנוקד.
יתירה מזו היא שומרת על העיצוב והתבנית! למשל פענחה לי טבלה באותו צורה של הטבלה המקורית שזה מאד משמעותי!
-
@אלף-שין אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
@צור הוא המומחה הכי גדול פה בפורום עם נסיון בתוכנות OCR!!
מניח שיש טובים ממני
לדעתי המנוע הכי טוב הוא של אוצה"ח
לרחמים יש בעיה (קיים מעט אבל קיים) שהתכנה לא יודעת לזהות ר"ת אלא כשני גרשיים (ולי אישית זה נורא מציק בעין)
בכל מקרה צריך לזכור שלוקחים מישהו מקצועי להמרה אין מצב בעולם שהוא לא עובר על כל הטקסט המומר
המעלה בתוכנות כמה שגיאות יש אצל רחמים הגעתי לעמודים שהיה בהם בין 5-10 שגיאות לעמוד
בפיין רידר לא מצאתי עמוד שהיה פחות מארבים שגיאות@צור תנסה את התוכנה של רחמים על התמונה הזאת !
כרגע יש לנו את התוצאות מתמונה זאת מ-
אוצר החכמה:
"ל"ב ירט הדרך לנגדי עפ"י הערבית כי תוהותה' ק"ז מ' דרכך בעיגי שם קי"ט קס"ח או כי כוזבת דרכך בעיני הקבל רנזב"ן כי ההולך ירט דרכו ועיוות אותה לנגד עיני כי אנוכי היודע ועד או לנגדי שירט הדרך לעשות כנגד רצונו כי ההליכה היה בה רשות מאת ה' הנכבד אבל בלעם עיוות אותם בלכתו עמהם על דעתם שיקלל את העם רש"י רבותינו חכמי המשנה דרשוהו נוטריקון יראה ראתה נטתה בשביל שהדרך לנגדי כלומר לקנאתי ולהקניטני"
וABBYY:
-
@ששמעון אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
@צור קוראים לזה DT סרצ'.
יש באתר GETINTOPC
הוא משמש גם במשטרה לזיהוי פלילי וכו'.קישור?
@אלף-שין אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
@ששמעון אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
@צור קוראים לזה DT סרצ'.
יש באתר GETINTOPC
הוא משמש גם במשטרה לזיהוי פלילי וכו'.קישור?
https://getintopc.com/softwares/management/dtsearch-desktop-free-download/
מדובר בתוכנה לחיפוש, לא קשור לאשכול -
@צור תנסה את התוכנה של רחמים על התמונה הזאת !
כרגע יש לנו את התוצאות מתמונה זאת מ-
אוצר החכמה:
"ל"ב ירט הדרך לנגדי עפ"י הערבית כי תוהותה' ק"ז מ' דרכך בעיגי שם קי"ט קס"ח או כי כוזבת דרכך בעיני הקבל רנזב"ן כי ההולך ירט דרכו ועיוות אותה לנגד עיני כי אנוכי היודע ועד או לנגדי שירט הדרך לעשות כנגד רצונו כי ההליכה היה בה רשות מאת ה' הנכבד אבל בלעם עיוות אותם בלכתו עמהם על דעתם שיקלל את העם רש"י רבותינו חכמי המשנה דרשוהו נוטריקון יראה ראתה נטתה בשביל שהדרך לנגדי כלומר לקנאתי ולהקניטני"
וABBYY:
-
@cannon
עיקר ה"ווארט" בתוכנה של רחמים הינה בזיהוי כת"י עפ"י אימון, לא כ"כ רלוונטי לדפוס,
בדפוס - ABBYY יותר טובה לדעתי, תראה פה את מה שכתב רחמים עצמו.@אלף-שין אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
@cannon
עיקר ה"ווארט" בתוכנה של רחמים הינה בזיהוי כת"י עפ"י אימון, לא כ"כ רלוונטי לדפוס,
בדפוס - ABBYY יותר טובה לדעתי, תראה פה את מה שכתב רחמים עצמו.תקרא את כל הפוסטים שכתבו מהתחלה ותבין מה כתבתי לצור.
-
@אלף-שין אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
@cannon
עיקר ה"ווארט" בתוכנה של רחמים הינה בזיהוי כת"י עפ"י אימון, לא כ"כ רלוונטי לדפוס,
בדפוס - ABBYY יותר טובה לדעתי, תראה פה את מה שכתב רחמים עצמו.תקרא את כל הפוסטים שכתבו מהתחלה ותבין מה כתבתי לצור.
@cannon
לא רלוונטי וזאת משם שלא שווה לעבוד על התוכנה של רחמים בפחות ממאה עמ' (שלוקח זמן לעבוד על איזה עמוד ואחרי זה לעבור לאט לאט על עוד 5 ) ורק אחרי זה מחילים לרוץ בהנאה ובכיףבכל אופן נעניתי לבקשה להריץ בתוכנה
במילון המקורי
ל"בי ירט הדרך לנגדי – עפ"י הערבית : כי תוהו �תה' ק"ז, מ'י דרכך
בעיני 1שם קי"ט, קס"חי ; או : כי כוזבת דרכך בעיני. הקבל רמב"ן : "כי ההולך
ירט דרכו ועיוות אותה לגגד עיני, כי אנוכי היודע ועד. או לנגדי – שירט הדרך
לעשות כנגד רצוגו... בי ההליכה היה בה רשות מאת ה' הנכבד, אבל בלעם עיוות
אותם בלכתו עמהם על דעתם שיקלל את העם''. רש–י : "רבותינו חכמי המשגה
דרשוהו נוטריקון : יראה, ראתה, נטתה, בשביל שהדרך לנגדי, כלומר : לקנאתי
ולהקניטני".המקרא והארץ - א ; נאור, מנחם ; עמוד 153
הודפס מאוצר החכמה
במילון שעיבדתי אותו בעבר
ל"ב) ירט הדרך לנגדי – עפ"י הערבית : כי תוהו (תה' ק"ז, מ') דרכך
בעיני (שם קי"ט, קס"ח) ; או : כי כוזבת דרכך בעיני. הקבל רמב"ן : "כי ההולך
ירט דרכו ועיוות אותה לנגד עיני, כי אנוכי היודע ועד. או לנגדי – שירט הדרך
לעשות כנגד רצונו... כי ההליכה היה בה רשות מאת ה' הנכבד, אבל בלעם עיוות
אותם בלכתו עמהם על דעתם שיקלל את העם''. רש"י : "רבותינו חכמי המשנה
דרשוהו נוטריקון : יראה, ראתה, נטתה, בשביל שהדרך לנגדי, כלומר : לקנאתי
ולהקניטני".המקרא והארץ - א ; נאור, מנחם ; עמוד 153
הודפס מאוצר החכמה -
לכולנו פה זה קורה.......יש לנו תמונה של מסמך כל שהוא מצולם ואנחנו רוצים אותו בטקסט או הודעה באנגלית כל שהיא ואנחנו רוצים רק את הטקסט שלהם ע"מ לתרגם את ההודעה או לא משנה למה, אבל יש לנו בעיה זה תמונה ולא טקסט.
אז מן הסתם חלקכם יודעים כבר (ומי שלא יודע שידע עכשיו) שיש כזה דבר שנקרה OCR ראשי תיבות של Optical Character Recognition פירושו "זיהוי תווים אופטי" שזה בדיוק מה שאתם צריכים אבל איפה משיגים את זה.
התשובה היא כאן
אז הינה אספתי לכם כמה כלים שעושים OCR :
תוכנות
1. ABBYY FineReader Corporate הורדה מכאן. או מתורגם לעברית מכאן.
2. TurboPDF הורדה מכאן.
3. Kofax OmniPage Ultimate הורדה מכאן.
4. Neevia Document Converter Pro הורדה מכאן.
5. Apowersoft PDF Converter הורדה מכאן.
6. Readiris Corporate הורדה מכאן.
7. Tipard PDF to Word Converter הורדה מכאן.
8. AnyMP4 PDF Converter Ultimate הורדה מכאן.
9. PDF-XChange Editor ההורדה מכאן.
10. Photo Scan ההורדה מכאן
11. Qtranslate (לתרגום הודעות מחשב) ההורדה מכאן
12. עדכון: ב"כלי החיתוך" נוסף האפשרות לחילץ טקסט. לחץ כאן להוראת (קרדיט ל @דאנציג שהזכיר לי להוסיף את זה)
OCR און-ליין (אתרים)
1. keep.google
2. newocr.
3. ocr2edit.
4. onlineocr.
5. convertio.
-
מדריך לזיהוי ואימון תווים בABBYY.
-
מדריך כיצד להוסיף ל ABBYY גופנים כרש"י וכדו' ע"מ שגם אותם הוא יזהה.
תהנו
@cannon שכחת את PDF-XChange Editor מצ"ב התוצאה:
-
-
@cannon שכחת את PDF-XChange Editor מצ"ב התוצאה:
@יוסי-מחשבים
צודק.
ציטוט מ'המכלול':
**אפשרויות השימוש בספרייה
הספרים ניתנים הן לצפייה מקוונת בדפדפן והן להורדה כקובצי PDF, של הספר בשלמותו או של עמוד בודד, וללא תשלום (אך לשימוש אישי בלבד[10]).הספרים מעובדים בטכנולוגיית זיהוי תווים אופטי שפיתחה החברה הישראלית ליגטורה (Ligature) ומאונדקסים באמצעות טכנולוגיה שפיתחה חברת dtSearch, ובדרך זו ניתן לערוך בהם חיפוש טקסטואלי מלא וכן להמירם לטקסט רגיל.**
-
@cannon שכחת את PDF-XChange Editor מצ"ב התוצאה:
-
-
@ששמעון אמר במדריך | תוכנות ואתרים ל OCR...כל הדרכים.:
@צור איזו גירסה זה?
ב 8.0.341 אין עברית
זה 9 או 10?תבחר ב: הוסף/עדכן שפה
ותוסיף עברית