מדריך | המרת קבצי PDF או תמונות המכילות סריקת טקסט - לוורד
-
מקוה שאיני הורס לאף אחד את הפרנסה ואדרבה מי שרוצה יכול לעשות מזה פרנסה...
ישנם כמה שיטות ידועות וכמה שלא.
הקדמה קטנה, לא צריכים לסרוק את המסמך\ספר ע"י סורק איכותי שעולה 5000 ש"ח ע"מ שהפענוח יצא מוצלח. מנסיון, ניתן לצלם ע"י מצלמה ביתית איכותית כמו של קנון [ולאו דווקא מהסדרה המקצועית שעולות 1500 +] עמוד עמוד. האיכות הזו מספיקה בשביל שתוכנות הפענוח יפענחו נכון.
שיטה א.
א. ישנו תוכנה ידועה ונתנת להורדה גם כאן בשם ABBYY FINEREADER שמיועדת להמרת קבצים לטקסט. אז דבר ראשון שיש לדעת שאחרי המון בדיקות, לא ברור כלל שגרסה 15 למשל עדיפה על 12 . בנסיונות השונים ראיתי שיש דברים שב 12 הוא שיבש וב 15 פענח תקין ומאידך ב 15 שיבש דברים אחרים שב 12 היו תקינים ובמילים אחרות כל אחד מפספס בפענוח במקומות שונים. כתב רש"י באמת ב 15 היה קצת יותר מדויק אך לא הבדל משמעותי.
ב. בתוכנה הנ"ל מי שלא עושה ANALYZE (סיקור) אוטומטי אלא מציין לבד באופן ידני איפה איזור הטקסט שדרוש לו המרה, הפענוח יוצא הרבה יותר מדויק.!!! info []: הערה חשובה להמרת מסמך בכתב רש"י: בדרך כלל אם עושים המרה ע"י הכלי ABBYY Screenshot Reader [הוא מותקן ביחד עם ההתקנה של ABBYY ואין צורך בהתקנה נוספת - ראו תמונה] שזה בעצם המרה לטקסט ע"י צילום מסך.
בוחרים חלק בעמוד ומאשרים כמו בצילום מסך של וינדוס ודומיו, וההמרה ע"י הכלי הנ"ל יוצא מדויק יותר מהדרך הרגילה שפותחים את התוכנה ובוחרים קובץ להמרה (למה זה ככה? אין לי מושג).
שיטה ב.
עם כל הכבוד לתוכנה הנ"ל שהיא באמת המקצועית ביותר הקיימת בשוק, אך פענוח של גוגל עוקף אותה בלי ספק ותבדקו את זה. תעלו קובץ תמונה JPG או PDF המכיל טקסט (לא רש"י - גוגל לא למד רש"י מימיו ואינו מכירו כלל בשונה מ ABBYY) ותראו פחות שיבושים מהתוכנה הנ"ל באחוזים משמעותיים. אך יש לו חסרון שהוא לא תמיד מבדיל בין הטורים ואם אין מרחק ניכר ביניהם הוא קורא הכל כאילו זה שורה אחת ארוכה ומערבב את הטורים.
איך עושים פענוח ע"י גוגל? מעלים קובץ לדרייב >לחיצה ימינית>פתח באמצעות>google docs>להמתין להמרה.ההמרה יוצאת עם עיצוב מבולבל לחלוטין אך מדויק יחסית מבחינת פענוח התמונה לטקסט. לכן אחרי ההמרה פשוט לעשות בחר הכל (קונטרול+A) ואז ללחוץ על "הסרת עיצוב" כך נראה הלחצן
ניתן אח"כ להוריד את המסמך ע"י קובץ>הורדה. או פשוט לעשות העתק הדבק לקובץ וורד חדש במחשב.
שיטה ג.
להמרת PDF אונליין [לא כתב רש"י] יש אתר חינמי שממיר די מדויק בכתובת https://www.i2pdf.com
המרת תמונה תמונה יש את האתר www.i2ocr.com/free-online-hebrew-ocr
וכן www.structurise.com/screenshot-ocr לזכור לבחור HEBREW לפני לחיצה על "Process Whole Image"יש המון פרטים נוספים ע"מ להמיר בצורה מוצלחת וכל הנ"ל זה על קצה המזלג.
שיטה ד. (דומה לשיטה ב. ומשתמש באותה הטכנולוגיה)
להכנס לגוגל LENS . בצד שמאל למעלה ללחוץ "העלאה". אחרי שהתמונה עלתה ללחוץ בצד ימין על "טקסט" ואז בצד שמאל על "בחירת הטקסט במלואו" ואז "העתקת הטקסט". להדביק בקובץ וורד וכדו'.
בדרך כלל הדיוק גבוה מאד.
ממיר גם ניקוד.
השיטה הזו מתאימה להמרת קובץ תמונה אחת בודדת (לא רש"י) -
-
-