היו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!
-
@אמיר
בכל אופן התמחור של גוגל לחילוץ טקסט מתמונות:
צריך לבדוק כמה כאלו חבילות צריך בשביל פרויקט כזה.
למרות שהרעיון של הפרויקט החינמי בגיטהאב הרבה יותר טוב.
שוב, כל זה רק אם צריך רק קבצי טקסט.
אם לא כל הדיון מיותר.
חייבים מה ש @אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:1] בתוכנת ABBYY מכאן או באחד מהכלים האחרים שלהם [SDK /סרבר/עוד]
2] בתוכנת PDF-XChange מכאן {בכלי בשם טולס} [יש להגדיר שיהיה OCR משופר].
3] בתוכנה של רחמים זה מיועד רק למי שקנה את התוכנה מרחמים [ורק אם הרישיון שהוא נותן הוא ללא הגבלה]. -
@אלף-שין
הקובץ חייב להיות צילום עם שכבת טקסט?
זה מה ששאלתי.@יאנג-בוי כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
צריך לקבל את הספרים בצורתם המקורית עם אפשרות חיפוש?
או רק קובץ טקסט עם הטקסט שלהם?
אם רק קובץ טקסט, זו לדעתי תהיה האפשרות היעילה ביותר.ואם כן, כל הרעיון של גוגל לא רלוונטי בכלל.
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
דבר שני מדובר על 11.7 מיליון עמודים!!
אין הבדל בין ABBYY לגוגל בהקשר הזה.
אבל שוב, לא רלוונטי. -
@יאנג-בוי כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
הקובץ חייב להיות צילום עם שכבת טקסט?
זה מה ששאלתי.כן.
חייב.@יאנג-בוי כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
ואם כן, כל הרעיון של גוגל לא רלוונטי בכלל.
נכון.
-
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
מה בוחרים כאן?
את הראשון.
חשוב!! אח"כ תגדיר עברית בלבד.
ואל תתייחס לפירוט השגיאות שהבאת בהודעה הבאה.
רק מה שנפק"מ זה רק מה שכתוב לך להגדיר את הרוזולוצי' ל 600 -
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
1] בתוכנת ABBYY מכאן או באחד מהכלים האחרים שלהם [SDK /סרבר/עוד]
ניתן פשוט להדגיש את כל הקבצים בתיקייה שמורידים > מקש ימני > אפשרויות נוספות > המר למסמך PDF הניתן לחיפוש
ואז בחלון שנפתח לבחור בשפות OCR עברית והמר אל PDF ולבחור תיקייה שלשם ישמור את המסמכים החדשים
-
@יום-חדש-מתחיל כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
ואל תתייחס לפירוט השגיאות שהבאת בהודעה הבאה.
למה לא להתייחס? זה לא אומר שזה לא פוענח?
רק מה שנפק"מ זה רק מה שכתוב לך להגדיר את הרוזולוצי' ל 600
איך עושים את זה?
בנוסף, בחרתי את כל הקבצים והוא שמר לי אותם כקובץ אחד, איך אפשר להגדיר שכל קובץ יישמר בנפרד?
-
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
למה לא להתייחס?
כי בכל עמוד מספר סרוק שתנסה לפענח הוא יכתוב לך כאלה שגיאות. בדוק ומנוסה.
איך עושים את זה?
האמת שלא מצאתי איך עושים את זה, רק בפתיחת ABBYY FineReader 15 OCR Editor ושם אחרי לחיצה על אפשרויות ניתן להגדיר
איך אפשר להגדיר שכל קובץ יישמר בנפרד?
פשוט מאוד. לא ללחוץ על 'שלב את כל הקבצים למסמך אחד'.
-
@יום-חדש-מתחיל כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
פשוט מאוד. לא ללחוץ על 'שלב את כל הקבצים למסמך אחד'.
אין לי את הגירסה הזו..
בנוסף אשמח לדעת איך אני מגדיר מראש את המיקום של השמירה?
אגב, עשיתי בשעתיים וחצי יותר מ5000 דפים, בקצב כזה אפשר לעשות כל לילה כשהולכים לישון 10,000 דפים שזה אומר שעוד 35 אנשים כמוני עושים זאת במשך חודש גומרים סיפור.
אם 70 אנשים תוך שבועיים... -
@aiib יפה מאוד!! אין עליך! זכות הרבים שילמדו בספרים תיזקף לזכותך.
אז יוצא שבכל 3 דקות אתה עושה 100 עמודים.ובקשר לשאלתך, הנה עוד סיבה לעדכן לגירסא ש @אלף-שין הביא למעלה. [או לגירסא 15 ש @י-פל תרגם לעברית]. גם עברית, גם עוד פונקציות. גם אפשרות לבחור מיקום לשמירה. [אצלי זה אוטומטי אחרי לחיצה על הכפתור הכחול "המר ל- PDF"]
ד.א. אתה ישן רק 5 שעות ביום? ככה יוצא לפי החשבון שכתבת ל 10000 דפים ללילה. -
לא לגמרי הבנתי, התוכנה מורידה לבד מהדרייב ומעלה לבד?
-
@צבי-דורש-ציון לא, אתה מגדיר לה לשמור את הקבצים בתיקייה שמסתנכרת אוטומטית עם דרייב
ואז כשקובץ נשמר הוא עולה לדרייב בלי התערבות נוספת מצידך -
@קינג-קומפיוטר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@צבי-דורש-ציון לא, אתה מגדיר לה לשמור את הקבצים בתיקייה שמסתנכרת אוטומטית עם דרייב
ואז כשקובץ נשמר הוא עולה לדרייב בלי התערבות נוספת מצידךאיפה מגדירים את זה?