היו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!
-
@aiib על כמה קבצים עשית?
גם אצלי הוא לא היה תמיד על 100 הרבה זמן הוא גם היה על 30-40
כנראה שחלק מתהליך העיבוד דורש כוח מסיבי ולזה ההגדרה עוזרת להעלות את השימוש במעבד
וחלק מהזמן זה חישובים שדורשים פחות כוח אז זה בין כה וכה לא משנה -
@קינג-קומפיוטר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
על כמה קבצים עשית?
על כל הקבצים ששלחת לי- 20
-
@aiib @קינג-קומפיוטר @אהרן-שובקס @יעקב-מ-פינס
שימו לב!!
הענין הפך לפשוט ביותר בזכותו של @האדם-החושב שהכין קובץ הגדרות מסודר,
אותו יש לייבא לתוכנה להלן המדריך
מדריך לocr מאגר.docx
להלן קובץ ההגדרות המוכן
היברו בוקס.hft -
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@aiib @קינג-קומפיוטר @אהרן-שובקס @יעקב-מ-פינס
שימו לב!!
הענין הפך לפשוט ביותר בזכותו של @האדם-החושב שהכין קובץ הגדרות מסודר,
אותו יש לייבא לתוכנה להלן המדריך
מדריך לocr מאגר.docx
להלן קובץ ההגדרות המוכן
היברו בוקס.hftאחרי שכבר עשיתי פעם אחת יש עניין להשתמש בזה?
-
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
עשיתי אתמול ניסיון וזה עשה לי 5150 בבערך שעתיים וחצי. בטח זה משתנה מספר לספר.
אתה יכול להשאיר לילה. רק שים לב להגדרות החשמל שלא יתכבה לך באמצע המחשבמשהו מוזר, עשיתי מהתחלה על אותם ספרים (כן החלפתי מגרסה 15 לגרסה 16 שמצורפת למעלה ועכשיו כבר כמעט 3 שעות ורק 5 מתוך 20 נעשו.
גם המדדים בכלל לא במקסימום שלהם.אולי זה בגלל ההגדרה הזו שלא בטוח קיימת בגרסה 15?
-
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אחרי שכבר עשיתי פעם אחת יש עניין להשתמש בזה?
אם זה עוזר לך לאוטמציה זה מצוין
אם אתה מסתדר לבד גם טוב,@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
משהו מוזר, עשיתי מהתחלה על אותם ספרים (כן החלפתי מגרסה 15 לגרסה 16 שמצורפת למעלה ועכשיו כבר כמעט 3 שעות ורק 5 מתוך 20 נעשו.
גם המדדים בכלל לא במקסימום שלהם.תשאל את @יעקב-מ-פינס איך הוא עושה?
אולי הוא שינה משהו במנהל המשימות?
אולי בהגדרות של כמות הליבות?@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אולי זה בגלל ההגדרה הזו שלא בטוח קיימת בגרסה 15?
מה הקשר לחיפוש?
-
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אחרי שכבר עשיתי פעם אחת יש עניין להשתמש בזה?
אם זה עוזר לך לאוטמציה זה מצוין
אם אתה מסתדר לבד גם טוב,@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
משהו מוזר, עשיתי מהתחלה על אותם ספרים (כן החלפתי מגרסה 15 לגרסה 16 שמצורפת למעלה ועכשיו כבר כמעט 3 שעות ורק 5 מתוך 20 נעשו.
גם המדדים בכלל לא במקסימום שלהם.תשאל את @יעקב-מ-פינס איך הוא עושה?
אולי הוא שינה משהו במנהל המשימות?
אולי בהגדרות של כמות הליבות?אני הגדרתי את המקסימום של הליבות
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אולי זה בגלל ההגדרה הזו שלא בטוח קיימת בגרסה 15?
מה הקשר לחיפוש?
יש 2 אופציות של חיפוש, אולי האופציה הזו היא כבדה יותר
-
@aiib אין שם שתי אופציות של חיפוש אלא רק אחת, דו"ק היטיב.
-
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אם יש סיבה אמיתית להתקין משהו אחר אשמח לדעת
נראה שיש לך גרסה 15. ב16, ככה"נ, הזיהוי יותר טוב, לתחושתי לפחות.
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
למה לא להתייחס? זה לא אומר שזה לא פוענח?
זה אומר שזה פוענח, אך הוא מצא גם תווים שלדעתו הם לא שייכים לשפה שנבחרה. לא אמור להטריד אותך [חוץ מזה שהOCR לא מושלם, אבל זה מה יש].
@אלף-שין אם היה דרך איכשהו לשלב בין חילוץ טקסט לPDF עצמו, זה היה פשוט מושלם!
-
מישהו מוכן להציץ כאן?
https://chatgpt.com/share/67ca277a-c60c-8013-a90a-151d78bcba30 -
@י-פל כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@אלף-שין אם היה דרך איכשהו לשלב בין חילוץ טקסט לPDF עצמו, זה היה פשוט מושלם!
כלומר?
-
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@י-פל כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@אלף-שין אם היה דרך איכשהו לשלב בין חילוץ טקסט לPDF עצמו, זה היה פשוט מושלם!
כלומר?
מישהו [אולי אתה?] הביא אפשרות לחילוץ טקסט ע"י גוגל-לנס, יש עוד כמה אפשרויות קלות ומהירות.
הבעיה, שכל עוד אין לנו דרך לדחוף את הטקסט מאחורי המסמך, זה לא שווה כלום.
ולכן כתבתי, שאם היה דרך, זה היה קל ומושלם.
וע"ז הבאתי את הצ'אט עם GPT, אך אין לי רגע פנוי לבדוק זאת, לילה טוב. -
@י-פל כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@י-פל כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@אלף-שין אם היה דרך איכשהו לשלב בין חילוץ טקסט לPDF עצמו, זה היה פשוט מושלם!
כלומר?
מישהו [אולי אתה?] הביא אפשרות לחילוץ טקסט ע"י גוגל-לנס, יש עוד כמה אפשרויות קלות ומהירות.
הבעיה, שכל עוד אין לנו דרך לדחוף את הטקסט מאחורי המסמך, זה לא שווה כלום.
ולכן כתבתי, שאם היה דרך, זה היה קל ומושלם.
וע"ז הבאתי את הצ'אט עם GPT, אך אין לי רגע פנוי לבדוק זאת, לילה טוב.התוכנות ש @אלף-שין הביא עושות את הפעולה, אתה חושב שגוגל לאנס וכדו' יעשו עבודה יותר טובה אחרי שנצליח לחבר את הטקסט מאחורה?
-
@אלף-שין
@י-פל
מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם, אולי אפשר למצוא את המנוע / תוכנה שאיתה הוא משתמש, ולהפיק מכך תוכנת OCR המדוייקת ביותר בשוק.אמנם זה לא יעזור לכתב רש"י, שעד כמה שידוע לי ABBYY עם הגדרה רק עברית, ועם גופן רש"י שהכי קרוב לקיים בספר, מזוהה בינתיים עם הכי פחות שגיאות.
-
@aiib כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אתה חושב שגוגל לאנס וכדו' יעשו עבודה יותר טובה אחרי שנצליח לחבר את הטקסט מאחורה?
יותר טוב וה-ר-ב-ה יותר מהר!
-
@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם,
קיים באופליין?
-
@אלף-שין כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
מנסיון אישי, בכתב מרובע הזיהוי תווים שבווינדוס 11 עוקף את כל התוכנות למיניהם,
קיים באופליין?
כן.
-
@aiib
@י-פל
תראה את הניסוי שהעלתי לעיל
https://mitmachim.top/topic/80826/היו-שותפים-בפרוייקט-זיהוי-תווים-גדול-וחשוב-מאד/12אתמול המרתי כך 32 דפים אחד אחד
נראה שיש 0 טעויות -
@אמיר כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
תראה את הניסוי שהעלתי לעיל
בדיוק בשביל זה הלכתי לבדוק אם אפשר לחלק את המשימה ל2 - זיהוי טקסט עם LENS, והוספתו לקובץ. בדיוק בגלל הפוסט שלך [והגיט שהביאו שם]!
האם תוכל לנסות את השיטה שהוא הביא לי?
אני ממש לחוץ בזמן. יש לי כמה דברים על הראש כעת, אחרת לא הייתי זורק זאת עליך...
89/113