בקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!
-
@SBW
לא ולא,
אין שום ענין שזה יעבוד על מחשב של אברך
עיין ערך מודל תמלול של דיקטה שמיועד למחשבי אברכים
עדיף שיהיה משהו עוצמתי ומדוייק מאד
גם אם זה דורש שרת ויהיה בתשלום מלא [רק פחות מקלדנית כמובן...]
טוב ציפור אחת ביד מאשר דימיונות על העץ -
@SBW כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:
@975
כמעט דייקת - מה שצריך באמת זה זה https://huggingface.co/datasets/sivan22/hebrew-handwritten-dataset
@sivan22 כבר הכין את זה עם מאות דוגמאות לכל אותלא נכון, מה שצריך באמת זה את המאגר השני, ואפילו הוא לא מספיק טוב כיוון שהוא לא כולל מעברי שורות.
באימון על אותיות יחידות בלבד הרמה תהיה ס"ה כמו לאמן ABBYY על הרבה אותיות, כלומר, לא מידי מדוייק, ולא מתקרב לרמה של למידת מכונה איכותית
@ע-ה-דכו-ע
לא מדויק כלל
EfficientNet זה מודל למידת מכונה עמוקה.
תעשה בירור
מודל יעודי הוא עדיף עשרת מונים על מודל שיש לו יכולות נוספות.
במקרה רגיל אימון מודל זה מורכב אבל בשביל 27 אותיות עם כמה סימוני פסיק - לבנות מודל כזה מאפס זה די קל. -
@ע-ה-דכו-ע
לא מדויק כלל
EfficientNet זה מודל למידת מכונה עמוקה.
תעשה בירור
מודל יעודי הוא עדיף עשרת מונים על מודל שיש לו יכולות נוספות.
במקרה רגיל אימון מודל זה מורכב אבל בשביל 27 אותיות עם כמה סימוני פסיק - לבנות מודל כזה מאפס זה די קל.@SBW כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:
@ע-ה-דכו-ע
לא מדויק כלל
EfficientNet זה מודל למידת מכונה עמוקה.
תעשה בירורמדוע זה הופך את מה שאמרתי ללא מדוייק?
-
@SBW כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:
@אלף-שין אני מכיר קלדנים שזה מה שהם עושים.
וזה עובד יפה מאוד.מה? המודל של דיקטה?
@ע-ה-דכו-ע
לא הם בנו לבד לבד מודל EfficientNet -
@אלף-שין
האם יש חדש בנושא ?
אני עוקב, וכבר זמן רב שאין התקדמות
יצויין, אין לי מה לתרום, כיון שאיני מבין כלל בנושא, אבל יש לי צורך בכך.
אשמח לעדכון -
@אלף-שין
האם יש חדש בנושא ?
אני עוקב, וכבר זמן רב שאין התקדמות
יצויין, אין לי מה לתרום, כיון שאיני מבין כלל בנושא, אבל יש לי צורך בכך.
אשמח לעדכון -
אני מציע שאני אקים שרת שבו כל אחד יכול להעלות את כתב ידו
תהיה אפשרות לחלוקה אוטומטית ותיוג אוטומטי של אותיות לקבוצות
המשתמש יצטרך לענות על כל קבוצה איזו אות היא וכך המודל ישתפר לאט לאט
את הקוד אני אפרסם בגיטהאב
אני רק צריך לחשוב על פתרון היכן לאחסן את הדאטה בייס
מבלי שאני אצטרך לשלם עליו
בסופו של דבר התוכנה תהיה פתוחה לציבור -
hebrew_ocr_system_88d4623b.plan.pdf
הציבור מוזמן לקרוא את התוכנית ולהציע שינויים -
hebrew_ocr_system_88d4623b.plan.pdf
הוספתי לתוכנית חידוד התמונות לפני אימון -
hebrew_ocr_system_88d4623b.plan.pdf
הוספתי לתוכנית חידוד התמונות לפני אימון -
hebrew_ocr_system_88d4623b.plan.pdf
הוספתי לתוכנית חידוד התמונות לפני אימון -
@shalomke כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:
hebrew_ocr_system_88d4623b.plan.pdf
הוספתי לתוכנית חידוד התמונות לפני אימוןזה לא נפתח לי, אולי הבעיה בנטפרי.
-
@ע-ה-דכו-ע כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:
תגדיר בהגדרות סינון בנטפרי שלא יהיה אזהרה על שיבוש קבצים
אני על סינון של משהו אחר, ולכן אני לא יכול לשנות את הגדרות הסינון, מה הבעיה להעלות את הקובץ הזה לפורום?
-
אני מציע שאני אקים שרת שבו כל אחד יכול להעלות את כתב ידו
תהיה אפשרות לחלוקה אוטומטית ותיוג אוטומטי של אותיות לקבוצות
המשתמש יצטרך לענות על כל קבוצה איזו אות היא וכך המודל ישתפר לאט לאט
את הקוד אני אפרסם בגיטהאב
אני רק צריך לחשוב על פתרון היכן לאחסן את הדאטה בייס
מבלי שאני אצטרך לשלם עליו
בסופו של דבר התוכנה תהיה פתוחה לציבור@shalomke בכל אופן, עם ישראל עומד מאחוריך , אם זה יצליח והלוואי שזה יצליח זה יהיה אחד המהפכות הכי חזקות והכי רציניות בעולם התורה, זה פשוט יעשה הסטוריה, רק לשם המחשה היום סיפרתי לכמה חברים שעובדים על כזו תוכנה, אתה צריך לראות את ההתרגשות שהייתה בקרב הקהל על זה, אתה חייב, אבל חייב להצליח!!!!
-
hebrew_ocr_system_88d4623b.plan.pdf
הוספתי לתוכנית חידוד התמונות לפני אימון@shalomke כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:
הדף מוציא שגיאה 403
גם לי לא נפתח, גם לא בחלוון גלישה בסתר שבדרך כלל מועיל בנטפרי