דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!

בקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
112 פוסטים 15 כותבים 2.5k צפיות 28 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • S מנותק
    S מנותק
    shalomke
    כתב נערך לאחרונה על ידי
    #94

    עכשיו קורסור ביצע בדיקה חדשה:
    הבעיה ברורה:
    הקואורדינטות קטנות מדי! - האנימציה: X: 141-191, Y: 219-229 (טווח זעיר) לעומת ידני: X: 144-706, Y: 63-431 (טווח גדול)
    מעט מדי נקודות! - רק 16 נקודות באנימציה לעומת 27-121 בידני
    הבעיה: הקואורדינטות של ה-SVG המקורי קטנות מדי! Google מצפה לקואורדינטות גדולות יותר. הפתרון: צריך להגדיל את הקואורדינטות שנשלחות ל-Google (לא רק את הציור על המסך):

    א תגובה 1 תגובה אחרונה
    3
    • S shalomke

      עכשיו קורסור ביצע בדיקה חדשה:
      הבעיה ברורה:
      הקואורדינטות קטנות מדי! - האנימציה: X: 141-191, Y: 219-229 (טווח זעיר) לעומת ידני: X: 144-706, Y: 63-431 (טווח גדול)
      מעט מדי נקודות! - רק 16 נקודות באנימציה לעומת 27-121 בידני
      הבעיה: הקואורדינטות של ה-SVG המקורי קטנות מדי! Google מצפה לקואורדינטות גדולות יותר. הפתרון: צריך להגדיל את הקואורדינטות שנשלחות ל-Google (לא רק את הציור על המסך):

      א מנותק
      א מנותק
      אלף שין
      כתב נערך לאחרונה על ידי
      #95

      @shalomke
      שאפו ענק על כל פריצת דרך והתקדמות!
      שיניתי את כותרת השרשור בהתאם להתפתחויות הדרמטיות!

      תגובה 1 תגובה אחרונה
      0
      • S מנותק
        S מנותק
        shalomke
        כתב נערך לאחרונה על ידי
        #96

        אוקיי
        ניסיתי להעלות תמונה גדולה ואכן הוא מזהה את האנימציה של השרבוט
        עכשיו בעיה חדשה
        אני קולט שבשביל להבדיל בין האות יוד לוא"ו הוא צריך להתחשב בגודל של האותיות מסביב
        ואת זה אני עדיין לא קלטתי איך הוא עושה את ההשוואה לאותיות שמסביבו
        מעלה סרטון
        (את המילה בית לא אני משרבט אלא התוכנה על פי קובץ
        שימו לב שהוא מזהה בות כי הוא לא קולט את הגודל של היוד ביחס לבית והת"ו
        הקלטת מסך 2025-12-08 111741.mp4

        תגובה 1 תגובה אחרונה
        0
        • S מנותק
          S מנותק
          shalomke
          כתב נערך לאחרונה על ידי
          #97

          הקלטת מסך 2025-12-08 111741.rar

          תגובה 1 תגובה אחרונה
          1
          • S מנותק
            S מנותק
            shalomke
            כתב נערך לאחרונה על ידי
            #98

            הפתרון שהוא מציע:

            שינוי בתהליך השליחה:
            במקום לשלוח כל קו בנפרד
            נשלח קבוצת קווים (מילה) יחד
            עם הגדלים היחסיים הנכונים

            ב תגובה 1 תגובה אחרונה
            1
            • S shalomke

              הפתרון שהוא מציע:

              שינוי בתהליך השליחה:
              במקום לשלוח כל קו בנפרד
              נשלח קבוצת קווים (מילה) יחד
              עם הגדלים היחסיים הנכונים

              ב מנותק
              ב מנותק
              במה
              כתב נערך לאחרונה על ידי
              #99

              @shalomke כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

              הפתרון שהוא מציע:

              שינוי בתהליך השליחה:
              במקום לשלוח כל קו בנפרד
              נשלח קבוצת קווים (מילה) יחד
              עם הגדלים היחסיים הנכונים

              לא עקבתי אחרי כל התהליך
              אבל אם תהיה לו הבנה של הקשר
              ואתה שולח לו מספר מילים יחד
              זה גם יסייע לו בזיהוי

              תגובה 1 תגובה אחרונה
              0
              • S מנותק
                S מנותק
                shalomke
                כתב נערך לאחרונה על ידי
                #100

                הבעיה הגדולה היא חלוקה לשורות
                והתחלה מסודרת של השרבוט מימין לשמאל וכל שורה בנפרד

                תגובה 1 תגובה אחרונה
                1
                • א אלף שין

                  @975 כתב בבקשה | מי יכול לבקש מגמיני סקריפט שיבצע מהפכה.... פרטים בפנים:

                  כמדומני שיש לי את המודלים האלה

                  אשמח מאד...
                  מאיפה יש לך?

                  9 מנותק
                  9 מנותק
                  975
                  כתב נערך לאחרונה על ידי
                  #101

                  @אלף-שין כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                  אשמח מאד...

                  מצאתי אצלי באחד מהמחשבים תיקיה עם אלפי תמונות של מילים כל מילה תמונה. ומתוייגים בצורה יפה וברורה בתוך קובץ שכתוב בו את המלל שבפנים התמונה וזה יכול לעזור, ובשמחה אני מסכים להביא את זה למי שלוקח את זה לשירות הציבור -שלא על מנת לקבל פרס או תשלום- רק מה אני מבין שאין בזה צורך כי הוא הלך לכיוון אחר.

                  תגובה 1 תגובה אחרונה
                  0
                  • S מנותק
                    S מנותק
                    SBW
                    כתב נערך לאחרונה על ידי SBW
                    #102

                    בשביל כזה פרויקט יש בזה 2 שלבים עיקריים
                    שלב א' - זיהוי גבולות ההטקסט - כלומר שבאמצעות איזה שיטה ספריית קוד או מודל מאומן - יזוהה איזור הטקסט, אם קיימים מספר עמודות וגבולותיהם, יזוהו הגבולות השורות, וגבולות המילים, וגבולות האותיות - כולל ישור הדף לסריקה או כתיבה עקומה. וסדר מימין לשמאל.
                    ברגע שיש את גבולות האותיות ניתן לעבור לשלב ב'.
                    שלב ב' - מודל שיכול לקבל קטל של תמונת אות ותת פלט של איזה אות זה .
                    בשביל לבנות מודל צריך שיהיה דוגמיות מכל סוג צריך כמות של עשרות מכל אות וזה מספיק למודלים טובים.
                    ---בכדי לבנות משהו שיכול לעבוד על מחשב ממוצע של אברייכים - רצוי לבנות מודל שיכול לעבוד בכו סביבה.

                    אחרי השלבים האלו - ניתן לכתוב קוד שיבצע את השלבים בזה אחר זה ויתן פלט - לעשות ממשק נח שיכולים להוסיף דרכו עוד דוגמיות למודל עצמו, וכך מתוך הכתב יד הספציפי שאתה רוצה לפענח יש ממנו דוגמיות במודל, ולכן זה יעבוד בקרוב ל מאת האחוזים על כל כתב יד.
                    [כמו כן ניתן לעשות שיהיה ויזאליזציה ומספור - שתראה את סדר העמודות והשורות והמילים בכל שורה. כך שאם זיהוי הגבולות לא יהיה מדויק תוכל לתקן אותו באמצעות העכבר]


                    לשלב א' ניתן להשתמש אפי' בספריית פיתון OpenCV, [יש עוד ספריות תומכות בפעולות כאלו אבל זה טוב מספיק].
                    לשלב ב' עדיף לבנות מודל לפחות EfficientNet-B0.
                    ויש לציין שיהיה צורך להשתמש בPyTorch או PyQt5 ועוד כלים [לפחות בnumpy torch torchvision matplotlib pandas pyqt5] בכדי להוסיף דיוק
                    [ועדיף שהדוגמית עצמם של האותיות לא יהיו חתוכים במרובע רק בפוליגון]
                    (קל לבנות מודל מדוגמיות שנבנו בתוכנה שמתאימה לבניית דוגמאות לזה - כמו Label Studio (ניתן לעשות שם ממשק נח לעשות תיוג) או אפי' VGG Image Annotator - יש יצוא מסודר ובנוי לזה)
                    [ויש אפשרות לבנות עם TrOCR ואז זה שני השלבים יחד רק צריכים להשתמש בדוגמיות של עברית שקיימות בגיטהב וכדו' ולהתאים לעברית]

                    באם זה לא מובן דיו - תוכל לשאול כל מודל על טקסט זה רק תכתוב לו כך "אני רוצה לבנות תוכנה עם ממשק ידידותי שמתאים לוינדוס - ויעבוד במחשב סטנדרטי באופן מקומי - ויפענח כתב יד בעברית.
                    לפניך איזה תכנית תעזור להבין אותה ואיך ליישם אותה".
                    ותצרף את הנ"ל ותראה פלאים. -תוך כמה שעות זה יהיה בנוי....

                    א תגובה 1 תגובה אחרונה
                    0
                    • 9 975

                      @אלף-שין

                      בינתיים עיין פה

                      S מנותק
                      S מנותק
                      SBW
                      כתב נערך לאחרונה על ידי
                      #103

                      @975
                      כמעט דייקת - מה שצריך באמת זה זה https://huggingface.co/datasets/sivan22/hebrew-handwritten-dataset
                      @sivan22 כבר הכין את זה עם מאות דוגמאות לכל אות

                      ע"ה דכו"עע תגובה 1 תגובה אחרונה
                      0
                      • S SBW

                        @975
                        כמעט דייקת - מה שצריך באמת זה זה https://huggingface.co/datasets/sivan22/hebrew-handwritten-dataset
                        @sivan22 כבר הכין את זה עם מאות דוגמאות לכל אות

                        ע"ה דכו"עע מנותק
                        ע"ה דכו"עע מנותק
                        ע"ה דכו"ע
                        כתב נערך לאחרונה על ידי ע"ה דכו"ע
                        #104

                        @SBW כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                        @975
                        כמעט דייקת - מה שצריך באמת זה זה https://huggingface.co/datasets/sivan22/hebrew-handwritten-dataset
                        @sivan22 כבר הכין את זה עם מאות דוגמאות לכל אות

                        לא נכון, מה שצריך באמת זה את המאגר השני, ואפילו הוא לא מספיק טוב כיוון שהוא לא כולל מעברי שורות.

                        באימון על אותיות יחידות בלבד הרמה תהיה ס"ה כמו לאמן ABBYY על הרבה אותיות, כלומר, לא מידי מדוייק, ולא מתקרב לרמה של למידת מכונה איכותית

                        S תגובה 1 תגובה אחרונה
                        0
                        • S SBW

                          בשביל כזה פרויקט יש בזה 2 שלבים עיקריים
                          שלב א' - זיהוי גבולות ההטקסט - כלומר שבאמצעות איזה שיטה ספריית קוד או מודל מאומן - יזוהה איזור הטקסט, אם קיימים מספר עמודות וגבולותיהם, יזוהו הגבולות השורות, וגבולות המילים, וגבולות האותיות - כולל ישור הדף לסריקה או כתיבה עקומה. וסדר מימין לשמאל.
                          ברגע שיש את גבולות האותיות ניתן לעבור לשלב ב'.
                          שלב ב' - מודל שיכול לקבל קטל של תמונת אות ותת פלט של איזה אות זה .
                          בשביל לבנות מודל צריך שיהיה דוגמיות מכל סוג צריך כמות של עשרות מכל אות וזה מספיק למודלים טובים.
                          ---בכדי לבנות משהו שיכול לעבוד על מחשב ממוצע של אברייכים - רצוי לבנות מודל שיכול לעבוד בכו סביבה.

                          אחרי השלבים האלו - ניתן לכתוב קוד שיבצע את השלבים בזה אחר זה ויתן פלט - לעשות ממשק נח שיכולים להוסיף דרכו עוד דוגמיות למודל עצמו, וכך מתוך הכתב יד הספציפי שאתה רוצה לפענח יש ממנו דוגמיות במודל, ולכן זה יעבוד בקרוב ל מאת האחוזים על כל כתב יד.
                          [כמו כן ניתן לעשות שיהיה ויזאליזציה ומספור - שתראה את סדר העמודות והשורות והמילים בכל שורה. כך שאם זיהוי הגבולות לא יהיה מדויק תוכל לתקן אותו באמצעות העכבר]


                          לשלב א' ניתן להשתמש אפי' בספריית פיתון OpenCV, [יש עוד ספריות תומכות בפעולות כאלו אבל זה טוב מספיק].
                          לשלב ב' עדיף לבנות מודל לפחות EfficientNet-B0.
                          ויש לציין שיהיה צורך להשתמש בPyTorch או PyQt5 ועוד כלים [לפחות בnumpy torch torchvision matplotlib pandas pyqt5] בכדי להוסיף דיוק
                          [ועדיף שהדוגמית עצמם של האותיות לא יהיו חתוכים במרובע רק בפוליגון]
                          (קל לבנות מודל מדוגמיות שנבנו בתוכנה שמתאימה לבניית דוגמאות לזה - כמו Label Studio (ניתן לעשות שם ממשק נח לעשות תיוג) או אפי' VGG Image Annotator - יש יצוא מסודר ובנוי לזה)
                          [ויש אפשרות לבנות עם TrOCR ואז זה שני השלבים יחד רק צריכים להשתמש בדוגמיות של עברית שקיימות בגיטהב וכדו' ולהתאים לעברית]

                          באם זה לא מובן דיו - תוכל לשאול כל מודל על טקסט זה רק תכתוב לו כך "אני רוצה לבנות תוכנה עם ממשק ידידותי שמתאים לוינדוס - ויעבוד במחשב סטנדרטי באופן מקומי - ויפענח כתב יד בעברית.
                          לפניך איזה תכנית תעזור להבין אותה ואיך ליישם אותה".
                          ותצרף את הנ"ל ותראה פלאים. -תוך כמה שעות זה יהיה בנוי....

                          א מנותק
                          א מנותק
                          אלף שין
                          כתב נערך לאחרונה על ידי
                          #105

                          @SBW
                          לא ולא,
                          אין שום ענין שזה יעבוד על מחשב של אברך
                          עיין ערך מודל תמלול של דיקטה שמיועד למחשבי אברכים
                          עדיף שיהיה משהו עוצמתי ומדוייק מאד
                          גם אם זה דורש שרת ויהיה בתשלום מלא [רק פחות מקלדנית כמובן...]
                          טוב ציפור אחת ביד מאשר דימיונות על העץ

                          ע"ה דכו"עע S 2 תגובות תגובה אחרונה
                          0
                          • א אלף שין

                            @SBW
                            לא ולא,
                            אין שום ענין שזה יעבוד על מחשב של אברך
                            עיין ערך מודל תמלול של דיקטה שמיועד למחשבי אברכים
                            עדיף שיהיה משהו עוצמתי ומדוייק מאד
                            גם אם זה דורש שרת ויהיה בתשלום מלא [רק פחות מקלדנית כמובן...]
                            טוב ציפור אחת ביד מאשר דימיונות על העץ

                            ע"ה דכו"עע מנותק
                            ע"ה דכו"עע מנותק
                            ע"ה דכו"ע
                            כתב נערך לאחרונה על ידי
                            #106

                            @אלף-שין כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                            [רק פחות מקלדנית כמובן...]

                            וגם פחות מג'מיני, שאת היכולות שלו לא יצליחו לעקוף.

                            תגובה 1 תגובה אחרונה
                            0
                            • א אלף שין

                              @SBW
                              לא ולא,
                              אין שום ענין שזה יעבוד על מחשב של אברך
                              עיין ערך מודל תמלול של דיקטה שמיועד למחשבי אברכים
                              עדיף שיהיה משהו עוצמתי ומדוייק מאד
                              גם אם זה דורש שרת ויהיה בתשלום מלא [רק פחות מקלדנית כמובן...]
                              טוב ציפור אחת ביד מאשר דימיונות על העץ

                              S מנותק
                              S מנותק
                              SBW
                              כתב נערך לאחרונה על ידי
                              #107

                              @אלף-שין אני מכיר קלדנים שזה מה שהם עושים.
                              וזה עובד יפה מאוד.

                              ע"ה דכו"עע א 2 תגובות תגובה אחרונה
                              0
                              • S SBW

                                @אלף-שין אני מכיר קלדנים שזה מה שהם עושים.
                                וזה עובד יפה מאוד.

                                ע"ה דכו"עע מנותק
                                ע"ה דכו"עע מנותק
                                ע"ה דכו"ע
                                כתב נערך לאחרונה על ידי
                                #108

                                @SBW כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                                @אלף-שין אני מכיר קלדנים שזה מה שהם עושים.
                                וזה עובד יפה מאוד.

                                מה? המודל של דיקטה?

                                S תגובה 1 תגובה אחרונה
                                0
                                • ע"ה דכו"עע ע"ה דכו"ע

                                  @SBW כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                                  @975
                                  כמעט דייקת - מה שצריך באמת זה זה https://huggingface.co/datasets/sivan22/hebrew-handwritten-dataset
                                  @sivan22 כבר הכין את זה עם מאות דוגמאות לכל אות

                                  לא נכון, מה שצריך באמת זה את המאגר השני, ואפילו הוא לא מספיק טוב כיוון שהוא לא כולל מעברי שורות.

                                  באימון על אותיות יחידות בלבד הרמה תהיה ס"ה כמו לאמן ABBYY על הרבה אותיות, כלומר, לא מידי מדוייק, ולא מתקרב לרמה של למידת מכונה איכותית

                                  S מנותק
                                  S מנותק
                                  SBW
                                  כתב נערך לאחרונה על ידי
                                  #109

                                  @ע-ה-דכו-ע
                                  לא מדויק כלל
                                  EfficientNet זה מודל למידת מכונה עמוקה.
                                  תעשה בירור


                                  מודל יעודי הוא עדיף עשרת מונים על מודל שיש לו יכולות נוספות.
                                  במקרה רגיל אימון מודל זה מורכב אבל בשביל 27 אותיות עם כמה סימוני פסיק - לבנות מודל כזה מאפס זה די קל.

                                  ע"ה דכו"עע תגובה 1 תגובה אחרונה
                                  0
                                  • S SBW

                                    @ע-ה-דכו-ע
                                    לא מדויק כלל
                                    EfficientNet זה מודל למידת מכונה עמוקה.
                                    תעשה בירור


                                    מודל יעודי הוא עדיף עשרת מונים על מודל שיש לו יכולות נוספות.
                                    במקרה רגיל אימון מודל זה מורכב אבל בשביל 27 אותיות עם כמה סימוני פסיק - לבנות מודל כזה מאפס זה די קל.

                                    ע"ה דכו"עע מנותק
                                    ע"ה דכו"עע מנותק
                                    ע"ה דכו"ע
                                    כתב נערך לאחרונה על ידי
                                    #110

                                    @SBW כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                                    @ע-ה-דכו-ע
                                    לא מדויק כלל
                                    EfficientNet זה מודל למידת מכונה עמוקה.
                                    תעשה בירור

                                    מדוע זה הופך את מה שאמרתי ללא מדוייק?

                                    תגובה 1 תגובה אחרונה
                                    0
                                    • ע"ה דכו"עע ע"ה דכו"ע

                                      @SBW כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                                      @אלף-שין אני מכיר קלדנים שזה מה שהם עושים.
                                      וזה עובד יפה מאוד.

                                      מה? המודל של דיקטה?

                                      S מנותק
                                      S מנותק
                                      SBW
                                      כתב נערך לאחרונה על ידי
                                      #111

                                      @ע-ה-דכו-ע
                                      לא הם בנו לבד לבד מודל EfficientNet

                                      תגובה 1 תגובה אחרונה
                                      0
                                      • S SBW

                                        @אלף-שין אני מכיר קלדנים שזה מה שהם עושים.
                                        וזה עובד יפה מאוד.

                                        א מנותק
                                        א מנותק
                                        אלף שין
                                        כתב נערך לאחרונה על ידי
                                        #112

                                        @SBW כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                                        @אלף-שין אני מכיר קלדנים שזה מה שהם עושים.
                                        וזה עובד יפה מאוד.

                                        נא לפרט יותר,
                                        וגם איך הם עושים את זה
                                        והאם הם מוכרים את מה שעשו

                                        תגובה 1 תגובה אחרונה
                                        0

                                        • התחברות

                                        • אין לך חשבון עדיין? הרשמה

                                        • התחברו או הירשמו כדי לחפש.
                                        • פוסט ראשון
                                          פוסט אחרון
                                        0
                                        • חוקי הפורום
                                        • פופולרי
                                        • לא נפתר
                                        • משתמשים
                                        • חיפוש גוגל בפורום
                                        • צור קשר