דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!

בקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
158 פוסטים 20 כותבים 5.5k צפיות 42 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • S shalomke

    hebrew_ocr_system_88d4623b.plan.pdf
    הוספתי לתוכנית חידוד התמונות לפני אימון

    ל מנותק
    ל מנותק
    לומד ומתלמד
    כתב נערך לאחרונה על ידי
    #123

    @shalomke כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

    הדף מוציא שגיאה 403
    גם לי לא נפתח, גם לא בחלוון גלישה בסתר שבדרך כלל מועיל בנטפרי

    תגובה 1 תגובה אחרונה
    1
    • S shalomke

      אתמול ניסיתי להמשיך את התוכנה שבניתי עם הסיגמנטציה
      לפני יומיים גוגל הוציאה תוסף כרום שמזהה כתב יד אבל רק על ידי שרבוט בזמן אמת
      הורדתי את התוסף וחקרתי אותו ולא הצלחתי לבנות משהו דומה על סריקות
      מה שכן אני עובדד עכשיו על תוכנה שתבצע סיגמנטציה לאלפי כתבי יד
      להלן התוכנית מלמעלה:
      התוכנית:

      1. תמונות גולמיות
        ↓
      2. שיפור איכות (denoise, deskew, contrast)
        ↓
      3. חיתוך כל אות בנפרד (contour detection)
        ↓
      4. קיבוץ אותיות דומות (K-Means clustering)
        ↓
      5. תיוג 27 קבוצות בלבד! (אות לכל קבוצה)
        ↓
      6. אימון CNN classifier
        ↓
      7. זיהוי: חיתוך → זיהוי כל אות → הרכבת טקסט
      I מנותק
      I מנותק
      I believe
      כתב נערך לאחרונה על ידי
      #124

      @shalomke כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

      לפני יומיים גוגל הוציאה תוסף כרום שמזהה כתב יד אבל רק על ידי שרבוט בזמן אמת

      יש גם את google keep שמזהה כתב יד בצורה ממש מוצלחת, ואינו מתבסס על זיהוי השרבוט בזמן אמת, אלא על זיהוי הכתב.
      לוחצים על 'הוספת שרבוט', משרבטים, ואז יש אפשרות 'הוספת הטקסט מהתמונה להערה'.
      אבל זה לא בקונספט של תוסף, אז כנראה זה לא יועיל לך עבור הכלי שאתה מפתח...

      א י 2 תגובות תגובה אחרונה
      0
      • I I believe

        @shalomke כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

        לפני יומיים גוגל הוציאה תוסף כרום שמזהה כתב יד אבל רק על ידי שרבוט בזמן אמת

        יש גם את google keep שמזהה כתב יד בצורה ממש מוצלחת, ואינו מתבסס על זיהוי השרבוט בזמן אמת, אלא על זיהוי הכתב.
        לוחצים על 'הוספת שרבוט', משרבטים, ואז יש אפשרות 'הוספת הטקסט מהתמונה להערה'.
        אבל זה לא בקונספט של תוסף, אז כנראה זה לא יועיל לך עבור הכלי שאתה מפתח...

        א מנותק
        א מנותק
        אלף שין
        כתב נערך לאחרונה על ידי
        #125

        @I-believe כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

        ואינו מתבסס על זיהוי השרבוט בזמן אמת, אלא על זיהוי הכתב.

        מי אמר?
        אולי זה נשמר בקובץ?

        המחשב נועד לשרת את האדם ולא האדם את המחשב

        I תגובה 1 תגובה אחרונה
        0
        • I I believe

          @shalomke כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

          לפני יומיים גוגל הוציאה תוסף כרום שמזהה כתב יד אבל רק על ידי שרבוט בזמן אמת

          יש גם את google keep שמזהה כתב יד בצורה ממש מוצלחת, ואינו מתבסס על זיהוי השרבוט בזמן אמת, אלא על זיהוי הכתב.
          לוחצים על 'הוספת שרבוט', משרבטים, ואז יש אפשרות 'הוספת הטקסט מהתמונה להערה'.
          אבל זה לא בקונספט של תוסף, אז כנראה זה לא יועיל לך עבור הכלי שאתה מפתח...

          י מנותק
          י מנותק
          ישיבישער
          כתב נערך לאחרונה על ידי
          #126

          @I-believe כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

          יש גם את google keep שמזהה כתב יד בצורה ממש מוצלחת,

          לא כ"כ מצליח להבין את התוכנה הזו, היא יכולה לזהות כתבי יד בעברית? וזה מזהה באופן מוצלח?

          תגובה 1 תגובה אחרונה
          1
          • א אלף שין

            @I-believe כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

            ואינו מתבסס על זיהוי השרבוט בזמן אמת, אלא על זיהוי הכתב.

            מי אמר?
            אולי זה נשמר בקובץ?

            I מנותק
            I מנותק
            I believe
            כתב נערך לאחרונה על ידי
            #127

            @אלף-שין כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

            מי אמר?
            אולי זה נשמר בקובץ?

            כשמבקשים ממנו להפוך את הטקסט להערה, מתחיל להסתובב שם גלגל כזה, ולכאורה זה נראה שהוא מעבד את השרבוט לאחר הבקשה.

            @ישיבישער כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

            לא כ"כ מצליח להבין את התוכנה הזו, היא יכולה לזהות כתבי יד בעברית? וזה מזהה באופן מוצלח?

            כן, מדובר בכתב יד שאתה כותב בתוך התוכנה, אבל אם תעלה אליה קובץ סרוק של כתב יד, היא כנראה לא תזהה.

            א תגובה 1 תגובה אחרונה
            1
            • I I believe

              @אלף-שין כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

              מי אמר?
              אולי זה נשמר בקובץ?

              כשמבקשים ממנו להפוך את הטקסט להערה, מתחיל להסתובב שם גלגל כזה, ולכאורה זה נראה שהוא מעבד את השרבוט לאחר הבקשה.

              @ישיבישער כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

              לא כ"כ מצליח להבין את התוכנה הזו, היא יכולה לזהות כתבי יד בעברית? וזה מזהה באופן מוצלח?

              כן, מדובר בכתב יד שאתה כותב בתוך התוכנה, אבל אם תעלה אליה קובץ סרוק של כתב יד, היא כנראה לא תזהה.

              א מנותק
              א מנותק
              אלף שין
              כתב נערך לאחרונה על ידי
              #128

              @I-believe כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

              כן, מדובר בכתב יד שאתה כותב בתוך התוכנה, אבל אם תעלה אליה קובץ סרוק של כתב יד, היא כנראה לא תזהה.

              ברור שלא כי זה מזההה את סדר השרבוט
              אין זיהוי כתב יד בעברית נכון לשנה הקרובה

              המחשב נועד לשרת את האדם ולא האדם את המחשב

              I תגובה 1 תגובה אחרונה
              0
              • א אלף שין

                @I-believe כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                כן, מדובר בכתב יד שאתה כותב בתוך התוכנה, אבל אם תעלה אליה קובץ סרוק של כתב יד, היא כנראה לא תזהה.

                ברור שלא כי זה מזההה את סדר השרבוט
                אין זיהוי כתב יד בעברית נכון לשנה הקרובה

                I מנותק
                I מנותק
                I believe
                כתב נערך לאחרונה על ידי
                #129

                @אלף-שין כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                זה מזההה את סדר השרבוט

                כפי שכתבתי, לדעתי היא מזהה את 'מבנה השרבוט', ולא את 'סדר השרבוט'.

                א תגובה 1 תגובה אחרונה
                0
                • י מנותק
                  י מנותק
                  ישיבישער
                  כתב נערך לאחרונה על ידי
                  #130

                  מישהו תכל'ס יודע מה עם הפורייקט שרצו לעשות כאן? יש לזה עדין אחרית ותקווה?

                  תגובה 1 תגובה אחרונה
                  0
                  • I I believe

                    @אלף-שין כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                    זה מזההה את סדר השרבוט

                    כפי שכתבתי, לדעתי היא מזהה את 'מבנה השרבוט', ולא את 'סדר השרבוט'.

                    א מנותק
                    א מנותק
                    אלף שין
                    כתב נערך לאחרונה על ידי
                    #131

                    @I-believe כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                    לדעתי

                    אין שום סיבה להניח כך
                    אם כן היה אפשר להעלות תמונות
                    וגם היו מפרסמים את זה.....

                    המחשב נועד לשרת את האדם ולא האדם את המחשב

                    I תגובה 1 תגובה אחרונה
                    0
                    • א אלף שין

                      @I-believe כתב בבקשה | פיתוח זיהוי כתב יד בעברית יוצא לדרך! בואו והצטרפו!:

                      לדעתי

                      אין שום סיבה להניח כך
                      אם כן היה אפשר להעלות תמונות
                      וגם היו מפרסמים את זה.....

                      I מנותק
                      I מנותק
                      I believe
                      כתב נערך לאחרונה על ידי I believe
                      #132

                      @אלף-שין זה לא אותו דבר. כשמעלים תמונה, או סריקה של הכתב, אין לתוכנה את קווי השרבוט עצמם, אלא היא צריכה לפענח לפי השינויים בגוון הפיקסלים מה מצוייר שם.
                      משא"כ כמשרבטים בתוך התוכנה, התוכנה מקבלת שרבוט חי (Digital Ink), ויכולה לנתח ישירות את מבנה הקו (לא בהכרח את סדר השרבוט).

                      ולכן, גוגל קיפ מזהה ב 100% כתב יד שמשרבטים בתוך התוכנה, אבל כשמעלים צילום או סריקה של כתב יד היא לרוב לא מצליחה, בעברית לפחות - ניסיתי את זה כעת.

                      הנפ"מ מכל זה, שיתכן ואם נצליח לשרבט אצלה את הכתב יד, כפי שניסה @shalomke למעלה, היא כן תזהה, גם אם זה לא יהיה לפי סדר הכתיבה.

                      אבל יכול להיות שאני טועה והתוכנה מזהה גם את סדר השרבוט מתוך השרבוט החי שהיא שמרה, צריך פשוט לנסות להעלות לה שרבוט חי - שנשמר אצלו מבנה השרבוט, בלי הסדר של השרבוט, אני לא ממש יודע איך.

                      א תגובה 1 תגובה אחרונה
                      0
                      • I I believe

                        @אלף-שין זה לא אותו דבר. כשמעלים תמונה, או סריקה של הכתב, אין לתוכנה את קווי השרבוט עצמם, אלא היא צריכה לפענח לפי השינויים בגוון הפיקסלים מה מצוייר שם.
                        משא"כ כמשרבטים בתוך התוכנה, התוכנה מקבלת שרבוט חי (Digital Ink), ויכולה לנתח ישירות את מבנה הקו (לא בהכרח את סדר השרבוט).

                        ולכן, גוגל קיפ מזהה ב 100% כתב יד שמשרבטים בתוך התוכנה, אבל כשמעלים צילום או סריקה של כתב יד היא לרוב לא מצליחה, בעברית לפחות - ניסיתי את זה כעת.

                        הנפ"מ מכל זה, שיתכן ואם נצליח לשרבט אצלה את הכתב יד, כפי שניסה @shalomke למעלה, היא כן תזהה, גם אם זה לא יהיה לפי סדר הכתיבה.

                        אבל יכול להיות שאני טועה והתוכנה מזהה גם את סדר השרבוט מתוך השרבוט החי שהיא שמרה, צריך פשוט לנסות להעלות לה שרבוט חי - שנשמר אצלו מבנה השרבוט, בלי הסדר של השרבוט, אני לא ממש יודע איך.

                        א מנותק
                        א מנותק
                        אלף שין
                        כתב נערך לאחרונה על ידי
                        #133

                        @I-believe
                        אין שום סיבה להניח שיש יכולת זיהוי לפי שירבוט כל עוד שיש הסבר של הסדר....

                        המחשב נועד לשרת את האדם ולא האדם את המחשב

                        תגובה 1 תגובה אחרונה
                        0
                        • S מנותק
                          S מנותק
                          shalomke
                          כתב נערך לאחרונה על ידי
                          #134

                          אני מוכן להקים אתר שיתופי על רנדר שאנשים יאמנו עליו את כתבי היד שלהם ובמקביל יעשו סריקות וניסויים
                          השאלות הם ככה:
                          עולה לי כסף להחזיק שרת, ובטח עם המון תמונות.
                          זה עולה בהמון זמן התעסקות.
                          אני חשבתי לעשות אחד מ2 הדברים:
                          או שמי שישלח לי למייל כתבי יד יקבל גישה למערכת. בכניסה דרך המייל שלו.
                          או שמי שיאמן מספר דפים מסוים על המערכת יקבל אוטומטית גם גישה למערכת המאומנת.
                          ככה כולם ירויחו

                          cfopuserC תגובה 1 תגובה אחרונה
                          2
                          • S shalomke

                            אני מוכן להקים אתר שיתופי על רנדר שאנשים יאמנו עליו את כתבי היד שלהם ובמקביל יעשו סריקות וניסויים
                            השאלות הם ככה:
                            עולה לי כסף להחזיק שרת, ובטח עם המון תמונות.
                            זה עולה בהמון זמן התעסקות.
                            אני חשבתי לעשות אחד מ2 הדברים:
                            או שמי שישלח לי למייל כתבי יד יקבל גישה למערכת. בכניסה דרך המייל שלו.
                            או שמי שיאמן מספר דפים מסוים על המערכת יקבל אוטומטית גם גישה למערכת המאומנת.
                            ככה כולם ירויחו

                            cfopuserC מנותק
                            cfopuserC מנותק
                            cfopuser
                            כתב נערך לאחרונה על ידי
                            #135

                            @shalomke אין לך כסף לאמן מודל בטח לא בגודל שאתה מדבר עליו....

                            S תגובה 1 תגובה אחרונה
                            0
                            • S מנותק
                              S מנותק
                              shalomke
                              כתב נערך לאחרונה על ידי
                              #136

                              אם הם הצליחו (ברמה מסוימת) למה שאני לא אצליח?
                              https://github.com/Lotemn102/HebHTR

                              תגובה 1 תגובה אחרונה
                              0
                              • cfopuserC cfopuser

                                @shalomke אין לך כסף לאמן מודל בטח לא בגודל שאתה מדבר עליו....

                                S מנותק
                                S מנותק
                                shalomke
                                כתב נערך לאחרונה על ידי
                                #137

                                @cfopuser חוץ מזה שלאמן אפשר לוקלית על המחשב, לא?
                                אני מגשש אני באמת לא ברור בענין

                                cfopuserC תגובה 1 תגובה אחרונה
                                0
                                • S מנותק
                                  S מנותק
                                  shalomke
                                  כתב נערך לאחרונה על ידי
                                  #138

                                  אני צריך לנסות באמת את הפרויקט הזה שהבאתי מגיטהאב על האובונטו שיש לי בדוקר
                                  הוא לא פועל על ווינדוס

                                  תגובה 1 תגובה אחרונה
                                  0
                                  • S shalomke

                                    @cfopuser חוץ מזה שלאמן אפשר לוקלית על המחשב, לא?
                                    אני מגשש אני באמת לא ברור בענין

                                    cfopuserC מנותק
                                    cfopuserC מנותק
                                    cfopuser
                                    כתב נערך לאחרונה על ידי cfopuser
                                    #139

                                    @shalomke זה ocr שזה ML ואתה רוצה להשתמש בai ולשניהם אין לך את המחשוב
                                    בטח שלא כדי להשיג תוצאה סבירה + לא נראה לי אתה רוצה או יודע לפתח מודל מאפס.

                                    ככה שכנראה עדיף לך לקחת מודל קיים ולעשות לו fune tuning לעברית לא שאני תלה בזה הרבה תקוות

                                    שים לגודל של התמונות שמשתמשים במאגר שהבאת מה שמצביע על מודל קטן
                                    בנוסף הם לא משתמשים בpytorch ככה שהביצועים לא יהיו ברמה כנראה

                                    תגובה 1 תגובה אחרונה
                                    0
                                    • S מנותק
                                      S מנותק
                                      shalomke
                                      כתב נערך לאחרונה על ידי
                                      #140

                                      אני מדבר רק על פיין טיונינג TensorFlow/Keras
                                      ולאמן לא רק על אותיות אלא גם על מילים ושורות
                                      עם סגימנטציה מאוד מקצועית שמתייגת לקבוצות בצורה מואד מוצלחת

                                      cfopuserC תגובה 1 תגובה אחרונה
                                      0
                                      • S מנותק
                                        S מנותק
                                        shalomke
                                        כתב נערך לאחרונה על ידי
                                        #141

                                        החידוש שלי יהיה אם אני אצליח דבר ראשון להוריד עם התוכנה שלי אתרים שלמים של כתבי יד
                                        ודבר שני לבצע להם סיגמנטציה במספר דקות

                                        תגובה 1 תגובה אחרונה
                                        0
                                        • S shalomke

                                          אני מדבר רק על פיין טיונינג TensorFlow/Keras
                                          ולאמן לא רק על אותיות אלא גם על מילים ושורות
                                          עם סגימנטציה מאוד מקצועית שמתייגת לקבוצות בצורה מואד מוצלחת

                                          cfopuserC מנותק
                                          cfopuserC מנותק
                                          cfopuser
                                          כתב נערך לאחרונה על ידי cfopuser
                                          #142

                                          @shalomke אם תסתכל על מה שהבאת הסגמנטציה שם מאוד בסיסית של פסים קצוות ומעגלים,
                                          ככה שהמודל כנראה לא יעבוד בקביעות ויהיה די איטי לפעמים,
                                          בנוסף המודל משתמש בטכניקות שנחשבות מיושנות (אם לא אפילו פרימטיביות ממה שאני יודע).

                                          תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • פופולרי
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר