דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. מחשבים וטכנולוגיה
  3. עזרה הדדית - מחשבים וטכנולוגיה
  4. בקשת מידע | OCR בעברית בקרוב? תלוי בכם...

בקשת מידע | OCR בעברית בקרוב? תלוי בכם...

מתוזמן נעוץ נעול הועבר עזרה הדדית - מחשבים וטכנולוגיה
22 פוסטים 9 כותבים 980 צפיות 13 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • sivan22S sivan22

    @10110000 למה לא תשתמש בTRDG? עם פונטים שונים של כתב יד.
    זה מה שאני עשיתי.
    אגב, מה הארכיטקטורה שאתה מתכוון להשתמש בה, TrOCR? כי אם כן, יש לי כבר קוד לזה ואשמח לשתף איתך.

    101100001 מנותק
    101100001 מנותק
    10110000
    כתב ב נערך לאחרונה על ידי
    #21

    @sivan22 כי זה לא יאמן את הAI טוב (האותיות הם אותם אותיות ואין חיבור בין אותיות וכו')

    sivan22S תגובה 1 תגובה אחרונה
    0
    • 101100001 10110000

      @sivan22 כי זה לא יאמן את הAI טוב (האותיות הם אותם אותיות ואין חיבור בין אותיות וכו')

      sivan22S מנותק
      sivan22S מנותק
      sivan22
      כתב ב נערך לאחרונה על ידי
      #22

      @10110000 יש כתבים שנראים יותר אמיתיים מאחרים, ואני מסכים איתך שזה עדיין לא כמו כתב יד ממש, אבל האימון הראשוני לדעתי כדאי להשתמש בזה כי תוכל ליצור דאטה סט עצום שלא תשיג בדרך אחרת (נגיד כמה מיליונים של שורות), ואחר כך תמשיך לכוונן על דאטה סט קטן יותר של כתב יד אמיתי.
      אגב, בנייר האקדמי של TrOCR הם מציינים כי את המודל שמזהה כתב יד באנגלית הם אימנו בהתחלה על אנגלית מודפסת (684 מיליון שורות) ואחר כך אימנו אותו על פונטים של כתב יד מTRDG (כ 17 מיליון שורות מ5427 פונטים), כמו כן הוסיפו 53 אלף מרשמים בכתב יד שפוענחו על ידי כלי OCR מסחריים.
      אבל אל תתייאש מהמספרים! יש עדויות שהצליחו להגיע לתוצאות יפות גם עם הרבה פחות נתונים.

      8f328659-768c-4b2b-82c9-a22382a333e0-image.png

      תגובה 1 תגובה אחרונה
      1

      • התחברות

      • אין לך חשבון עדיין? הרשמה

      • התחברו או הירשמו כדי לחפש.
      • פוסט ראשון
        פוסט אחרון
      0
      • חוקי הפורום
      • פופולרי
      • לא נפתר
      • משתמשים
      • חיפוש גוגל בפורום
      • צור קשר