המלצה | OCR תורני - קוד פתוח
-
עוד כלי שאני משחרר לתועלת הציבור בקוד פתוח וגישה חופשית [נדרש להביא מפתח API מהבית] - כלי המרת תמונה לטקסט (OCR), מותאם לחומר תורני, ועם אפשרות נוחה להגהה נוספת אוטומטית.
עם זאת, עדיין מרגיש לי שחסר שיוף בחויית המשתמש ובממשק (UI/UX) ואשמח לפידבק נוסף כדי לעשות את הפינישים הדרושים.
תכונות:
- תומך בקבצי תמונה/פידיאף, גם קבצים מרובים
- ספקים גוגל או קלוד (יש להביא מפתח מהבית)
- גמישות בהגדרת הפרומפט, להתאמה מירבית לסריקה הספציפית.
- תצוגת דף מול דף נוחה
- המשך הגהה באמצעות AI - שוב עם גמישות מלאה בכתיבת ההנחיות לתיקון
- דחייה/קבלה של כל תיקון
- ייצוא לוורד
- הכל נשמר במחשב המקומי, אין שרת
- ניתן להמשיך את העבודה גם לאחר הסגירה
גישה לאתר:
https://sivan22.github.io/llm_ocr/
קוד המקור:
https://github.com/Sivan22/llm_ocr
הדגמה:

-
@sivan22 ממש נפלא.
יש לפעמים שהוא לא מבין מילים אז הוא מנסה להמציא לפי ההקשר היאך אני מגדיר שיצמד למה שכתוב בלבד. -
@sivan22 האם ניתן להעלות סםר שלם והוא יסרוק את כולו בבא או זאז ויחזיר הכל
כי בדרכ הוא לא עונה תשובות ארוכות השאלה אם זה תוכנן שיענה חלק חלק והתוכנה האתר תחבר את הכל לקובץ אחד -
@sivan22 האם ניתן להעלות סםר שלם והוא יסרוק את כולו בבא או זאז ויחזיר הכל
כי בדרכ הוא לא עונה תשובות ארוכות השאלה אם זה תוכנן שיענה חלק חלק והתוכנה האתר תחבר את הכל לקובץ אחד@חד-בדרא-השני כתב בהמלצה | OCR תורני - קוד פתוח:
@sivan22 האם ניתן להעלות סםר שלם והוא יסרוק את כולו בבא או זאז ויחזיר הכל
כי בדרכ הוא לא עונה תשובות ארוכות השאלה אם זה תוכנן שיענה חלק חלק והתוכנה האתר תחבר את הכל לקובץ אחדהתשובה היא כן, כולל ייצוא לוורד ותמיכה בהערות שוליים.
-
לכל המבקשים, הוספתי אפשרות למודלים החינמיים של גוגל - flash-lite-3.1 וכן המודל הישן יותר flash-2-5
כמובן שהאיכות לא מתקרבת, אבל לפחות אפשר לנסות. בטקסטים קצרים וברורים זה עלול אפילו להיות סביר.