המלצה | OCR תורני - קוד פתוח
-
עוד כלי שאני משחרר לתועלת הציבור בקוד פתוח וגישה חופשית [נדרש להביא מפתח API מהבית] - כלי המרת תמונה לטקסט (OCR), מותאם לחומר תורני, ועם אפשרות נוחה להגהה נוספת אוטומטית.
עם זאת, עדיין מרגיש לי שחסר שיוף בחויית המשתמש ובממשק (UI/UX) ואשמח לפידבק נוסף כדי לעשות את הפינישים הדרושים.
תכונות:
- תומך בקבצי תמונה/פידיאף, גם קבצים מרובים
- ספקים גוגל או קלוד (יש להביא מפתח מהבית)
- גמישות בהגדרת הפרומפט, להתאמה מירבית לסריקה הספציפית.
- תצוגת דף מול דף נוחה
- המשך הגהה באמצעות AI - שוב עם גמישות מלאה בכתיבת ההנחיות לתיקון
- דחייה/קבלה של כל תיקון
- ייצוא לוורד
- הכל נשמר במחשב המקומי, אין שרת
- ניתן להמשיך את העבודה גם לאחר הסגירה
גישה לאתר:
https://sivan22.github.io/llm_ocr/
קוד המקור:
https://github.com/Sivan22/llm_ocr
הדגמה:

-
@אברהם-0 כתב בהמלצה | OCR תורני - קוד פתוח:
@סוד-כמוס איך זה עובד, צריך לשלם לפני כן לקוד API?
@u88 כתב בהמלצה | OCR תורני - קוד פתוח:
אשמח אם יהיה אפשרות גם לגימיני בשכבה החינמית ולא רק לפרו שעולה כסף
תוציאו API חינמי מAISTUDIO

-
@אברהם-0 כתב בהמלצה | OCR תורני - קוד פתוח:
@סוד-כמוס איך זה עובד, צריך לשלם לפני כן לקוד API?
@u88 כתב בהמלצה | OCR תורני - קוד פתוח:
אשמח אם יהיה אפשרות גם לגימיני בשכבה החינמית ולא רק לפרו שעולה כסף
תוציאו API חינמי מAISTUDIO

-
@אברהם-0 כתב בהמלצה | OCR תורני - קוד פתוח:
@סוד-כמוס איך זה עובד, צריך לשלם לפני כן לקוד API?
@u88 כתב בהמלצה | OCR תורני - קוד פתוח:
אשמח אם יהיה אפשרות גם לגימיני בשכבה החינמית ולא רק לפרו שעולה כסף
תוציאו API חינמי מAISTUDIO

-
עוד כלי שאני משחרר לתועלת הציבור בקוד פתוח וגישה חופשית [נדרש להביא מפתח API מהבית] - כלי המרת תמונה לטקסט (OCR), מותאם לחומר תורני, ועם אפשרות נוחה להגהה נוספת אוטומטית.
עם זאת, עדיין מרגיש לי שחסר שיוף בחויית המשתמש ובממשק (UI/UX) ואשמח לפידבק נוסף כדי לעשות את הפינישים הדרושים.
תכונות:
- תומך בקבצי תמונה/פידיאף, גם קבצים מרובים
- ספקים גוגל או קלוד (יש להביא מפתח מהבית)
- גמישות בהגדרת הפרומפט, להתאמה מירבית לסריקה הספציפית.
- תצוגת דף מול דף נוחה
- המשך הגהה באמצעות AI - שוב עם גמישות מלאה בכתיבת ההנחיות לתיקון
- דחייה/קבלה של כל תיקון
- ייצוא לוורד
- הכל נשמר במחשב המקומי, אין שרת
- ניתן להמשיך את העבודה גם לאחר הסגירה
גישה לאתר:
https://sivan22.github.io/llm_ocr/
קוד המקור:
https://github.com/Sivan22/llm_ocr
הדגמה:

-
עוד כלי שאני משחרר לתועלת הציבור בקוד פתוח וגישה חופשית [נדרש להביא מפתח API מהבית] - כלי המרת תמונה לטקסט (OCR), מותאם לחומר תורני, ועם אפשרות נוחה להגהה נוספת אוטומטית.
עם זאת, עדיין מרגיש לי שחסר שיוף בחויית המשתמש ובממשק (UI/UX) ואשמח לפידבק נוסף כדי לעשות את הפינישים הדרושים.
תכונות:
- תומך בקבצי תמונה/פידיאף, גם קבצים מרובים
- ספקים גוגל או קלוד (יש להביא מפתח מהבית)
- גמישות בהגדרת הפרומפט, להתאמה מירבית לסריקה הספציפית.
- תצוגת דף מול דף נוחה
- המשך הגהה באמצעות AI - שוב עם גמישות מלאה בכתיבת ההנחיות לתיקון
- דחייה/קבלה של כל תיקון
- ייצוא לוורד
- הכל נשמר במחשב המקומי, אין שרת
- ניתן להמשיך את העבודה גם לאחר הסגירה
גישה לאתר:
https://sivan22.github.io/llm_ocr/
קוד המקור:
https://github.com/Sivan22/llm_ocr
הדגמה:

-
@sivan22 ממש נפלא.
יש לפעמים שהוא לא מבין מילים אז הוא מנסה להמציא לפי ההקשר היאך אני מגדיר שיצמד למה שכתוב בלבד. -
@sivan22 האם ניתן להעלות סםר שלם והוא יסרוק את כולו בבא או זאז ויחזיר הכל
כי בדרכ הוא לא עונה תשובות ארוכות השאלה אם זה תוכנן שיענה חלק חלק והתוכנה האתר תחבר את הכל לקובץ אחד