שיתוף | רוצים להשתמש בקלוד קוד בחינם? כנסו.
-
יש לי מנוי Max של Claude, ובדרך כלל אני לא מנצל את כל המכסה שלו.
אם מישהו עובד על פרויקט רציני וצריך עזרה בבנייה ראשונית של המערכת או באיזה פרומפט רציני (אבל חד פעמי), אתם מוזמנים לפנות אליי פה עם פרומפט מוכן ומסודר של מה שאתם רוצים.
אני אתן את הפרומפט לClaude Code, אעלה לגיטהאב את התוצאה ואשתף אותה איתכם בריפו פרטי.
הבהרה: אני נותן שימוש של פרומפט אחד. הוא יכול להיות מאוד מקיף ויסודי, אבל חד פעמי.המלצה ששווה זהב: קודם תאפיינו את הפרויקט שלכם עם ChatGPT למשל, ואז תנו פה את הפרומפט.
נא לפנות בדברים רציניים בלבד שמצריכים את קלוד קוד ולא סתם איזו תוכנה או תוסף קטנים.
כמו כן, אני שומר לעצמי את הזכות לסרב לכל בקשה על פי שיקול דעתי. -
א אברהם גלסר התייחס לנושא זה
-
יש לי מנוי Max של Claude, ובדרך כלל אני לא מנצל את כל המכסה שלו.
אם מישהו עובד על פרויקט רציני וצריך עזרה בבנייה ראשונית של המערכת או באיזה פרומפט רציני (אבל חד פעמי), אתם מוזמנים לפנות אליי פה עם פרומפט מוכן ומסודר של מה שאתם רוצים.
אני אתן את הפרומפט לClaude Code, אעלה לגיטהאב את התוצאה ואשתף אותה איתכם בריפו פרטי.
הבהרה: אני נותן שימוש של פרומפט אחד. הוא יכול להיות מאוד מקיף ויסודי, אבל חד פעמי.המלצה ששווה זהב: קודם תאפיינו את הפרויקט שלכם עם ChatGPT למשל, ואז תנו פה את הפרומפט.
נא לפנות בדברים רציניים בלבד שמצריכים את קלוד קוד ולא סתם איזו תוכנה או תוסף קטנים.
כמו כן, אני שומר לעצמי את הזכות לסרב לכל בקשה על פי שיקול דעתי. -
יש לי מנוי Max של Claude, ובדרך כלל אני לא מנצל את כל המכסה שלו.
אם מישהו עובד על פרויקט רציני וצריך עזרה בבנייה ראשונית של המערכת או באיזה פרומפט רציני (אבל חד פעמי), אתם מוזמנים לפנות אליי פה עם פרומפט מוכן ומסודר של מה שאתם רוצים.
אני אתן את הפרומפט לClaude Code, אעלה לגיטהאב את התוצאה ואשתף אותה איתכם בריפו פרטי.
הבהרה: אני נותן שימוש של פרומפט אחד. הוא יכול להיות מאוד מקיף ויסודי, אבל חד פעמי.המלצה ששווה זהב: קודם תאפיינו את הפרויקט שלכם עם ChatGPT למשל, ואז תנו פה את הפרומפט.
נא לפנות בדברים רציניים בלבד שמצריכים את קלוד קוד ולא סתם איזו תוכנה או תוסף קטנים.
כמו כן, אני שומר לעצמי את הזכות לסרב לכל בקשה על פי שיקול דעתי.@אברהם-גלסר וואהו, מטורף
כמה זמן חיכיתי שמישהו ירים את הכפפה בנושא.
יש לי פרוייקט קטן לזיהוי כתב רשי ברמה גבוהה מתוך ספר, כלומר סריקת OCR מלאה לכתב רשי.# שדרוג מערכת OCR מקצועית לתמיכה מיטבית בכתבי רש"י
מטרת השדרוג היא להפוך את מנוע ה-OCR למערכת ברמה מחקרית עבור ספרים תורניים, כתבי רש"י, דפוס ישן, צילום לא איכותי, וסריקות מורכבות.
דרישות כלליות
יש לשמור על כל הפונקציונליות הקיימת במערכת.
אין להסיר שום יכולת קיימת.
יש לבצע שדרוג מלא של מנוע ה-OCR בלבד.
זיהוי אוטומטי של סוג הכתב
לפני תחילת הפענוח יש לבצע שלב Classification.
המערכת תזהה:
- כתב רש"י
- דפוס רגיל
- שילוב רש"י ודפוס
- כתב יד ברור
- טקסט מעורב
לכל סוג כתב יש להשתמש בפרומפט OCR שונה.
מצב OCR ייעודי לכתב רש"י
כאשר מזוהה כתב רש"י:
הוראות קריאה
- לקרוא אות אחר אות.
- לא לנחש מילים.
- לא לבצע השלמות אוטומטיות.
- לא לתקן שגיאות כתיב.
- לא להשתמש בהיגיון תחבירי.
- לא להשתמש בהשלמות תלמודיות.
- לא להמיר מילים למונחים מוכרים.
אם מילה אינה ברורה:
-------ולא ניחוש.
מערכת Multi Pass OCR
במקום 4 שלבים:
לבצע 7 שלבים.
Pass 1
קריאה גולמית.
Pass 2
קריאה שנייה עצמאית.
Pass 3
השוואת Pass 1 ו-Pass 2.
Pass 4
חיפוש מילים חסרות.
Pass 5
בדיקת אותיות דומות:
- ב / כ
- ד / ר
- ה / ח
- ו / ז
- י / ו
- ן / ו
Pass 6
בדיקת ראשי תיבות.
Pass 7
אימות סופי מול התמונה המקורית.
OCR לפי אזורים
לפני הקריאה:
לפרק כל עמוד לבלוקים.
לדוגמה:
- כותרת
- גוף טקסט
- הערות שוליים
- ציטוטים
- רש"י בצד
כל בלוק יפוענח בנפרד.
רק לאחר מכן יאוחד למסמך.
Preprocessing מתקדם
לפני שליחת התמונה למודל:
Deskew
יישור דפים עקומים.
Denoise
ניקוי רעשים.
Contrast Enhancement
שיפור ניגודיות.
Adaptive Threshold
הבלטת אותיות חלשות.
Sharpen
חידוד טקסט.
Super Resolution
שיפור רזולוציה אוטומטי.
OCR ברזולוציה גבוהה
בעת חילוץ PDF:
במקום
scale: 2.0להגדיל ל:
scale: 4.0או
scale: 5.0כאשר הזיכרון מאפשר.
מנגנון Anti-Hallucination
אסור למודל:
- להשלים פסוקים.
- להשלים גמרא.
- להשלים ביטויים מוכרים.
- להשלים ראשי תיבות.
- להשלים ציטוטים.
אם הטקסט לא נראה בבירור:
-------
מנגנון Confidence Score
לכל מילה יש לחשב ציון אמינות:
{ "word": "לדוגמה", "confidence": 98 }מתחת ל־85:
לסמן לבדיקה.
מצב Ultra Rashi
להוסיף אפשרות בהגדרות:
Ultra Rashi Modeבמצב זה:
- סריקה איטית יותר.
- 10 מעברי OCR.
- אפס השלמות.
- מקסימום דיוק.
- עדיפות לדיוק על פני מהירות.
תמיכה במסמכים תורניים
אופטימיזציה עבור:
- תלמוד בבלי
- ירושלמי
- רמב"ם
- טור
- בית יוסף
- שו"ע
- משנה ברורה
- שו"ת
- ספרי ראשונים
- ספרי אחרונים
ייצוא מתקדם
להוסיף:
DOCX אמיתי
באמצעות:
docxולא MHTML.
PDF
ייצוא PDF איכותי.
TXT
טקסט בלבד.
JSON
טקסט + ציוני אמינות.
יעד ביצועים
המערכת צריכה להגיע למקסימום דיוק אפשרי עבור:
- כתב רש"י ברור
- ספרים תורניים סרוקים
- דפוס ישן
- מסמכים באיכות בינונית
כאשר היעד המרכזי הוא:
מינימום דילוגי מילים ומינימום הזיות מודל, גם במחיר זמן עיבוד ארוך יותר.
הנוסח הזה מתאים כמשימת שדרוג מלאה עבור Claude Code וייתן לו הוראות ברורות מאוד מה לשנות במערכת הקיימת.
-
יש לי מנוי Max של Claude, ובדרך כלל אני לא מנצל את כל המכסה שלו.
אם מישהו עובד על פרויקט רציני וצריך עזרה בבנייה ראשונית של המערכת או באיזה פרומפט רציני (אבל חד פעמי), אתם מוזמנים לפנות אליי פה עם פרומפט מוכן ומסודר של מה שאתם רוצים.
אני אתן את הפרומפט לClaude Code, אעלה לגיטהאב את התוצאה ואשתף אותה איתכם בריפו פרטי.
הבהרה: אני נותן שימוש של פרומפט אחד. הוא יכול להיות מאוד מקיף ויסודי, אבל חד פעמי.המלצה ששווה זהב: קודם תאפיינו את הפרויקט שלכם עם ChatGPT למשל, ואז תנו פה את הפרומפט.
נא לפנות בדברים רציניים בלבד שמצריכים את קלוד קוד ולא סתם איזו תוכנה או תוסף קטנים.
כמו כן, אני שומר לעצמי את הזכות לסרב לכל בקשה על פי שיקול דעתי.@אברהם-גלסר שלחתי בפרטי (אני פחות מעוניין לפרסם את הקוד)
תודה רבה על כל העזרה (שהייתה ושתבוא) -
@אברהם-גלסר שלחתי בפרטי (אני פחות מעוניין לפרסם את הקוד)
תודה רבה על כל העזרה (שהייתה ושתבוא)@מייבין-במקצת יצא לדרך!
-
@אברהם-גלסר וואהו, מטורף
כמה זמן חיכיתי שמישהו ירים את הכפפה בנושא.
יש לי פרוייקט קטן לזיהוי כתב רשי ברמה גבוהה מתוך ספר, כלומר סריקת OCR מלאה לכתב רשי.# שדרוג מערכת OCR מקצועית לתמיכה מיטבית בכתבי רש"י
מטרת השדרוג היא להפוך את מנוע ה-OCR למערכת ברמה מחקרית עבור ספרים תורניים, כתבי רש"י, דפוס ישן, צילום לא איכותי, וסריקות מורכבות.
דרישות כלליות
יש לשמור על כל הפונקציונליות הקיימת במערכת.
אין להסיר שום יכולת קיימת.
יש לבצע שדרוג מלא של מנוע ה-OCR בלבד.
זיהוי אוטומטי של סוג הכתב
לפני תחילת הפענוח יש לבצע שלב Classification.
המערכת תזהה:
- כתב רש"י
- דפוס רגיל
- שילוב רש"י ודפוס
- כתב יד ברור
- טקסט מעורב
לכל סוג כתב יש להשתמש בפרומפט OCR שונה.
מצב OCR ייעודי לכתב רש"י
כאשר מזוהה כתב רש"י:
הוראות קריאה
- לקרוא אות אחר אות.
- לא לנחש מילים.
- לא לבצע השלמות אוטומטיות.
- לא לתקן שגיאות כתיב.
- לא להשתמש בהיגיון תחבירי.
- לא להשתמש בהשלמות תלמודיות.
- לא להמיר מילים למונחים מוכרים.
אם מילה אינה ברורה:
-------ולא ניחוש.
מערכת Multi Pass OCR
במקום 4 שלבים:
לבצע 7 שלבים.
Pass 1
קריאה גולמית.
Pass 2
קריאה שנייה עצמאית.
Pass 3
השוואת Pass 1 ו-Pass 2.
Pass 4
חיפוש מילים חסרות.
Pass 5
בדיקת אותיות דומות:
- ב / כ
- ד / ר
- ה / ח
- ו / ז
- י / ו
- ן / ו
Pass 6
בדיקת ראשי תיבות.
Pass 7
אימות סופי מול התמונה המקורית.
OCR לפי אזורים
לפני הקריאה:
לפרק כל עמוד לבלוקים.
לדוגמה:
- כותרת
- גוף טקסט
- הערות שוליים
- ציטוטים
- רש"י בצד
כל בלוק יפוענח בנפרד.
רק לאחר מכן יאוחד למסמך.
Preprocessing מתקדם
לפני שליחת התמונה למודל:
Deskew
יישור דפים עקומים.
Denoise
ניקוי רעשים.
Contrast Enhancement
שיפור ניגודיות.
Adaptive Threshold
הבלטת אותיות חלשות.
Sharpen
חידוד טקסט.
Super Resolution
שיפור רזולוציה אוטומטי.
OCR ברזולוציה גבוהה
בעת חילוץ PDF:
במקום
scale: 2.0להגדיל ל:
scale: 4.0או
scale: 5.0כאשר הזיכרון מאפשר.
מנגנון Anti-Hallucination
אסור למודל:
- להשלים פסוקים.
- להשלים גמרא.
- להשלים ביטויים מוכרים.
- להשלים ראשי תיבות.
- להשלים ציטוטים.
אם הטקסט לא נראה בבירור:
-------
מנגנון Confidence Score
לכל מילה יש לחשב ציון אמינות:
{ "word": "לדוגמה", "confidence": 98 }מתחת ל־85:
לסמן לבדיקה.
מצב Ultra Rashi
להוסיף אפשרות בהגדרות:
Ultra Rashi Modeבמצב זה:
- סריקה איטית יותר.
- 10 מעברי OCR.
- אפס השלמות.
- מקסימום דיוק.
- עדיפות לדיוק על פני מהירות.
תמיכה במסמכים תורניים
אופטימיזציה עבור:
- תלמוד בבלי
- ירושלמי
- רמב"ם
- טור
- בית יוסף
- שו"ע
- משנה ברורה
- שו"ת
- ספרי ראשונים
- ספרי אחרונים
ייצוא מתקדם
להוסיף:
DOCX אמיתי
באמצעות:
docxולא MHTML.
PDF
ייצוא PDF איכותי.
TXT
טקסט בלבד.
JSON
טקסט + ציוני אמינות.
יעד ביצועים
המערכת צריכה להגיע למקסימום דיוק אפשרי עבור:
- כתב רש"י ברור
- ספרים תורניים סרוקים
- דפוס ישן
- מסמכים באיכות בינונית
כאשר היעד המרכזי הוא:
מינימום דילוגי מילים ומינימום הזיות מודל, גם במחיר זמן עיבוד ארוך יותר.
הנוסח הזה מתאים כמשימת שדרוג מלאה עבור Claude Code וייתן לו הוראות ברורות מאוד מה לשנות במערכת הקיימת.
-
@יודע-ספר בוצע.
@אברהם-גלסר אלוף עם לב זהב!
-
@אברהם-גלסר אלוף עם לב זהב!
@יודע-ספר כל מילה!
-
@אברהם-גלסר אלוף עם לב זהב!
שלום! נראה שהשיחה הזו מעניינת אותך, אבל עדיין אין לך חשבון.
נמאס לכם לגלול בין אותם הפוסטים בכל ביקור? כשנרשמים לחשבון, תמיד תחזרו בדיוק למקום שבו הייתם קודם, ותוכלו לבחור לקבל התראות על תגובות חדשות (בין אם במייל, ובין אם בהתראת פוש). תוכלו גם לשמור סימניות ולפרגן ב-upvote לפוסטים כדי להביע הערכה לחברי קהילה אחרים.
בעזרת התרומה שלך, הפוסט הזה יכול להיות אפילו טוב יותר 💗
הרשמה התחברות