בירור | OCR לזית, המשך
-
@לא-מתייאש לא הבנתי.
אתה רוצה שכל סריקה של 'מפרש' - תסרוק מחדש גם את המקור שכבר קיים?
מה העניין?
אם תרצה לשלב AI גם בזה, תנסה לאמן אותו להקפיד על הדגשת קטעים, ותיוג נכון של כותרות.
(למשל במקרה זה: פרק ומשנה)
אח"כ החיבור למקור יהיה אוטומטי עם סקריפט.@לא-מתייאש לא הבנתי.
אתה רוצה שכל סריקה של 'מפרש' - תסרוק מחדש גם את המקור שכבר קיים?
מה העניין?
אם תרצה לשלב AI גם בזה, תנסה לאמן אותו להקפיד על הדגשת קטעים, ותיוג נכון של כותרות.
(למשל במקרה זה: פרק ומשנה)
אח"כ החיבור למקור יהיה אוטומטי עם סקריפט.אני לא הבנתי
-
@דוד-משה-1 כל היברו בוקס.
ככל וזה ישתפר ויזהה כתב שבור ומזעזע, השמים הם הגבול. -
@לא-מתייאש לא הבנתי.
אתה רוצה שכל סריקה של 'מפרש' - תסרוק מחדש גם את המקור שכבר קיים?
מה העניין?
אם תרצה לשלב AI גם בזה, תנסה לאמן אותו להקפיד על הדגשת קטעים, ותיוג נכון של כותרות.
(למשל במקרה זה: פרק ומשנה)
אח"כ החיבור למקור יהיה אוטומטי עם סקריפט.אני לא הבנתי
@לא-מתייאש יש לך ספר, למשל יעבץ על אבות.
אתה רוצה שהוא יהיה מקושר - כל קטע למשנה שהוא הולך עליה.
אין צורך בשביל זה שOCR יפענח את המשניות מלבד הפירוש (=כתב מרובע).
אלא שהוא יזהה רק את הפירוש.
וכל פעם שכתוב פרק א - ישים תגית תואמת לפי ההיררכיה הרגילה (H2)
כל משנה ישים תגית תואמת (H3).
ואז אח"כ ההצמדה לספר המקור שכבר קיים במאגר - יכולה להיות על ידי סקריפט. -
@לא-מתייאש יש לך ספר, למשל יעבץ על אבות.
אתה רוצה שהוא יהיה מקושר - כל קטע למשנה שהוא הולך עליה.
אין צורך בשביל זה שOCR יפענח את המשניות מלבד הפירוש (=כתב מרובע).
אלא שהוא יזהה רק את הפירוש.
וכל פעם שכתוב פרק א - ישים תגית תואמת לפי ההיררכיה הרגילה (H2)
כל משנה ישים תגית תואמת (H3).
ואז אח"כ ההצמדה לספר המקור שכבר קיים במאגר - יכולה להיות על ידי סקריפט.@לא-מתייאש יש לך ספר, למשל יעבץ על אבות.
אתה רוצה שהוא יהיה מקושר - כל קטע למשנה שהוא הולך עליה.
אין צורך בשביל זה שOCR יפענח את המשניות מלבד הפירוש (=כתב מרובע).
אלא שהוא יזהה רק את הפירוש.
וכל פעם שכתוב פרק א - ישים תגית תואמת לפי ההיררכיה הרגילה (H2)
כל משנה ישים תגית תואמת (H3).
ואז אח"כ ההצמדה לספר המקור שכבר קיים במאגר - יכולה להיות על ידי סקריפט.זה לא נכון אבל זה לא משנה, אני יודע איך לקשר את זה בדיוק
-
@לא-מתייאש יש לך ספר, למשל יעבץ על אבות.
אתה רוצה שהוא יהיה מקושר - כל קטע למשנה שהוא הולך עליה.
אין צורך בשביל זה שOCR יפענח את המשניות מלבד הפירוש (=כתב מרובע).
אלא שהוא יזהה רק את הפירוש.
וכל פעם שכתוב פרק א - ישים תגית תואמת לפי ההיררכיה הרגילה (H2)
כל משנה ישים תגית תואמת (H3).
ואז אח"כ ההצמדה לספר המקור שכבר קיים במאגר - יכולה להיות על ידי סקריפט.@צדיק-וטוב-לו-0
הספר הראשון ש @לא-מתייאש העלה כביטוי לניסוי של המודל, הוציא גם את ההיררכיה המתאימה לזית!
כך שמספר לספר המודל רק ישתכלל בלהוציא תוצר מושלם, שיוכל להכנס ישירות לזית...
עבודה עם סקריפטים וכו', זה לא שיטת העבודה המושלמת של @לא-מתייאש שבונה כל דבר מהבסיס שיתאים בדיוק לצרכים, בהבנה מלאה של כל התהליך ושל כל שורת קוד, הוא לא יודע לשחק עם AI כדי לעשות טלאי ולחבר קטעי קוד כדי שזה יעבוד, אלא הוא 'מתכנת'! שבונה כפשוטו מערך של קוד מושלם שמהמסד עד הטפחות בנוי כדי לעשות את מה שהוא רוצה, אבל בצורה הטובה ביותר. -
פירוש היעב"ץ על אבות.
https://beta.hebrewbooks.org/41541
בעמוד 157 מתחיל פירוש 'בית אהרן', כך שלא צריך גם אותו.
אבל זה משלב גם כתב מרובע למעלה, אם זה יעזור.@דאנציג ocr_book_d779ffc8ce5b.zip
זה על המודל הישן אבל יש לו הבנה טובה של הכתב רש"י והוא הוציא פורמט דומה לשל דיקטא, כרגע ההמרה לזית לא עובדת על הספרים שהם פירוש על ספר שהוא כבר קיים במאגר.
אם לא זה לקח 63 דקות, זה ארוך אבל אני אקצר את זה -
@דאנציג ocr_book_d779ffc8ce5b.zip
זה על המודל הישן אבל יש לו הבנה טובה של הכתב רש"י והוא הוציא פורמט דומה לשל דיקטא, כרגע ההמרה לזית לא עובדת על הספרים שהם פירוש על ספר שהוא כבר קיים במאגר.
אם לא זה לקח 63 דקות, זה ארוך אבל אני אקצר את זה -
אם לא זה לקח 63 דקות,
על cpu או gpu?
-
@דאנציג ocr_book_d779ffc8ce5b.zip
זה על המודל הישן אבל יש לו הבנה טובה של הכתב רש"י והוא הוציא פורמט דומה לשל דיקטא, כרגע ההמרה לזית לא עובדת על הספרים שהם פירוש על ספר שהוא כבר קיים במאגר.
אם לא זה לקח 63 דקות, זה ארוך אבל אני אקצר את זה -
@לא-מתייאש
מדהים!
אין לי אפשרות לעמוד בקצב לבדוק את זה...
זה וודאי הרבה יותר מהר מבן אנוש, אמנם יש בזה טעויות, אבל אני משער שבעיקר של כתב מרובע, ובכל מקרה זה הולך ומשתכלל מיום ליום.שה' ישלח ברכה והצלחה בכל מעשה ידיך!!!
-
@דאנציג כן זה עיקר כתב מרובע, המודל הזה לא טוב, אבל זה לא משנה, אני אחבר אותו למקור בזית ואשמור רק את הפירוש
-
אני אחבר אותו למקור בזית
אתה יודע ש @sivan22 עשה mcp, נכון?
-
@לא-מתייאש
כי? אשמח להחכים. -
יהיה לזית ב"ה גם צורת הדף אמיתית בלי PDF בזכות המודל הזה :), אני לא יודע אם זה יהיה ב0.6 אבל זה וודאי בתיכנון
-
בשורה משמחת מאוד!!!
ישנם דברים שצורת הדף מאוד חשובה - והחשוב שבהם ש"ס.
איש טוב - מבשר טוב!!!
-
@לא-מתייאש במפרשי האוצר של אוצר החכמה יש כן משהו כזה [אמנם הפורמט שלהם הוא לא PDF אבל הוא גם לא טקסט]
-
@לא-מתייאש במפרשי האוצר של אוצר החכמה יש כן משהו כזה [אמנם הפורמט שלהם הוא לא PDF אבל הוא גם לא טקסט]
@לא-מתייאש במפרשי האוצר של אוצר החכמה יש כן משהו כזה [אמנם הפורמט שלהם הוא לא PDF אבל הוא גם לא טקסט]
לא מכיר
-
@לא-מתייאש במפרשי האוצר של אוצר החכמה יש כן משהו כזה [אמנם הפורמט שלהם הוא לא PDF אבל הוא גם לא טקסט]
לא מכיר
לא מכיר
https://tablet.otzar.org/#/b/173917/p/11/t/1708426290386/fs/0/start/0/end/0/c/1783278433648
תלחץ על קטע בגמרא / רש"י / תוספות.
שלום! נראה שהשיחה הזו מעניינת אותך, אבל עדיין אין לך חשבון.
נמאס לכם לגלול בין אותם הפוסטים בכל ביקור? כשנרשמים לחשבון, תמיד תחזרו בדיוק למקום שבו הייתם קודם, ותוכלו לבחור לקבל התראות על תגובות חדשות (בין אם במייל, ובין אם בהתראת פוש). תוכלו גם לשמור סימניות ולפרגן ב-upvote לפוסטים כדי להביע הערכה לחברי קהילה אחרים.
בעזרת התרומה שלך, הפוסט הזה יכול להיות אפילו טוב יותר 💗
הרשמה התחברות
