בירור | OCR לזית, המשך
-
@דאנציג 45 עמודים ברבע שעה, זה קצת ארוך ...
יש לו בעייה עם כתב ריבוע במודל הזה, אבל זה לא נורה, כי זה פרקי אבות, צריך לכתוב סקריפט קטן שמחבר את הפירוש למקור בזית.@לא-מתייאש אין צורך בכלל לעשות את המרובע, רק את הכתב רש"י.
באתר העריכה של אוצריא יעשו את הקודים, וזה כבר יחבר אותו.(אגב, שלחתי לך בדיוק את הספר הזה בפרטי כבר לפני שבוע, לא זכיתי למענה
) -
@לא-מתייאש אין צורך בכלל לעשות את המרובע, רק את הכתב רש"י.
באתר העריכה של אוצריא יעשו את הקודים, וזה כבר יחבר אותו.(אגב, שלחתי לך בדיוק את הספר הזה בפרטי כבר לפני שבוע, לא זכיתי למענה
) -
@לא-מתייאש אין צורך בכלל לעשות את המרובע, רק את הכתב רש"י.
באתר העריכה של אוצריא יעשו את הקודים, וזה כבר יחבר אותו.(אגב, שלחתי לך בדיוק את הספר הזה בפרטי כבר לפני שבוע, לא זכיתי למענה
)באתר העריכה של אוצריא יעשו את הקודים, וזה כבר יחבר אותו.
על הספר הזה אוליי, אבל אחר כך זה יצא אותו לפורמט זית ויחבר אותו אם צריך, אני לא רוצה שיהיה מגע של בן אדם, המטרה שלי זה לעשות 30 ספר ליום ושזה יעלה לי אוליי 100 ש"ח לחודש, ככה אחרי 6 חודשים לזית יהיה יותר ספרים מבר אלין

-
באתר העריכה של אוצריא יעשו את הקודים, וזה כבר יחבר אותו.
על הספר הזה אוליי, אבל אחר כך זה יצא אותו לפורמט זית ויחבר אותו אם צריך, אני לא רוצה שיהיה מגע של בן אדם, המטרה שלי זה לעשות 30 ספר ליום ושזה יעלה לי אוליי 100 ש"ח לחודש, ככה אחרי 6 חודשים לזית יהיה יותר ספרים מבר אלין

-
באתר העריכה של אוצריא יעשו את הקודים, וזה כבר יחבר אותו.
על הספר הזה אוליי, אבל אחר כך זה יצא אותו לפורמט זית ויחבר אותו אם צריך, אני לא רוצה שיהיה מגע של בן אדם, המטרה שלי זה לעשות 30 ספר ליום ושזה יעלה לי אוליי 100 ש"ח לחודש, ככה אחרי 6 חודשים לזית יהיה יותר ספרים מבר אלין

@לא-מתייאש לא הבנתי.
אתה רוצה שכל סריקה של 'מפרש' - תסרוק מחדש גם את המקור שכבר קיים?
מה העניין?
אם תרצה לשלב AI גם בזה, תנסה לאמן אותו להקפיד על הדגשת קטעים, ותיוג נכון של כותרות.
(למשל במקרה זה: פרק ומשנה)
אח"כ החיבור למקור יהיה אוטומטי עם סקריפט. -
לזית יהיה יותר ספרים מבר אלין
יש מספיק ספקים בלי זכויות יוצרים?
@דוד-משה-1 כל היברו בוקס.
ככל וזה ישתפר ויזהה כתב שבור ומזעזע, השמים הם הגבול. -
@לא-מתייאש לא הבנתי.
אתה רוצה שכל סריקה של 'מפרש' - תסרוק מחדש גם את המקור שכבר קיים?
מה העניין?
אם תרצה לשלב AI גם בזה, תנסה לאמן אותו להקפיד על הדגשת קטעים, ותיוג נכון של כותרות.
(למשל במקרה זה: פרק ומשנה)
אח"כ החיבור למקור יהיה אוטומטי עם סקריפט.@לא-מתייאש לא הבנתי.
אתה רוצה שכל סריקה של 'מפרש' - תסרוק מחדש גם את המקור שכבר קיים?
מה העניין?
אם תרצה לשלב AI גם בזה, תנסה לאמן אותו להקפיד על הדגשת קטעים, ותיוג נכון של כותרות.
(למשל במקרה זה: פרק ומשנה)
אח"כ החיבור למקור יהיה אוטומטי עם סקריפט.אני לא הבנתי
-
@דוד-משה-1 כל היברו בוקס.
ככל וזה ישתפר ויזהה כתב שבור ומזעזע, השמים הם הגבול. -
@לא-מתייאש לא הבנתי.
אתה רוצה שכל סריקה של 'מפרש' - תסרוק מחדש גם את המקור שכבר קיים?
מה העניין?
אם תרצה לשלב AI גם בזה, תנסה לאמן אותו להקפיד על הדגשת קטעים, ותיוג נכון של כותרות.
(למשל במקרה זה: פרק ומשנה)
אח"כ החיבור למקור יהיה אוטומטי עם סקריפט.אני לא הבנתי
@לא-מתייאש יש לך ספר, למשל יעבץ על אבות.
אתה רוצה שהוא יהיה מקושר - כל קטע למשנה שהוא הולך עליה.
אין צורך בשביל זה שOCR יפענח את המשניות מלבד הפירוש (=כתב מרובע).
אלא שהוא יזהה רק את הפירוש.
וכל פעם שכתוב פרק א - ישים תגית תואמת לפי ההיררכיה הרגילה (H2)
כל משנה ישים תגית תואמת (H3).
ואז אח"כ ההצמדה לספר המקור שכבר קיים במאגר - יכולה להיות על ידי סקריפט. -
@לא-מתייאש יש לך ספר, למשל יעבץ על אבות.
אתה רוצה שהוא יהיה מקושר - כל קטע למשנה שהוא הולך עליה.
אין צורך בשביל זה שOCR יפענח את המשניות מלבד הפירוש (=כתב מרובע).
אלא שהוא יזהה רק את הפירוש.
וכל פעם שכתוב פרק א - ישים תגית תואמת לפי ההיררכיה הרגילה (H2)
כל משנה ישים תגית תואמת (H3).
ואז אח"כ ההצמדה לספר המקור שכבר קיים במאגר - יכולה להיות על ידי סקריפט.@לא-מתייאש יש לך ספר, למשל יעבץ על אבות.
אתה רוצה שהוא יהיה מקושר - כל קטע למשנה שהוא הולך עליה.
אין צורך בשביל זה שOCR יפענח את המשניות מלבד הפירוש (=כתב מרובע).
אלא שהוא יזהה רק את הפירוש.
וכל פעם שכתוב פרק א - ישים תגית תואמת לפי ההיררכיה הרגילה (H2)
כל משנה ישים תגית תואמת (H3).
ואז אח"כ ההצמדה לספר המקור שכבר קיים במאגר - יכולה להיות על ידי סקריפט.זה לא נכון אבל זה לא משנה, אני יודע איך לקשר את זה בדיוק
-
@לא-מתייאש יש לך ספר, למשל יעבץ על אבות.
אתה רוצה שהוא יהיה מקושר - כל קטע למשנה שהוא הולך עליה.
אין צורך בשביל זה שOCR יפענח את המשניות מלבד הפירוש (=כתב מרובע).
אלא שהוא יזהה רק את הפירוש.
וכל פעם שכתוב פרק א - ישים תגית תואמת לפי ההיררכיה הרגילה (H2)
כל משנה ישים תגית תואמת (H3).
ואז אח"כ ההצמדה לספר המקור שכבר קיים במאגר - יכולה להיות על ידי סקריפט.@צדיק-וטוב-לו-0
הספר הראשון ש @לא-מתייאש העלה כביטוי לניסוי של המודל, הוציא גם את ההיררכיה המתאימה לזית!
כך שמספר לספר המודל רק ישתכלל בלהוציא תוצר מושלם, שיוכל להכנס ישירות לזית...
עבודה עם סקריפטים וכו', זה לא שיטת העבודה המושלמת של @לא-מתייאש שבונה כל דבר מהבסיס שיתאים בדיוק לצרכים, בהבנה מלאה של כל התהליך ושל כל שורת קוד, הוא לא יודע לשחק עם AI כדי לעשות טלאי ולחבר קטעי קוד כדי שזה יעבוד, אלא הוא 'מתכנת'! שבונה כפשוטו מערך של קוד מושלם שמהמסד עד הטפחות בנוי כדי לעשות את מה שהוא רוצה, אבל בצורה הטובה ביותר. -
פירוש היעב"ץ על אבות.
https://beta.hebrewbooks.org/41541
בעמוד 157 מתחיל פירוש 'בית אהרן', כך שלא צריך גם אותו.
אבל זה משלב גם כתב מרובע למעלה, אם זה יעזור.@דאנציג ocr_book_d779ffc8ce5b.zip
זה על המודל הישן אבל יש לו הבנה טובה של הכתב רש"י והוא הוציא פורמט דומה לשל דיקטא, כרגע ההמרה לזית לא עובדת על הספרים שהם פירוש על ספר שהוא כבר קיים במאגר.
אם לא זה לקח 63 דקות, זה ארוך אבל אני אקצר את זה -
@דאנציג ocr_book_d779ffc8ce5b.zip
זה על המודל הישן אבל יש לו הבנה טובה של הכתב רש"י והוא הוציא פורמט דומה לשל דיקטא, כרגע ההמרה לזית לא עובדת על הספרים שהם פירוש על ספר שהוא כבר קיים במאגר.
אם לא זה לקח 63 דקות, זה ארוך אבל אני אקצר את זה -
אם לא זה לקח 63 דקות,
על cpu או gpu?
-
@דאנציג ocr_book_d779ffc8ce5b.zip
זה על המודל הישן אבל יש לו הבנה טובה של הכתב רש"י והוא הוציא פורמט דומה לשל דיקטא, כרגע ההמרה לזית לא עובדת על הספרים שהם פירוש על ספר שהוא כבר קיים במאגר.
אם לא זה לקח 63 דקות, זה ארוך אבל אני אקצר את זה -
@לא-מתייאש
מדהים!
אין לי אפשרות לעמוד בקצב לבדוק את זה...
זה וודאי הרבה יותר מהר מבן אנוש, אמנם יש בזה טעויות, אבל אני משער שבעיקר של כתב מרובע, ובכל מקרה זה הולך ומשתכלל מיום ליום.שה' ישלח ברכה והצלחה בכל מעשה ידיך!!!
-
@דאנציג כן זה עיקר כתב מרובע, המודל הזה לא טוב, אבל זה לא משנה, אני אחבר אותו למקור בזית ואשמור רק את הפירוש
-
אני אחבר אותו למקור בזית
אתה יודע ש @sivan22 עשה mcp, נכון?
-
@לא-מתייאש
כי? אשמח להחכים.
שלום! נראה שהשיחה הזו מעניינת אותך, אבל עדיין אין לך חשבון.
נמאס לכם לגלול בין אותם הפוסטים בכל ביקור? כשנרשמים לחשבון, תמיד תחזרו בדיוק למקום שבו הייתם קודם, ותוכלו לבחור לקבל התראות על תגובות חדשות (בין אם במייל, ובין אם בהתראת פוש). תוכלו גם לשמור סימניות ולפרגן ב-upvote לפוסטים כדי להביע הערכה לחברי קהילה אחרים.
בעזרת התרומה שלך, הפוסט הזה יכול להיות אפילו טוב יותר 💗
הרשמה התחברות