בקשת מידע | אני מעוניין לפתוח מסד נתונים בגיטהב - אשמח לעזרה ולהסבר
-
אני רוצה ליצור מסד נתונים בגיטהב שבעצם אני יוכל להפנות אליו מסקירפטים תוספים ואפליקציות אינטרנטיות כמו כל מיני מסדי נתונים שאנחנו מוצאים היום.
העניין הוא כזה:
כל המסד זה קבצי קודש כלומר, חיבורים עיוניים בעברית וחלקם מתובלים גם בארמית ואידיש.
כל התצורה של המסד זה PDF שקיימים אצלי בשלימותם.
ואז אני רוצה להעלות לגיטהב כך שרק בהזכרת המאגר אוטמטית יהיה להם את הכל בראש.
השאלה אם זה רלוונטי.
כמו"כ בגלל שאני לא יכול ליצור מסד נתונים על PDF אני רוצה להמיר הכל לטקסט או COR או מה שעושים באוצריא (לא יודע מה הם עושים- רק שמעתי)
השאלה היא האם זה הגיוני? מדובר בעמוד עם שני עמודות והערות שוליים.
האם אפשר לעשות לו COR ברמה גבוהה? האם אפשרי ליצור כזה מאגר בכלל? האם יש כלים לזה?תודה רבה.
מי שאין לו כח לברבורי שכל:
מדובר על שיחות של הרבי מליובאוויטש יש לזה 40 כרכים כל כרך זה ספר בתורה. בכל שבוע יש בין 2 שיחות ל5 שיחות זה כמות דיי גדולה וככה נראה כל עמוד
אני מתייג את כל מי שיש לו ידע בזה...
@iosi-poli @מישהו12
אגב, אשמח לדעת מה עושים באוצריא והאם יש להם פיתרון לקבצי PDF.וכמו"כ זה לא המקום. אבל אין לי הרשאת כתיבה לתכנות אז אני לא יכול לכתוב שם ...
רוב הקבצים זה קבצים מקוריים עם אופציה לבחירת הטקסט.
כמובן שהכל יהיה עם זכויות יוצרים וכו -
אני רוצה ליצור מסד נתונים בגיטהב שבעצם אני יוכל להפנות אליו מסקירפטים תוספים ואפליקציות אינטרנטיות כמו כל מיני מסדי נתונים שאנחנו מוצאים היום.
העניין הוא כזה:
כל המסד זה קבצי קודש כלומר, חיבורים עיוניים בעברית וחלקם מתובלים גם בארמית ואידיש.
כל התצורה של המסד זה PDF שקיימים אצלי בשלימותם.
ואז אני רוצה להעלות לגיטהב כך שרק בהזכרת המאגר אוטמטית יהיה להם את הכל בראש.
השאלה אם זה רלוונטי.
כמו"כ בגלל שאני לא יכול ליצור מסד נתונים על PDF אני רוצה להמיר הכל לטקסט או COR או מה שעושים באוצריא (לא יודע מה הם עושים- רק שמעתי)
השאלה היא האם זה הגיוני? מדובר בעמוד עם שני עמודות והערות שוליים.
האם אפשר לעשות לו COR ברמה גבוהה? האם אפשרי ליצור כזה מאגר בכלל? האם יש כלים לזה?תודה רבה.
מי שאין לו כח לברבורי שכל:
מדובר על שיחות של הרבי מליובאוויטש יש לזה 40 כרכים כל כרך זה ספר בתורה. בכל שבוע יש בין 2 שיחות ל5 שיחות זה כמות דיי גדולה וככה נראה כל עמוד
אני מתייג את כל מי שיש לו ידע בזה...
@iosi-poli @מישהו12
אגב, אשמח לדעת מה עושים באוצריא והאם יש להם פיתרון לקבצי PDF.וכמו"כ זה לא המקום. אבל אין לי הרשאת כתיבה לתכנות אז אני לא יכול לכתוב שם ...
רוב הקבצים זה קבצים מקוריים עם אופציה לבחירת הטקסט.
כמובן שהכל יהיה עם זכויות יוצרים וכו -
אני רוצה ליצור מסד נתונים בגיטהב שבעצם אני יוכל להפנות אליו מסקירפטים תוספים ואפליקציות אינטרנטיות כמו כל מיני מסדי נתונים שאנחנו מוצאים היום.
העניין הוא כזה:
כל המסד זה קבצי קודש כלומר, חיבורים עיוניים בעברית וחלקם מתובלים גם בארמית ואידיש.
כל התצורה של המסד זה PDF שקיימים אצלי בשלימותם.
ואז אני רוצה להעלות לגיטהב כך שרק בהזכרת המאגר אוטמטית יהיה להם את הכל בראש.
השאלה אם זה רלוונטי.
כמו"כ בגלל שאני לא יכול ליצור מסד נתונים על PDF אני רוצה להמיר הכל לטקסט או COR או מה שעושים באוצריא (לא יודע מה הם עושים- רק שמעתי)
השאלה היא האם זה הגיוני? מדובר בעמוד עם שני עמודות והערות שוליים.
האם אפשר לעשות לו COR ברמה גבוהה? האם אפשרי ליצור כזה מאגר בכלל? האם יש כלים לזה?תודה רבה.
מי שאין לו כח לברבורי שכל:
מדובר על שיחות של הרבי מליובאוויטש יש לזה 40 כרכים כל כרך זה ספר בתורה. בכל שבוע יש בין 2 שיחות ל5 שיחות זה כמות דיי גדולה וככה נראה כל עמוד
אני מתייג את כל מי שיש לו ידע בזה...
@iosi-poli @מישהו12
אגב, אשמח לדעת מה עושים באוצריא והאם יש להם פיתרון לקבצי PDF.וכמו"כ זה לא המקום. אבל אין לי הרשאת כתיבה לתכנות אז אני לא יכול לכתוב שם ...
רוב הקבצים זה קבצים מקוריים עם אופציה לבחירת הטקסט.
כמובן שהכל יהיה עם זכויות יוצרים וכו -
@למה-באתי לא ברור מה אתה רוצה במסד נתונים למה אתה רוצה להגיע
לגבי OCR אפשר ואפשר וזה יכול לצאת יפה מאודאם תצטרך עזרה תעדכן
@975 כתב בבקשת מידע | אני מעוניין לפתוח מסד נתונים בגיטהב - אשמח לעזרה ולהסבר:
@למה-באתי לא ברור מה אתה רוצה במסד נתונים למה אתה רוצה להגיע
לגבי OCR אפשר ואפשר וזה יכול לצאת יפה מאודאם תצטרך עזרה תעדכן
אשמח לעזרה בCOR. באופן ובצורה דיי סיטונאית
-
@975 כתב בבקשת מידע | אני מעוניין לפתוח מסד נתונים בגיטהב - אשמח לעזרה ולהסבר:
@למה-באתי לא ברור מה אתה רוצה במסד נתונים למה אתה רוצה להגיע
לגבי OCR אפשר ואפשר וזה יכול לצאת יפה מאודאם תצטרך עזרה תעדכן
אשמח לעזרה בCOR. באופן ובצורה דיי סיטונאית
-
@975 כתב בבקשת מידע | אני מעוניין לפתוח מסד נתונים בגיטהב - אשמח לעזרה ולהסבר:
@למה-באתי אם יש לך זמן וסבלנות אז תראה כאן או בעוד הרבה מקומות כאן בפורום
אם לא אז תביא למי שעובד בזה הוא יעשה בחצי זמן והרבה מאוד פחות מזה, ולא עולה הרבה.אני לא צריך COR יש לי קבצים חדשים אני רק רוצה שיתורגם לטקסט.
-
@975 כתב בבקשת מידע | אני מעוניין לפתוח מסד נתונים בגיטהב - אשמח לעזרה ולהסבר:
@למה-באתי אם יש לך זמן וסבלנות אז תראה כאן או בעוד הרבה מקומות כאן בפורום
אם לא אז תביא למי שעובד בזה הוא יעשה בחצי זמן והרבה מאוד פחות מזה, ולא עולה הרבה.אני לא צריך COR יש לי קבצים חדשים אני רק רוצה שיתורגם לטקסט.
@למה-באתי כלומר אתה רוצה לחלץ את הטקסט מהקובץ
אז אם השכבת טקסט מתחת לתמונה מדוייקת אז אתה יכול באקרובט לשמור בשם קובץ וורד
ואם השכבה מתחת לא מדוייקת ויש הרבה תיקונים או שהעמודים וההערות מבלבלים הכל, אז הפיתרון הוא על ידי אצוה וחזרנו ל-OCR ולסבלנות רבה - אין הרבה קיצורי דרך -
@למה-באתי כלומר אתה רוצה לחלץ את הטקסט מהקובץ
אז אם השכבת טקסט מתחת לתמונה מדוייקת אז אתה יכול באקרובט לשמור בשם קובץ וורד
ואם השכבה מתחת לא מדוייקת ויש הרבה תיקונים או שהעמודים וההערות מבלבלים הכל, אז הפיתרון הוא על ידי אצוה וחזרנו ל-OCR ולסבלנות רבה - אין הרבה קיצורי דרך@975 כתב בבקשת מידע | אני מעוניין לפתוח מסד נתונים בגיטהב - אשמח לעזרה ולהסבר:
@למה-באתי כלומר אתה רוצה לחלץ את הטקסט מהקובץ
אז אם השכבת טקסט מתחת לתמונה מדוייקת אז אתה יכול באקרובט לשמור בשם קובץ וורד
ואם השכבה מתחת לא מדוייקת ויש הרבה תיקונים או שהעמודים וההערות מבלבלים הכל, אז הפיתרון הוא על ידי אצוה וחזרנו ל-OCR ולסבלנות רבה - אין הרבה קיצורי דרךלא מבין בזה כ"כ..
שלחתי צילו"מ מספויילר תוכל לבדוק למה אתה מתכוון. זה נראלי PDF ממש מקורי. -
@975 כתב בבקשת מידע | אני מעוניין לפתוח מסד נתונים בגיטהב - אשמח לעזרה ולהסבר:
@למה-באתי כלומר אתה רוצה לחלץ את הטקסט מהקובץ
אז אם השכבת טקסט מתחת לתמונה מדוייקת אז אתה יכול באקרובט לשמור בשם קובץ וורד
ואם השכבה מתחת לא מדוייקת ויש הרבה תיקונים או שהעמודים וההערות מבלבלים הכל, אז הפיתרון הוא על ידי אצוה וחזרנו ל-OCR ולסבלנות רבה - אין הרבה קיצורי דרךלא מבין בזה כ"כ..
שלחתי צילו"מ מספויילר תוכל לבדוק למה אתה מתכוון. זה נראלי PDF ממש מקורי.