דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. כללי - עזרה הדדית
  3. להורדה | ספריא מסונן - מסד נתונים של sqlite

להורדה | ספריא מסונן - מסד נתונים של sqlite

מתוזמן נעוץ נעול הועבר כללי - עזרה הדדית
26 פוסטים 12 כותבים 1.7k צפיות 14 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א אהרן

    @sivan22 כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

    בהמשך לפרוייקט של סינון ספריא, אני מעלה כאן קישור למסד הנתונים של ספריא, מסונן, רק עם ספרים בעברית, בפורמט sqlite.

    ניתן להוריד קורא קבצי sqlite מכאן.

    להלן מידע כללי על תוכן מסד הנתונים:

    מספר הספרים הכולל: 5669
    מספר קטעי הטקסט: 2,936,539
    מספר הקישורים בין קטעי טקסט: 2,655,954

    הטבלאות

    • books - הספרים, שמם באנגלית ובעברית, ומידע נוסף.
    • texts - הטסקטים, עם מזהה הספר המקושר לטבלת הספרים, וכן מספור הקטע השורה הדף וכדומה.
    • links - הקישורים בין הטסקטים השונים, מזהה טקסט למזהה טקסט, וכן סוג הקשרים.
    • nodes - מבנה הספר לספרים מורכבים (ראה להלן). וכן מבנים נוספים לספרים שיש להם חלוקה נוספת (כגון חומש לפרשיות, ירושלמי לדפי וילנא ודפי ונציה
    • searchings - אינדקס עבור חיפוש לפי מילים.

    מבנה הספרים בספריא

    חשוב להבין את מבנה הספרים בספריא:

    • ספרים פשוטים - מחולקים לכמה רמות של חלוקה, לדוגמה שס בבלי מחולק לפי עמוד, שורה. רשי על החומש מחולק לפי פרק, פסוק, פירוש. את שמות הקטעים ["פרק", "פסוק"] ניתן למצוא בטבלה books. ואת מספור הקטעים ניתן למצוא בטבלה texts, כאשר level_1 הוא החלוקה הנמוכה ביותר (שורה בגמרא, פירוש ברש"י).
    • ספרים מורכבים - מחולקים לחלקים שונים בספר (הקדמה, על אורח חיים, על חושן משפט, נספח) כאשר כל חלק בספר מחולק לרמות שונות של חלוקה כמו ספר פשוט (לדוגמה ההקדמה מחולקת לפסקאות, על אורח חיים מחולק לסימן, סעיף, סעיף קטן).

    במסד הנתונים מבנה הספר המורכב נמצא בטבלה nodes. לכל טקסט בטבלה texts ששייך לספר מורכב קיים parentNode שהוא מזהה שמשייך אותו לרשומה בטבלה node בה נמצא שם החלק בספר, ולאותה רשומה ישנו גם כן מאפיין parentNode שמשייך אותו לרמה מעליו, עד לרמה הגבוהה ביותר שם parentNode שווה לאפס.

    כמו כן גם לספרים פשוטים קיימים מבנים נוספים של חלוקה, והם מופיעים בטבלה nodes.

    למי שיש פרוייקט השו"ת [29], יש ספרים שקיימים בספריא ולא בשו"ת?

    ד מנותק
    ד מנותק
    דאנציג
    כתב ב נערך לאחרונה על ידי דאנציג
    #17

    @אהרן כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

    למי שיש פרוייקט השו"ת [29], יש ספרים שקיימים בספריא ולא בשו"ת?

    כן!
    כרגע אני לא זוכר את כולם, אבל:

    1. חלק מפרשני מדרש רבה.
    2. כל ספרי הקבלה [חוץ מזוהר הקדוש ופירוש הסולם].
    3. סידורי תפילה ומחזורים סליחות הגדה של פסח, ופרשניה (כן סידור פשוט - אין בפרוייקט השו"ת).

    וישנם עוד כמה ספרים, ואפילו חשובים, אם זה חשוב לך תעדכן אותי, ואני אבדוק.

    תגובה 1 תגובה אחרונה
    1
    • sivan22S sivan22

      @לא-מתייאש כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

      @יעקב11 כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

      @sivan22 סליחה על השאלה, אבל זה יכול לבא לידי שימוש באנדרואיד?

      וודאי, SQLITE זה הבסיס באנדרואיד

      האמת שבדקתי את זה ולמעשה הם לא משתמשים כיום בכלל בsqlite באנדרואיד, אלא בקבצי json כאלו: Genesis.zip

      לכל ספר יש אינדקס, וגם כל הלינקים בתוך המקום שלהם בספר!

      וזה הקובץ שהוא האינדקס הכללי של הספרים: toc.json

      וזה בערך המבנה של הספרייה:
      f1bc7cb0-3811-412c-8c94-fe69e0c6597d-image.png
      f1c23268-7fc2-4db6-9a17-2b212452c30b-image.png

      זאת אומרת בסוף הם משתמשים בnoSQL כי הם בנויים לקבל מהשרת את התוצאות, רק שיש גם אפשרות להוריד את הספריה.

      D מנותק
      D מנותק
      DAVID 3
      כתב נערך לאחרונה על ידי
      #18

      @sivan22 כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

      וזה הקובץ שהוא האינדקס הכללי של הספרים: toc.json

      איך אני יכול לחלץ מתוך הקובץ רק את שמות הספרים בעברית ובאנגלית?
      (אני רוצה ליצור מפתחות וערכים ("עברית": "אנגלית") של כל הספרים במאגר)

      sivan22S תגובה 1 תגובה אחרונה
      0
      • D DAVID 3

        @sivan22 כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

        וזה הקובץ שהוא האינדקס הכללי של הספרים: toc.json

        איך אני יכול לחלץ מתוך הקובץ רק את שמות הספרים בעברית ובאנגלית?
        (אני רוצה ליצור מפתחות וערכים ("עברית": "אנגלית") של כל הספרים במאגר)

        sivan22S מנותק
        sivan22S מנותק
        sivan22
        כתב נערך לאחרונה על ידי sivan22
        #19

        @DAVID-3 כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

        @sivan22 כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

        וזה הקובץ שהוא האינדקס הכללי של הספרים: toc.json

        איך אני יכול לחלץ מתוך הקובץ רק את שמות הספרים בעברית ובאנגלית?
        (אני רוצה ליצור מפתחות וערכים ("עברית": "אנגלית") של כל הספרים במאגר)

        זה אפשרי, אבל לדעתי עדיף שתנסה קודם להשתמש בapi לפי הפירוט כאן: https://developers.sefaria.org/reference/get_api-index

        למעשה תצטרך קוד מיוחד לזה, לדעתי עדיף להשתמש בnode.j. ממש ממליץ לצרף חלק מהjson לבינה מלאכותית, עדיף קלוד, ולבקש קוד מתאים.

        D תגובה 1 תגובה אחרונה
        0
        • sivan22S sivan22

          @DAVID-3 כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

          @sivan22 כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

          וזה הקובץ שהוא האינדקס הכללי של הספרים: toc.json

          איך אני יכול לחלץ מתוך הקובץ רק את שמות הספרים בעברית ובאנגלית?
          (אני רוצה ליצור מפתחות וערכים ("עברית": "אנגלית") של כל הספרים במאגר)

          זה אפשרי, אבל לדעתי עדיף שתנסה קודם להשתמש בapi לפי הפירוט כאן: https://developers.sefaria.org/reference/get_api-index

          למעשה תצטרך קוד מיוחד לזה, לדעתי עדיף להשתמש בnode.j. ממש ממליץ לצרף חלק מהjson לבינה מלאכותית, עדיף קלוד, ולבקש קוד מתאים.

          D מנותק
          D מנותק
          DAVID 3
          כתב נערך לאחרונה על ידי
          #20

          @sivan22 כבר ביקשתי מצ'אט GPT והוא נתן לי קוד שלא הועיל
          זה הקוד
          import json
          import os

          נתיב הקובץ הקיים שסיפקת

          input_file_path = r"C:\Users\DAVID\Downloads\sefaria_books.json"

          יצירת נתיב לתיקיית ההורדות ולשם הקובץ החדש

          downloads_folder = os.path.join(os.path.expanduser("~"), "Downloads")
          output_file_path = os.path.join(downloads_folder, "SEFARIA TTTT.json")

          try:
          # קריאת נתונים מהקובץ הקיים
          with open(input_file_path, 'r', encoding='utf-8') as input_file:
          data = json.load(input_file)

          # עיבוד והדפסת הנתונים
          print("מוציא נתונים מהקובץ:")
          for hebrew, english in data.items():
              print(f"{hebrew}: {english}")
          
          # שמירת הנתונים לקובץ חדש
          with open(output_file_path, 'w', encoding='utf-8') as output_file:
              json.dump(data, output_file, ensure_ascii=False, indent=4)
          
          print(f"הנתונים נשמרו בהצלחה בקובץ החדש: {output_file_path}")
          

          except FileNotFoundError:
          print(f"שגיאה: הקובץ המקורי לא נמצא בנתיב: {input_file_path}")
          except json.JSONDecodeError:
          print("שגיאה: הקובץ המקורי אינו בפורמט JSON תקין.")
          except Exception as e:
          print(f"שגיאה לא צפויה: {e}")
          הרצתי את זה בפייתון
          וזה התוצאה

          ^
          IndentationError: unindent does not match any outer indentation level

          # שמירת הנתונים לקובץ חדש
          with open(output_file_path, 'w', encoding='utf-8') as output_file:
          

          File "<python-input-12>", line 1
          with open(output_file_path, 'w', encoding='utf-8') as output_file:
          IndentationError: unexpected indent

              json.dump(data, output_file, ensure_ascii=False, indent=4)
          

          File "<python-input-13>", line 1
          json.dump(data, output_file, ensure_ascii=False, indent=4)
          IndentationError: unexpected indent

          print(f"הנתונים נשמרו בהצלחה בקובץ החדש: {output_file_path}")
          

          File "<python-input-15>", line 1
          print(f"הנתונים נשמרו בהצלחה בקובץ החדש: {output_file_path}")
          IndentationError: unexpected indent

          except FileNotFoundError:
          File "<python-input-16>", line 1
          except FileNotFoundError:
          ^^^^^^
          SyntaxError: invalid syntax
          print(f"שגיאה: הקובץ המקורי לא נמצא בנתיב: {input_file_path}")
          File "<python-input-17>", line 1
          print(f"שגיאה: הקובץ המקורי לא נמצא בנתיב: {input_file_path}")
          IndentationError: unexpected indent
          except json.JSONDecodeError:
          File "<python-input-18>", line 1
          except json.JSONDecodeError:
          ^^^^^^
          SyntaxError: invalid syntax
          print("שגיאה: הקובץ המקורי אינו בפורמט JSON תקין.")
          File "<python-input-19>", line 1
          print("שגיאה: הקובץ המקורי אינו בפורמט JSON תקין.")
          IndentationError: unexpected indent
          except Exception as e:
          File "<python-input-20>", line 1
          except Exception as e:
          ^^^^^^
          SyntaxError: invalid syntax
          print(f"שגיאה לא צפויה: {e}")
          File "<python-input-21>", line 1
          print(f"שגיאה לא צפויה: {e}")
          IndentationError: unexpected indent

          D תגובה 1 תגובה אחרונה
          0
          • D DAVID 3

            @sivan22 כבר ביקשתי מצ'אט GPT והוא נתן לי קוד שלא הועיל
            זה הקוד
            import json
            import os

            נתיב הקובץ הקיים שסיפקת

            input_file_path = r"C:\Users\DAVID\Downloads\sefaria_books.json"

            יצירת נתיב לתיקיית ההורדות ולשם הקובץ החדש

            downloads_folder = os.path.join(os.path.expanduser("~"), "Downloads")
            output_file_path = os.path.join(downloads_folder, "SEFARIA TTTT.json")

            try:
            # קריאת נתונים מהקובץ הקיים
            with open(input_file_path, 'r', encoding='utf-8') as input_file:
            data = json.load(input_file)

            # עיבוד והדפסת הנתונים
            print("מוציא נתונים מהקובץ:")
            for hebrew, english in data.items():
                print(f"{hebrew}: {english}")
            
            # שמירת הנתונים לקובץ חדש
            with open(output_file_path, 'w', encoding='utf-8') as output_file:
                json.dump(data, output_file, ensure_ascii=False, indent=4)
            
            print(f"הנתונים נשמרו בהצלחה בקובץ החדש: {output_file_path}")
            

            except FileNotFoundError:
            print(f"שגיאה: הקובץ המקורי לא נמצא בנתיב: {input_file_path}")
            except json.JSONDecodeError:
            print("שגיאה: הקובץ המקורי אינו בפורמט JSON תקין.")
            except Exception as e:
            print(f"שגיאה לא צפויה: {e}")
            הרצתי את זה בפייתון
            וזה התוצאה

            ^
            IndentationError: unindent does not match any outer indentation level

            # שמירת הנתונים לקובץ חדש
            with open(output_file_path, 'w', encoding='utf-8') as output_file:
            

            File "<python-input-12>", line 1
            with open(output_file_path, 'w', encoding='utf-8') as output_file:
            IndentationError: unexpected indent

                json.dump(data, output_file, ensure_ascii=False, indent=4)
            

            File "<python-input-13>", line 1
            json.dump(data, output_file, ensure_ascii=False, indent=4)
            IndentationError: unexpected indent

            print(f"הנתונים נשמרו בהצלחה בקובץ החדש: {output_file_path}")
            

            File "<python-input-15>", line 1
            print(f"הנתונים נשמרו בהצלחה בקובץ החדש: {output_file_path}")
            IndentationError: unexpected indent

            except FileNotFoundError:
            File "<python-input-16>", line 1
            except FileNotFoundError:
            ^^^^^^
            SyntaxError: invalid syntax
            print(f"שגיאה: הקובץ המקורי לא נמצא בנתיב: {input_file_path}")
            File "<python-input-17>", line 1
            print(f"שגיאה: הקובץ המקורי לא נמצא בנתיב: {input_file_path}")
            IndentationError: unexpected indent
            except json.JSONDecodeError:
            File "<python-input-18>", line 1
            except json.JSONDecodeError:
            ^^^^^^
            SyntaxError: invalid syntax
            print("שגיאה: הקובץ המקורי אינו בפורמט JSON תקין.")
            File "<python-input-19>", line 1
            print("שגיאה: הקובץ המקורי אינו בפורמט JSON תקין.")
            IndentationError: unexpected indent
            except Exception as e:
            File "<python-input-20>", line 1
            except Exception as e:
            ^^^^^^
            SyntaxError: invalid syntax
            print(f"שגיאה לא צפויה: {e}")
            File "<python-input-21>", line 1
            print(f"שגיאה לא צפויה: {e}")
            IndentationError: unexpected indent

            D מנותק
            D מנותק
            DAVID 3
            כתב נערך לאחרונה על ידי
            #21

            @DAVID-3 בקיצור זה לא עבד
            הצ'אט סיפק לי את הקוד בצורה שונה ושוב לא עבד.
            (אני ממש לא מבין בקוד, אולי באמת לא הרצתי את זה נכון)
            (אגב, אם אפשר לדבר איתך בפרטי לפרט יותר את הצורך המדויק שלי, אשמח.)

            sivan22S תגובה 1 תגובה אחרונה
            0
            • א מנותק
              א מנותק
              איש שלו'
              כתב נערך לאחרונה על ידי
              #22

              שאלת תם,
              מסד הנתונים הדין מאי אהני לן ולחבריא
              אחר שאת כל הטוב אשר נמצא ב'ספריא'
              הביא הרב @sivan22 אל בית ה'אוצריא' ??

              D sivan22S 2 תגובות תגובה אחרונה
              0
              • א איש שלו'

                שאלת תם,
                מסד הנתונים הדין מאי אהני לן ולחבריא
                אחר שאת כל הטוב אשר נמצא ב'ספריא'
                הביא הרב @sivan22 אל בית ה'אוצריא' ??

                D מנותק
                D מנותק
                DAVID 3
                כתב נערך לאחרונה על ידי
                #23

                @איש-שלו י״ל דאיכא דרגיל וניחא ליה בהאי ולא בהאי

                תגובה 1 תגובה אחרונה
                0
                • א איש שלו'

                  שאלת תם,
                  מסד הנתונים הדין מאי אהני לן ולחבריא
                  אחר שאת כל הטוב אשר נמצא ב'ספריא'
                  הביא הרב @sivan22 אל בית ה'אוצריא' ??

                  sivan22S מנותק
                  sivan22S מנותק
                  sivan22
                  כתב נערך לאחרונה על ידי
                  #24

                  @איש-שלו כתב בלהורדה | ספריא מסונן - מסד נתונים של sqlite:

                  שאלת תם,
                  מסד הנתונים הדין מאי אהני לן ולחבריא
                  אחר שאת כל הטוב אשר נמצא ב'ספריא'
                  הביא הרב @sivan22 אל בית ה'אוצריא' ??

                  זה יושב ומחכה ו"לא-מתייאש" שתהיה תוכנה חדשה שבנויה על זה ביום מן הימים.

                  תגובה 1 תגובה אחרונה
                  4
                  • D DAVID 3

                    @DAVID-3 בקיצור זה לא עבד
                    הצ'אט סיפק לי את הקוד בצורה שונה ושוב לא עבד.
                    (אני ממש לא מבין בקוד, אולי באמת לא הרצתי את זה נכון)
                    (אגב, אם אפשר לדבר איתך בפרטי לפרט יותר את הצורך המדויק שלי, אשמח.)

                    sivan22S מנותק
                    sivan22S מנותק
                    sivan22
                    כתב נערך לאחרונה על ידי
                    #25

                    @DAVID-3 יש את כתובת המייל שלי באתר של אוצריא.

                    תגובה 1 תגובה אחרונה
                    0
                    • P מנותק
                      P מנותק
                      pcinfogmach
                      מדריכים
                      כתב נערך לאחרונה על ידי
                      #26

                      יש במסד יותר מידע מממה שיש לך באוצריא היום?
                      למה זה שוקל כל כך הרבה?

                      גמ"ח עזרה וייעוץ בנושאי מחשבים

                      תגובה 1 תגובה אחרונה
                      1

                      • התחברות

                      • אין לך חשבון עדיין? הרשמה

                      • התחברו או הירשמו כדי לחפש.
                      • פוסט ראשון
                        פוסט אחרון
                      0
                      • חוקי הפורום
                      • פופולרי
                      • לא נפתר
                      • משתמשים
                      • חיפוש גוגל בפורום
                      • צור קשר