דילוג לתוכן
  • חוקי הפורום
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. מחשבים וטכנולוגיה
  3. עזרה הדדית - מחשבים וטכנולוגיה
  4. בקשת מידע | השוואה בין קבצים על בסיס פונקציית Hash

בקשת מידע | השוואה בין קבצים על בסיס פונקציית Hash

מתוזמן נעוץ נעול הועבר עזרה הדדית - מחשבים וטכנולוגיה
8 פוסטים 4 כותבים 203 צפיות 2 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • ס מנותק
    ס מנותק
    סקרן 0
    כתב ב נערך לאחרונה על ידי
    #1

    כמו חובבי מוזיקה חרדים רבים, שאין להם גישה לאפליקציות סטרימינג כמו ספוטיפיי וכדו', אני אוגר מוזיקה במחשב האישי שלי. אני בטוח שכל אחד שהכניס כמה שירים למחשב/נגן וכדו' נתקל בבעיה של קבצים כפולים, שאין דרך מסודרת לדעת ולמחוק אותם, כיון שהם תחת שמות שונים (או איזה ג'יבריש אחרי שהורידו אותם מטלגרם😒). אז כמובן שאפשר להשוות דרך המטא דאטה וכדו' אבל זה ג"כ לא מספיק.
    לאחרונה הבנתי שיש אפשרות להוציא פונקציית Hash על קובץ, כך שרק קובץ זהה לו מבחינת התוכן יביא פלט זהה לפונקציה, וממילא השאלה היא האם יש תוכנה/דרך נוחה אחרת שעושה את זה?
    ראיתי כאן שדנו בזה ולא הצלחתי להבין כלום.
    לכאורה זה נשמע ממש פשוט, תוכנה שעוברת על כל הקבצים בתיקיה/ות, משווה את ה Hash שלהם ומציעה למחוק אחד מהם... לא?
    אשמח לקבל מידע ואני בטוח שיש כאן עוד רבים שהנושא הזה מציק להם 😉
    תודה רבה

    dfhzrhreeD מ י 3 תגובות תגובה אחרונה
    1
    • ס סקרן 0

      כמו חובבי מוזיקה חרדים רבים, שאין להם גישה לאפליקציות סטרימינג כמו ספוטיפיי וכדו', אני אוגר מוזיקה במחשב האישי שלי. אני בטוח שכל אחד שהכניס כמה שירים למחשב/נגן וכדו' נתקל בבעיה של קבצים כפולים, שאין דרך מסודרת לדעת ולמחוק אותם, כיון שהם תחת שמות שונים (או איזה ג'יבריש אחרי שהורידו אותם מטלגרם😒). אז כמובן שאפשר להשוות דרך המטא דאטה וכדו' אבל זה ג"כ לא מספיק.
      לאחרונה הבנתי שיש אפשרות להוציא פונקציית Hash על קובץ, כך שרק קובץ זהה לו מבחינת התוכן יביא פלט זהה לפונקציה, וממילא השאלה היא האם יש תוכנה/דרך נוחה אחרת שעושה את זה?
      ראיתי כאן שדנו בזה ולא הצלחתי להבין כלום.
      לכאורה זה נשמע ממש פשוט, תוכנה שעוברת על כל הקבצים בתיקיה/ות, משווה את ה Hash שלהם ומציעה למחוק אחד מהם... לא?
      אשמח לקבל מידע ואני בטוח שיש כאן עוד רבים שהנושא הזה מציק להם 😉
      תודה רבה

      dfhzrhreeD מנותק
      dfhzrhreeD מנותק
      dfhzrhree
      מדריכים
      כתב ב נערך לאחרונה על ידי
      #2

      @סקרן-0
      ניסית את זה?
      (יש בתוכנה כמה אפשרויות לזיהוי, נסה בעצמך).
      ec1897ad-2652-438b-8954-1b7d1030ebad-image.png


      אתה שומע? תגיד תודה!
      רוץ לספר פה!
      רוצה תכל'ס? טוווווב, קח!

      ס תגובה 1 תגובה אחרונה
      1
      • dfhzrhreeD dfhzrhree

        @סקרן-0
        ניסית את זה?
        (יש בתוכנה כמה אפשרויות לזיהוי, נסה בעצמך).
        ec1897ad-2652-438b-8954-1b7d1030ebad-image.png

        ס מנותק
        ס מנותק
        סקרן 0
        כתב ב נערך לאחרונה על ידי
        #3

        @dfhzrhree תודה רבה, בדקתי ואכן זה עובד
        (אמנם אם זה מתבסס על תאריך יצירה ותאריך שינוי הוא עדיין יכול לפספס מקרים של שני קבצים שהורדו בתאריכים נפרדים וכדו', אבל ברור שחלק משמעותי זה באמת פותר)

        dfhzrhreeD תגובה 1 תגובה אחרונה
        2
        • ס סקרן 0

          @dfhzrhree תודה רבה, בדקתי ואכן זה עובד
          (אמנם אם זה מתבסס על תאריך יצירה ותאריך שינוי הוא עדיין יכול לפספס מקרים של שני קבצים שהורדו בתאריכים נפרדים וכדו', אבל ברור שחלק משמעותי זה באמת פותר)

          dfhzrhreeD מנותק
          dfhzrhreeD מנותק
          dfhzrhree
          מדריכים
          כתב ב נערך לאחרונה על ידי dfhzrhree
          #4

          @סקרן-0
          מאחר ואתה מתעניין בדווקא בהאשינג, יש משהו שאולי יקדם אותך יותר:
          baa11125-ba60-4fad-841a-9b0d4f3bc2c2-image.png
          או בתרגום:
          36104747-da1d-48e7-80ac-b699af46995a-image.png
          הנ"ל מתייחס ככל הנראה בדווקא לגרסה המעודכנת יותר של התוכנה דלעיל, שנמצאת כאן. או כאן.


          אתה שומע? תגיד תודה!
          רוץ לספר פה!
          רוצה תכל'ס? טוווווב, קח!

          תגובה 1 תגובה אחרונה
          1
          • ס סקרן 0

            כמו חובבי מוזיקה חרדים רבים, שאין להם גישה לאפליקציות סטרימינג כמו ספוטיפיי וכדו', אני אוגר מוזיקה במחשב האישי שלי. אני בטוח שכל אחד שהכניס כמה שירים למחשב/נגן וכדו' נתקל בבעיה של קבצים כפולים, שאין דרך מסודרת לדעת ולמחוק אותם, כיון שהם תחת שמות שונים (או איזה ג'יבריש אחרי שהורידו אותם מטלגרם😒). אז כמובן שאפשר להשוות דרך המטא דאטה וכדו' אבל זה ג"כ לא מספיק.
            לאחרונה הבנתי שיש אפשרות להוציא פונקציית Hash על קובץ, כך שרק קובץ זהה לו מבחינת התוכן יביא פלט זהה לפונקציה, וממילא השאלה היא האם יש תוכנה/דרך נוחה אחרת שעושה את זה?
            ראיתי כאן שדנו בזה ולא הצלחתי להבין כלום.
            לכאורה זה נשמע ממש פשוט, תוכנה שעוברת על כל הקבצים בתיקיה/ות, משווה את ה Hash שלהם ומציעה למחוק אחד מהם... לא?
            אשמח לקבל מידע ואני בטוח שיש כאן עוד רבים שהנושא הזה מציק להם 😉
            תודה רבה

            מ מנותק
            מ מנותק
            משחזר מידע
            כתב ב נערך לאחרונה על ידי
            #5

            @סקרן-0 יש תוכנות למכביר שקיימות בשוק שעושות את זה
            לחילופין תוכל לכתוב סקריפט קטן בpowershell


            הפעלת ניהול דיסקים דרך הקובץ המצורף

            Hex editor חינמי

            תגובה 1 תגובה אחרונה
            1
            • ס סקרן 0

              כמו חובבי מוזיקה חרדים רבים, שאין להם גישה לאפליקציות סטרימינג כמו ספוטיפיי וכדו', אני אוגר מוזיקה במחשב האישי שלי. אני בטוח שכל אחד שהכניס כמה שירים למחשב/נגן וכדו' נתקל בבעיה של קבצים כפולים, שאין דרך מסודרת לדעת ולמחוק אותם, כיון שהם תחת שמות שונים (או איזה ג'יבריש אחרי שהורידו אותם מטלגרם😒). אז כמובן שאפשר להשוות דרך המטא דאטה וכדו' אבל זה ג"כ לא מספיק.
              לאחרונה הבנתי שיש אפשרות להוציא פונקציית Hash על קובץ, כך שרק קובץ זהה לו מבחינת התוכן יביא פלט זהה לפונקציה, וממילא השאלה היא האם יש תוכנה/דרך נוחה אחרת שעושה את זה?
              ראיתי כאן שדנו בזה ולא הצלחתי להבין כלום.
              לכאורה זה נשמע ממש פשוט, תוכנה שעוברת על כל הקבצים בתיקיה/ות, משווה את ה Hash שלהם ומציעה למחוק אחד מהם... לא?
              אשמח לקבל מידע ואני בטוח שיש כאן עוד רבים שהנושא הזה מציק להם 😉
              תודה רבה

              י מנותק
              י מנותק
              יושב אהלים
              כתב ב נערך לאחרונה על ידי יושב אהלים
              #6

              @סקרן-0
              היי, בדיוק נכנסתי לכאן.. (בטעות..)
              בגדול, אתה יכול להשוות בין הHashים של הקבצים, כיוון שהHash לא משתנה אם משנים לקובץ את השם, אלא לפי המטאדטא ששמור בקובץ.
              הבעיה העיקרית בשיטה הזאת היא קבצים שלא ממש זהים אחד לשני, לפעמים ערוץ שמע נמוך יותר, קובץ דחוס או פורמט אחר, מטאדאטה שונה וכד׳.
              בפייתון ספציפית יש ספריות יעודיות שפותחו לנושא, כדוגמת Audiodiff, וpython-compare-mp3.
              באמצעות audiodiff ספציפית קל מאוד לבדוק את זה, באמצעות הפונקציה audio_equal אפשר לבדוק האם קבצי המוזיקה שווים אחד לשני באמצעות בדיקה של ערוצי השמע וקצב הסיביות, ובאמצעות הפונקציה tags_equal אפשר לבדוק האם המטאדטא של שניהם שווה, אם מעניין אותך, אני יכול לכתוב בקלות סקריפט או תוכנה שתמש אותך.

              ס תגובה 1 תגובה אחרונה
              2
              • י יושב אהלים

                @סקרן-0
                היי, בדיוק נכנסתי לכאן.. (בטעות..)
                בגדול, אתה יכול להשוות בין הHashים של הקבצים, כיוון שהHash לא משתנה אם משנים לקובץ את השם, אלא לפי המטאדטא ששמור בקובץ.
                הבעיה העיקרית בשיטה הזאת היא קבצים שלא ממש זהים אחד לשני, לפעמים ערוץ שמע נמוך יותר, קובץ דחוס או פורמט אחר, מטאדאטה שונה וכד׳.
                בפייתון ספציפית יש ספריות יעודיות שפותחו לנושא, כדוגמת Audiodiff, וpython-compare-mp3.
                באמצעות audiodiff ספציפית קל מאוד לבדוק את זה, באמצעות הפונקציה audio_equal אפשר לבדוק האם קבצי המוזיקה שווים אחד לשני באמצעות בדיקה של ערוצי השמע וקצב הסיביות, ובאמצעות הפונקציה tags_equal אפשר לבדוק האם המטאדטא של שניהם שווה, אם מעניין אותך, אני יכול לכתוב בקלות סקריפט או תוכנה שתמש אותך.

                ס מנותק
                ס מנותק
                סקרן 0
                כתב ב נערך לאחרונה על ידי
                #7

                @יושב-אהלים

                @יושב-אהלים כתב בבקשת מידע | השוואה בין קבצים על בסיס פונקציית Hash:

                אם מעניין אותך, אני יכול לכתוב בקלות סקריפט או תוכנה שתמש אותך.

                אני בהחלט אשמח (רק אם זה בקלות...)
                תודה רבה

                י תגובה 1 תגובה אחרונה
                1
                • ס סקרן 0

                  @יושב-אהלים

                  @יושב-אהלים כתב בבקשת מידע | השוואה בין קבצים על בסיס פונקציית Hash:

                  אם מעניין אותך, אני יכול לכתוב בקלות סקריפט או תוכנה שתמש אותך.

                  אני בהחלט אשמח (רק אם זה בקלות...)
                  תודה רבה

                  י מנותק
                  י מנותק
                  יושב אהלים
                  כתב ב נערך לאחרונה על ידי יושב אהלים
                  #8

                  @סקרן-0 סליחה על התגובה המאוחרת,
                  בגדול יש בGitHub סקריפט מוכן של פייתון לביצוע השוואה בין שתי קבצי קול, כתובת הסקריפט: https://github.com/kdave/audio-compare.
                  בגדול צריך להוריד, להתקין את התלויות Chromaprint וffmpeg, ולהריץ (או לארוז לEXE), הסקריפט עצמו מאוד מתקדם, ומשווה בין טביעות אצבע (fingerprints), קצב הזרמת הסיביות והסט סיביות וכו׳. הסקריפט יכול לזהות גם שירים דומים (יכתב בפלט מה אחוזי ההתאמה), כך שאני מאוד ממליץ להשתמש בו.
                  בהזדמנות אני יכין קובץ מוכן עם ממשק גרפי באמצעות Tkinter.

                  תגובה 1 תגובה אחרונה
                  3

                  • התחברות

                  • אין לך חשבון עדיין? הרשמה

                  • התחברו או הירשמו כדי לחפש.
                  • פוסט ראשון
                    פוסט אחרון
                  0
                  • חוקי הפורום
                  • לא נפתר
                  • משתמשים
                  • חיפוש גוגל בפורום
                  • צור קשר