דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. מחשבים וטכנולוגיה
  3. עזרה הדדית - מחשבים וטכנולוגיה
  4. בירור | ניקוי קובץ טקסט מתווים מיותרים

בירור | ניקוי קובץ טקסט מתווים מיותרים

מתוזמן נעוץ נעול הועבר נפתר עזרה הדדית - מחשבים וטכנולוגיה
47 פוסטים 10 כותבים 632 צפיות 8 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • MGM IVRM MGM IVR

    @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

    יש לי קובץ טקסט שנראה ככה
    7e56062d-516f-4f0a-b6f2-bb610385805e-image.png
    אני מעוניין שישארו רק המשפטים בעברית, בלי כל הסימנים, הכיתוב באנגלית וכדו'.
    חפש והחלף לא עוזר לי כי אפשר לחפש\למחוק שם ירידות שורה (אנטרים).

    תודה!

    למה לא להריץ איזה סקריפט פייתון קצר,
    סוג של כזה דבר

    אפשרי להריץ אונליין גם למשל באתר הבא https://www.programiz.com/python-programming/online-compiler/

    data = [
        {
            "timestamp":[3249, 2455],
            "text" : "המחשבה בדבר"
        },
        {
            "timestamp":[3269, 1455],
            "text" : "המחשבה האמיתית"
        },
        {
            "timestamp":[234, 24423342555],
            "text" : "היא מחתימה את הכל "
        },
        {
            "timestamp":[3249, 2455],
            "text" : "עבור מישהו12 "
        }
    ]
    

    ואז

    alltext = ""
    
    for i in data:
        alltext += i["text"] + " "
    print(alltext)
    

    בשביל לחבר בין משפט למשפט ברווח

    או

    alltext = ""
    
    for i in data:
        alltext += i["text"] + "\n"
        
    print(alltext)
    

    כדי לחבר בינהם בשורה חדשה

    כמובן שלא חייבים להדפיס את התוצאה, אפשרי גם לכתוב אתה לקובץ (זה לא ניתן באתר הנ״ל לכאורה)

    open("text.txt", "w").write(alltext)
    
    מישהו12מ מחובר
    מישהו12מ מחובר
    מישהו12
    מדריכים
    כתב ב נערך לאחרונה על ידי
    #41

    @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

    הבלוג שלי
    https://aiv-dev.com/he-IL/

    MGM IVRM תגובה 1 תגובה אחרונה
    0
    • מישהו12מ מישהו12

      @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

      MGM IVRM מנותק
      MGM IVRM מנותק
      MGM IVR
      מדריכים
      כתב ב נערך לאחרונה על ידי MGM IVR
      #42

      @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

      @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

      import json
      
      file = open('file.txt', 'r').read()
      data = json.loads(file)
      
      alltext = ""
       
      for i in data:
          alltext += i["text"] + "\n"
          
      
      open("output.txt", "w").write(alltext)
      

      הקובץ צריך להיות במבנה json כמובן
      למשל

      [
          {
              "timestamp":[3249, 2455],
              "text" : "המחשבה בדבר"
          },
          {
              "timestamp":[3269, 1455],
              "text" : "המחשבה האמיתית"
          },
          {
              "timestamp":[234, 24423342555],
              "text" : "היא מחתימה את הכל "
          },
          {
              "timestamp":[3249, 2455],
              "text" : "עבור מישהו12 "
          }
      ]
      
      מישהו12מ תגובה 1 תגובה אחרונה
      0
      • MGM IVRM MGM IVR

        @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

        import json
        
        file = open('file.txt', 'r').read()
        data = json.loads(file)
        
        alltext = ""
         
        for i in data:
            alltext += i["text"] + "\n"
            
        
        open("output.txt", "w").write(alltext)
        

        הקובץ צריך להיות במבנה json כמובן
        למשל

        [
            {
                "timestamp":[3249, 2455],
                "text" : "המחשבה בדבר"
            },
            {
                "timestamp":[3269, 1455],
                "text" : "המחשבה האמיתית"
            },
            {
                "timestamp":[234, 24423342555],
                "text" : "היא מחתימה את הכל "
            },
            {
                "timestamp":[3249, 2455],
                "text" : "עבור מישהו12 "
            }
        ]
        
        מישהו12מ מחובר
        מישהו12מ מחובר
        מישהו12
        מדריכים
        כתב ב נערך לאחרונה על ידי
        #43

        @MGM-IVR

        python script.py
        Traceback (most recent call last):
          File "C:\Users\*****\Desktop\מסמכים אישיים\*******\New folder\script.py", line 3, in <module>
            file = open('file.txt', 'r').read()
                   ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
          File "C:\Users\*****\AppData\Local\Programs\Python\Python311\Lib\encodings\cp1255.py", line 23, in decode
            return codecs.charmap_decode(input,self.errors,decoding_table)[0]
                   ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        UnicodeDecodeError: 'charmap' codec can't decode byte 0x9e in position 59: character maps to <undefined>
        

        הבלוג שלי
        https://aiv-dev.com/he-IL/

        תגובה 1 תגובה אחרונה
        0
        • מישהו12מ מחובר
          מישהו12מ מחובר
          מישהו12
          מדריכים
          כתב ב נערך לאחרונה על ידי
          #44

          ChatGPT סיפק את התשובה אחרי הרבה ניסיונות

          def clean_text(input_text):
              hebrew_sentences = []
          
              # קרא את הקובץ ונקה את המשפטים העבריים
              with open("input_file.txt", "r", encoding="utf-8") as file:
                  for line in file:
                      if '"text": "' in line:
                          sentence = line.split('"text": "')[1].rstrip('\n').rstrip('"')
                          hebrew_sentences.append(sentence)
          
              # החזר כל משפט בשורה נפרדת
              cleaned_text = "\n".join(hebrew_sentences)
          
              return cleaned_text
          
          # קרא את קובץ הטקסט וקרא את המשפטים
          cleaned_text = clean_text("input_file.txt")
          print(cleaned_text)
          
          # אם ברצונך לשמור את הטקסט הנקי בקובץ חדש
          with open("output_file.txt", "w", encoding="utf-8") as file:
              file.write(cleaned_text)
          
          

          https://chat.openai.com/share/3bc11429-df51-4046-b937-a98fc225c1b7

          הבלוג שלי
          https://aiv-dev.com/he-IL/

          תגובה 1 תגובה אחרונה
          1
          • מישהו12מ מישהו12

            @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

            ^13

            לא עובד
            6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

            menajemmendelM מנותק
            menajemmendelM מנותק
            menajemmendel
            כתב ב נערך לאחרונה על ידי
            #45

            @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

            @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

            ^13

            לא עובד
            6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

            מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

            מישהו12מ תגובה 1 תגובה אחרונה
            0
            • מ מנותק
              מ מנותק
              מקצועי_
              כתב ב נערך לאחרונה על ידי מקצועי_
              #46

              @מישהו12

              תדביק פה את ה JSON ותקבל למטה פלט נקי

              https://regex101.com/r/XZGqY7/1

              ואם אתה רוצה בשורות נפרדות

              https://regex101.com/r/XZGqY7/2

              תגובה 1 תגובה אחרונה
              1
              • menajemmendelM menajemmendel

                @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                ^13

                לא עובד
                6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

                מישהו12מ מחובר
                מישהו12מ מחובר
                מישהו12
                מדריכים
                כתב ב נערך לאחרונה על ידי
                #47

                @menajemmendel מוזר, עשיתי העתק הדבק. בטוח שבלי יותר מידי רווחים.
                \בכל מקרה תודה לכולם, הסתדרתי עם
                https://mitmachim.top/post/759544

                הבלוג שלי
                https://aiv-dev.com/he-IL/

                תגובה 1 תגובה אחרונה
                0
                • מישהו12מ מישהו12 סימן נושא זה כשאלה ב
                • מישהו12מ מישהו12 סימן נושא זה כנפתר ב

                • התחברות

                • אין לך חשבון עדיין? הרשמה

                • התחברו או הירשמו כדי לחפש.
                • פוסט ראשון
                  פוסט אחרון
                0
                • חוקי הפורום
                • פופולרי
                • לא נפתר
                • משתמשים
                • חיפוש גוגל בפורום
                • צור קשר