דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. מחשבים וטכנולוגיה
  3. עזרה הדדית - מחשבים וטכנולוגיה
  4. בירור | ניקוי קובץ טקסט מתווים מיותרים

בירור | ניקוי קובץ טקסט מתווים מיותרים

מתוזמן נעוץ נעול הועבר נפתר עזרה הדדית - מחשבים וטכנולוגיה
47 פוסטים 10 כותבים 632 צפיות 8 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • צדיק תמיםצ צדיק תמים

    @מישהו12 אני עדיין לא מבין את הרעיון המוזר לפרסר JSON באמצעות חיפוש והחלפה לסוגיו כאילו שזה טקסט רגיל

    מישהו12מ מחובר
    מישהו12מ מחובר
    מישהו12
    מדריכים
    כתב ב נערך לאחרונה על ידי
    #36

    @צדיק-תמים יש לי עניין בתוצאה, לא מעניין אותי הדרך...

    הבלוג שלי
    https://aiv-dev.com/he-IL/

    תגובה 1 תגובה אחרונה
    0
    • מישהו12מ מישהו12

      @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

      @מישהו12
      תיקנתי תנסה עכשיו

      עכשיו זה שומר את כל הגרשיים

      ישראל 142י מנותק
      ישראל 142י מנותק
      ישראל 142
      מדריכים
      כתב ב נערך לאחרונה על ידי
      #37

      @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

      @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

      @מישהו12
      תיקנתי תנסה עכשיו

      עכשיו זה שומר את כל הגרשיים

      אז עכשיו אתה יכול לעשות החלפה של כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד, ואז כל הרגשיים שבתוך מילה ישארו

      טכנאי מחשבים

      מישהו12מ תגובה 1 תגובה אחרונה
      0
      • ישראל 142י ישראל 142

        @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        @מישהו12
        תיקנתי תנסה עכשיו

        עכשיו זה שומר את כל הגרשיים

        אז עכשיו אתה יכול לעשות החלפה של כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד, ואז כל הרגשיים שבתוך מילה ישארו

        מישהו12מ מחובר
        מישהו12מ מחובר
        מישהו12
        מדריכים
        כתב ב נערך לאחרונה על ידי
        #38

        @ישראל-142 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד

        אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

        הבלוג שלי
        https://aiv-dev.com/he-IL/

        menajemmendelM תגובה 1 תגובה אחרונה
        0
        • מישהו12מ מישהו12

          @ישראל-142 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

          כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד

          אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

          menajemmendelM מנותק
          menajemmendelM מנותק
          menajemmendel
          כתב ב נערך לאחרונה על ידי
          #39

          @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

          אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

          אתה יודע להשתמש בחפש והחלף?
          CTRL +H
          ותכתוב שם "^13
          9d2619ad-618c-4722-8379-2a8d7dfb39a5-image.png

          הסבר: ^13 הוא אנטר
          מישהו12מ תגובה 1 תגובה אחרונה
          1
          • menajemmendelM menajemmendel

            @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

            אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

            אתה יודע להשתמש בחפש והחלף?
            CTRL +H
            ותכתוב שם "^13
            9d2619ad-618c-4722-8379-2a8d7dfb39a5-image.png

            הסבר: ^13 הוא אנטר
            מישהו12מ מחובר
            מישהו12מ מחובר
            מישהו12
            מדריכים
            כתב ב נערך לאחרונה על ידי
            #40

            @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

            ^13

            לא עובד
            6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

            הבלוג שלי
            https://aiv-dev.com/he-IL/

            menajemmendelM תגובה 1 תגובה אחרונה
            0
            • MGM IVRM MGM IVR

              @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

              יש לי קובץ טקסט שנראה ככה
              7e56062d-516f-4f0a-b6f2-bb610385805e-image.png
              אני מעוניין שישארו רק המשפטים בעברית, בלי כל הסימנים, הכיתוב באנגלית וכדו'.
              חפש והחלף לא עוזר לי כי אפשר לחפש\למחוק שם ירידות שורה (אנטרים).

              תודה!

              למה לא להריץ איזה סקריפט פייתון קצר,
              סוג של כזה דבר

              אפשרי להריץ אונליין גם למשל באתר הבא https://www.programiz.com/python-programming/online-compiler/

              data = [
                  {
                      "timestamp":[3249, 2455],
                      "text" : "המחשבה בדבר"
                  },
                  {
                      "timestamp":[3269, 1455],
                      "text" : "המחשבה האמיתית"
                  },
                  {
                      "timestamp":[234, 24423342555],
                      "text" : "היא מחתימה את הכל "
                  },
                  {
                      "timestamp":[3249, 2455],
                      "text" : "עבור מישהו12 "
                  }
              ]
              

              ואז

              alltext = ""
              
              for i in data:
                  alltext += i["text"] + " "
              print(alltext)
              

              בשביל לחבר בין משפט למשפט ברווח

              או

              alltext = ""
              
              for i in data:
                  alltext += i["text"] + "\n"
                  
              print(alltext)
              

              כדי לחבר בינהם בשורה חדשה

              כמובן שלא חייבים להדפיס את התוצאה, אפשרי גם לכתוב אתה לקובץ (זה לא ניתן באתר הנ״ל לכאורה)

              open("text.txt", "w").write(alltext)
              
              מישהו12מ מחובר
              מישהו12מ מחובר
              מישהו12
              מדריכים
              כתב ב נערך לאחרונה על ידי
              #41

              @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

              הבלוג שלי
              https://aiv-dev.com/he-IL/

              MGM IVRM תגובה 1 תגובה אחרונה
              0
              • מישהו12מ מישהו12

                @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

                MGM IVRM מנותק
                MGM IVRM מנותק
                MGM IVR
                מדריכים
                כתב ב נערך לאחרונה על ידי MGM IVR
                #42

                @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

                import json
                
                file = open('file.txt', 'r').read()
                data = json.loads(file)
                
                alltext = ""
                 
                for i in data:
                    alltext += i["text"] + "\n"
                    
                
                open("output.txt", "w").write(alltext)
                

                הקובץ צריך להיות במבנה json כמובן
                למשל

                [
                    {
                        "timestamp":[3249, 2455],
                        "text" : "המחשבה בדבר"
                    },
                    {
                        "timestamp":[3269, 1455],
                        "text" : "המחשבה האמיתית"
                    },
                    {
                        "timestamp":[234, 24423342555],
                        "text" : "היא מחתימה את הכל "
                    },
                    {
                        "timestamp":[3249, 2455],
                        "text" : "עבור מישהו12 "
                    }
                ]
                
                מישהו12מ תגובה 1 תגובה אחרונה
                0
                • MGM IVRM MGM IVR

                  @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                  @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

                  import json
                  
                  file = open('file.txt', 'r').read()
                  data = json.loads(file)
                  
                  alltext = ""
                   
                  for i in data:
                      alltext += i["text"] + "\n"
                      
                  
                  open("output.txt", "w").write(alltext)
                  

                  הקובץ צריך להיות במבנה json כמובן
                  למשל

                  [
                      {
                          "timestamp":[3249, 2455],
                          "text" : "המחשבה בדבר"
                      },
                      {
                          "timestamp":[3269, 1455],
                          "text" : "המחשבה האמיתית"
                      },
                      {
                          "timestamp":[234, 24423342555],
                          "text" : "היא מחתימה את הכל "
                      },
                      {
                          "timestamp":[3249, 2455],
                          "text" : "עבור מישהו12 "
                      }
                  ]
                  
                  מישהו12מ מחובר
                  מישהו12מ מחובר
                  מישהו12
                  מדריכים
                  כתב ב נערך לאחרונה על ידי
                  #43

                  @MGM-IVR

                  python script.py
                  Traceback (most recent call last):
                    File "C:\Users\*****\Desktop\מסמכים אישיים\*******\New folder\script.py", line 3, in <module>
                      file = open('file.txt', 'r').read()
                             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                    File "C:\Users\*****\AppData\Local\Programs\Python\Python311\Lib\encodings\cp1255.py", line 23, in decode
                      return codecs.charmap_decode(input,self.errors,decoding_table)[0]
                             ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                  UnicodeDecodeError: 'charmap' codec can't decode byte 0x9e in position 59: character maps to <undefined>
                  

                  הבלוג שלי
                  https://aiv-dev.com/he-IL/

                  תגובה 1 תגובה אחרונה
                  0
                  • מישהו12מ מחובר
                    מישהו12מ מחובר
                    מישהו12
                    מדריכים
                    כתב ב נערך לאחרונה על ידי
                    #44

                    ChatGPT סיפק את התשובה אחרי הרבה ניסיונות

                    def clean_text(input_text):
                        hebrew_sentences = []
                    
                        # קרא את הקובץ ונקה את המשפטים העבריים
                        with open("input_file.txt", "r", encoding="utf-8") as file:
                            for line in file:
                                if '"text": "' in line:
                                    sentence = line.split('"text": "')[1].rstrip('\n').rstrip('"')
                                    hebrew_sentences.append(sentence)
                    
                        # החזר כל משפט בשורה נפרדת
                        cleaned_text = "\n".join(hebrew_sentences)
                    
                        return cleaned_text
                    
                    # קרא את קובץ הטקסט וקרא את המשפטים
                    cleaned_text = clean_text("input_file.txt")
                    print(cleaned_text)
                    
                    # אם ברצונך לשמור את הטקסט הנקי בקובץ חדש
                    with open("output_file.txt", "w", encoding="utf-8") as file:
                        file.write(cleaned_text)
                    
                    

                    https://chat.openai.com/share/3bc11429-df51-4046-b937-a98fc225c1b7

                    הבלוג שלי
                    https://aiv-dev.com/he-IL/

                    תגובה 1 תגובה אחרונה
                    1
                    • מישהו12מ מישהו12

                      @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                      ^13

                      לא עובד
                      6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                      menajemmendelM מנותק
                      menajemmendelM מנותק
                      menajemmendel
                      כתב ב נערך לאחרונה על ידי
                      #45

                      @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                      @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                      ^13

                      לא עובד
                      6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                      מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

                      מישהו12מ תגובה 1 תגובה אחרונה
                      0
                      • מ מנותק
                        מ מנותק
                        מקצועי_
                        כתב ב נערך לאחרונה על ידי מקצועי_
                        #46

                        @מישהו12

                        תדביק פה את ה JSON ותקבל למטה פלט נקי

                        https://regex101.com/r/XZGqY7/1

                        ואם אתה רוצה בשורות נפרדות

                        https://regex101.com/r/XZGqY7/2

                        תגובה 1 תגובה אחרונה
                        1
                        • menajemmendelM menajemmendel

                          @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                          @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                          ^13

                          לא עובד
                          6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                          מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

                          מישהו12מ מחובר
                          מישהו12מ מחובר
                          מישהו12
                          מדריכים
                          כתב ב נערך לאחרונה על ידי
                          #47

                          @menajemmendel מוזר, עשיתי העתק הדבק. בטוח שבלי יותר מידי רווחים.
                          \בכל מקרה תודה לכולם, הסתדרתי עם
                          https://mitmachim.top/post/759544

                          הבלוג שלי
                          https://aiv-dev.com/he-IL/

                          תגובה 1 תגובה אחרונה
                          0
                          • מישהו12מ מישהו12 סימן נושא זה כשאלה ב
                          • מישהו12מ מישהו12 סימן נושא זה כנפתר ב

                          • התחברות

                          • אין לך חשבון עדיין? הרשמה

                          • התחברו או הירשמו כדי לחפש.
                          • פוסט ראשון
                            פוסט אחרון
                          0
                          • חוקי הפורום
                          • פופולרי
                          • לא נפתר
                          • משתמשים
                          • חיפוש גוגל בפורום
                          • צור קשר