דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. מחשבים וטכנולוגיה
  3. עזרה הדדית - מחשבים וטכנולוגיה
  4. בירור | ניקוי קובץ טקסט מתווים מיותרים

בירור | ניקוי קובץ טקסט מתווים מיותרים

מתוזמן נעוץ נעול הועבר נפתר עזרה הדדית - מחשבים וטכנולוגיה
47 פוסטים 10 כותבים 632 צפיות 8 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • מישהו12מ מישהו12

    @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

    @מישהו12
    תיקנתי תנסה עכשיו

    עכשיו זה שומר את כל הגרשיים

    ישראל 142י מנותק
    ישראל 142י מנותק
    ישראל 142
    מדריכים
    כתב ב נערך לאחרונה על ידי
    #37

    @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

    @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

    @מישהו12
    תיקנתי תנסה עכשיו

    עכשיו זה שומר את כל הגרשיים

    אז עכשיו אתה יכול לעשות החלפה של כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד, ואז כל הרגשיים שבתוך מילה ישארו

    טכנאי מחשבים

    מישהו12מ תגובה 1 תגובה אחרונה
    0
    • ישראל 142י ישראל 142

      @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

      @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

      @מישהו12
      תיקנתי תנסה עכשיו

      עכשיו זה שומר את כל הגרשיים

      אז עכשיו אתה יכול לעשות החלפה של כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד, ואז כל הרגשיים שבתוך מילה ישארו

      מישהו12מ מחובר
      מישהו12מ מחובר
      מישהו12
      מדריכים
      כתב ב נערך לאחרונה על ידי
      #38

      @ישראל-142 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

      כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד

      אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

      הבלוג שלי
      https://aiv-dev.com/he-IL/

      menajemmendelM תגובה 1 תגובה אחרונה
      0
      • מישהו12מ מישהו12

        @ישראל-142 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד

        אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

        menajemmendelM מנותק
        menajemmendelM מנותק
        menajemmendel
        כתב ב נערך לאחרונה על ידי
        #39

        @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

        אתה יודע להשתמש בחפש והחלף?
        CTRL +H
        ותכתוב שם "^13
        9d2619ad-618c-4722-8379-2a8d7dfb39a5-image.png

        הסבר: ^13 הוא אנטר
        מישהו12מ תגובה 1 תגובה אחרונה
        1
        • menajemmendelM menajemmendel

          @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

          אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

          אתה יודע להשתמש בחפש והחלף?
          CTRL +H
          ותכתוב שם "^13
          9d2619ad-618c-4722-8379-2a8d7dfb39a5-image.png

          הסבר: ^13 הוא אנטר
          מישהו12מ מחובר
          מישהו12מ מחובר
          מישהו12
          מדריכים
          כתב ב נערך לאחרונה על ידי
          #40

          @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

          ^13

          לא עובד
          6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

          הבלוג שלי
          https://aiv-dev.com/he-IL/

          menajemmendelM תגובה 1 תגובה אחרונה
          0
          • MGM IVRM MGM IVR

            @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

            יש לי קובץ טקסט שנראה ככה
            7e56062d-516f-4f0a-b6f2-bb610385805e-image.png
            אני מעוניין שישארו רק המשפטים בעברית, בלי כל הסימנים, הכיתוב באנגלית וכדו'.
            חפש והחלף לא עוזר לי כי אפשר לחפש\למחוק שם ירידות שורה (אנטרים).

            תודה!

            למה לא להריץ איזה סקריפט פייתון קצר,
            סוג של כזה דבר

            אפשרי להריץ אונליין גם למשל באתר הבא https://www.programiz.com/python-programming/online-compiler/

            data = [
                {
                    "timestamp":[3249, 2455],
                    "text" : "המחשבה בדבר"
                },
                {
                    "timestamp":[3269, 1455],
                    "text" : "המחשבה האמיתית"
                },
                {
                    "timestamp":[234, 24423342555],
                    "text" : "היא מחתימה את הכל "
                },
                {
                    "timestamp":[3249, 2455],
                    "text" : "עבור מישהו12 "
                }
            ]
            

            ואז

            alltext = ""
            
            for i in data:
                alltext += i["text"] + " "
            print(alltext)
            

            בשביל לחבר בין משפט למשפט ברווח

            או

            alltext = ""
            
            for i in data:
                alltext += i["text"] + "\n"
                
            print(alltext)
            

            כדי לחבר בינהם בשורה חדשה

            כמובן שלא חייבים להדפיס את התוצאה, אפשרי גם לכתוב אתה לקובץ (זה לא ניתן באתר הנ״ל לכאורה)

            open("text.txt", "w").write(alltext)
            
            מישהו12מ מחובר
            מישהו12מ מחובר
            מישהו12
            מדריכים
            כתב ב נערך לאחרונה על ידי
            #41

            @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

            הבלוג שלי
            https://aiv-dev.com/he-IL/

            MGM IVRM תגובה 1 תגובה אחרונה
            0
            • מישהו12מ מישהו12

              @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

              MGM IVRM מנותק
              MGM IVRM מנותק
              MGM IVR
              מדריכים
              כתב ב נערך לאחרונה על ידי MGM IVR
              #42

              @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

              @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

              import json
              
              file = open('file.txt', 'r').read()
              data = json.loads(file)
              
              alltext = ""
               
              for i in data:
                  alltext += i["text"] + "\n"
                  
              
              open("output.txt", "w").write(alltext)
              

              הקובץ צריך להיות במבנה json כמובן
              למשל

              [
                  {
                      "timestamp":[3249, 2455],
                      "text" : "המחשבה בדבר"
                  },
                  {
                      "timestamp":[3269, 1455],
                      "text" : "המחשבה האמיתית"
                  },
                  {
                      "timestamp":[234, 24423342555],
                      "text" : "היא מחתימה את הכל "
                  },
                  {
                      "timestamp":[3249, 2455],
                      "text" : "עבור מישהו12 "
                  }
              ]
              
              מישהו12מ תגובה 1 תגובה אחרונה
              0
              • MGM IVRM MGM IVR

                @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

                import json
                
                file = open('file.txt', 'r').read()
                data = json.loads(file)
                
                alltext = ""
                 
                for i in data:
                    alltext += i["text"] + "\n"
                    
                
                open("output.txt", "w").write(alltext)
                

                הקובץ צריך להיות במבנה json כמובן
                למשל

                [
                    {
                        "timestamp":[3249, 2455],
                        "text" : "המחשבה בדבר"
                    },
                    {
                        "timestamp":[3269, 1455],
                        "text" : "המחשבה האמיתית"
                    },
                    {
                        "timestamp":[234, 24423342555],
                        "text" : "היא מחתימה את הכל "
                    },
                    {
                        "timestamp":[3249, 2455],
                        "text" : "עבור מישהו12 "
                    }
                ]
                
                מישהו12מ מחובר
                מישהו12מ מחובר
                מישהו12
                מדריכים
                כתב ב נערך לאחרונה על ידי
                #43

                @MGM-IVR

                python script.py
                Traceback (most recent call last):
                  File "C:\Users\*****\Desktop\מסמכים אישיים\*******\New folder\script.py", line 3, in <module>
                    file = open('file.txt', 'r').read()
                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                  File "C:\Users\*****\AppData\Local\Programs\Python\Python311\Lib\encodings\cp1255.py", line 23, in decode
                    return codecs.charmap_decode(input,self.errors,decoding_table)[0]
                           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                UnicodeDecodeError: 'charmap' codec can't decode byte 0x9e in position 59: character maps to <undefined>
                

                הבלוג שלי
                https://aiv-dev.com/he-IL/

                תגובה 1 תגובה אחרונה
                0
                • מישהו12מ מחובר
                  מישהו12מ מחובר
                  מישהו12
                  מדריכים
                  כתב ב נערך לאחרונה על ידי
                  #44

                  ChatGPT סיפק את התשובה אחרי הרבה ניסיונות

                  def clean_text(input_text):
                      hebrew_sentences = []
                  
                      # קרא את הקובץ ונקה את המשפטים העבריים
                      with open("input_file.txt", "r", encoding="utf-8") as file:
                          for line in file:
                              if '"text": "' in line:
                                  sentence = line.split('"text": "')[1].rstrip('\n').rstrip('"')
                                  hebrew_sentences.append(sentence)
                  
                      # החזר כל משפט בשורה נפרדת
                      cleaned_text = "\n".join(hebrew_sentences)
                  
                      return cleaned_text
                  
                  # קרא את קובץ הטקסט וקרא את המשפטים
                  cleaned_text = clean_text("input_file.txt")
                  print(cleaned_text)
                  
                  # אם ברצונך לשמור את הטקסט הנקי בקובץ חדש
                  with open("output_file.txt", "w", encoding="utf-8") as file:
                      file.write(cleaned_text)
                  
                  

                  https://chat.openai.com/share/3bc11429-df51-4046-b937-a98fc225c1b7

                  הבלוג שלי
                  https://aiv-dev.com/he-IL/

                  תגובה 1 תגובה אחרונה
                  1
                  • מישהו12מ מישהו12

                    @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                    ^13

                    לא עובד
                    6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                    menajemmendelM מנותק
                    menajemmendelM מנותק
                    menajemmendel
                    כתב ב נערך לאחרונה על ידי
                    #45

                    @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                    @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                    ^13

                    לא עובד
                    6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                    מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

                    מישהו12מ תגובה 1 תגובה אחרונה
                    0
                    • מ מנותק
                      מ מנותק
                      מקצועי_
                      כתב ב נערך לאחרונה על ידי מקצועי_
                      #46

                      @מישהו12

                      תדביק פה את ה JSON ותקבל למטה פלט נקי

                      https://regex101.com/r/XZGqY7/1

                      ואם אתה רוצה בשורות נפרדות

                      https://regex101.com/r/XZGqY7/2

                      תגובה 1 תגובה אחרונה
                      1
                      • menajemmendelM menajemmendel

                        @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                        @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                        ^13

                        לא עובד
                        6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                        מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

                        מישהו12מ מחובר
                        מישהו12מ מחובר
                        מישהו12
                        מדריכים
                        כתב ב נערך לאחרונה על ידי
                        #47

                        @menajemmendel מוזר, עשיתי העתק הדבק. בטוח שבלי יותר מידי רווחים.
                        \בכל מקרה תודה לכולם, הסתדרתי עם
                        https://mitmachim.top/post/759544

                        הבלוג שלי
                        https://aiv-dev.com/he-IL/

                        תגובה 1 תגובה אחרונה
                        0
                        • מישהו12מ מישהו12 סימן נושא זה כשאלה ב
                        • מישהו12מ מישהו12 סימן נושא זה כנפתר ב

                        • התחברות

                        • אין לך חשבון עדיין? הרשמה

                        • התחברו או הירשמו כדי לחפש.
                        • פוסט ראשון
                          פוסט אחרון
                        0
                        • חוקי הפורום
                        • פופולרי
                        • לא נפתר
                        • משתמשים
                        • חיפוש גוגל בפורום
                        • צור קשר