דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. מחשבים וטכנולוגיה
  3. עזרה הדדית - מחשבים וטכנולוגיה
  4. בירור | ניקוי קובץ טקסט מתווים מיותרים

בירור | ניקוי קובץ טקסט מתווים מיותרים

מתוזמן נעוץ נעול הועבר נפתר עזרה הדדית - מחשבים וטכנולוגיה
47 פוסטים 10 כותבים 632 צפיות 8 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • ישראל 142י ישראל 142

    @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

    @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

    @מישהו12
    תיקנתי תנסה עכשיו

    עכשיו זה שומר את כל הגרשיים

    אז עכשיו אתה יכול לעשות החלפה של כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד, ואז כל הרגשיים שבתוך מילה ישארו

    מישהו12מ מחובר
    מישהו12מ מחובר
    מישהו12
    מדריכים
    כתב ב נערך לאחרונה על ידי
    #38

    @ישראל-142 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

    כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד

    אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

    הבלוג שלי
    https://aiv-dev.com/he-IL/

    menajemmendelM תגובה 1 תגובה אחרונה
    0
    • מישהו12מ מישהו12

      @ישראל-142 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

      כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד

      אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

      menajemmendelM מנותק
      menajemmendelM מנותק
      menajemmendel
      כתב ב נערך לאחרונה על ידי
      #39

      @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

      אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

      אתה יודע להשתמש בחפש והחלף?
      CTRL +H
      ותכתוב שם "^13
      9d2619ad-618c-4722-8379-2a8d7dfb39a5-image.png

      הסבר: ^13 הוא אנטר
      מישהו12מ תגובה 1 תגובה אחרונה
      1
      • menajemmendelM menajemmendel

        @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

        אתה יודע להשתמש בחפש והחלף?
        CTRL +H
        ותכתוב שם "^13
        9d2619ad-618c-4722-8379-2a8d7dfb39a5-image.png

        הסבר: ^13 הוא אנטר
        מישהו12מ מחובר
        מישהו12מ מחובר
        מישהו12
        מדריכים
        כתב ב נערך לאחרונה על ידי
        #40

        @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        ^13

        לא עובד
        6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

        הבלוג שלי
        https://aiv-dev.com/he-IL/

        menajemmendelM תגובה 1 תגובה אחרונה
        0
        • MGM IVRM MGM IVR

          @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

          יש לי קובץ טקסט שנראה ככה
          7e56062d-516f-4f0a-b6f2-bb610385805e-image.png
          אני מעוניין שישארו רק המשפטים בעברית, בלי כל הסימנים, הכיתוב באנגלית וכדו'.
          חפש והחלף לא עוזר לי כי אפשר לחפש\למחוק שם ירידות שורה (אנטרים).

          תודה!

          למה לא להריץ איזה סקריפט פייתון קצר,
          סוג של כזה דבר

          אפשרי להריץ אונליין גם למשל באתר הבא https://www.programiz.com/python-programming/online-compiler/

          data = [
              {
                  "timestamp":[3249, 2455],
                  "text" : "המחשבה בדבר"
              },
              {
                  "timestamp":[3269, 1455],
                  "text" : "המחשבה האמיתית"
              },
              {
                  "timestamp":[234, 24423342555],
                  "text" : "היא מחתימה את הכל "
              },
              {
                  "timestamp":[3249, 2455],
                  "text" : "עבור מישהו12 "
              }
          ]
          

          ואז

          alltext = ""
          
          for i in data:
              alltext += i["text"] + " "
          print(alltext)
          

          בשביל לחבר בין משפט למשפט ברווח

          או

          alltext = ""
          
          for i in data:
              alltext += i["text"] + "\n"
              
          print(alltext)
          

          כדי לחבר בינהם בשורה חדשה

          כמובן שלא חייבים להדפיס את התוצאה, אפשרי גם לכתוב אתה לקובץ (זה לא ניתן באתר הנ״ל לכאורה)

          open("text.txt", "w").write(alltext)
          
          מישהו12מ מחובר
          מישהו12מ מחובר
          מישהו12
          מדריכים
          כתב ב נערך לאחרונה על ידי
          #41

          @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

          הבלוג שלי
          https://aiv-dev.com/he-IL/

          MGM IVRM תגובה 1 תגובה אחרונה
          0
          • מישהו12מ מישהו12

            @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

            MGM IVRM מנותק
            MGM IVRM מנותק
            MGM IVR
            מדריכים
            כתב ב נערך לאחרונה על ידי MGM IVR
            #42

            @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

            @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

            import json
            
            file = open('file.txt', 'r').read()
            data = json.loads(file)
            
            alltext = ""
             
            for i in data:
                alltext += i["text"] + "\n"
                
            
            open("output.txt", "w").write(alltext)
            

            הקובץ צריך להיות במבנה json כמובן
            למשל

            [
                {
                    "timestamp":[3249, 2455],
                    "text" : "המחשבה בדבר"
                },
                {
                    "timestamp":[3269, 1455],
                    "text" : "המחשבה האמיתית"
                },
                {
                    "timestamp":[234, 24423342555],
                    "text" : "היא מחתימה את הכל "
                },
                {
                    "timestamp":[3249, 2455],
                    "text" : "עבור מישהו12 "
                }
            ]
            
            מישהו12מ תגובה 1 תגובה אחרונה
            0
            • MGM IVRM MGM IVR

              @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

              @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

              import json
              
              file = open('file.txt', 'r').read()
              data = json.loads(file)
              
              alltext = ""
               
              for i in data:
                  alltext += i["text"] + "\n"
                  
              
              open("output.txt", "w").write(alltext)
              

              הקובץ צריך להיות במבנה json כמובן
              למשל

              [
                  {
                      "timestamp":[3249, 2455],
                      "text" : "המחשבה בדבר"
                  },
                  {
                      "timestamp":[3269, 1455],
                      "text" : "המחשבה האמיתית"
                  },
                  {
                      "timestamp":[234, 24423342555],
                      "text" : "היא מחתימה את הכל "
                  },
                  {
                      "timestamp":[3249, 2455],
                      "text" : "עבור מישהו12 "
                  }
              ]
              
              מישהו12מ מחובר
              מישהו12מ מחובר
              מישהו12
              מדריכים
              כתב ב נערך לאחרונה על ידי
              #43

              @MGM-IVR

              python script.py
              Traceback (most recent call last):
                File "C:\Users\*****\Desktop\מסמכים אישיים\*******\New folder\script.py", line 3, in <module>
                  file = open('file.txt', 'r').read()
                         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                File "C:\Users\*****\AppData\Local\Programs\Python\Python311\Lib\encodings\cp1255.py", line 23, in decode
                  return codecs.charmap_decode(input,self.errors,decoding_table)[0]
                         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
              UnicodeDecodeError: 'charmap' codec can't decode byte 0x9e in position 59: character maps to <undefined>
              

              הבלוג שלי
              https://aiv-dev.com/he-IL/

              תגובה 1 תגובה אחרונה
              0
              • מישהו12מ מחובר
                מישהו12מ מחובר
                מישהו12
                מדריכים
                כתב ב נערך לאחרונה על ידי
                #44

                ChatGPT סיפק את התשובה אחרי הרבה ניסיונות

                def clean_text(input_text):
                    hebrew_sentences = []
                
                    # קרא את הקובץ ונקה את המשפטים העבריים
                    with open("input_file.txt", "r", encoding="utf-8") as file:
                        for line in file:
                            if '"text": "' in line:
                                sentence = line.split('"text": "')[1].rstrip('\n').rstrip('"')
                                hebrew_sentences.append(sentence)
                
                    # החזר כל משפט בשורה נפרדת
                    cleaned_text = "\n".join(hebrew_sentences)
                
                    return cleaned_text
                
                # קרא את קובץ הטקסט וקרא את המשפטים
                cleaned_text = clean_text("input_file.txt")
                print(cleaned_text)
                
                # אם ברצונך לשמור את הטקסט הנקי בקובץ חדש
                with open("output_file.txt", "w", encoding="utf-8") as file:
                    file.write(cleaned_text)
                
                

                https://chat.openai.com/share/3bc11429-df51-4046-b937-a98fc225c1b7

                הבלוג שלי
                https://aiv-dev.com/he-IL/

                תגובה 1 תגובה אחרונה
                1
                • מישהו12מ מישהו12

                  @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                  ^13

                  לא עובד
                  6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                  menajemmendelM מנותק
                  menajemmendelM מנותק
                  menajemmendel
                  כתב ב נערך לאחרונה על ידי
                  #45

                  @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                  @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                  ^13

                  לא עובד
                  6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                  מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

                  מישהו12מ תגובה 1 תגובה אחרונה
                  0
                  • מ מנותק
                    מ מנותק
                    מקצועי_
                    כתב ב נערך לאחרונה על ידי מקצועי_
                    #46

                    @מישהו12

                    תדביק פה את ה JSON ותקבל למטה פלט נקי

                    https://regex101.com/r/XZGqY7/1

                    ואם אתה רוצה בשורות נפרדות

                    https://regex101.com/r/XZGqY7/2

                    תגובה 1 תגובה אחרונה
                    1
                    • menajemmendelM menajemmendel

                      @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                      @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                      ^13

                      לא עובד
                      6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                      מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

                      מישהו12מ מחובר
                      מישהו12מ מחובר
                      מישהו12
                      מדריכים
                      כתב ב נערך לאחרונה על ידי
                      #47

                      @menajemmendel מוזר, עשיתי העתק הדבק. בטוח שבלי יותר מידי רווחים.
                      \בכל מקרה תודה לכולם, הסתדרתי עם
                      https://mitmachim.top/post/759544

                      הבלוג שלי
                      https://aiv-dev.com/he-IL/

                      תגובה 1 תגובה אחרונה
                      0
                      • מישהו12מ מישהו12 סימן נושא זה כשאלה ב
                      • מישהו12מ מישהו12 סימן נושא זה כנפתר ב

                      • התחברות

                      • אין לך חשבון עדיין? הרשמה

                      • התחברו או הירשמו כדי לחפש.
                      • פוסט ראשון
                        פוסט אחרון
                      0
                      • חוקי הפורום
                      • פופולרי
                      • לא נפתר
                      • משתמשים
                      • חיפוש גוגל בפורום
                      • צור קשר