דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. מחשבים וטכנולוגיה
  3. עזרה הדדית - מחשבים וטכנולוגיה
  4. בירור | ניקוי קובץ טקסט מתווים מיותרים

בירור | ניקוי קובץ טקסט מתווים מיותרים

מתוזמן נעוץ נעול הועבר נפתר עזרה הדדית - מחשבים וטכנולוגיה
47 פוסטים 10 כותבים 632 צפיות 8 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • מישהו12מ מישהו12

    @menajemmendel תודה, זה עבד.
    רק עם בעיה קטנה אחת.
    איפה שהיה גרשיים בטקסט (בדרך כלל במילה הרמב"ם). זה מחק אותם ואת כל מה שאחריהם.
    וזה מה שאמרתי, שגירשיים בתוך הטקסט אני רוצה לשמור.
    הדרך להבדיל היא, שאחרי גרשיים מהסוג שאני רוצה לשמור תמיד יופיע עוד תו, ואחרי אלו שאני רוצה למחוק אותם ואת מה שאחריהם, יופיע אנטר או רווח ואחריו אנטר.

    צדיק תמיםצ מנותק
    צדיק תמיםצ מנותק
    צדיק תמים
    מדריכים
    כתב ב נערך לאחרונה על ידי צדיק תמים
    #35

    @מישהו12 אני עדיין לא מבין את הרעיון המוזר לפרסר JSON באמצעות חיפוש והחלפה לסוגיו כאילו שזה טקסט רגיל

    רוצה לזכור קריאת שמע בזמן? לחץ כאן! || אתר שכולו מדריכים

    מישהו12מ תגובה 1 תגובה אחרונה
    2
    • צדיק תמיםצ צדיק תמים

      @מישהו12 אני עדיין לא מבין את הרעיון המוזר לפרסר JSON באמצעות חיפוש והחלפה לסוגיו כאילו שזה טקסט רגיל

      מישהו12מ מנותק
      מישהו12מ מנותק
      מישהו12
      מדריכים
      כתב ב נערך לאחרונה על ידי
      #36

      @צדיק-תמים יש לי עניין בתוצאה, לא מעניין אותי הדרך...

      הבלוג שלי
      https://aiv-dev.com/he-IL/

      תגובה 1 תגובה אחרונה
      0
      • מישהו12מ מישהו12

        @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        @מישהו12
        תיקנתי תנסה עכשיו

        עכשיו זה שומר את כל הגרשיים

        ישראל 142י מנותק
        ישראל 142י מנותק
        ישראל 142
        מדריכים
        כתב ב נערך לאחרונה על ידי
        #37

        @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

        @מישהו12
        תיקנתי תנסה עכשיו

        עכשיו זה שומר את כל הגרשיים

        אז עכשיו אתה יכול לעשות החלפה של כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד, ואז כל הרגשיים שבתוך מילה ישארו

        טכנאי מחשבים

        מישהו12מ תגובה 1 תגובה אחרונה
        0
        • ישראל 142י ישראל 142

          @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

          @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

          @מישהו12
          תיקנתי תנסה עכשיו

          עכשיו זה שומר את כל הגרשיים

          אז עכשיו אתה יכול לעשות החלפה של כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד, ואז כל הרגשיים שבתוך מילה ישארו

          מישהו12מ מנותק
          מישהו12מ מנותק
          מישהו12
          מדריכים
          כתב ב נערך לאחרונה על ידי
          #38

          @ישראל-142 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

          כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד

          אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

          הבלוג שלי
          https://aiv-dev.com/he-IL/

          menajemmendelM תגובה 1 תגובה אחרונה
          0
          • מישהו12מ מישהו12

            @ישראל-142 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

            כל הרגשיים שיש לפניהם או אחריהם רווח -ברווח לבד

            אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

            menajemmendelM מנותק
            menajemmendelM מנותק
            menajemmendel
            כתב ב נערך לאחרונה על ידי
            #39

            @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

            אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

            אתה יודע להשתמש בחפש והחלף?
            CTRL +H
            ותכתוב שם "^13
            9d2619ad-618c-4722-8379-2a8d7dfb39a5-image.png

            הסבר: ^13 הוא אנטר
            מישהו12מ תגובה 1 תגובה אחרונה
            1
            • menajemmendelM menajemmendel

              @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

              אם הייתי יודע איך לעשות החלפה של " שיש אחריהם אנטר, הנושא מתחילתו לא היה נפתח... זו בדיוק השאלה.

              אתה יודע להשתמש בחפש והחלף?
              CTRL +H
              ותכתוב שם "^13
              9d2619ad-618c-4722-8379-2a8d7dfb39a5-image.png

              הסבר: ^13 הוא אנטר
              מישהו12מ מנותק
              מישהו12מ מנותק
              מישהו12
              מדריכים
              כתב ב נערך לאחרונה על ידי
              #40

              @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

              ^13

              לא עובד
              6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

              הבלוג שלי
              https://aiv-dev.com/he-IL/

              menajemmendelM תגובה 1 תגובה אחרונה
              0
              • MGM IVRM MGM IVR

                @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                יש לי קובץ טקסט שנראה ככה
                7e56062d-516f-4f0a-b6f2-bb610385805e-image.png
                אני מעוניין שישארו רק המשפטים בעברית, בלי כל הסימנים, הכיתוב באנגלית וכדו'.
                חפש והחלף לא עוזר לי כי אפשר לחפש\למחוק שם ירידות שורה (אנטרים).

                תודה!

                למה לא להריץ איזה סקריפט פייתון קצר,
                סוג של כזה דבר

                אפשרי להריץ אונליין גם למשל באתר הבא https://www.programiz.com/python-programming/online-compiler/

                data = [
                    {
                        "timestamp":[3249, 2455],
                        "text" : "המחשבה בדבר"
                    },
                    {
                        "timestamp":[3269, 1455],
                        "text" : "המחשבה האמיתית"
                    },
                    {
                        "timestamp":[234, 24423342555],
                        "text" : "היא מחתימה את הכל "
                    },
                    {
                        "timestamp":[3249, 2455],
                        "text" : "עבור מישהו12 "
                    }
                ]
                

                ואז

                alltext = ""
                
                for i in data:
                    alltext += i["text"] + " "
                print(alltext)
                

                בשביל לחבר בין משפט למשפט ברווח

                או

                alltext = ""
                
                for i in data:
                    alltext += i["text"] + "\n"
                    
                print(alltext)
                

                כדי לחבר בינהם בשורה חדשה

                כמובן שלא חייבים להדפיס את התוצאה, אפשרי גם לכתוב אתה לקובץ (זה לא ניתן באתר הנ״ל לכאורה)

                open("text.txt", "w").write(alltext)
                
                מישהו12מ מנותק
                מישהו12מ מנותק
                מישהו12
                מדריכים
                כתב ב נערך לאחרונה על ידי
                #41

                @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

                הבלוג שלי
                https://aiv-dev.com/he-IL/

                MGM IVRM תגובה 1 תגובה אחרונה
                0
                • מישהו12מ מישהו12

                  @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

                  MGM IVRM מנותק
                  MGM IVRM מנותק
                  MGM IVR
                  מדריכים
                  כתב ב נערך לאחרונה על ידי MGM IVR
                  #42

                  @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                  @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

                  import json
                  
                  file = open('file.txt', 'r').read()
                  data = json.loads(file)
                  
                  alltext = ""
                   
                  for i in data:
                      alltext += i["text"] + "\n"
                      
                  
                  open("output.txt", "w").write(alltext)
                  

                  הקובץ צריך להיות במבנה json כמובן
                  למשל

                  [
                      {
                          "timestamp":[3249, 2455],
                          "text" : "המחשבה בדבר"
                      },
                      {
                          "timestamp":[3269, 1455],
                          "text" : "המחשבה האמיתית"
                      },
                      {
                          "timestamp":[234, 24423342555],
                          "text" : "היא מחתימה את הכל "
                      },
                      {
                          "timestamp":[3249, 2455],
                          "text" : "עבור מישהו12 "
                      }
                  ]
                  
                  מישהו12מ תגובה 1 תגובה אחרונה
                  0
                  • MGM IVRM MGM IVR

                    @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                    @MGM-IVR אפשר את זה כסקריפט אחד שירוץ על קובץ בשם file.txt?

                    import json
                    
                    file = open('file.txt', 'r').read()
                    data = json.loads(file)
                    
                    alltext = ""
                     
                    for i in data:
                        alltext += i["text"] + "\n"
                        
                    
                    open("output.txt", "w").write(alltext)
                    

                    הקובץ צריך להיות במבנה json כמובן
                    למשל

                    [
                        {
                            "timestamp":[3249, 2455],
                            "text" : "המחשבה בדבר"
                        },
                        {
                            "timestamp":[3269, 1455],
                            "text" : "המחשבה האמיתית"
                        },
                        {
                            "timestamp":[234, 24423342555],
                            "text" : "היא מחתימה את הכל "
                        },
                        {
                            "timestamp":[3249, 2455],
                            "text" : "עבור מישהו12 "
                        }
                    ]
                    
                    מישהו12מ מנותק
                    מישהו12מ מנותק
                    מישהו12
                    מדריכים
                    כתב ב נערך לאחרונה על ידי
                    #43

                    @MGM-IVR

                    python script.py
                    Traceback (most recent call last):
                      File "C:\Users\*****\Desktop\מסמכים אישיים\*******\New folder\script.py", line 3, in <module>
                        file = open('file.txt', 'r').read()
                               ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                      File "C:\Users\*****\AppData\Local\Programs\Python\Python311\Lib\encodings\cp1255.py", line 23, in decode
                        return codecs.charmap_decode(input,self.errors,decoding_table)[0]
                               ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
                    UnicodeDecodeError: 'charmap' codec can't decode byte 0x9e in position 59: character maps to <undefined>
                    

                    הבלוג שלי
                    https://aiv-dev.com/he-IL/

                    תגובה 1 תגובה אחרונה
                    0
                    • מישהו12מ מנותק
                      מישהו12מ מנותק
                      מישהו12
                      מדריכים
                      כתב ב נערך לאחרונה על ידי
                      #44

                      ChatGPT סיפק את התשובה אחרי הרבה ניסיונות

                      def clean_text(input_text):
                          hebrew_sentences = []
                      
                          # קרא את הקובץ ונקה את המשפטים העבריים
                          with open("input_file.txt", "r", encoding="utf-8") as file:
                              for line in file:
                                  if '"text": "' in line:
                                      sentence = line.split('"text": "')[1].rstrip('\n').rstrip('"')
                                      hebrew_sentences.append(sentence)
                      
                          # החזר כל משפט בשורה נפרדת
                          cleaned_text = "\n".join(hebrew_sentences)
                      
                          return cleaned_text
                      
                      # קרא את קובץ הטקסט וקרא את המשפטים
                      cleaned_text = clean_text("input_file.txt")
                      print(cleaned_text)
                      
                      # אם ברצונך לשמור את הטקסט הנקי בקובץ חדש
                      with open("output_file.txt", "w", encoding="utf-8") as file:
                          file.write(cleaned_text)
                      
                      

                      https://chat.openai.com/share/3bc11429-df51-4046-b937-a98fc225c1b7

                      הבלוג שלי
                      https://aiv-dev.com/he-IL/

                      תגובה 1 תגובה אחרונה
                      1
                      • מישהו12מ מישהו12

                        @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                        ^13

                        לא עובד
                        6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                        menajemmendelM מנותק
                        menajemmendelM מנותק
                        menajemmendel
                        כתב ב נערך לאחרונה על ידי
                        #45

                        @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                        @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                        ^13

                        לא עובד
                        6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                        מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

                        מישהו12מ תגובה 1 תגובה אחרונה
                        0
                        • מ מנותק
                          מ מנותק
                          מקצועי_
                          כתב ב נערך לאחרונה על ידי מקצועי_
                          #46

                          @מישהו12

                          תדביק פה את ה JSON ותקבל למטה פלט נקי

                          https://regex101.com/r/XZGqY7/1

                          ואם אתה רוצה בשורות נפרדות

                          https://regex101.com/r/XZGqY7/2

                          תגובה 1 תגובה אחרונה
                          1
                          • menajemmendelM menajemmendel

                            @מישהו12 כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                            @menajemmendel כתב בבירור | ניקוי קובץ טקסט מתווים מיותרים:

                            ^13

                            לא עובד
                            6fe1cbfd-31c7-4b69-a806-2e60d4753c68-image.png

                            מעניין לי דוקא כן עובד, אולי כתבת מידי הרבה רווחים 81ccb2e6-adba-4d34-8391-ddb5e979fcc4-image.png

                            מישהו12מ מנותק
                            מישהו12מ מנותק
                            מישהו12
                            מדריכים
                            כתב ב נערך לאחרונה על ידי
                            #47

                            @menajemmendel מוזר, עשיתי העתק הדבק. בטוח שבלי יותר מידי רווחים.
                            \בכל מקרה תודה לכולם, הסתדרתי עם
                            https://mitmachim.top/post/759544

                            הבלוג שלי
                            https://aiv-dev.com/he-IL/

                            תגובה 1 תגובה אחרונה
                            0
                            • מישהו12מ מישהו12 סימן נושא זה כשאלה ב
                            • מישהו12מ מישהו12 סימן נושא זה כנפתר ב

                            • התחברות

                            • אין לך חשבון עדיין? הרשמה

                            • התחברו או הירשמו כדי לחפש.
                            • פוסט ראשון
                              פוסט אחרון
                            0
                            • חוקי הפורום
                            • פופולרי
                            • לא נפתר
                            • משתמשים
                            • חיפוש גוגל בפורום
                            • צור קשר