@אלי-ויל כתב בשיתוף | כלי AI חדש - זיהוי שגיאות OCR לפי הקשר בטקסטים בעברית:
לכאו' כבר עדיף להכניס לגמיני ולבקש ממנו (מומלץ ליצור ג'ים מיוחד)
קלוד אלוף בזה, מצא לי 99% מהטעיות בתמלולים של שיעורים בלשון הקוידש
@אלי-ויל כתב בשיתוף | כלי AI חדש - זיהוי שגיאות OCR לפי הקשר בטקסטים בעברית:
לכאו' כבר עדיף להכניס לגמיני ולבקש ממנו (מומלץ ליצור ג'ים מיוחד)
קלוד אלוף בזה, מצא לי 99% מהטעיות בתמלולים של שיעורים בלשון הקוידש
@משחזר-מידע איך מבטלים?
@דאנציג כתב בהיו שותפים בפרוייקט זיהוי תווים גדול וחשוב מאד!:
אולי אפשר למצוא את המנוע / תוכנה שאיתה הוא משתמש, ולהפיק מכך תוכנת OCR המדוייקת ביותר בשוק.
ראה כאן:
https://github.com/microsoft/PowerToys/issues/30159#issuecomment-1886341385
@אלף-שין אני שמח לשמוע, רק אם אתה עושה מזה מאקרו - אל תתדגיש את המספרים אלא תעשה עיצוב שאתה בטוח שאין לך בקובץ, או שתוסיף אח"כ שלב של מחיקת רווחים כפולים. כי עכשיו אם יש לך משהו מודגש כבר (שהוא לא מספר) החיפוש יתפוס אותו ויוסיף רווח (מיותר) אחריו.
@menajemmendel אפשר עם התוסף של האדם החושב וורד תורני דרך חיפוש VBA עם קובץ אקסל
@אלף-שין חפש ^# החלף במודגש, לאחר מכן חפש מודגש (רק עיצוב, תשאיר את תיבת החפש ריקה) והחלף ב ^& עם רווח אחריו.
@אלף-שין כתב בבקשת מידע | איך מוסיפים מספר לכל הספרות שנמצאות בקובץ וורד?:
הבעיה היא שלאחר העדכון של המספר הוא מוחק את הרווח שבינו לבין המילה הבאה משום מה,
אם רק זה הבעיה תחפש את כל המספרים - תשנה עיצוב ותוסיף רווח אחרי כן,
חפש: ^# (ספרה כל שהיא) שנה עיצוב, אחר כך תעשה לעיצוב הזה החלף בלי שינוי (^&) + רווח.
@יאיר-דניאל סליחה טעות, הנקודה צריכה להיות בתוך הסוגריים.
אבל ליתר דיוק החיפוש צריך להיות כך: (?[!.])(..)(?[!.]) החלף ב \1.\3
@יאיר-דניאל בנוגע לתיקון נקודה כפולה - כבר כתבתי למעלה שהרבה פעמים כותבים שלוש נקודות ...
ובצורה שאתה עשית זה יהפוך להיות רק שתיים.
לכן החיפוש צריך להיות "..[!]." להחליף ב "..." וכן למקרה שיצא 4 נקודות צריך לחפש: ".{4,}" החלף ב"..."
@106 הOCR הכי טוב היום נמצא בכלי החיתוך של וינדוס 11, (הוא מזהה אפילו ניקוד ממש טוב!)
החיסרון הוא שזה עמוד עמוד.
@מניין רק הערה, בד"כ כשמחפשים נקודה כפולה צריך לנסח כך: ..?[!.] כי מצוי מאד השימוש בשלוש נקודות.
@pcinfogmach אין מילים להודות לך על התוכנה הנפלאה הזאת,
ממש שינה לי (ולעוד כמה שכבר התקנתי להם...) את כל הלימוד וההעריכה בוורד.
מתנצל שאין לי זמן כלל לעזור, אך בכל זאת מצאתי אצלי קובץ של ר"ת בפי.די.אף. (נראה לי מקורו מפרוג)
אולי מישהו יכול לחלץ לטקסט,
כל הראשי תיבות.pdf
@ששמעון מצאתי אצלי איזה מאקרו ישן בשביל זה, לא יודע האם ואיך הוא עובד. לא לוקח אחריות - תגבה קודם את הקבצים.
Sub שילוב_הערות()
aaa = InputBox("?כמה הערות ישנן")
'ccc = InputBox("?מהו שם קובץ ראשי", , "1.doc")
'ddd = InputBox("?מהו שם קובץ הערות", , "2.doc")
'for office 2007
ccc = InputBox("?מהו שם קובץ ראשי", , "1 [מצב תאימות]")
ddd = InputBox("?מהו שם קובץ הערות", , "2 [מצב תאימות]")
Application.ScreenUpdating = False
Windows(ddd).Activate
With Selection
.EndKey Unit:=wdStory
.TypeParagraph
.TypeText Text:="&"
.HomeKey Unit:=wdStory
End With
Windows.Arrange
For i = 1 To aaa
StatusBar = i & " of " & aaa
Windows(ddd).Activate
With Selection
.StartIsActive = False
.Extend Character:="&"
.Extend Character:="&"
.MoveLeft Unit:=wdCharacter, Count:=1, Extend:=wdExtend
.Cut
End With
Windows(ccc).Activate
Selection.Find.ClearFormatting
With Selection.Find
.Text = "$"
.Forward = True
.Wrap = wdFindContinue
.MatchWildcards = False
End With
Selection.Find.Execute
Selection.Delete
ActiveDocument.Footnotes.Add Range:=Selection.Range, Reference:=""
Selection.Paste
Selection.TypeBackspace
ActiveWindow.Panes(1).Activate
Selection.HomeKey Unit:=wdStory
Next
Application.ScreenUpdating = True
End Sub
@pcinfogmach
תודה רבה על ההדרכה הנפלאה, וההסברים המפורטים, החכמתי מכך רבות.
בחיפוש טקסט בתוך מירכאות כתבת קוד למציאת ראשי תיבות:
([א-ת])(")([א-ת])
הבעיה שהקוד לא עובד על טקסט מנוקד,
אולי כדאי להחליף בקוד הזה: ^$"^$ (בלי להפעיל תווים כלליים)
הקוד מוצא ראשי תיבות בכל טקסט מנוקד או לא מנוקד.
מכיוון ש: ^$ מייצג אות כל שהיא בין מנוקדת בין שאינה מנוקדת.
ואם כבר, אז אני מעתיק לכאן נוסחה שמוצאת את כל המילים עם הראשי תיבות, גם המנוקדים וגם הלא מנוקדים:
כך:
<[א-תְ-ׂ]@>"<[א-תְ-ׂ]@>
הסבר:
< תחילת מילה
[א-תְ-ׂ] טווח: כל האותיות וכל הניקוד
@ רצף של המופע הקודם
> סוף מילה (בוורד מילה עם ראשי תיבות נחשבת כשני מילים)
" הראשי תיבות עצמם
וחוזר שוב לאחר הראשי תיבות.
הערה: כאשר יש שימוש בקובץ בגרשיים (לסימון ציטוטים, או מה שקרוי "גרשיים כפולים" וכדומה) החיפוש ימצא גם מילה כזו: הכומר ה"קדוש". אין לכך פתרון גורף, אך אפשר להגביל את כמות התווים במקטע השני שלאחר הר"ת ל3 או ל4:
ככה:
<[א-תְ-ׂ]@>"<[א-תְ-ׂ]{1,4}>
למה 4? זו כמות התווים הכי גדולה שיש באות אחת: שי"ן. 1 האות עצמה, 2 הניקוד, 3 שׂ או שׁ, 4 ואולי גם שמו דגש... שּ
@MNM ייש"כ עצום!
פשוט מדהים!
כל כך ברור ונעים!
לדעתי כדאי לשנות את הכותרת מ'הוראות לעימוד' למשהו בסגנון 'באו לעמד יד ביד יחד עם מעמד מקצועי וסבלן'...
ודאי שמחכים להמשך!
@MNM מעולה ביותר!!
ממש ברור ונעים, תודה רבה על ההשקעה.
@MNM כתב במדריך | הוראות לעימוד בתוכנת Publisher פרק א':
אשמח לדעת האם החברים כאן מעוניינים שאמשיך לעבוד על הפרקים הבאים.
בהחלט מצפים להמשך.
@MNM כתב בבירור | האם אפשר לעשות עימוד לספר תורני עם publisher של אופיס:
יעיל מאוד.
אולי אשב לכתוב הסבר והוראות לעימוד בתוכנה ואעלה את זה כאן.
לי עצמי וכן לעוד כמה אנשים שאני מכיר זה ממש יעזור.