@pcinfogmach
תודה רבה על ההדרכה הנפלאה, וההסברים המפורטים, החכמתי מכך רבות.
בחיפוש טקסט בתוך מירכאות כתבת קוד למציאת ראשי תיבות:
([א-ת])(")([א-ת])
הבעיה שהקוד לא עובד על טקסט מנוקד,
אולי כדאי להחליף בקוד הזה: ^$"^$ (בלי להפעיל תווים כלליים)
הקוד מוצא ראשי תיבות בכל טקסט מנוקד או לא מנוקד.
מכיוון ש: ^$ מייצג אות כל שהיא בין מנוקדת בין שאינה מנוקדת.
ואם כבר, אז אני מעתיק לכאן נוסחה שמוצאת את כל המילים עם הראשי תיבות, גם המנוקדים וגם הלא מנוקדים:
כך:
<[א-תְ-ׂ]@>"<[א-תְ-ׂ]@>
הסבר:
< תחילת מילה
[א-תְ-ׂ] טווח: כל האותיות וכל הניקוד
@ רצף של המופע הקודם
> סוף מילה (בוורד מילה עם ראשי תיבות נחשבת כשני מילים)
" הראשי תיבות עצמם
וחוזר שוב לאחר הראשי תיבות.
הערה: כאשר יש שימוש בקובץ בגרשיים (לסימון ציטוטים, או מה שקרוי "גרשיים כפולים" וכדומה) החיפוש ימצא גם מילה כזו: הכומר ה"קדוש". אין לכך פתרון גורף, אך אפשר להגביל את כמות התווים במקטע השני שלאחר הר"ת ל3 או ל4:
ככה:
<[א-תְ-ׂ]@>"<[א-תְ-ׂ]{1,4}>
Spoiler
למה 4? זו כמות התווים הכי גדולה שיש באות אחת: שי"ן. 1 האות עצמה, 2 הניקוד, 3 שׂ או שׁ, 4 ואולי גם שמו דגש... שּ