@עידו300 בשאילתא המודל הקטן (ההטמעה/אמבדינג/מקודד) לא עובר על כל החומר אלא רק על בשאילתא, מקודד אותה לוקטור, ואז המערכת בפעולה חישובית מהירה של אלפית שניה משווה אותה לאינדקס המוכן מראש של החומר המלא ושולפת את ההתאמות הזדמנויות, כלומר לפי משמעות, ופנימיות התורה קרוב מאוד לתניא ולכן זה יעלה בתוצאות.
התוצאות הקרובות מבחינה סמנטית מצורפות לשאילתה שממשיכה אל המודל הגדול (שפה/מפענח), שהוא מנסח תשובה בהתאם להקשר שעלה בחיפוש.
אז קודם כל פנימיות התורה ותניא זה כן קרוב בקידוד הוקטורי. קרבה משמעותית (סמנטית) היא קרבה ב"קידוד".
בנוסף, המודל הקטן לא עובר בכל פעם על כל התוכן אלא רק על בשאילתא, והמערכת משווה אותה לאינדקס בפעולה שכמעט לא צורכת משאבים.
עוד דבר, בשביל לקודד טקסט לווקטור לא צריך מודל גדול ולכן מספיק מודל קטן וחסכוני.
אגב, המודל הקטן המקודד והמודל הגדול המפענח לא פועלים באותה דרך. הקטן יותר מתאים לקידוד טקסט כי הוא דו כיווני (קורא את הטקסט ישר והפוך) לעומת הגדול שקורא רק ישר.