דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בירור | RAG עם חיפוש וקטורי?

בירור | RAG עם חיפוש וקטורי?

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
4 פוסטים 2 כותבים 62 צפיות 2 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • ע מנותק
    ע מנותק
    עידו300
    כתב נערך לאחרונה על ידי
    #1

    אם גם ככה בשביל RAG צריך קודם מודל שימצא את הנתונים המתאימים ואח"כ עוד מודל שיעשה מזה פלט, למה לעשות את זה וקטורי? אפשר לדלג על השלב הראשון ופשוט לתת את כל המידע למודל שמיצר את הפלט ושיעשה את כל העבודה? למה לעבוד כפול ומכופל?

    א.מ.ד.א תגובה 1 תגובה אחרונה
    0
    • ע עידו300

      אם גם ככה בשביל RAG צריך קודם מודל שימצא את הנתונים המתאימים ואח"כ עוד מודל שיעשה מזה פלט, למה לעשות את זה וקטורי? אפשר לדלג על השלב הראשון ופשוט לתת את כל המידע למודל שמיצר את הפלט ושיעשה את כל העבודה? למה לעבוד כפול ומכופל?

      א.מ.ד.א מנותק
      א.מ.ד.א מנותק
      א.מ.ד.
      כתב נערך לאחרונה על ידי
      #2

      @עידו300 יש פה אי-הבנה איך זה עובד.
      המערכת מצמידה להקשר את הטקסטים הדומים מבחינה סמנטית לשאילתה, אחרי שביצעה אינדוקס סמנטי באמצעות מודל קטן של הטמעה.
      בדרך כלל מדובר בכמויות עצומות של טקסטים, ואי אפשר לתת אותם למודל הראשי שיעבור על הכל, ולכן רק החלקים הרלוונטיים בטקסט מצורפים לשאילתה.
      בנוסף, ככה מודל ההטמעה עובר רק פעם אחת על הטקסט באינדוקס, ואחר כך בכל שאילתא רק השאלה עוברת הטמעה סמנטית שזה לוקח רגע אחד, ולא צריך לסרוק שוב את כל התוכן.

      מפתח אפליקציות אנדרואיד
      em0548438097@gmail.com

      ע תגובה 1 תגובה אחרונה
      2
      • א.מ.ד.א א.מ.ד.

        @עידו300 יש פה אי-הבנה איך זה עובד.
        המערכת מצמידה להקשר את הטקסטים הדומים מבחינה סמנטית לשאילתה, אחרי שביצעה אינדוקס סמנטי באמצעות מודל קטן של הטמעה.
        בדרך כלל מדובר בכמויות עצומות של טקסטים, ואי אפשר לתת אותם למודל הראשי שיעבור על הכל, ולכן רק החלקים הרלוונטיים בטקסט מצורפים לשאילתה.
        בנוסף, ככה מודל ההטמעה עובר רק פעם אחת על הטקסט באינדוקס, ואחר כך בכל שאילתא רק השאלה עוברת הטמעה סמנטית שזה לוקח רגע אחד, ולא צריך לסרוק שוב את כל התוכן.

        ע מנותק
        ע מנותק
        עידו300
        כתב נערך לאחרונה על ידי
        #3

        @א.מ.ד. בשאילתא - המודל הקטן לא עובר על כל החומר שוב כדי למצוא אם יש משהו מתאים?
        כמו שהבנתי זה ככה:
        בהטמעה - מודל אמבדד "מקודד" (נקרא לזה ככה) את כל החומר.
        בחיפוש - מודל אמבדד "מקודד" את השאלה ומחפש המאגר ה"מקודד" משהו מתאים, הן מבחינת התאמה בקידוד והן מבחינת התאמה בהקשר, זאת אומרת שמי שמחפש ספר על פנימיות התורה יקבל תוצאות של תניא וכד', למרות שמבחינת הקידוד זה לא מתאים.
        את התוצאות מביאים למודל גדול כדי שינסח מזה תשובה.

        אם גם ככה המודל הקטן עובר על הכל (הרי הוא צריך למצוא כל מה שמתאים, גם מבחינת ההקשר) למה שהמודל הגדול לא יעשה את זה וזהו.

        א.מ.ד.א תגובה 1 תגובה אחרונה
        0
        • ע עידו300

          @א.מ.ד. בשאילתא - המודל הקטן לא עובר על כל החומר שוב כדי למצוא אם יש משהו מתאים?
          כמו שהבנתי זה ככה:
          בהטמעה - מודל אמבדד "מקודד" (נקרא לזה ככה) את כל החומר.
          בחיפוש - מודל אמבדד "מקודד" את השאלה ומחפש המאגר ה"מקודד" משהו מתאים, הן מבחינת התאמה בקידוד והן מבחינת התאמה בהקשר, זאת אומרת שמי שמחפש ספר על פנימיות התורה יקבל תוצאות של תניא וכד', למרות שמבחינת הקידוד זה לא מתאים.
          את התוצאות מביאים למודל גדול כדי שינסח מזה תשובה.

          אם גם ככה המודל הקטן עובר על הכל (הרי הוא צריך למצוא כל מה שמתאים, גם מבחינת ההקשר) למה שהמודל הגדול לא יעשה את זה וזהו.

          א.מ.ד.א מנותק
          א.מ.ד.א מנותק
          א.מ.ד.
          כתב נערך לאחרונה על ידי
          #4

          @עידו300 בשאילתא המודל הקטן (ההטמעה/אמבדינג/מקודד) לא עובר על כל החומר אלא רק על בשאילתא, מקודד אותה לוקטור, ואז המערכת בפעולה חישובית מהירה של אלפית שניה משווה אותה לאינדקס המוכן מראש של החומר המלא ושולפת את ההתאמות הזדמנויות, כלומר לפי משמעות, ופנימיות התורה קרוב מאוד לתניא ולכן זה יעלה בתוצאות.
          התוצאות הקרובות מבחינה סמנטית מצורפות לשאילתה שממשיכה אל המודל הגדול (שפה/מפענח), שהוא מנסח תשובה בהתאם להקשר שעלה בחיפוש.
          אז קודם כל פנימיות התורה ותניא זה כן קרוב בקידוד הוקטורי. קרבה משמעותית (סמנטית) היא קרבה ב"קידוד".
          בנוסף, המודל הקטן לא עובר בכל פעם על כל התוכן אלא רק על בשאילתא, והמערכת משווה אותה לאינדקס בפעולה שכמעט לא צורכת משאבים.
          עוד דבר, בשביל לקודד טקסט לווקטור לא צריך מודל גדול ולכן מספיק מודל קטן וחסכוני.
          אגב, המודל הקטן המקודד והמודל הגדול המפענח לא פועלים באותה דרך. הקטן יותר מתאים לקידוד טקסט כי הוא דו כיווני (קורא את הטקסט ישר והפוך) לעומת הגדול שקורא רק ישר.

          מפתח אפליקציות אנדרואיד
          em0548438097@gmail.com

          תגובה 1 תגובה אחרונה
          1

          • התחברות

          • אין לך חשבון עדיין? הרשמה

          • התחברו או הירשמו כדי לחפש.
          • פוסט ראשון
            פוסט אחרון
          0
          • חוקי הפורום
          • פופולרי
          • לא נפתר
          • משתמשים
          • חיפוש גוגל בפורום
          • צור קשר