@א-מ-ד כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:
@mefateach כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:
@א-מ-ד אתה בטוח שהוא לא באמת חושב, אני חשבתי שמה שמוצג כחושב זה בעצם הוא כאילו מוסיף את זה לשאלה של המשתמש בעצם כמו שבן אדם חושב הוא חושב גם מילולית זה מרחיב את החשיבה
קראתי את זה בפרסום של OPENAI על מודל החשיבה O1 כשיצא לאוויר העולם. אחרי שהוא חושב בתהליך הפנימי הוא מנסה לתמלל בדיעבד את החשיבה. אם אני זוכר נכון, קראתי אז בגיקטיים אאל"ט שתהליך החשיבה האמיתי הוא סוד עסקי שאין מצב שיחשפו לנו אותו.
לא מדויק. OpenAI ספציפית מסתירים את תהליך החשיבה משיקולים של מניעת תחרות וכדומה.
בפועל, הדרך שבה המודל מנהל את החשיבה של עצמו היא באמצעות הטקסט שהוא פולט, רק שבאופן פנימי הוא יוצר הרבה אסימונים נסתרים. וזו גם אחת הסיבות שהמחיר של מודלי חשיבה פר אסימון הוא הרבה יותר גבוה, כי בפועל עבור כל אסימון הם עובדים מאחורי הקלעים הרבה יותר
אני לא ממש יודע את הפרטים המלאים, אבל זה בודאי לא סתם עוד טקסט, ולא לחינם זה מקפיץ את היכולות של המודלים פי כמה וכמה