דילוג לתוכן
  • חוקי הפורום
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
לוגו מותג
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. בקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?

בקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
25 פוסטים 8 כותבים 939 צפיות
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א.מ.ד.א מנותק
    א.מ.ד.א מנותק
    א.מ.ד.
    השיב לחנוך הכהן נערך לאחרונה על ידי א.מ.ד.
    #4

    @חנוך-הכהן כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

    @א-מ-ד יש לי מחשב של 16 ומחשב של 32 (מחשב נייח, כך שאני יכול להרחיב את הRAM להרבה יותר מזה)

    במחשב הייתי אומר שאתה יכול להריץ עד מודל שגודלו עד חצי מה-RAM שלך, אבל כמובן זה אינדיבידואלי... תבדוק שזה לא תוקע לך את ה-RAM. נפח דיסק לא רלוונטי.
    הייתי ממליץ על מודל GEMMA 3 שהוא מעולה בעברית. תיקח כמה שיותר גדול (בהתאם ליכולת של המחשב).
    כדאי שתיקח בקוונטיזציית Q_8, ותעלה בכמות הפרמטרים ככל האפשר.

    תגובה 1 תגובה אחרונה
    1
    • א.מ.ד.א מנותק
      א.מ.ד.א מנותק
      א.מ.ד.
      השיב לחנוך הכהן נערך לאחרונה על ידי
      #5

      @חנוך-הכהן קח את זה:
      https://huggingface.co/bartowski/google_gemma-3-12b-it-qat-GGUF/resolve/main/google_gemma-3-12b-it-qat-Q8_0.gguf?download=true

      ח 2 תגובות תגובה אחרונה
      2
      • ח מנותק
        ח מנותק
        חנוך הכהן
        השיב לא.מ.ד. נערך לאחרונה על ידי
        #6

        @א-מ-ד המודל כולל מאגר נתונים?

        תגובה 1 תגובה אחרונה
        0
        • ח מנותק
          ח מנותק
          חנוך הכהן
          השיב לא.מ.ד. נערך לאחרונה על ידי
          #7

          @א-מ-ד וגם, באיזה תוכנה אפשר להריץ את זה?

          דוד משה 1ד תגובה 1 תגובה אחרונה
          0
          • דוד משה 1ד מנותק
            דוד משה 1ד מנותק
            דוד משה 1
            השיב לחנוך הכהן נערך לאחרונה על ידי
            #8
            פוסט זה נמחק!
            תגובה 1 תגובה אחרונה
            1
            • א מנותק
              א מנותק
              א.מ. מדריכים
              השיב לחנוך הכהן נערך לאחרונה על ידי
              #9

              @חנוך-הכהן זה תלוי בעיקר ב-VRAM של הכרטיס מסך, הרצה על ה-CPU תהיה איטית.
              המודל הכי איכותי שניתן להריץ כיום על מחשב מקומי הוא DeepSeek שדורש 24 GB (לגרסה הכי איכותית שלו).

              ח א.מ.ד.א 2 תגובות תגובה אחרונה
              1
              • ח מנותק
                ח מנותק
                חנוך הכהן
                השיב לא.מ. נערך לאחרונה על ידי
                #10

                @א-מ כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                GB

                הזיכרון בדיסק זה לא הבעיה, אבל כמה RAM נדרש?

                א תגובה 1 תגובה אחרונה
                0
                • א מנותק
                  א מנותק
                  א.מ. מדריכים
                  השיב לחנוך הכהן נערך לאחרונה על ידי א.מ.
                  #11

                  @חנוך-הכהן
                  למודלים של 14B – 32B:
                  זיכרון RAM: 64GB.
                  מעבד: 16 ליבות (Intel i7/AMD Ryzen 7 ומעלה).
                  GPU: מומלץ כרטיס עם 24GB VRAM (כגון RTX 4090).

                  תגובה 1 תגובה אחרונה
                  1
                  • א מנותק
                    א מנותק
                    אריאלל
                    השיב לחנוך הכהן נערך לאחרונה על ידי
                    #12

                    @חנוך-הכהן כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                    אני רוצה לצרכים לימודיים מודל שפה לא מורכב מידי - שיהיה ניתן להתקין על מחשב

                    כמו שכבר כתבו לך, גם אם תריץ על ה 32 ראם זה עדין יהיה איטי בצורה מתסכלת, במיוחד אם תשתמש במודל שרק "מתרגם" את האימון שלו לעברית (כמו GEEMA).
                    אז או שתריץ על GPU חיצוני, או שתשתמש במודל 'דיקטה' שאומן על עברית וכך זה יהיה יותר מהיר. החיסרון הוא שהוא לא כ"כ חכם כמו שאר המודלים הקיימים.
                    אם תרצה, העליתי פה תוכנה פשוטה להרצת מודלים מכווצים מקומית

                    תגובה 1 תגובה אחרונה
                    0
                    • א מנותק
                      א מנותק
                      א.מ. מדריכים
                      כתב נערך לאחרונה על ידי
                      #13

                      אני הייתי הכי ממליץ על המודל הזה הוא שילוב סביר בין איכות לביצועים.

                      תגובה 1 תגובה אחרונה
                      1
                      • א.מ.ד.א מנותק
                        א.מ.ד.א מנותק
                        א.מ.ד.
                        השיב לא.מ. נערך לאחרונה על ידי א.מ.ד.
                        #14

                        @א-מ כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                        המודל הכי איכותי שניתן להריץ כיום על מחשב מקומי הוא DeepSeek שדורש 24 GB (לגרסה הכי איכותית שלו).

                        1. לא מצטיין בעברית
                        2. זו ממש לא הגרסא הכי איכותית (היא שוקלת מאות ג'יגה)
                        3. אתה מדבר על מודל V3 שהוא לא הכי חכם שלהם בלשון המעטה

                        @א-מ כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                        למודלים של 14B – 32B:

                        זה לא מחושב לפי מספר הפרמטרים אלא לפי המשקל בג'יגות

                        @אריאלל כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                        גם אם תריץ על ה 32 ראם זה עדין יהיה איטי בצורה מתסכלת

                        לא נכון לגבי gemma 3

                        @אריאלל כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                        במיוחד אם תשתמש במודל שרק "מתרגם" את האימון שלו לעברית (כמו GEEMA)

                        ????????????

                        @א-מ כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                        אני הייתי הכי ממליץ על המודל הזה הוא שילוב סביר בין איכות לביצועים

                        בדיוק המודל שהעליתי למעלה

                        א תגובה 1 תגובה אחרונה
                        1
                        • א מנותק
                          א מנותק
                          אריאלל
                          השיב לא.מ.ד. נערך לאחרונה על ידי
                          #15

                          @א-מ-ד כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                          במיוחד אם תשתמש במודל שרק "מתרגם" את האימון שלו לעברית (כמו GEEMA)

                          ????????????

                          תנסה את GEEMA באנגלית ובעברית ותראה את הפער במהירות התגובה.
                          (מה שהמודלים האלה תומכים בעברית זה בעצם על ידי תרגום ולא שהם באמת אומנו על עברית)

                          ח א.מ.ד.א 2 תגובות תגובה אחרונה
                          0
                          • ח מנותק
                            ח מנותק
                            חנוך הכהן
                            השיב לאריאלל נערך לאחרונה על ידי חנוך הכהן
                            #16

                            @אריאלל נכון, אבל זה המקסימום שאפשר לצפות אליו ממחשב כמו שלי
                            ||סתם שאלה, זה רק אני או שהפורומים שהכי פעילים בלילה זה פורומי טכנולוגיה? 😉 ||

                            א תגובה 1 תגובה אחרונה
                            1
                            • א מנותק
                              א מנותק
                              אריאלל
                              השיב לחנוך הכהן נערך לאחרונה על ידי
                              #17

                              @חנוך-הכהן או שתנסה את דיקטה
                              השאלה לאיזה צורך כמובן...

                              תגובה 1 תגובה אחרונה
                              0
                              • א.מ.ד.א מנותק
                                א.מ.ד.א מנותק
                                א.מ.ד.
                                השיב לאריאלל נערך לאחרונה על ידי
                                #18

                                @אריאלל כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                                תנסה את GEEMA באנגלית ובעברית ותראה את הפער במהירות התגובה.

                                בדקתי. זהה לחלוטין בממוצע.

                                @אריאלל כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                                (מה שהמודלים האלה תומכים בעברית זה בעצם על ידי תרגום ולא שהם באמת אומנו על עברית)

                                אתה בעצם טוען שבכל שאילתא המודל מתרגם את השאלה לאנגלית, עונה עליה, ומתרגם חזרה לעברית? יש לך מקור לזה?

                                א NH.LOCALN 2 תגובות תגובה אחרונה
                                0
                                • א מנותק
                                  א מנותק
                                  אריאלל
                                  השיב לא.מ.ד. נערך לאחרונה על ידי
                                  #19

                                  @א-מ-ד א. אצלי ישנו הבדל יחסית משמעותי.
                                  ב. אין לי מקור לזה, אבל אני חושב שזה דבר פשוט. תסתכל במודלים שאתה יכול לראות את החשיבה שלהם, גם אם שאלת והוא עונה בעברית המחשבות הם באנגלית. ס"ס הוא אומן 95% על השפה האנגלית ואין לו באמת את כל הידע לכל השפות.

                                  א.מ.ד.א תגובה 1 תגובה אחרונה
                                  0
                                  • א.מ.ד.א מנותק
                                    א.מ.ד.א מנותק
                                    א.מ.ד.
                                    השיב לאריאלל נערך לאחרונה על ידי א.מ.ד.
                                    #20

                                    @אריאלל כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                                    תסתכל במודלים שאתה יכול לראות את החשיבה שלהם, גם אם שאלת והוא עונה בעברית המחשבות הם באנגלית

                                    זה לא באמת המחשבות שהוא חושב... הוא סתם מראה לך "הסבר בדיעבד" (post-hoc explanation)...

                                    הסיבה שהחשיבה מופיעה באנגלית היא שהטכניקות של ה"חשיבה" שנועדו לחשוף את שלבי ההסקה של המודל פותחו באנגלית, והם אומנו להציג את ה"חשיבה" שלהם באנגלית, בערך כמו אדם שיודע כמה שפות אבל שפת האם שלו היא אנגלית שגם כשהוא משוחח בעברית הוא חושב באנגלית... לא נראה לי שיש להם צורך ועניין להשקיע כדי שגם זה יהיה בעברית.
                                    בכל אופן, כשהמודל מקבל ממך שאלה, בין באנגלית בין בעברית, הוא מפענח אותה לשפה פנימית של וקטורים מספריים (embeddings) שמייצגים את המשמעות וההקשר של המילה, ללא קשר לשפה הספציפית שבה השאלה נשאלה. הרב לשוניות של המודל מתבטאת בזה שהוא אומן לפענח יותר ויותר שפות לשפה הפנימית שלו.

                                    אגב, יש יכולת ב-API של GEMINI או GPT שנקראת embedding שמטרתה היא לזהות אם שני טקסטים שונים (לדוגמא בשפות שונות) זהים מבחינה ווקטורית, כלומר האם הייצוג של שניהם בשפה הפנימית של המודל זהה.

                                    אחר כך, המודל חושב בתוך מרחב הייצוג הפנימי הזה, ומשתמש בקשרים שלמד ממאגר הנתונים שלו (שכולל הרבה מאוד שפות, כמובן עם דומיננטיות לאנגלית אבל כמו שכתבתי הוא לא רואה את זה כאנגלית אלא כווקטורים פנימיים) כדי לעבד את השאלה, לגשת לידע הרלוונטי, ולגבש תגובה.
                                    אחרי שהמודל סיים את תהליך העיבוד הפנימי והגיע לתשובה במרחב הפנימי, הוא מפענח (Decode) את הייצוג הפנימי הזה בחזרה לשפת היעד שבה נשאלה השאלה - במקרה הזה עברית.

                                    כשהמודל מתמלל בדיעבד את תהליך החשיבה שהוא עשה, הוא מושפע מנתוני האימון שעליהם אומן באנגלית כשהוא מפענח את תשובתו לשפה אנושית.

                                    למעשה, המודל למד לקשר ישירות בין ייצוגים לשוניים בשפות שונות לבין הייצוג הפנימי הווקטורי, והוא לא צריך שלב ביניים של תרגום לאנגלית ואז חזרה לעברית. היכולת הרב-לשונית שלו מאפשרת לו לעבור ישירות מהשפה המקורית (עברית) לייצוג הפנימי, ולחזור מהייצוג הפנימי לשפת היעד (עברית).

                                    mefateachM א 2 תגובות תגובה אחרונה
                                    4
                                    • mefateachM מנותק
                                      mefateachM מנותק
                                      mefateach מדריכים
                                      השיב לא.מ.ד. נערך לאחרונה על ידי
                                      #21

                                      @א-מ-ד אתה בטוח שהוא לא באמת חושב, אני חשבתי שמה שמוצג כחושב זה בעצם הוא כאילו מוסיף את זה לשאלה של המשתמש בעצם כמו שבן אדם חושב הוא חושב גם מילולית זה מרחיב את החשיבה

                                      Life is learning

                                      א.מ.ד.א תגובה 1 תגובה אחרונה
                                      0
                                      • א מנותק
                                        א מנותק
                                        אלי ויל
                                        השיב לא.מ.ד. נערך לאחרונה על ידי
                                        #22

                                        @א-מ-ד עקרונית במקרה שאין למודל הבנה עמוקה בעברית הוא עלול 'לחשוב' יותר זמן איזה מילים להוציא בפלט. (אתה צודק שהוא לא מתרגם).

                                        תגובה 1 תגובה אחרונה
                                        1
                                        • NH.LOCALN מנותק
                                          NH.LOCALN מנותק
                                          NH.LOCAL מדריכים
                                          השיב לא.מ.ד. נערך לאחרונה על ידי NH.LOCAL
                                          #23

                                          @א-מ-ד כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                                          בדקתי. זהה לחלוטין בממוצע.

                                          יש הבדל מסויים, אבל זה לא קשור כלל ל"תרגום" פנימי, אלא לעובדה שמבנה הטוקניזציה (חלוקת האסימונים) עבור עברית פחות יעיל מאנגלית. זה עשוי להאט את הקצב בסביבות 20 עד 50 אחוז

                                          כמובן שהמודל לא מתרגם בפועל

                                          @א-מ-ד כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                                          @חנוך-הכהן כתב בבקשת מידע | מהו מודל השפה הכי גדול שניתן להרצה באופן מקומי?:

                                          @א-מ-ד יש לי מחשב של 16 ומחשב של 32 (מחשב נייח, כך שאני יכול להרחיב את הRAM להרבה יותר מזה)

                                          במחשב הייתי אומר שאתה יכול להריץ עד מודל שגודלו עד חצי מה-RAM שלך, אבל כמובן זה אינדיבידואלי... תבדוק שזה לא תוקע לך את ה-RAM. נפח דיסק לא רלוונטי.
                                          הייתי ממליץ על מודל GEMMA 3 שהוא מעולה בעברית. תיקח כמה שיותר גדול (בהתאם ליכולת של המחשב).
                                          כדאי שתיקח בקוונטיזציית Q_8, ותעלה בכמות הפרמטרים ככל האפשר.

                                          שימוש במודל 12B עם q8 יהיה מאוד מאוד כבד, בסופו של דבר שימוש ב-CPU ובזיכרון ראם רגיל הוא הרבה יותר איטי. זה יהפוך לכמעט לא שמיש.

                                          יש לי מחשב עם מפרט ממש דומה - הקצב עבור gemma 4b q4 הוא בערך 7-8 אסימונים לשנייה

                                          לאינדקס המלא של כלל הסקריפטים שלי
                                          https://nhlocal.github.io

                                          תגובה 1 תגובה אחרונה
                                          1

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר