דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. כללי - עזרה הדדית
  3. בירור | מודל AI אופליין

בירור | מודל AI אופליין

מתוזמן נעוץ נעול הועבר כללי - עזרה הדדית
31 פוסטים 4 כותבים 134 צפיות 4 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א.מ.ד.א א.מ.ד.

    @anomimi1789 כתב בבירור | מודל AI אופליין:

    עדיפות לכמה שיותר פרמטרים אבל מה שיש טוב תודה מראש

    אם תרצה יש לי של 1.6 טריליון פרמטרים. מספיק טוב?

    A מנותק
    A מנותק
    anomimi1789
    כתב נערך לאחרונה על ידי
    #10

    @א.מ.ד.
    רגע רגע...אמרת טרליון????

    המלאךה תגובה 1 תגובה אחרונה
    1
    • A anomimi1789

      @א.מ.ד.
      רגע רגע...אמרת טרליון????

      המלאךה מנותק
      המלאךה מנותק
      המלאך
      כתב נערך לאחרונה על ידי
      #11

      @anomimi1789 בול.

      כתב בבירור | מודל AI אופליין:

      הוא התכוון להגיד שלא נכון לומר 'כמה שיותר פרמטרים'.

      תגובה 1 תגובה אחרונה
      1
      • המלאךה המלאך

        @anomimi1789 הוא התכוון להגיד שלא נכון לומר 'כמה שיותר פרמטרים'.
        נראה לי [לא יודע כמה ראם רגיל יש לך..]
        קוואן 13b כימות 4b או אפילו 5b ישרוד.
        כימות 8b לא ישרוד יותר מ7b פרמטרים.
        אהיה יותר ברור.
        מודל: qwen.
        גודל פרמטרים: 14b.
        כימות [gguf]: 4b/5b.
        ייעוד: קודר.
        ת'אנת אין לי מושג אם יש בכימות הזה לגודל הזה.
        אשאיר ל @א.מ.ד. את העבודה השחורה של לחפש האגינג פייס.

        א.מ.ד.א מנותק
        א.מ.ד.א מנותק
        א.מ.ד.
        כתב נערך לאחרונה על ידי א.מ.ד.
        #12

        @המלאך כתב בבירור | מודל AI אופליין:

        @anomimi1789 הוא התכוון להגיד שלא נכון לומר 'כמה שיותר פרמטרים'.
        נראה לי [לא יודע כמה ראם רגיל יש לך..]
        קוואן 13b כימות 4b או אפילו 5b ישרוד.
        כימות 8b לא ישרוד יותר מ7b פרמטרים.
        אהיה יותר ברור.
        מודל: qwen.
        גודל פרמטרים: 14b.
        כימות [gguf]: 4b/5b.
        ייעוד: קודר.
        ת'אנת אין לי מושג אם יש בכימות הזה לגודל הזה.
        אשאיר ל @א.מ.ד. את העבודה השחורה של לחפש האגינג פייס.

        אין צורך בכימות פחות אגרסיבי מ-4 ביט. 4 ביט חוסך 75% מהזיכרון הדרוש, תוך ירידה מינרית בביצועים וכמעט בלתי מורגשת לעין אנושית. זה נכון בין למודלי 4B ובין למודלי 400B.
        אגב ככל שהמספר בכימות יותר גבוה (לדוגמא Q8) אז המודל יותר איכותי (שוב, מינורי), לא ההיפך. Q4 פחות איכותי מ-Q8.
        לגבי המודל שהצעת - QWEN 14B, שזה QWEN 3, מדובר במודל מיושן. ישנם מודלים שקטנים ממנו בחצי וטובים יותר ממנו.
        סדרת המודלים המומלצת כיום לקידוד היא QWEN 3.5, ולשימוש כללי GEMMA 4.
        אז תבחר את גודל המודל לפי כמות ה-RAM שלך, כמפורט במדריך שקישרתי אליו למעלה.
        הכימות המומלץ הוא Q4.

        אגב @המלאך , הסימון של כימותים הוא Q4, לא 4B.

        מפתח אפליקציות אנדרואיד
        em0548438097@gmail.com

        המלאךה תגובה 1 תגובה אחרונה
        0
        • א.מ.ד.א א.מ.ד.

          @המלאך כתב בבירור | מודל AI אופליין:

          @anomimi1789 הוא התכוון להגיד שלא נכון לומר 'כמה שיותר פרמטרים'.
          נראה לי [לא יודע כמה ראם רגיל יש לך..]
          קוואן 13b כימות 4b או אפילו 5b ישרוד.
          כימות 8b לא ישרוד יותר מ7b פרמטרים.
          אהיה יותר ברור.
          מודל: qwen.
          גודל פרמטרים: 14b.
          כימות [gguf]: 4b/5b.
          ייעוד: קודר.
          ת'אנת אין לי מושג אם יש בכימות הזה לגודל הזה.
          אשאיר ל @א.מ.ד. את העבודה השחורה של לחפש האגינג פייס.

          אין צורך בכימות פחות אגרסיבי מ-4 ביט. 4 ביט חוסך 75% מהזיכרון הדרוש, תוך ירידה מינרית בביצועים וכמעט בלתי מורגשת לעין אנושית. זה נכון בין למודלי 4B ובין למודלי 400B.
          אגב ככל שהמספר בכימות יותר גבוה (לדוגמא Q8) אז המודל יותר איכותי (שוב, מינורי), לא ההיפך. Q4 פחות איכותי מ-Q8.
          לגבי המודל שהצעת - QWEN 14B, שזה QWEN 3, מדובר במודל מיושן. ישנם מודלים שקטנים ממנו בחצי וטובים יותר ממנו.
          סדרת המודלים המומלצת כיום לקידוד היא QWEN 3.5, ולשימוש כללי GEMMA 4.
          אז תבחר את גודל המודל לפי כמות ה-RAM שלך, כמפורט במדריך שקישרתי אליו למעלה.
          הכימות המומלץ הוא Q4.

          אגב @המלאך , הסימון של כימותים הוא Q4, לא 4B.

          המלאךה מנותק
          המלאךה מנותק
          המלאך
          כתב נערך לאחרונה על ידי
          #13

          @א.מ.ד. כתב בבירור | מודל AI אופליין:

          אין צורך בכימות פחות אגרסיבי מ-4 ביט. 4 ביט חוסך 75% מהזיכרון הדרוש, תוך ירידה מינרית בביצועים וכמעט בלתי מורגשת לעין אנושית. זה נכון בין למודלי 4B ובין למודלי 400B.
          אגב ככל שהמספר בכימות יותר גבוה (לדוגמא Q8) אז המודל יותר איכותי (שוב, מינורי), לא ההיפך. Q4 פחות איכותי מ-Q8.

          לכן הצעתי כימות יותר גדול. 5 ולא 4. עניין של איכות.

          @א.מ.ד. כתב בבירור | מודל AI אופליין:

          אגב ככל שהמספר בכימות יותר גבוה (לדוגמא Q8) אז המודל יותר איכותי (שוב, מינורי), לא ההיפך. Q4 פחות איכותי מ-Q8.
          לגבי המודל שהצעת - QWEN 14B, שזה QWEN 3, מדובר במודל מיושן. ישנם מודלים שקטנים ממנו בחצי וטובים יותר ממנו.
          סדרת המודלים המומלצת כיום לקידוד היא QWEN 3.5,

          הקודר שלו לדעתי די בייתרון.
          לא מצאתי גדול יותר בשבילו. הוא ביקש כמה שיותר פרמטרים..😉

          @א.מ.ד. כתב בבירור | מודל AI אופליין:

          אגב @המלאך , הסימון של כימותים הוא Q4, לא 4B.

          🤷‍♂️ Whatever you say, sir.
          Anyway, thank you for your attention to this matter.

          א.מ.ד.א 2 תגובות תגובה אחרונה
          0
          • המלאךה המלאך

            @א.מ.ד. כתב בבירור | מודל AI אופליין:

            אין צורך בכימות פחות אגרסיבי מ-4 ביט. 4 ביט חוסך 75% מהזיכרון הדרוש, תוך ירידה מינרית בביצועים וכמעט בלתי מורגשת לעין אנושית. זה נכון בין למודלי 4B ובין למודלי 400B.
            אגב ככל שהמספר בכימות יותר גבוה (לדוגמא Q8) אז המודל יותר איכותי (שוב, מינורי), לא ההיפך. Q4 פחות איכותי מ-Q8.

            לכן הצעתי כימות יותר גדול. 5 ולא 4. עניין של איכות.

            @א.מ.ד. כתב בבירור | מודל AI אופליין:

            אגב ככל שהמספר בכימות יותר גבוה (לדוגמא Q8) אז המודל יותר איכותי (שוב, מינורי), לא ההיפך. Q4 פחות איכותי מ-Q8.
            לגבי המודל שהצעת - QWEN 14B, שזה QWEN 3, מדובר במודל מיושן. ישנם מודלים שקטנים ממנו בחצי וטובים יותר ממנו.
            סדרת המודלים המומלצת כיום לקידוד היא QWEN 3.5,

            הקודר שלו לדעתי די בייתרון.
            לא מצאתי גדול יותר בשבילו. הוא ביקש כמה שיותר פרמטרים..😉

            @א.מ.ד. כתב בבירור | מודל AI אופליין:

            אגב @המלאך , הסימון של כימותים הוא Q4, לא 4B.

            🤷‍♂️ Whatever you say, sir.
            Anyway, thank you for your attention to this matter.

            א.מ.ד.א מנותק
            א.מ.ד.א מנותק
            א.מ.ד.
            כתב נערך לאחרונה על ידי
            #14

            @המלאך כתב בבירור | מודל AI אופליין:

            לכן הצעתי כימות יותר גדול. 5 ולא 4. עניין של איכות.

            א. כתבתי שאין הבדל נראה לעין בין המודל המלא לבין Q4, אז בין Q4 ל-Q5 ודאי שאין כמעט הבדל באיכות.
            ב. הבנתי ש"ישרוד" התכוונת מבחינת איכות. עכשיו אני מבין שאתה מתכוון מבחינת חומרה.

            מפתח אפליקציות אנדרואיד
            em0548438097@gmail.com

            A תגובה 1 תגובה אחרונה
            1
            • המלאךה המלאך

              @א.מ.ד. כתב בבירור | מודל AI אופליין:

              אין צורך בכימות פחות אגרסיבי מ-4 ביט. 4 ביט חוסך 75% מהזיכרון הדרוש, תוך ירידה מינרית בביצועים וכמעט בלתי מורגשת לעין אנושית. זה נכון בין למודלי 4B ובין למודלי 400B.
              אגב ככל שהמספר בכימות יותר גבוה (לדוגמא Q8) אז המודל יותר איכותי (שוב, מינורי), לא ההיפך. Q4 פחות איכותי מ-Q8.

              לכן הצעתי כימות יותר גדול. 5 ולא 4. עניין של איכות.

              @א.מ.ד. כתב בבירור | מודל AI אופליין:

              אגב ככל שהמספר בכימות יותר גבוה (לדוגמא Q8) אז המודל יותר איכותי (שוב, מינורי), לא ההיפך. Q4 פחות איכותי מ-Q8.
              לגבי המודל שהצעת - QWEN 14B, שזה QWEN 3, מדובר במודל מיושן. ישנם מודלים שקטנים ממנו בחצי וטובים יותר ממנו.
              סדרת המודלים המומלצת כיום לקידוד היא QWEN 3.5,

              הקודר שלו לדעתי די בייתרון.
              לא מצאתי גדול יותר בשבילו. הוא ביקש כמה שיותר פרמטרים..😉

              @א.מ.ד. כתב בבירור | מודל AI אופליין:

              אגב @המלאך , הסימון של כימותים הוא Q4, לא 4B.

              🤷‍♂️ Whatever you say, sir.
              Anyway, thank you for your attention to this matter.

              א.מ.ד.א מנותק
              א.מ.ד.א מנותק
              א.מ.ד.
              כתב נערך לאחרונה על ידי
              #15

              @המלאך כתב בבירור | מודל AI אופליין:

              הקודר שלו לדעתי די בייתרון.
              לא מצאתי גדול יותר בשבילו. הוא ביקש כמה שיותר פרמטרים..

              אין 14B קודר. חוץ מזה שה-3.5 9B (שאין לו גרסת קודר) טובה יותר מגרסאות הקודר של QWEN 3.

              מפתח אפליקציות אנדרואיד
              em0548438097@gmail.com

              המלאךה תגובה 1 תגובה אחרונה
              0
              • א.מ.ד.א א.מ.ד.

                @המלאך כתב בבירור | מודל AI אופליין:

                לכן הצעתי כימות יותר גדול. 5 ולא 4. עניין של איכות.

                א. כתבתי שאין הבדל נראה לעין בין המודל המלא לבין Q4, אז בין Q4 ל-Q5 ודאי שאין כמעט הבדל באיכות.
                ב. הבנתי ש"ישרוד" התכוונת מבחינת איכות. עכשיו אני מבין שאתה מתכוון מבחינת חומרה.

                A מנותק
                A מנותק
                anomimi1789
                כתב נערך לאחרונה על ידי
                #16

                @א.מ.ד.
                לסיכום יש למישהו משהו? @א.מ.ד.

                א.מ.ד.א תגובה 1 תגובה אחרונה
                0
                • A anomimi1789

                  @א.מ.ד.
                  לסיכום יש למישהו משהו? @א.מ.ד.

                  א.מ.ד.א מנותק
                  א.מ.ד.א מנותק
                  א.מ.ד.
                  כתב נערך לאחרונה על ידי
                  #17

                  @anomimi1789 כתב בבירור | מודל AI אופליין:

                  @א.מ.ד.
                  לסיכום יש למישהו משהו? @א.מ.ד.

                  כמה RAM יש לך? וכמה VRAM?

                  מפתח אפליקציות אנדרואיד
                  em0548438097@gmail.com

                  A תגובה 1 תגובה אחרונה
                  0
                  • א.מ.ד.א א.מ.ד.

                    @המלאך כתב בבירור | מודל AI אופליין:

                    הקודר שלו לדעתי די בייתרון.
                    לא מצאתי גדול יותר בשבילו. הוא ביקש כמה שיותר פרמטרים..

                    אין 14B קודר. חוץ מזה שה-3.5 9B (שאין לו גרסת קודר) טובה יותר מגרסאות הקודר של QWEN 3.

                    המלאךה מנותק
                    המלאךה מנותק
                    המלאך
                    כתב נערך לאחרונה על ידי
                    #18

                    @א.מ.ד. כתב בבירור | מודל AI אופליין:

                    אין 14B קודר. חוץ מזה שה-3.5 9B (שאין לו גרסת קודר) טובה יותר מגרסאות הקודר של QWEN 3.

                    בטוח?
                    אני די בטוח שראיתי.
                    אבל כמובן הגיוני שאני טועה..

                    א.מ.ד.א תגובה 1 תגובה אחרונה
                    0
                    • א.מ.ד.א א.מ.ד.

                      @anomimi1789 כתב בבירור | מודל AI אופליין:

                      @א.מ.ד.
                      לסיכום יש למישהו משהו? @א.מ.ד.

                      כמה RAM יש לך? וכמה VRAM?

                      A מנותק
                      A מנותק
                      anomimi1789
                      כתב נערך לאחרונה על ידי
                      #19

                      @א.מ.ד.
                      32 RAM (כרטיס מסך RTX 5070) 8VRAM

                      א.מ.ד.א תגובה 1 תגובה אחרונה
                      0
                      • המלאךה המלאך

                        @א.מ.ד. כתב בבירור | מודל AI אופליין:

                        אין 14B קודר. חוץ מזה שה-3.5 9B (שאין לו גרסת קודר) טובה יותר מגרסאות הקודר של QWEN 3.

                        בטוח?
                        אני די בטוח שראיתי.
                        אבל כמובן הגיוני שאני טועה..

                        א.מ.ד.א מנותק
                        א.מ.ד.א מנותק
                        א.מ.ד.
                        כתב נערך לאחרונה על ידי
                        #20

                        @המלאך כתב בבירור | מודל AI אופליין:

                        בטוח?
                        אני די בטוח שראיתי.
                        אבל כמובן הגיוני שאני טועה..

                        אין. בדקתי שוב.

                        מפתח אפליקציות אנדרואיד
                        em0548438097@gmail.com

                        תגובה 1 תגובה אחרונה
                        2
                        • A anomimi1789

                          @א.מ.ד.
                          32 RAM (כרטיס מסך RTX 5070) 8VRAM

                          א.מ.ד.א מנותק
                          א.מ.ד.א מנותק
                          א.מ.ד.
                          כתב נערך לאחרונה על ידי א.מ.ד.
                          #21

                          @anomimi1789 כתב בבירור | מודל AI אופליין:

                          @א.מ.ד.
                          32 RAM (כרטיס מסך RTX 5070) 8VRAM

                          אז הכי מומלץ בשבילך לקידוד הוא QWEN 3.6 35B A3B, ולשימוש כללי GEMMA 4 26B A4B. כימות של Q4_K_M.
                          להריץ ב-LM STUDIO.

                          מפתח אפליקציות אנדרואיד
                          em0548438097@gmail.com

                          המלאךה A 2 תגובות תגובה אחרונה
                          1
                          • א.מ.ד.א א.מ.ד.

                            @anomimi1789 כתב בבירור | מודל AI אופליין:

                            @א.מ.ד.
                            32 RAM (כרטיס מסך RTX 5070) 8VRAM

                            אז הכי מומלץ בשבילך לקידוד הוא QWEN 3.6 35B A3B, ולשימוש כללי GEMMA 4 26B A4B. כימות של Q4_K_M.
                            להריץ ב-LM STUDIO.

                            המלאךה מנותק
                            המלאךה מנותק
                            המלאך
                            כתב נערך לאחרונה על ידי
                            #22

                            @א.מ.ד. בל נשכח כמובן סביבת הרצה.

                            A תגובה 1 תגובה אחרונה
                            0
                            • א.מ.ד.א א.מ.ד.

                              @anomimi1789 כתב בבירור | מודל AI אופליין:

                              @א.מ.ד.
                              32 RAM (כרטיס מסך RTX 5070) 8VRAM

                              אז הכי מומלץ בשבילך לקידוד הוא QWEN 3.6 35B A3B, ולשימוש כללי GEMMA 4 26B A4B. כימות של Q4_K_M.
                              להריץ ב-LM STUDIO.

                              A מנותק
                              A מנותק
                              anomimi1789
                              כתב נערך לאחרונה על ידי
                              #23

                              @א.מ.ד.
                              זה לא יזלוג לRAM? אאכ אתה מדבר על גרסא דחוסה

                              א.מ.ד.א תגובה 1 תגובה אחרונה
                              0
                              • המלאךה המלאך

                                @א.מ.ד. בל נשכח כמובן סביבת הרצה.

                                A מנותק
                                A מנותק
                                anomimi1789
                                כתב נערך לאחרונה על ידי
                                #24

                                @המלאך
                                LM STUDIO אן כל משהו אחר

                                א.מ.ד.א תגובה 1 תגובה אחרונה
                                1
                                • A anomimi1789

                                  @א.מ.ד.
                                  זה לא יזלוג לRAM? אאכ אתה מדבר על גרסא דחוסה

                                  א.מ.ד.א מנותק
                                  א.מ.ד.א מנותק
                                  א.מ.ד.
                                  כתב נערך לאחרונה על ידי א.מ.ד.
                                  #25

                                  @anomimi1789 כתב בבירור | מודל AI אופליין:

                                  @א.מ.ד.
                                  זה לא יזלוג לRAM? אאכ אתה מדבר על גרסא דחוסה

                                  זה לא ייזלוג ל-RAM אלא יישב כל כולו בנינוחות ב-RAM. הפרמטרים הפעילים בלבד יוכנסו ל-VRAM בכל טוקן להרצה מהירה.

                                  מפתח אפליקציות אנדרואיד
                                  em0548438097@gmail.com

                                  A תגובה 1 תגובה אחרונה
                                  1
                                  • A anomimi1789

                                    @המלאך
                                    LM STUDIO אן כל משהו אחר

                                    א.מ.ד.א מנותק
                                    א.מ.ד.א מנותק
                                    א.מ.ד.
                                    כתב נערך לאחרונה על ידי
                                    #26

                                    @anomimi1789 כתב בבירור | מודל AI אופליין:

                                    @המלאך
                                    LM STUDIO אן כל משהו אחר

                                    יש אבל אתה בטח לא מחפש הרפתקאות...

                                    מפתח אפליקציות אנדרואיד
                                    em0548438097@gmail.com

                                    המלאךה תגובה 1 תגובה אחרונה
                                    0
                                    • א.מ.ד.א א.מ.ד.

                                      @anomimi1789 כתב בבירור | מודל AI אופליין:

                                      @א.מ.ד.
                                      זה לא יזלוג לRAM? אאכ אתה מדבר על גרסא דחוסה

                                      זה לא ייזלוג ל-RAM אלא יישב כל כולו בנינוחות ב-RAM. הפרמטרים הפעילים בלבד יוכנסו ל-VRAM בכל טוקן להרצה מהירה.

                                      A מנותק
                                      A מנותק
                                      anomimi1789
                                      כתב נערך לאחרונה על ידי
                                      #27

                                      @א.מ.ד.
                                      הידד.. אנא שלח קישור
                                      למה הכוונה הרפתקאות...יש גם את LUMA 3 איך זה

                                      המלאךה א.מ.ד.א 2 תגובות תגובה אחרונה
                                      0
                                      • א.מ.ד.א א.מ.ד.

                                        @anomimi1789 כתב בבירור | מודל AI אופליין:

                                        @המלאך
                                        LM STUDIO אן כל משהו אחר

                                        יש אבל אתה בטח לא מחפש הרפתקאות...

                                        המלאךה מנותק
                                        המלאךה מנותק
                                        המלאך
                                        כתב נערך לאחרונה על ידי
                                        #28
                                        פוסט זה נמחק!
                                        תגובה 1 תגובה אחרונה
                                        0
                                        • A anomimi1789

                                          @א.מ.ד.
                                          הידד.. אנא שלח קישור
                                          למה הכוונה הרפתקאות...יש גם את LUMA 3 איך זה

                                          המלאךה מנותק
                                          המלאךה מנותק
                                          המלאך
                                          כתב נערך לאחרונה על ידי
                                          #29

                                          @anomimi1789 הרפתקאות כי זה די מסובך לתפעול אם אין היכרות עם הנושא.
                                          יש הרבה.
                                          תעיין במדריך שלו.. ממש מכסה הכל!

                                          תגובה 1 תגובה אחרונה
                                          2

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • פופולרי
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר