להורדה | כך תריצו מודל בינה מלאכותית על המחשב שלכם - בקלי קלות!

משה מזרחי

@דאנציג
אני ינסה
יקח קצת זמן

REFAEL 2

@NH-LOCAL קראתי שוב ושוב
נראה לי שהבנתי ועשיתי הכל נכון
מי יכול לעזור לי

NH.LOCAL

@REFAEL-2 לא העתקת את זה למיקום הנכון. העליתי כעת קובץ באט לעיל - תשתמש בו

לחילופין:

במקום הנתיב הזה

C:\Users\User.cache\lm-studio\models\dicta-il\dictalm2.0-instruct-GGUF

תכניס את הקובץ לנתיב הזה:

%userprofile%\.cache\lm-studio\models\dicta-il\dictalm2.0-instruct-GGUF\

tcrvodkxrvzurgho

פתחתי את קובץ הBAT וזה מה שהוא נתן:

REFAEL 2

@NH-LOCAL
%userprofile%.cache\lm-studio\models\dicta-il\dictalm2.0-instruct-GGUF
זה בדיוק המיקום שבו היה הקובץ

NH.LOCAL

@REFAEL-2 ממש לא. עליך להוסיף לוכסן אחרי שם המשתמש שלך (מסומן באדום)

%userprofile%\.cache\lm-studio\models\dicta-il\dictalm2.0-instruct-GGUF

REFAEL 2

@NH-LOCAL הנה המיקום של הקובץ כרגע
C:\Users\User.cache\lm-studio\models\dicta-il\dictalm2.0-instruct-GGUF
לא מבין איך זה נמחק בפוסט הקודם שלי
ועדיין שום דבר לא זז
בכל אופן, מעריך מאוד את העזרה שלך

REFAEL 2

@NH-LOCAL ניסיתי גם את קובץ הבאט, ואז הוא כתב לי (באנגלית) לחץ על לחצן כלשהוא כדי להמשיך, כך עשיתי, החלון נסגר, ודבר לא השתנה

NH.LOCAL

@REFAEL-2 גררת את הקובץ של המודל ע"ג קובץ הבאט?

tcrvodkxrvzurgho

@NH-LOCAL לפתוח את קובץ הבאט?

REFAEL 2

@NH-LOCAL כן ואז קרה מה שאני מתאר

NH.LOCAL

@REFAEL-2 אז זה אמור לעבוד עכשיו

tcrvodkxrvzurgho

@REFAEL-2 לי זה פשוט כתב את זה עוד פעם

NH.LOCAL

@tcrvodkxrvzurgho אתה והוא לא מדברים על אותו הדבר

tcrvodkxrvzurgho

@NH-LOCAL להוריד את קובץ הבאט מחדש?

tcrvodkxrvzurgho

@NH-LOCAL אה

REFAEL 2

@NH-LOCAL
זה ממש לא

NH.LOCAL

@tcrvodkxrvzurgho כתב בלהורדה | כך תריצו מודל בינה מלאכותית על המחשב שלכם - בקלי קלות!:

@NH-LOCAL להוריד את קובץ הבאט מחדש?

לא. אתה צריך שהקובץ של המודל (ששוקל כמה ג'יגה) יהיה באותה תיקיה יחד עם קובץ הבאט. אחרת זה לא יעבוד לעולם

@REFAEL-2 כתב בלהורדה | כך תריצו מודל בינה מלאכותית על המחשב שלכם - בקלי קלות!:

@NH-LOCAL
זה ממש לא

רק בוא נוודא את זה: על איזה תוכנה אתה מדבר בדיוק?

sivan22

@NH-LOCAL יש לקחת בחשבון שהגרסה הזו עברה קוונטיזציה, כלומר המודל המקורי אומן על 7 מיליארד מספרים שכל אחד מהם הוא 16 ביטים, וישנו תהליך מסויים להפוך כל מספר לבעל 4 ביטים, תוך איבוד מידע מסויים בהכרח. המודל המקורי דורש פי 4 זכרון ראם, וגם קצת יותר איכותי. החכמה היא לשמור על האיכות ככל האפשר. (זה כמו להוריד רזולוציה של תמונה)

יש שיטה מיוחדת שנקראת GPTQ שעושה את זה תוך כדי אימון קל עם דאטה סט קטן. https://huggingface.co/dicta-il/dictalm2.0-instruct-GPTQ

אבל הקובץ הזה הוא קוונטיזציה יותר פשוטה ופחות איכותית. ואגב, יש גם גרסת gguf ברזולוציה של 16.

מה שבאתי לומר שהאיכות על המחשב תהיה קצת פחות מלהשתמש בדמו שלהם.

NH.LOCAL

@sivan22 אני מכיר קצת את הנושא ממודלים אחרים שהרצתי עם llama.cpp, אבל יש לציין שהיכולות של המודל עדיין מרשימות מאוד כשאני מריץ אותו על המחשב שלי, וגם הביצועים שלו נחמדים. (3-4 טוקנים בשנייה)

אם כי לאחר 2048 אסימונים הוא מאבד את זה לגמרי. לא ברור אם זו בעיה בגרסה הזו או עניין של הגדרה

מה למעשה הדגם המומלץ ביותר באיזון בין איכות לביצועים למיטב ידיעתך?