דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. שיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...

שיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
148 פוסטים 32 כותבים 6.9k צפיות 45 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א.מ.ד.א א.מ.ד.

    אחרי לא מעט שעות של אימון (Fine-tuning) על בסיס המודל החדש של מעבדות Cohere, מודל ששווה נושא בפני עצמו - Tiny-Aya-3.35B, (ותיקי הפורום בטח זוכרים את aya-expanse-8b שהיה מעולה בעברית) הגעתי לתוצאה הבאה: מודל AI שמבין עברית מצוין, ומסונן מראש ברמת המודל לערכי הציבור החרדי.

    מה בעצם עשיתי?
    לקחתי מודל שפה חזק וקטן יחסית (3.35B פרמטרים) ואימנתי אותו על דאטה-סט שבניתי, המונה יותר מ-520 דוגמאות צ'אט, בתמהיל של 70% דוגמאות שליליות (סירוב) ו-30% דוגמאות חיוביות (בקשות רגילות) כדי לשמר את יכולות המודל (- שלא יענה בסירוב על כל שאלה), וכן דוגמאות של צ'אט רב סיבובי ושפות שונות, ואלו התוצאות:

    • סינון מובנה: המודל מסרב לבקשות שכוללות תכנים שאינם מתאימים לרוח הקהילה החרדית, באופן מובנה ולא רק כהנחיית מערכת שניתנת לעקיפה.
    • שימור יכולות: למרות ה"גיור", המודל עדיין חזק מאוד בכתיבת קוד, ידע כללי ועזרה בכתיבה.
    • עברית איכותית: מבוסס על סדרת Aya, כך שהעברית שלו זורמת הרבה יותר טוב ממודלים אחרים בטווח הגודל שלו.

    המודל פורסם תחת רישיון CC-BY-NC-4.0 - שימוש אישי/קהילתי ללא מטרות רווח.

    כרגע החיסרון היחיד באימון שביצעתי הוא שהמודל למד לענות על כל שאלה בצורה מתומצתת יחסית, כנראה כי התשובות המסורבות בנתוני האימון קצרות מידי, ואני צריך בגרסה הבאה לשפר את מערך הנתונים כך שהמודל יבין שבתשובות רגילות הוא צריך לספק תשובה מלאה ומפורטת.


    המודל הועלה לפלטפורמת אחסון המודלים Hugging Face, אבל כאן הקאץ':
    כרגע אסור להעלות כאן בפורום מודלי AI או קישורים אליהם וכלים להרצת AI אופליין בשל "פריצת סינונים", השאלה היא האם ייתכן שנטפרי יאשרו את המודל (ואז מסתבר שגם הפורום)... זכור לי שלא מזמן משתמש מהפורום דיבר איתם לגבי פתיחת מודל יצירת תמונות, והם השיבו שאם המודל עצמו יהיה חסום מהבסיס ליצירת תוכן לא ראוי ייתכן שהם ייפתחו את המודל להורדה.
    מכיוון שאני גולש עם סינון אחר שאינו נטפרי, אין לי דרך ליצור איתם קשר בנושא, וכן אינני בקיא באופן קבלת ההחלטות שם, אבקש מהציבור אם מישהו יכול לפנות לנטפרי ולשאול על העניין, או לקבל מהם רשימת דרישות שהמודל ייצטרך לעמוד בהן...
    מקווה שהמודל יאושר ואז המשתמשים כאן יוכלו להנות ממודל AI מקומי על המחשבים והמכשירים האישיים, מסונן ומותאם לציבור החרדי...
    כמובן אם הקונספט יאושר והעבודה שלי תהיה משתלמת, אני ייצור בעז"ה מודלים נוספים חזקים יותר מסוננים מהבסיס, כך שהציבור החרדי יהנה גם הוא ממודלים חזקים בחינם ללא הגבלה...

    A מנותק
    A מנותק
    aiib
    כתב נערך לאחרונה על ידי
    #72

    @א.מ.ד. כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

    המודל עדיין חזק מאוד בכתיבת קוד, ידע כללי ועזרה בכתיבה

    איך זה מסתדר עם הנתון של 3.35B?

    א.מ.ד.א המלאךה 3 תגובות תגובה אחרונה
    0
    • A aiib

      @א.מ.ד. כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

      המודל עדיין חזק מאוד בכתיבת קוד, ידע כללי ועזרה בכתיבה

      איך זה מסתדר עם הנתון של 3.35B?

      א.מ.ד.א מחובר
      א.מ.ד.א מחובר
      א.מ.ד.
      כתב נערך לאחרונה על ידי
      #73

      @aiib כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

      איך זה מסתדר עם הנתון של 3.35B?

      כבר עניתי פה: https://mitmachim.top/post/1113992

      מפתח אפליקציות אנדרואיד
      em0548438097@gmail.com

      תגובה 1 תגובה אחרונה
      0
      • A aiib

        @א.מ.ד. כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

        המודל עדיין חזק מאוד בכתיבת קוד, ידע כללי ועזרה בכתיבה

        איך זה מסתדר עם הנתון של 3.35B?

        המלאךה מנותק
        המלאךה מנותק
        המלאך
        כתב נערך לאחרונה על ידי
        #74

        @aiib ובכללי זה אפשרי, מודל קטן הייתרון שלו הוא שהוא משתמש במידע ייעודי ואיכותי יותר מהמודל הגדול,
        הייתרון שיש למודל גדול הוא שהוא מקבל ידע עצום בכל דבר כמעט, ולכן הוא דורש הרבה פרמטרים, וכמובן שמודל גדול אחרי הכל יש ייתרון שהוא פשוט עם הרבה יותר פרמטרים יכול לקבל הרבה יותר חישובים מורכבים.

        תגובה 1 תגובה אחרונה
        1
        • A aiib

          @א.מ.ד. כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

          המודל עדיין חזק מאוד בכתיבת קוד, ידע כללי ועזרה בכתיבה

          איך זה מסתדר עם הנתון של 3.35B?

          א.מ.ד.א מחובר
          א.מ.ד.א מחובר
          א.מ.ד.
          כתב נערך לאחרונה על ידי א.מ.ד.
          #75

          @aiib אגב, יש טעות נפוצה במטרה של מודלים זעירים - הם לא נועדו לידע עולם, שבזה אפילו ג'מיני וGPT היו גרועים עד ששולב בהם חיפוש גוגל (כיום הם גדולים מספיק כדי שיהיה להם ידע נרחב גם בלי חיפוש גוגל), וגם לא לתכנון ובניית פרוייקטי קוד מורכבים.
          מודלים קטנים נועדו בעיקר למשימות כמו היגיון (פתרון בעיות לוגיות), ניתוח שפה טבעית לנתונים מובנים, השלמה אוטומטית, כתיבת תיעודים לקוד, השלמת שורות קוד, למשימות RAG, לזיהוי כוונות, ועוד.
          ככל שעובר הזמן, המודלים הקטנים נהיים יותר ויותר חכמים עבור ביצוע המטרות שלהן הם נועדו, אבל ההתקדמות בתחום הידע הכללי די מינורית מהסיבה הפשוטה: המודל מידי קטן מכדי להכיל את כל הידע הזה. זה תלוי כמעט לחלוטין בגודל המודל. לדוגמא GPT 3.5, אף שהיה גרוע במשימות היגיון, היה לו ידע עולם נרחב יחסית, רק בשל גודלו.

          מפתח אפליקציות אנדרואיד
          em0548438097@gmail.com

          המלאךה תגובה 1 תגובה אחרונה
          2
          • א.מ.ד.א א.מ.ד.

            @aiib אגב, יש טעות נפוצה במטרה של מודלים זעירים - הם לא נועדו לידע עולם, שבזה אפילו ג'מיני וGPT היו גרועים עד ששולב בהם חיפוש גוגל (כיום הם גדולים מספיק כדי שיהיה להם ידע נרחב גם בלי חיפוש גוגל), וגם לא לתכנון ובניית פרוייקטי קוד מורכבים.
            מודלים קטנים נועדו בעיקר למשימות כמו היגיון (פתרון בעיות לוגיות), ניתוח שפה טבעית לנתונים מובנים, השלמה אוטומטית, כתיבת תיעודים לקוד, השלמת שורות קוד, למשימות RAG, לזיהוי כוונות, ועוד.
            ככל שעובר הזמן, המודלים הקטנים נהיים יותר ויותר חכמים עבור ביצוע המטרות שלהן הם נועדו, אבל ההתקדמות בתחום הידע הכללי די מינורית מהסיבה הפשוטה: המודל מידי קטן מכדי להכיל את כל הידע הזה. זה תלוי כמעט לחלוטין בגודל המודל. לדוגמא GPT 3.5, אף שהיה גרוע במשימות היגיון, היה לו ידע עולם נרחב יחסית, רק בשל גודלו.

            המלאךה מנותק
            המלאךה מנותק
            המלאך
            כתב נערך לאחרונה על ידי המלאך
            #76

            @א.מ.ד. או יותר מדויק.
            הוא פשוט לא התאמן על המידע הכללי.
            מודל קטן כשמו - כן הוא.
            קטן בשביל הרבה זיכרון.
            ולכן כדי שהוא יהיה יעיל במשהו, מאמנים אותו על תחום ספציפי באיכות גבוהה.
            לדוג' במקום לעבור על כל גיטהאב, הוא עובר על 50 פרוייקטים מושלמים עם הרבה לוגיקה וחישובים וכך מבין [לפעמים אפילו כמו המודל הגדול - בתחום הזה] איך דברים כאלה עובדים.

            א.מ.ד.א תגובה 1 תגובה אחרונה
            2
            • המלאךה המלאך

              @א.מ.ד. או יותר מדויק.
              הוא פשוט לא התאמן על המידע הכללי.
              מודל קטן כשמו - כן הוא.
              קטן בשביל הרבה זיכרון.
              ולכן כדי שהוא יהיה יעיל במשהו, מאמנים אותו על תחום ספציפי באיכות גבוהה.
              לדוג' במקום לעבור על כל גיטהאב, הוא עובר על 50 פרוייקטים מושלמים עם הרבה לוגיקה וחישובים וכך מבין [לפעמים אפילו כמו המודל הגדול - בתחום הזה] איך דברים כאלה עובדים.

              א.מ.ד.א מחובר
              א.מ.ד.א מחובר
              א.מ.ד.
              כתב נערך לאחרונה על ידי
              #77

              @המלאך כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

              @א.מ.ד. או יותר מדויק.
              הוא פשוט לא התאמן על המידע הכללי.
              מודל קטן כשמו - כן הוא.
              קטן בשביל הרבה זיכרון.
              ולכן כדי שהוא יהיה יעיל במשהו, מאמנים אותו על תחום ספציפי באיכות גבוהה.
              לדוג' במקום לעבור על כל גיטהאב, הוא עובר על 50 פרוייקטים מושלמים עם הרבה לוגיקה וחישובים וכך מבין [לפעמים אפילו כמו המודל הגדול - בנושא הזה] איך דברים כאלה עובדים.

              אין ספק שגם מודלים זעירים ביותר מאומנים על כמויות עצומות של טקסטים, הרבה יותר מכל הגיטהאב, וגם על ידע עצום, רק שאין לו מספיק פרמטרים כדי לזכור את כל הידע הזה ולכן הוא רוכש בעיקר את היכולות שהזכרתי למעלה.
              אבל כן, כשמכווננים מודל קטן לתחום מסויים, לדוגמא למשחק שחמט, הוא מסוגל לעלות על הביצועים של מודלי העל.
              לפני כמה חודשים פורסם שחוקרים של סמסונג הצליחו לאמן מודל מיקרוסקופי של כ-7K פרמטרים בלבד להרכיב פאזלים מסויימים, והוא גבר על ג'מיני 2.5 פרו בתחום הזה.

              מפתח אפליקציות אנדרואיד
              em0548438097@gmail.com

              ש תגובה 1 תגובה אחרונה
              3
              • א.מ.ד.א א.מ.ד.

                @המלאך כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

                @א.מ.ד. או יותר מדויק.
                הוא פשוט לא התאמן על המידע הכללי.
                מודל קטן כשמו - כן הוא.
                קטן בשביל הרבה זיכרון.
                ולכן כדי שהוא יהיה יעיל במשהו, מאמנים אותו על תחום ספציפי באיכות גבוהה.
                לדוג' במקום לעבור על כל גיטהאב, הוא עובר על 50 פרוייקטים מושלמים עם הרבה לוגיקה וחישובים וכך מבין [לפעמים אפילו כמו המודל הגדול - בנושא הזה] איך דברים כאלה עובדים.

                אין ספק שגם מודלים זעירים ביותר מאומנים על כמויות עצומות של טקסטים, הרבה יותר מכל הגיטהאב, וגם על ידע עצום, רק שאין לו מספיק פרמטרים כדי לזכור את כל הידע הזה ולכן הוא רוכש בעיקר את היכולות שהזכרתי למעלה.
                אבל כן, כשמכווננים מודל קטן לתחום מסויים, לדוגמא למשחק שחמט, הוא מסוגל לעלות על הביצועים של מודלי העל.
                לפני כמה חודשים פורסם שחוקרים של סמסונג הצליחו לאמן מודל מיקרוסקופי של כ-7K פרמטרים בלבד להרכיב פאזלים מסויימים, והוא גבר על ג'מיני 2.5 פרו בתחום הזה.

                ש מנותק
                ש מנותק
                שליו
                כתב נערך לאחרונה על ידי
                #78

                @א.מ.ד.
                יש חדש עם נטפרי?

                המלאךה תגובה 1 תגובה אחרונה
                0
                • ש שליו

                  @א.מ.ד.
                  יש חדש עם נטפרי?

                  המלאךה מנותק
                  המלאךה מנותק
                  המלאך
                  כתב נערך לאחרונה על ידי
                  #79

                  @שליו הוא אמר שאין חדש.
                  כשיהיה חדש הוא יעדכן.

                  תגובה 1 תגובה אחרונה
                  0
                  • ע מחובר
                    ע מחובר
                    עידו300
                    כתב נערך לאחרונה על ידי
                    #80

                    @א.מ.ד. אפשר להשתמש בזה דרך ollama?

                    א.מ.ד.א תגובה 1 תגובה אחרונה
                    0
                    • ע עידו300

                      @א.מ.ד. אפשר להשתמש בזה דרך ollama?

                      א.מ.ד.א מחובר
                      א.מ.ד.א מחובר
                      א.מ.ד.
                      כתב נערך לאחרונה על ידי
                      #81

                      @עידו300 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

                      @א.מ.ד. אפשר להשתמש בזה דרך ollama?

                      יהיה אפשר.

                      מפתח אפליקציות אנדרואיד
                      em0548438097@gmail.com

                      ע תגובה 1 תגובה אחרונה
                      0
                      • א.מ.ד.א א.מ.ד.

                        @עידו300 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

                        @א.מ.ד. אפשר להשתמש בזה דרך ollama?

                        יהיה אפשר.

                        ע מחובר
                        ע מחובר
                        עידו300
                        כתב נערך לאחרונה על ידי
                        #82

                        @א.מ.ד. כיום איך אפשר להשתמש?

                        א.מ.ד.א תגובה 1 תגובה אחרונה
                        0
                        • ע עידו300

                          @א.מ.ד. כיום איך אפשר להשתמש?

                          א.מ.ד.א מחובר
                          א.מ.ד.א מחובר
                          א.מ.ד.
                          כתב נערך לאחרונה על ידי
                          #83

                          @עידו300 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

                          @א.מ.ד. כיום איך אפשר להשתמש?

                          דרך ספריית transformers בפייתון. כרגע המודל לוקח כ-7 RAM, ובהמשך אחרי ההמרה ל-GGUF והכימות הוא יצרוך כ-2.5 RAM.
                          כמו שכתבתי למעלה, עד שהמודל לא נפתח בנטפרי אני לא מתחייב לתוצאות איכותיות מבחינת יכולות ומבחינת הסינון.

                          מפתח אפליקציות אנדרואיד
                          em0548438097@gmail.com

                          ה תגובה 1 תגובה אחרונה
                          4
                          • א.מ.ד.א א.מ.ד.

                            @עידו300 כתב בשיתוף | מודל ה-AI החרדי הראשון! וגם בקשת עזרה...:

                            @א.מ.ד. כיום איך אפשר להשתמש?

                            דרך ספריית transformers בפייתון. כרגע המודל לוקח כ-7 RAM, ובהמשך אחרי ההמרה ל-GGUF והכימות הוא יצרוך כ-2.5 RAM.
                            כמו שכתבתי למעלה, עד שהמודל לא נפתח בנטפרי אני לא מתחייב לתוצאות איכותיות מבחינת יכולות ומבחינת הסינון.

                            ה מנותק
                            ה מנותק
                            הישבשר המלומד
                            כתב נערך לאחרונה על ידי
                            #84

                            @א.מ.ד. הגב משהו יודע כמה זמן זה אמור לקחת?

                            ה תגובה 1 תגובה אחרונה
                            0
                            • י מנותק
                              י מנותק
                              ישראל123
                              כתב נערך לאחרונה על ידי
                              #85

                              פניתי לנטפרי לצורך פתיחת מודל אחר והם פתחו אותו מצורף קישור למודל LLM הפתוח בנטפרי

                              [Qwen2.5-Coder-3B-Instruct-GGUF]
                              (https://huggingface.co/Qwen/Qwen2.5-Coder-3B-Instruct-GGUF/tree/main)

                              זה מאוד פשוט הפניה אליהם שולחים להם קישור עם הדף ממנו מורידים והם בודקים אותו
                              אם מישהו יבנה מאגר מידע על מודלים פתוחים בנטפרי זה יכול להועיל מאוד

                              ע תגובה 1 תגובה אחרונה
                              3
                              • י מנותק
                                י מנותק
                                ישראל123
                                כתב נערך לאחרונה על ידי
                                #86

                                אם כל אחד יפנה אליהם לפתיחה של מודל אחד נוכל להגיע למאגר גדול של מודלים מכל הסוגים והגדלים

                                תגובה 1 תגובה אחרונה
                                1
                                • ה הישבשר המלומד

                                  @א.מ.ד. הגב משהו יודע כמה זמן זה אמור לקחת?

                                  ה מנותק
                                  ה מנותק
                                  הישבשר המלומד
                                  כתב נערך לאחרונה על ידי הישבשר המלומד
                                  #87

                                  @א.מ.ד. תגיד אתה גם שלחת להם את המודל או שרק אמרת להם שפיתחת... כי יכול להיות שאם שולחים להם את זה הם פותחים יותר מהר

                                  י תגובה 1 תגובה אחרונה
                                  0
                                  • ה הישבשר המלומד

                                    @א.מ.ד. תגיד אתה גם שלחת להם את המודל או שרק אמרת להם שפיתחת... כי יכול להיות שאם שולחים להם את זה הם פותחים יותר מהר

                                    י מנותק
                                    י מנותק
                                    ישראל123
                                    כתב נערך לאחרונה על ידי
                                    #88

                                    @הישבשר-המלומד את מי אתה שואל? כי אני לא פיתחתי את המודל אלא שלחתי להם קישור למודל שהייתי צריך והם פתחו. אם זה מודל מסונן מהיסוד כנראה הם יפתחו את זה מהר

                                    ל ה 2 תגובות תגובה אחרונה
                                    0
                                    • י ישראל123

                                      @הישבשר-המלומד את מי אתה שואל? כי אני לא פיתחתי את המודל אלא שלחתי להם קישור למודל שהייתי צריך והם פתחו. אם זה מודל מסונן מהיסוד כנראה הם יפתחו את זה מהר

                                      ל מנותק
                                      ל מנותק
                                      לב טוב
                                      כתב נערך לאחרונה על ידי
                                      #89

                                      @ישראל123 למה הם פתחו אותו באמת, מה מיוחד בו שהם אישרו אותו?

                                      תגובה 1 תגובה אחרונה
                                      0
                                      • י ישראל123

                                        @הישבשר-המלומד את מי אתה שואל? כי אני לא פיתחתי את המודל אלא שלחתי להם קישור למודל שהייתי צריך והם פתחו. אם זה מודל מסונן מהיסוד כנראה הם יפתחו את זה מהר

                                        ה מנותק
                                        ה מנותק
                                        הישבשר המלומד
                                        כתב נערך לאחרונה על ידי הישבשר המלומד
                                        #90

                                        @ישראל123 הייתכוונתי לא.מ.ד מחילה, הגב הפוך מציאותית אתה רואה שפה המודל עצמו פותח בכוונה שלא יהיה בו בעיות וכו' וזה כבר כמה שבועות טובות בבדיקה.

                                        ולא יודע למה יש לי תחושה שזה יהיה לעוד הרבה זמן

                                        ל תגובה 1 תגובה אחרונה
                                        1
                                        • ה הישבשר המלומד

                                          @ישראל123 הייתכוונתי לא.מ.ד מחילה, הגב הפוך מציאותית אתה רואה שפה המודל עצמו פותח בכוונה שלא יהיה בו בעיות וכו' וזה כבר כמה שבועות טובות בבדיקה.

                                          ולא יודע למה יש לי תחושה שזה יהיה לעוד הרבה זמן

                                          ל מנותק
                                          ל מנותק
                                          לב טוב
                                          כתב נערך לאחרונה על ידי לב טוב
                                          #91

                                          @הישבשר-המלומד אפשר להבין,
                                          אם נטפרי מאשרים 'מודל שיוצר במיוחד לציבור החרדי'
                                          שהם צריכים לקחת אחריות רבה יותר
                                          מאשר אישור רגיל על כל דבר אחר שהוא רק 'נבדק וכשר לציבור'

                                          תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • פופולרי
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר