דילוג לתוכן
  • חוקי הפורום
  • פופולרי
  • לא נפתר
  • משתמשים
  • חיפוש גוגל בפורום
  • צור קשר
עיצובים
  • Light
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • ברירת מחדל (ללא עיצוב (ברירת מחדל))
  • ללא עיצוב (ברירת מחדל)
כיווץ
מתמחים טופ
  1. דף הבית
  2. קטגוריות בהרצה
  3. תכנות
  4. בינה מלאכותית - AI
  5. עזרה הדדית - בינה מלאכותית
  6. סקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?

סקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?

מתוזמן נעוץ נעול הועבר עזרה הדדית - בינה מלאכותית
32 פוסטים 11 כותבים 651 צפיות 15 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • א.מ.ד.א א.מ.ד.

    @ע-ה-דכו-ע כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

    @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

    @אליהו-בשטח כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

    חשבתי על מודל שפה שידע לקרוא כתבים תורנים / ארמית ולענות תשבות מבוססות על מאגר תורני כמו אוצריא ותורת אמת
    אם אתה מצליח ליצור משהו כזה אתה חזק

    כלומר מודל ocr? זה הרבה יותר מורכב - ליצור
    מקודד ראיה וכו'
    אולי בהמשך אני ינסה את זה

    אני ניסיתי בעבר אבל מסובך למצוא מודל ראשוני מתאים, כי רוב המודלים בקוד פתוח מיועדים לגודל קבוע מאוד וקטן של תמונה, ואילו שמיועדים לתמונות גדולות זה כנראה כמעט בלתי אפשרי לאמן אותם בצורה נורמאלית במגבלות החינמיות.

    כי התבססת על מודלים קיימים
    אם אתה יוצר מאפס יש לך שליטה על הכל
    אבל עוד לא ניסיתי את זה אז אולי אני טועה

    ע"ה דכו"עע מנותק
    ע"ה דכו"עע מנותק
    ע"ה דכו"ע
    כתב נערך לאחרונה על ידי
    #13

    @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

    @ע-ה-דכו-ע כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

    @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

    @אליהו-בשטח כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

    חשבתי על מודל שפה שידע לקרוא כתבים תורנים / ארמית ולענות תשבות מבוססות על מאגר תורני כמו אוצריא ותורת אמת
    אם אתה מצליח ליצור משהו כזה אתה חזק

    כלומר מודל ocr? זה הרבה יותר מורכב - ליצור
    מקודד ראיה וכו'
    אולי בהמשך אני ינסה את זה

    אני ניסיתי בעבר אבל מסובך למצוא מודל ראשוני מתאים, כי רוב המודלים בקוד פתוח מיועדים לגודל קבוע מאוד וקטן של תמונה, ואילו שמיועדים לתמונות גדולות זה כנראה כמעט בלתי אפשרי לאמן אותם בצורה נורמאלית במגבלות החינמיות.

    כי התבססת על מודלים קיימים
    אם אתה יוצר מאפס יש לך שליטה על הכל
    אבל עוד לא ניסיתי את זה אז אולי אני טועה

    אם אתה יוצר מאפס אז עוד יותר אין סיכוי לכאו' לעשות את זה במגבלות החינמיות.

    אפילו אימון של מודל קיים על תמונות בגודל של 6 מילים בערך כל אחת, דורש כ6 שעות אימון על כל סיבוב של 30000 תמונות, לבנות מודל חדש זה אמור לקחת הרבה יותר משאבים.

    א.מ.ד.א תגובה 1 תגובה אחרונה
    2
    • ע"ה דכו"עע ע"ה דכו"ע

      @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      @ע-ה-דכו-ע כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      @אליהו-בשטח כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      חשבתי על מודל שפה שידע לקרוא כתבים תורנים / ארמית ולענות תשבות מבוססות על מאגר תורני כמו אוצריא ותורת אמת
      אם אתה מצליח ליצור משהו כזה אתה חזק

      כלומר מודל ocr? זה הרבה יותר מורכב - ליצור
      מקודד ראיה וכו'
      אולי בהמשך אני ינסה את זה

      אני ניסיתי בעבר אבל מסובך למצוא מודל ראשוני מתאים, כי רוב המודלים בקוד פתוח מיועדים לגודל קבוע מאוד וקטן של תמונה, ואילו שמיועדים לתמונות גדולות זה כנראה כמעט בלתי אפשרי לאמן אותם בצורה נורמאלית במגבלות החינמיות.

      כי התבססת על מודלים קיימים
      אם אתה יוצר מאפס יש לך שליטה על הכל
      אבל עוד לא ניסיתי את זה אז אולי אני טועה

      אם אתה יוצר מאפס אז עוד יותר אין סיכוי לכאו' לעשות את זה במגבלות החינמיות.

      אפילו אימון של מודל קיים על תמונות בגודל של 6 מילים בערך כל אחת, דורש כ6 שעות אימון על כל סיבוב של 30000 תמונות, לבנות מודל חדש זה אמור לקחת הרבה יותר משאבים.

      א.מ.ד.א מחובר
      א.מ.ד.א מחובר
      א.מ.ד.
      כתב נערך לאחרונה על ידי
      #14

      @ע-ה-דכו-ע כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      @ע-ה-דכו-ע כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      @אליהו-בשטח כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

      חשבתי על מודל שפה שידע לקרוא כתבים תורנים / ארמית ולענות תשבות מבוססות על מאגר תורני כמו אוצריא ותורת אמת
      אם אתה מצליח ליצור משהו כזה אתה חזק

      כלומר מודל ocr? זה הרבה יותר מורכב - ליצור
      מקודד ראיה וכו'
      אולי בהמשך אני ינסה את זה

      אני ניסיתי בעבר אבל מסובך למצוא מודל ראשוני מתאים, כי רוב המודלים בקוד פתוח מיועדים לגודל קבוע מאוד וקטן של תמונה, ואילו שמיועדים לתמונות גדולות זה כנראה כמעט בלתי אפשרי לאמן אותם בצורה נורמאלית במגבלות החינמיות.

      כי התבססת על מודלים קיימים
      אם אתה יוצר מאפס יש לך שליטה על הכל
      אבל עוד לא ניסיתי את זה אז אולי אני טועה

      אם אתה יוצר מאפס אז עוד יותר אין סיכוי לכאו' לעשות את זה במגבלות החינמיות.

      אפילו אימון של מודל קיים על תמונות בגודל של 6 מילים בערך כל אחת, דורש כ6 שעות אימון על כל סיבוב של 30000 תמונות, לבנות מודל חדש זה אמור לקחת הרבה יותר משאבים.

      לא בהכרח! כשאתה מאמן מודל קיים אתה צריך גם "לתקן" את האימונים הקודמים שלו ו"להסביר" למודל שהם פחות מתאימים למטרה הנוכחית, כשאתה יוצר מאפס מודל שנועד למשימה אחת הוא יכול להיות קטן מאוד, והאימון שלו יהיה קל מאוד. השאלה היא אם יש מספיק נתונים, כי אם לא אז אין מנוס משימוש במודל קיים.

      מפתח אפליקציות אנדרואיד
      em0548438097@gmail.com

      תגובה 1 תגובה אחרונה
      2
      • א.מ.ד.א א.מ.ד.

        יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
        התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
        במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
        הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
        ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
        עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
        את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
        המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
        אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
        אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI...

        ח מנותק
        ח מנותק
        חובבן מקצועי
        כתב נערך לאחרונה על ידי חובבן מקצועי
        #15

        @א.מ.ד. יפה מאוד!! בהצלחה רבה!
        כמובן, אשמח מאוד אם תכתוב מדריך איך מאמנים מודל? עם איזה תוכנה? איך מגדירים מהי שאלה ומהי תשובה? איך להגדיר לו מתי לסיים משפט וכו'.. ואיך מקמפלים את זה אחרי זה לLM Studio.

        אגב, איזה מעבד צריך בשביל לאמן? מחשב עם i7 דור 13H, עם 6 VRAM ו32 RAM - אפשר אולי להריץ את זה מקומית?

        א.מ.ד.א תגובה 1 תגובה אחרונה
        0
        • ח חובבן מקצועי

          @א.מ.ד. יפה מאוד!! בהצלחה רבה!
          כמובן, אשמח מאוד אם תכתוב מדריך איך מאמנים מודל? עם איזה תוכנה? איך מגדירים מהי שאלה ומהי תשובה? איך להגדיר לו מתי לסיים משפט וכו'.. ואיך מקמפלים את זה אחרי זה לLM Studio.

          אגב, איזה מעבד צריך בשביל לאמן? מחשב עם i7 דור 13H, עם 6 VRAM ו32 RAM - אפשר אולי להריץ את זה מקומית?

          א.מ.ד.א מחובר
          א.מ.ד.א מחובר
          א.מ.ד.
          כתב נערך לאחרונה על ידי א.מ.ד.
          #16

          @חובבן-מקצועי כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

          כמובן, אשמח מאוד אם תכתוב מדריך איך מאמנים מודל? עם איזה תוכנה? איך מגדירים מהי שאלה ומהי תשובה? איך להגדיר לו מתי לסיים משפט וכו'.. ואיך מקמפלים את זה אחרי זה לLM Studio.

          בעברת השם אסביר על כל שלב

          @חובבן-מקצועי כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

          אגב, איזה מעבד צריך בשביל לאמן? מחשב עם i7 דור 13H, עם 6 VRAM ו32 RAM - אפשר אולי להריץ את זה מקומית?

          בהחלט, אבל עם מספר שינויים בקוד וחיבור מסובך יותר של הדרייב (אלא אם כן אתה רוצה לשמור מקומית)

          מפתח אפליקציות אנדרואיד
          em0548438097@gmail.com

          תגובה 1 תגובה אחרונה
          1
          • א.מ.ד.א א.מ.ד.

            יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
            התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
            במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
            הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
            ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
            עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
            את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
            המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
            אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
            אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI...

            C מנותק
            C מנותק
            CSS 0
            כתב נערך לאחרונה על ידי
            #17

            @א.מ.ד. ואו באמת מלא פעמים שניסיתי ליצור AI בעצמי יש לי מאגרים ענקיים של טקסט אבל אף פעם לא הצלחתי ליצור משהו שבאמת עבד
            עם תעלה מדריך זה יהיה מטורף!
            (תעלה גם למשתמשי נטפרי כי גוגל קלאב לא עובד לנטפרי לכן אני אישית נאלצתי להריץ מקומית אבל פה ראיתי באחת ההודעות שמישהו אמר:

            חסום בנטפרי, אבל אפשר ב kaggle , רק צריך SMS לאימות ביצירת החשבון.

            תגובה 1 תגובה אחרונה
            0
            • א.מ.ד.א א.מ.ד.

              יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
              התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
              במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
              הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
              ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
              עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
              את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
              המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
              אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
              אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI...

              נ מחובר
              נ מחובר
              נוחעם FM
              מדריכים
              כתב נערך לאחרונה על ידי נוחעם FM
              #18

              @א.מ.ד.

              הערה קטנה לא קשורה לעצם הנושא המופלא הזה, אם אכן זו כוונתך בסקר

              המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה

              אז אל תעשה 4 אופציות של כן אני רוצה כזה מדריך ואופציה אחת שלא..
              כי אז זה מוטעה ומטעה את את הציבור וגם את אותך...
              זה כמו סקר שהשמאל עשו (בערך תפוס את הרעיון)
              מה סדר גודל של הרעב בעזה?
              1 קטסטרופלי.
              2 בלתי ניתן לתיאור.
              3 אין שם אוכל בכלל.
              4 יש ממש קצת אנשים שיש להם אוכל.

              אתה מבין לבד שזה יוביל לתוצאות לא אמיתיות...

              א.מ.ד.א תגובה 1 תגובה אחרונה
              0
              • א.מ.ד.א א.מ.ד.

                יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
                התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
                במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
                הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
                ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
                עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
                את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
                המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
                אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
                אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI...

                איש אמתא מנותק
                איש אמתא מנותק
                איש אמת
                מדריכים
                כתב נערך לאחרונה על ידי
                #19

                @א.מ.ד. שאלת תם, איפה הפואנטה? למה לי לעבוד כ״כ קשה?

                אני יודע שאני חושב שאני יודע.

                א.מ.ד.א תגובה 1 תגובה אחרונה
                1
                • נ נוחעם FM

                  @א.מ.ד.

                  הערה קטנה לא קשורה לעצם הנושא המופלא הזה, אם אכן זו כוונתך בסקר

                  המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה

                  אז אל תעשה 4 אופציות של כן אני רוצה כזה מדריך ואופציה אחת שלא..
                  כי אז זה מוטעה ומטעה את את הציבור וגם את אותך...
                  זה כמו סקר שהשמאל עשו (בערך תפוס את הרעיון)
                  מה סדר גודל של הרעב בעזה?
                  1 קטסטרופלי.
                  2 בלתי ניתן לתיאור.
                  3 אין שם אוכל בכלל.
                  4 יש ממש קצת אנשים שיש להם אוכל.

                  אתה מבין לבד שזה יוביל לתוצאות לא אמיתיות...

                  א.מ.ד.א מחובר
                  א.מ.ד.א מחובר
                  א.מ.ד.
                  כתב נערך לאחרונה על ידי
                  #20

                  @נוחעם-FM כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                  @א.מ.ד.

                  הערה קטנה לא קשורה לעצם הנושא המופלא הזה, אם אכן זו כוונתך בסקר

                  המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה

                  אז אל תעשה 4 אופציות של כן אני רוצה כזה מדריך ואופציה אחת שלא..
                  כי אז זה מוטעה ומטעה את את הציבור וגם את אותך...
                  זה סקר שהשמאל עשו (בערך תפוס את הרעיון)
                  מה סדר גודל של הרעב בעזה?
                  1 קטסטרופלי.
                  2 בלתי ניתן לתיאור.
                  3 אין שם אוכל בכלל.
                  4 יש ממש קצת אנשים שיש להם אוכל.

                  אתה מבין לבד שזה יוביל לתוצאות לא אמיתיות...

                  זה שיירצו מדריך כזה זה היה לי די ברור, אבל רציתי לדעת מה מידת הנכונות להשתמש במדריך. הרוב היו מצביעים "כן" כי למה לא, למרות שחלקם לא יעיפו מבט על המדריך, ולא רציתי לטרוח סתם בשבילם, וזה שראיתי שמעל 50 אחוז מעוניינים מאוד במדריך מעודד אותי לכתוב אותו. זה לא שמצביעים באקראיות שאז רוב הסיכויים שייבחרו באחת מ-4 האפשרויות הראשונות.
                  אגב בכל סקר יש "סולם ליקרט": 1 (בכלל לא מעוניין) עד 5 (מעוניין מאוד), שבעצם 4 אפשרויות מתוכו הן "מעוניין", ואלה בדיוק האפשרויות שנתתי בתרגום חופשי, וכמו שאתה יכול לראות יש התפלגות בהצבעות לכל האפשרויות.

                  מפתח אפליקציות אנדרואיד
                  em0548438097@gmail.com

                  תגובה 1 תגובה אחרונה
                  2
                  • איש אמתא איש אמת

                    @א.מ.ד. שאלת תם, איפה הפואנטה? למה לי לעבוד כ״כ קשה?

                    א.מ.ד.א מחובר
                    א.מ.ד.א מחובר
                    א.מ.ד.
                    כתב נערך לאחרונה על ידי
                    #21

                    @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                    @א.מ.ד. שאלת תם, איפה הפואנטה? למה לי לעבוד כ״כ קשה?

                    1. ליצירת מודלים זעירים למטרות מסויימות, שעשויים להיות יעילים יותר ממודלים גדולים במשימות הספציפיות עליהן אומנו ויכולים להשתלב בקלות בתוכנות ואפליקציות בלי להכביד על המעבד.
                    2. כי זה כיף!
                    3. למה זה קשה?

                    מפתח אפליקציות אנדרואיד
                    em0548438097@gmail.com

                    איש אמתא תגובה 1 תגובה אחרונה
                    3
                    • א.מ.ד.א א.מ.ד.

                      @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                      @א.מ.ד. שאלת תם, איפה הפואנטה? למה לי לעבוד כ״כ קשה?

                      1. ליצירת מודלים זעירים למטרות מסויימות, שעשויים להיות יעילים יותר ממודלים גדולים במשימות הספציפיות עליהן אומנו ויכולים להשתלב בקלות בתוכנות ואפליקציות בלי להכביד על המעבד.
                      2. כי זה כיף!
                      3. למה זה קשה?
                      איש אמתא מנותק
                      איש אמתא מנותק
                      איש אמת
                      מדריכים
                      כתב נערך לאחרונה על ידי
                      #22

                      @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                      כי זה כיף!
                      למה זה קשה?

                      טוב, כוונתי לא היתה למה אתה עושה את זה התכוונתי למה שווה לאדם מן השוק לעשות את זה...

                      ליצירת מודלים זעירים למטרות מסויימות, שעשויים להיות יעילים יותר ממודלים גדולים במשימות הספציפיות עליהן אומנו ויכולים להשתלב בקלות בתוכנות ואפליקציות בלי להכביד על המעבד.

                      לאיזה רמה זה מגיע?
                      ואיזה טווח מעבדים ו ram אני יצטרך?
                      יש מצב שדבר כזה יעזור לי...

                      אני יודע שאני חושב שאני יודע.

                      א.מ.ד.א תגובה 1 תגובה אחרונה
                      0
                      • איש אמתא איש אמת

                        @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                        כי זה כיף!
                        למה זה קשה?

                        טוב, כוונתי לא היתה למה אתה עושה את זה התכוונתי למה שווה לאדם מן השוק לעשות את זה...

                        ליצירת מודלים זעירים למטרות מסויימות, שעשויים להיות יעילים יותר ממודלים גדולים במשימות הספציפיות עליהן אומנו ויכולים להשתלב בקלות בתוכנות ואפליקציות בלי להכביד על המעבד.

                        לאיזה רמה זה מגיע?
                        ואיזה טווח מעבדים ו ram אני יצטרך?
                        יש מצב שדבר כזה יעזור לי...

                        א.מ.ד.א מחובר
                        א.מ.ד.א מחובר
                        א.מ.ד.
                        כתב נערך לאחרונה על ידי
                        #23

                        @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                        טוב, כוונתי לא היתה למה אתה עושה את זה התכוונתי למה שווה לאדם מן השוק לעשות את זה...

                        כי החברה פה בפורום אוהבים לדעת איך דברים עובדים מתחת למכסה המנוע ואיך יוצרים אותם...
                        וגם בגדול זה יהיה בשבילם העתק הדבק מהמדריך אז למה לא...

                        @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                        לאיזה רמה זה מגיע?

                        תלוי בך ובמערכי הנתונים... כמובן שזה לא gemini 3.0 אבל יכול לעבוד מצויין במשימות מקומיות ספציפיות שתבחר לאמן עליהן.

                        @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                        ואיזה טווח מעבדים ו ram אני יצטרך?

                        המדריך יהיה על מודל של כ-120M פרמטרים אבל תוכל להגדיר אותו לאיזה גודל שתרצה, החל ממודלים להפעלה על מיקרוגל 😉 ועד למודלים של כמה מליארדי פרמטרים (שיצריכו כמובן כוח עיבוד חזק בהרבה...

                        @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                        יש מצב שדבר כזה יעזור לי...

                        הבנת את הפואנטה?

                        מפתח אפליקציות אנדרואיד
                        em0548438097@gmail.com

                        איש אמתא תגובה 1 תגובה אחרונה
                        1
                        • א.מ.ד.א א.מ.ד.

                          @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                          טוב, כוונתי לא היתה למה אתה עושה את זה התכוונתי למה שווה לאדם מן השוק לעשות את זה...

                          כי החברה פה בפורום אוהבים לדעת איך דברים עובדים מתחת למכסה המנוע ואיך יוצרים אותם...
                          וגם בגדול זה יהיה בשבילם העתק הדבק מהמדריך אז למה לא...

                          @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                          לאיזה רמה זה מגיע?

                          תלוי בך ובמערכי הנתונים... כמובן שזה לא gemini 3.0 אבל יכול לעבוד מצויין במשימות מקומיות ספציפיות שתבחר לאמן עליהן.

                          @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                          ואיזה טווח מעבדים ו ram אני יצטרך?

                          המדריך יהיה על מודל של כ-120M פרמטרים אבל תוכל להגדיר אותו לאיזה גודל שתרצה, החל ממודלים להפעלה על מיקרוגל 😉 ועד למודלים של כמה מליארדי פרמטרים (שיצריכו כמובן כוח עיבוד חזק בהרבה...

                          @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                          יש מצב שדבר כזה יעזור לי...

                          הבנת את הפואנטה?

                          איש אמתא מנותק
                          איש אמתא מנותק
                          איש אמת
                          מדריכים
                          כתב נערך לאחרונה על ידי
                          #24

                          @א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.
                          לא משנה, העיקר זה שתצליח...

                          אני יודע שאני חושב שאני יודע.

                          א.מ.ד.א תגובה 1 תגובה אחרונה
                          0
                          • איש אמתא איש אמת

                            @א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.
                            לא משנה, העיקר זה שתצליח...

                            א.מ.ד.א מחובר
                            א.מ.ד.א מחובר
                            א.מ.ד.
                            כתב נערך לאחרונה על ידי
                            #25

                            @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                            @א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.

                            אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.

                            @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                            לא משנה, העיקר זה שתצליח...

                            תודה!

                            מפתח אפליקציות אנדרואיד
                            em0548438097@gmail.com

                            איש אמתא תגובה 1 תגובה אחרונה
                            1
                            • א.מ.ד.א א.מ.ד.

                              @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                              @א.מ.ד. לא כל כך, כאילו הבנתי זה יכול לעזור לי בכמה פרויקטים שלי אבל כיוון שלא הבנתי מה הרמה מול פרמטרים-כוח מחשוב אז לא כל כך הבנתי.

                              אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.

                              @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                              לא משנה, העיקר זה שתצליח...

                              תודה!

                              איש אמתא מנותק
                              איש אמתא מנותק
                              איש אמת
                              מדריכים
                              כתב נערך לאחרונה על ידי
                              #26

                              @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                              אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.

                              עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
                              (אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)

                              אני יודע שאני חושב שאני יודע.

                              א.מ.ד.א תגובה 1 תגובה אחרונה
                              1
                              • איש אמתא איש אמת

                                @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                                אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.

                                עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
                                (אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)

                                א.מ.ד.א מחובר
                                א.מ.ד.א מחובר
                                א.מ.ד.
                                כתב נערך לאחרונה על ידי א.מ.ד.
                                #27

                                @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                                @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                                אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.

                                עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
                                (אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)

                                אני מאמן במדריך מודל טקסט-לטקסט, לא יצירת וניתוח תמונות. אם חשוב לך ספציפית הנושא הזה אתה יכול להשתמש במודלים קיימים בטווח הגודל הזה, כמו smolvlm2 לניתוח תמונות. אולי בעתיד אני ייתעסק גם בזה אבל זה מסובך בהרבה.

                                מפתח אפליקציות אנדרואיד
                                em0548438097@gmail.com

                                cfopuserC תגובה 1 תגובה אחרונה
                                0
                                • א.מ.ד.א א.מ.ד.

                                  @איש-אמת כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                                  @א.מ.ד. כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                                  אם המודל הוא 120M פרמטרים אז הוא יכול לרוץ עם ניצול של כחצי ג'יגה RAM ומעבד MTK פשוט של נגני אליאקספרס במהירות סבירה.

                                  עכשיו אתה מדבר לעניין, ומה 120M פרמטרים מצליחים לספק לי? לנתח/ ליצור תמונות זה יצליח?
                                  (אני מניח שהשאלות תם שלי יעזרו לעוד ניקים שלא מבינים בזה)

                                  אני מאמן במדריך מודל טקסט-לטקסט, לא יצירת וניתוח תמונות. אם חשוב לך ספציפית הנושא הזה אתה יכול להשתמש במודלים קיימים בטווח הגודל הזה, כמו smolvlm2 לניתוח תמונות. אולי בעתיד אני ייתעסק גם בזה אבל זה מסובך בהרבה.

                                  cfopuserC מנותק
                                  cfopuserC מנותק
                                  cfopuser
                                  כתב נערך לאחרונה על ידי cfopuser
                                  #28

                                  @א.מ.ד. נשמע מעניין,
                                  מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,
                                  בעבר השתמשתי בyolo כדי לזהות דברים אבל אני מניח שאפשר לדחוף את זה הרבה יותר גבוה.

                                  א.מ.ד.א תגובה 1 תגובה אחרונה
                                  0
                                  • cfopuserC cfopuser

                                    @א.מ.ד. נשמע מעניין,
                                    מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,
                                    בעבר השתמשתי בyolo כדי לזהות דברים אבל אני מניח שאפשר לדחוף את זה הרבה יותר גבוה.

                                    א.מ.ד.א מחובר
                                    א.מ.ד.א מחובר
                                    א.מ.ד.
                                    כתב נערך לאחרונה על ידי א.מ.ד.
                                    #29

                                    @cfopuser כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                                    מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,

                                    נכון, אבל מורכב בהרבה. רק לחשוב על התעסקות עם תמונות בפורמט base64... זה לא כמו טקסט פשוט שאפשר לבחון בכל שלב את ההתקדמות.

                                    מפתח אפליקציות אנדרואיד
                                    em0548438097@gmail.com

                                    cfopuserC תגובה 1 תגובה אחרונה
                                    0
                                    • א.מ.ד.א א.מ.ד.

                                      @cfopuser כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                                      מודלים שרואים נראה לי תחום מאוד מעניין להתעמק בו,

                                      נכון, אבל מורכב בהרבה. רק לחשוב על התעסקות עם תמונות בפורמט base64... זה לא כמו טקסט פשוט שאפשר לבחון בכל שלב את ההתקדמות.

                                      cfopuserC מנותק
                                      cfopuserC מנותק
                                      cfopuser
                                      כתב נערך לאחרונה על ידי
                                      #30

                                      @א.מ.ד. נכון אתה צודק אם כול המטרה היא לאמן מודל מאפס אפשר להתייאש על ההתחלה (כמו המידע שצריך והכוח חישוב לא ריאלים).

                                      ממתינים לראות מה יצא מזה.
                                      בהצלחה

                                      תגובה 1 תגובה אחרונה
                                      1
                                      • א.מ.ד.א א.מ.ד.

                                        יצא לי לאחרונה להתעסק הרבה במודלי AI מקומיים קטנים, וגם ביצעתי כוונון עדין לכמה מהם למטרות שונות, מה שהביא אותי לחשוב - עד כמה מסובך באמת לאמן מודל כזה מאפס?
                                        התבשלתי עם זה הרבה זמן, עד שהחלטתי לנסות. מה יש לי להפסיד? לצורך כך השתמשתי בחשבון חינמי לגוגל קולאב שמאפשר שימוש בסביבת עבודה מרוחקת עם GPU T4 לכמה שעות ביום בחינם.
                                        במקום להתחיל לפי הסדר הרגיל, של אימון יסודי על טקסטים מלאים ורק אז אימון על תבנית צ'אט, התחלתי אימון מהתחלה בפורמט צ'אט (שאלות + תשובות). כמובן זה לא יוצר מודל שימושי בכלל, אבל זה היה רק בשביל ניסוי הכלים ובדיקת היתכנות.
                                        הבעיה הקשה הייתה למצוא מערכי נתונים טובים בעברית, אבל בסופו של דבר אחרי אימון של כשעתיים בלבד על מערך נתונים עברי של כ-41K שאלות + תשובות, המודל כבר למד ליצור מילים שלמות בעברית תקנית, ולענות תשובות שנראות כמו תשובות AI קצת משובשות!
                                        ניסוי נוסף של אימון שעתיים על מערך הנתונים של ספרייא ייצר מודל שיודע לדבר מילים בעברית-ספרותית עם הבנת הקשר בין מילה למילה, ואפילו חיבר משפטים הגיוניים מידי פעם!
                                        עכשיו, אחרי שראיתי שיש היתכנות כזאת, החלטתי ללכת על זה שלב אחר שלב. "הדבר האמיתי" אמור לקחת שבועות של אימון, כשבכל יום צריך להפעיל מחדש את סביבת גוגל קולאב שמתנתקת כל כמה שעות בתוכנית החינמית.
                                        את החלק הקל והמהיר כבר סיימתי, שהוא הכנת קוד האימון המלא, כולל הסברים מפורטים על כל שלב, וגם החלטתי על מערכי נתונים שישמשו אותי לצורך האימון, ועכשיו נשאר לבצע את האימון עצמו! תכננתי את מחברת האימון כך שבכל 500 צעדי אימון תישמר נקודת ביקורת בגוגל דרייב, כך שהאימון ביום למחרת או באתחול המחברת מחדש ימשיך מהנקודה שבה הפסקתי אתמול, וגם הוספתי תא קוד ששומר את המודל ב-huggingface. המחברת יכולה גם לבדוק את הפלט הנוכחי שהמודל יודע להפיק, כדי לעקוב אחר ההתקדמות.
                                        המטרה שהעליתי את הסקר הזה, היא לוודא שבכלל יש ביקוש למדריך כזה, שהוא בעצם יותר תיעוד מסע (=וולוג) מכיון שעוד לא עשתי את האימון הגדול על 5 מיליון שורות טקסט, ואני מתכוון לכתוב את המדריך תוך כדי ביצוע האימון כמדריך מתעדכן.
                                        אם יהיה מספיק ביקוש, אני אתאמץ בעז"ה להעלות בכל שלב את ההתקדמות והתוצאות, כמובן בלי התחייבות... אחרי הכל זה תהליך מאוד כבד ומורכב...
                                        אשמח גם לחוות דעת והערות מהמבינים בתחום ה-AI...

                                        ח מנותק
                                        ח מנותק
                                        חובבן מקצועי
                                        כתב נערך לאחרונה על ידי
                                        #31

                                        @א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?

                                        א.מ.ד.א תגובה 1 תגובה אחרונה
                                        0
                                        • ח חובבן מקצועי

                                          @א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?

                                          א.מ.ד.א מחובר
                                          א.מ.ד.א מחובר
                                          א.מ.ד.
                                          כתב נערך לאחרונה על ידי א.מ.ד.
                                          #32

                                          @חובבן-מקצועי כתב בסקר | סקר | האם יש ביקוש למדריך (או יותר נכון, תיעוד מסע) ליצירת מודל AI זעיר מאפס?:

                                          @א.מ.ד. אגב, כחלק מהמדריך - תעלה דאטה לאימון בשביל שיהיה לנו קצת טקסט לאמן אותו?

                                          נשתמש במערכי נתונים פתוחים מ-hugging face של מליוני טקסטים.

                                          מפתח אפליקציות אנדרואיד
                                          em0548438097@gmail.com

                                          תגובה 1 תגובה אחרונה
                                          0

                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • חוקי הפורום
                                          • פופולרי
                                          • לא נפתר
                                          • משתמשים
                                          • חיפוש גוגל בפורום
                                          • צור קשר