שיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא
-
@NH-LOCAL כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
לגבי כל השאר - צ'אט GPT גרוע ממש בעברית (אא"כ מדובר על GPT4)
לא יודע על מה אתה מדבר אני ממש מסתדר איתו בעברית מצויין
@NH-LOCAL כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
בארד - ברמה סבירה ומטה
כנ״ל עובד לי מעולה
@NH-LOCAL כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
לגבי character - בפעם האחרונה שנגעתי בו לא הייתה בו עברית בכלל, אם זה השתנה - תעדכן
תלוי איזה דמויות, יש דמיות שיודעות עברית ויש שלא.
@NH-LOCAL כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
בקיצור - בהחלט טעיתי במידת מה, אבל גם אתה לא הכי מדייק
זה לא מה שחשוב... מה שחשוב זה שגם בעברית ברמה נמוכה זה שווה אם הוא ידע ״ללמוד טוב״
@אהרן כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
נטפרי מחפשים פתרונות סינון
חסום בנטפרי
מה אתה רוצה ממני??
@NH-LOCAL כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
רגקס = שיפור חיפוש על ידי הגדרת מילים חילופיות
רגקס עד כמה שידוע לי זה חיפוש מדויק לא
@NH-LOCAL כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
אפשר בהחלט להריץ מודל AI על מחשב, השאלה רק כמה כבד הוא יהיה
רק אם הוא בקוד פתוח...
@mefateach כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
רגקס עד כמה שידוע לי זה חיפוש מדויק לא
צודק. לגבי כל השאר - פחות מסכים...
ומה באה לומר ההדגמה של שור-בור וכו'?
-
@mefateach כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
רגקס עד כמה שידוע לי זה חיפוש מדויק לא
צודק. לגבי כל השאר - פחות מסכים...
ומה באה לומר ההדגמה של שור-בור וכו'?
-
@NH-LOCAL כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
ומה באה לומר ההדגמה של שור-בור וכו'?
סתם, את היכולת שלו להסביר גמרא,די יפה.
-
@NH-LOCAL אתה גמור??? איפה אתה חי??? היום המודלי שפה הם עובדים 100% בעברית, לא פחות מאנגלית, אני קובע מתכתב איתם בעברית
https://chat.openai.com/
https://bard.google.com/
https://claude.ai/chat (לאחרונה @זונדל הראה לי אותו, ונראה לי שהוא הכי טוב!!)
https://beta.character.a@mefateach כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
https://claude.ai/chat (לאחרונה @זונדל הראה לי אותו, ונראה לי שהוא הכי טוב!!)
תוכל להרחיב בבקשה?
-
@mefateach איזה מודל?
@NH-LOCAL כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
@mefateach איזה מודל?
-
@mefateach כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
https://claude.ai/chat (לאחרונה @זונדל הראה לי אותו, ונראה לי שהוא הכי טוב!!)
תוכל להרחיב בבקשה?
@aiib כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
מה יש להרחיב? תנסה תראה, אם אין לך אפשרות לנסות אין לי הרבה מה לסביר, אתה רק יכול לראות את הדוגמה שהעלתי
-
@mefateach לגבי קלאוד AI, כנראה שאתה צודק. לא יצא לי להשתמש בו בעצמי.
לגבי כל השאר - צ'אט GPT גרוע ממש בעברית (אא"כ מדובר על GPT4)
בארד - ברמה סבירה ומטה
לגבי character - בפעם האחרונה שנגעתי בו לא הייתה בו עברית בכלל, אם זה השתנה - תעדכןבקיצור - בהחלט טעיתי במידת מה, אבל גם אתה לא הכי מדייק
@NH-LOCAL כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
@mefateach לגבי קלאוד AI, כנראה שאתה צודק. לא יצא לי להשתמש בו בעצמי.
לגבי כל השאר - צ'אט GPT גרוע ממש בעברית (אא"כ מדובר על GPT4)
בארד - ברמה סבירה ומטה
לגבי character - בפעם האחרונה שנגעתי בו לא הייתה בו עברית בכלל, אם זה השתנה - תעדכןבקיצור - בהחלט טעיתי במידת מה, אבל גם אתה לא הכי מדייק
המוזר זה שמי שהכי טוב בעברית לא זמין בישראל... (כן קומבינות VPN וכו)
-
@aiib כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
מה יש להרחיב? תנסה תראה, אם אין לך אפשרות לנסות אין לי הרבה מה לסביר, אתה רק יכול לראות את הדוגמה שהעלתי
@mefateach כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
@aiib כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
מה יש להרחיב? תנסה תראה, אם אין לך אפשרות לנסות אין לי הרבה מה לסביר, אתה רק יכול לראות את הדוגמה שהעלתי
במה הוא יותר טוב. במה לבדוק אותו?
-
@mefateach כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
@aiib כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
מה יש להרחיב? תנסה תראה, אם אין לך אפשרות לנסות אין לי הרבה מה לסביר, אתה רק יכול לראות את הדוגמה שהעלתי
במה הוא יותר טוב. במה לבדוק אותו?
-
@aiib כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
במה הוא יותר טוב. במה לבדוק אותו?
הוא יותר טוב בניסוח בשפה העברית, ובעוד כמה פרמטרים מסויימים, שאפשר לדון עליהם
-
@aiib כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
במה הוא יותר טוב. במה לבדוק אותו?
הוא יותר טוב בניסוח בשפה העברית, ובעוד כמה פרמטרים מסויימים, שאפשר לדון עליהם
-
@aiib כתב בשיתוף | מודל AI קטן שיצרתי - זיהוי האם מחרוזת היא מהתנ"ך או לא:
@NH-LOCAL על איזה מודל הוא מבוסס?
מודל קלאוד של חברה בשם אנטרופיק
-
עדכון: ניתן להתנסות במודל באופן מיידי באתר הבא:
https://huggingface.co/spaces/NHLOCAL/is-this-bible
לאחרונה עשיתי צעדים ראשונים בעולם ה-machine learning. במהלך הנסיונות יצרתי כמה מודלים לכמה מטרות, בין השאר - מודל שמזהה האם משפט מסויים הוא מהתנ"ך או מכל מקום אחר.
לצורך כך השתמשתי ברשימה של כ-500 פסוקים ממקומות שונים בתנ"ך ושל כ-500 משפטים בסגונונת שונים, כמו חדשות, בדיחות, סיפורים, מונולוגים, ועוד.
טוב, זה לא הדבר הכי שימושי בעולם, זה בא בעיקר בשביל להדגים את היכולות של למידת מכונה.
האמת היא, שכמעט לא עשיתי שום דבר בעצמי. בניית הקוד הבסיסי, ואפילו מערך הנתונים, נוצר בעזרתו האדיבה של צ'אט GPT.המודל מצליח לזהות משפטים ברמה טובה למדי, וניתן לנסות אותו בקלות על ידי הורדת קובץ השחרור מהמאגר בגיטהאב.
תוכלו להריץ את הקובץ try_model כדי לראות רשימת משפטים לדוגמה עם הזיהוי "bible" או "other", כולל רמת הוודאות של הזיהוי. בנוסף, תוכלו להכניס משפט כלשהו כפרמטר משורת הפקודה עם מרכאות בתחילת וסוף המשפט.
ניתן לחפש את המשפט הספציפי בתוך הקובץ bible_data.csv שמכיל את מערך הנתונים, כדי לוודא שהמשפט לא הוזן למודל מראש.
כדי להריץ את המודל בפועל יש להוריד עם pip את המודלים joblib ו- nltk.
דוגמה:
קלט שלילי:
try_model.py "האתר מתמחים מכיל שאלות בנושאי תכנות ונושאים אחרים"
פלט:
Text: האתר מתמחים מכיל שאלות בנושאי תכנות ונושאים אחרים | Prediction: Other | Confidence Score: 0.3112
קלט חיובי:
try_model.py "עניה סערה לא נחמה הנה אנכי מרביץ בפוך אבניך"
פלט:
Text: עניה סערה לא נחמה הנה אנכי מרביץ בפוך אבניך ויסדתיך בספירים | Prediction: Bible | Confidence Score: 1.0000
קישור למאגר עצמו - https://github.com/NHLOCAL/is-this-bible
עדכון (כ"ז אב) - יצרתי גרסה מוכנה בקובץ EXE ללא צורך בהורדת פייתון וספריות קוד.
הורידו בקישור הישיר הזה:
https://github.com/NHLOCAL/is-this-bible/releases/download/v2.0/is-this-bible.zipהוראות שימוש:
- חלצו את תוכן קובץ הזיפ לתיקיה.
- פתחו שורת הפקודה מתוך התיקיה - אפשר להקליד "CMD" בשורת הכותרת או לפתוח את התפריט בלחיצה על מקש ימני ובחירה ב"פתח במסוף" (עבור ווינדוס 11)
- הריצו את התוכנה + משפט לדוגמה שתרצו לנסות:
is-this-bible.exe "איש אחד הלך ברחוב"
-
עדכון (כ"ז אב) - יצרתי גרסה מוכנה בקובץ EXE ללא צורך בהורדת פייתון וספריות קוד.
הורידו בקישור הישיר הזה:
https://github.com/NHLOCAL/is-this-bible/releases/download/v2.0/is-this-bible.zipהוראות שימוש:
- חלצו את תוכן קובץ הזיפ לתיקיה.
- פתחו שורת הפקודה מתוך התיקיה - אפשר להקליד "CMD" בשורת הכותרת או לפתוח את התפריט בלחיצה על מקש ימני ובחירה ב"פתח במסוף" (עבור ווינדוס 11)
- הריצו את התוכנה + משפט לדוגמה שתרצו לנסות:
is-this-bible.exe "איש אחד הלך ברחוב"
-
ה האדם החושב התייחס לנושא זה ב
-
עדכון: ניתן להתנסות במודל באופן מיידי באתר הבא:
https://huggingface.co/spaces/NHLOCAL/is-this-bible
לאחרונה עשיתי צעדים ראשונים בעולם ה-machine learning. במהלך הנסיונות יצרתי כמה מודלים לכמה מטרות, בין השאר - מודל שמזהה האם משפט מסויים הוא מהתנ"ך או מכל מקום אחר.
לצורך כך השתמשתי ברשימה של כ-500 פסוקים ממקומות שונים בתנ"ך ושל כ-500 משפטים בסגונונת שונים, כמו חדשות, בדיחות, סיפורים, מונולוגים, ועוד.
טוב, זה לא הדבר הכי שימושי בעולם, זה בא בעיקר בשביל להדגים את היכולות של למידת מכונה.
האמת היא, שכמעט לא עשיתי שום דבר בעצמי. בניית הקוד הבסיסי, ואפילו מערך הנתונים, נוצר בעזרתו האדיבה של צ'אט GPT.המודל מצליח לזהות משפטים ברמה טובה למדי, וניתן לנסות אותו בקלות על ידי הורדת קובץ השחרור מהמאגר בגיטהאב.
תוכלו להריץ את הקובץ try_model כדי לראות רשימת משפטים לדוגמה עם הזיהוי "bible" או "other", כולל רמת הוודאות של הזיהוי. בנוסף, תוכלו להכניס משפט כלשהו כפרמטר משורת הפקודה עם מרכאות בתחילת וסוף המשפט.
ניתן לחפש את המשפט הספציפי בתוך הקובץ bible_data.csv שמכיל את מערך הנתונים, כדי לוודא שהמשפט לא הוזן למודל מראש.
כדי להריץ את המודל בפועל יש להוריד עם pip את המודלים joblib ו- nltk.
דוגמה:
קלט שלילי:
try_model.py "האתר מתמחים מכיל שאלות בנושאי תכנות ונושאים אחרים"
פלט:
Text: האתר מתמחים מכיל שאלות בנושאי תכנות ונושאים אחרים | Prediction: Other | Confidence Score: 0.3112
קלט חיובי:
try_model.py "עניה סערה לא נחמה הנה אנכי מרביץ בפוך אבניך"
פלט:
Text: עניה סערה לא נחמה הנה אנכי מרביץ בפוך אבניך ויסדתיך בספירים | Prediction: Bible | Confidence Score: 1.0000
קישור למאגר עצמו - https://github.com/NHLOCAL/is-this-bible
עדכון: כדי לאפשר לכולם להתנסות במודל, (וגם סתם כך לכיף, כי זה ממש קל...) בניתי אפליקצייה על גבי אתר "hugging face" שמריצה את המודל אונליין. כל אחד יכול להתנסות בה.
כרגע העיצוב די מינימלי, ואפילו לא בהמשך. אני מקווה לשפר את זה קצת בהמשך בעז"ה
ניתן להכנס לאפליקצייה כאן:
-
@NH-LOCAL מאוד יפה!
ניסיתי עכשיו "ויבוא אברהם" והוא אומר לא תנך
ניסיתי "ויבא אברהם" ואז הוא מאשר.האם המודל חייב בדיוק את האיות הנכון?