בקשת מידע | בונה מערכת סינון מה צריך להיות שם?
-
אני כבר עבדתי על זה הרבה זמן בסוף מכמה סיבות הבנתי שזה לא כל כך יילך (בעיקר בגלל עלות ai לא משתלמת ולכן חייבים גם "הודים" שיסננו את התמונות. והחלטתי לשתף את הפרויקט (לשימוש אישי. לשימוש מסחרי צריך לבקש ממני רשות.)
לדעתי גם זה צריך להיות כמו נטפרי בשרת ולא על הלקוח (זה יוצר הרבה בעיות, בעיקר בגלל שא-אפשר לאבטח את זה שאכן התוצאות נכונות ולרוב האנשים גם אין מחשב שיכול להריץ ai ברמה נורמלית (qwen3 vl 8B q8 מהבדיקה שלי מבצע את העבודה בלי טעויות)
הנה הפרויקט שלי תהנו:
https://github.com/Mordechay0000/goallm
(אשמח לשמוע הערות/הארות, אפשר לפתוח issus ב github לא מתחייב לפתור)
שימו-לב שהפרויקט כולל אתר (השתלדתי להיצמד לנטפיר עם שדרוגים נוספים)
בהגדרה ראשונית יתאפשר להוסיף משתמש כמנהל לאחר מכן כל המשתמשים הם לא מנהלים, למנהל יש אפשרות להגיב לפניות לפתוח ולחסום אתרים גלובלית להפעיל ולכבות סינונים ועוד.
אשמח לשמוע את חוות דעתכם. -
C CSS 0 התייחס לנושא זה
-
@CSS-0 עברתי על המודלים.
חייב לציין שהם לא מסננים טקסט.
1- מה תעשה עם טקסט מבוסס הקשר?
2- מה עם ווידאו?
3- תמונות בsvg/קנבס/בייס64? המודלים הישנים האלה לא בהכרח יזהו אותם.
4- מה עם הרבה תמונות בדף אחד?
יש כמה דברים שחשוב לוודא, כדי להיות בטוח שזה אפשרי.
תעבור על מה שהבאתי לעיל אחד אחד.
כל הערה שהובאה שם חשובה.כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
1- מה תעשה עם טקסט מבוסס הקשר?
2- מה עם ווידאו?
3- תמונות בsvg/קנבס/בייס64? המודלים הישנים האלה לא בהכרח יזהו אותם.
4- מה עם הרבה תמונות בדף אחד?
יש כמה דברים שחשוב לוודא, כדי להיות בטוח שזה אפשרי.
תעבור על מה שהבאתי לעיל אחד אחד.
כל הערה שהובאה שם חשובה.@mefateach איך אתה סידרת את הבעיות האלה?
-
כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
1- מה תעשה עם טקסט מבוסס הקשר?
2- מה עם ווידאו?
3- תמונות בsvg/קנבס/בייס64? המודלים הישנים האלה לא בהכרח יזהו אותם.
4- מה עם הרבה תמונות בדף אחד?
יש כמה דברים שחשוב לוודא, כדי להיות בטוח שזה אפשרי.
תעבור על מה שהבאתי לעיל אחד אחד.
כל הערה שהובאה שם חשובה.@mefateach איך אתה סידרת את הבעיות האלה?
@המלאך ווידיאו יחולק לפריימים.
תמונות בבייס64 זה ישאב אותם מה CSS של הדף וישים מעליהם את התמונה של הבדיקה,
הרבה תמונות בדף זה לא בעיה הם יבדקו אחד אחרי השני
כל תמונה תעבור סינון הרי לכל תמונה לוקח בערך שניה עד שתיים אז בזמן הבדיקה זה יראה תמונה של בדיקה לכמה ששניות עד שזה יפתח..
מקווה שעניתי על הכל -
@המלאך ווידיאו יחולק לפריימים.
תמונות בבייס64 זה ישאב אותם מה CSS של הדף וישים מעליהם את התמונה של הבדיקה,
הרבה תמונות בדף זה לא בעיה הם יבדקו אחד אחרי השני
כל תמונה תעבור סינון הרי לכל תמונה לוקח בערך שניה עד שתיים אז בזמן הבדיקה זה יראה תמונה של בדיקה לכמה ששניות עד שזה יפתח..
מקווה שעניתי על הכל -
@CSS-0
1 - לא ענית על טקסט מבוסס הקשר.
2- קל להגיד שזה יעבור פריים פריים, אבל מציע לשאול את הבינה כמה זמן זה יקח...
3- זה לא יבדוק בייס64, זה מודלים ישנים מדי בשביל זה.
הרבה תמונות בדף אחד יקח כמה דקות עד שזה יסנן את כולם.@המלאך זה לא יעבור על כל הפריימים של הסרטון, אלא יעבור על 20 פריימים מסרט אני יודע שזה לא יהיה טוב לסרטים ארוכים, אז לסרטים ארוכים זה יקח יותר וזה יקח הרבה זמן אני יודע .... לכל 3 דקות זה יקח 20 פריימים) זה יהצא הרבה יותר מהיר מנטפרי תאמין לי...
ולא המודלים יחלצו מבייס 44 כי הם בכלל לא מענין אותם המקור של התמונות גוגל לא גוגל, התוכנה תחלץ עבורם את זה.. -
@המלאך זה לא יעבור על כל הפריימים של הסרטון, אלא יעבור על 20 פריימים מסרט אני יודע שזה לא יהיה טוב לסרטים ארוכים, אז לסרטים ארוכים זה יקח יותר וזה יקח הרבה זמן אני יודע .... לכל 3 דקות זה יקח 20 פריימים) זה יהצא הרבה יותר מהיר מנטפרי תאמין לי...
ולא המודלים יחלצו מבייס 44 כי הם בכלל לא מענין אותם המקור של התמונות גוגל לא גוגל, התוכנה תחלץ עבורם את זה.. -
@CSS-0
.
ממש מהר.
זה לא נכון.
סרט של שעה שווה ערך לכ100,000 פרימים.
כל פריים זה תמונה.
ובכל מקרה זה יזלול משאבים למחשב בינתיים. -
@המלאך לא צריך כל פריים, גם 20 זה די הרבה. נגיד כל 10 שניות יספיק... (תלוי כמה פריימים לשניה...)
-
@דאבל זה עדיין מדי הרבה.
ולהגדיל את מרווח הזמן יגרום לירידה ברמת הסינון.
דרך אגב 20 שניות ו20 פרימים זה הבדל עצום.@המלאך קצת ירודה בסינון, נכון. אבל מצד שני גם נטפרי לא רואים את כל הסרטון כשפותחים...
קרה לי לא פעם שפתחו משהו ותוך כדי יש שניה אחת של תמונה שאמורה להיחסם.
השאלה אם זו הרמה שמצופה מהסינון הזה...@המלאך כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
דרך אגב 20 שניות ו20 פרימים זה הבדל עצום.
כמובן, זה מה שיגרום להרבה פחות עיכוב.
-
@המלאך קצת ירודה בסינון, נכון. אבל מצד שני גם נטפרי לא רואים את כל הסרטון כשפותחים...
קרה לי לא פעם שפתחו משהו ותוך כדי יש שניה אחת של תמונה שאמורה להיחסם.
השאלה אם זו הרמה שמצופה מהסינון הזה...@המלאך כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
דרך אגב 20 שניות ו20 פרימים זה הבדל עצום.
כמובן, זה מה שיגרום להרבה פחות עיכוב.
-
כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
1- מה תעשה עם טקסט מבוסס הקשר?
2- מה עם ווידאו?
3- תמונות בsvg/קנבס/בייס64? המודלים הישנים האלה לא בהכרח יזהו אותם.
4- מה עם הרבה תמונות בדף אחד?
יש כמה דברים שחשוב לוודא, כדי להיות בטוח שזה אפשרי.
תעבור על מה שהבאתי לעיל אחד אחד.
כל הערה שהובאה שם חשובה.@mefateach איך אתה סידרת את הבעיות האלה?
- כמו נטפרי (באמת צריך בדיקה אנושית לאתר חדש, לאחר מכן יש סינון מלל וסינון תמונות)
- כרגע אין סינון אבל בעקרון זה צריך להיות מחולק לפריימים ולהישלח למודל (לוקחים 2 פריימים משניה)
- מומר לתמונה רגילה ועובר סינון
- בעיה... (זה אמור לשבת על שרת מאוד מאוד חזק ואז זה אמור לעשות בערך בין 5 ל 20 תמונות בשנייה, בכל מקרה זה אכן לא משתלם לכן ביטלתי את הפרויקט)
לסיכום אין בעיה בעצם המודל (אני משתמש ב qwen זה מודל הרבה יותר חזק בלי השוואה בכלל ל מה ש @css-0 משתמש ולכן זה דורש משאבים הרבה יותר חזקים, אלא שאני מאמין שהוא היחיד שעושה את העבודה, אני יוצא מנקודת הנחה שבשביל לסנן תמונה חייבים מודל ש"מבין" את התמונה ולא מודל שרק מחפש פרטים, כי במציאות יש הרבה פעמים חלק מאוד קטן מהתמונה שגורם לה להיות בעייתית או סיטואציה וכו'), מה שכן חייב להיות שרת חזק (ואם רוצים שזה יישתלם חיביים גם הודים לסינון תמונות שפחות חשוב המהירות)