בקשת מידע | בונה מערכת סינון מה צריך להיות שם?
-
@מישהו12 כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
בהקשר הזה דווקא עדיף לוקאלי ולא שרת...
למה?
לוקאלי דורש תעודת אבטחה, זה בעצם לעקוף את האבטחה המובנית של הhhtps.
משא"כ שרת שזה רק מונע גישה.
אני טועה?@המלאך תסתכל על מה הוא הגיב.
בלוקאלי אין סכנה כיון שהמידע לא עוזב את המחשב שלך לא מוצפן כך שחוץ מהאתר איש לא קורא את התעבורה,
מה שאין כן בשרת שהמידע חייב לעבור לשרת הסופי ששמה לא בטוח יש לך אמון לדוג' כך זה עובד בנטפרי.כמובן זה תלוי איך בדיוק זה התבצע לוקאלית אבל לא אמורה להיות שום בעיה ורק יתרון על פני שימוש לשרת.
-
@מישהו12 כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
בהקשר הזה דווקא עדיף לוקאלי ולא שרת...
למה?
לוקאלי דורש תעודת אבטחה, זה בעצם לעקוף את האבטחה המובנית של הhhtps.
משא"כ שרת שזה רק מונע גישה.
אני טועה? -
@cfopuser יש טעם בטענת החבר שלך, למרות שזו לא הדרך שאני רואה את הדברים.
לגבי הטענה שתמיד אפשר ללכת לקנות סים וסמארטפון: נניח שאני רוצה להוריד את ה12 קילו העודפים ומחליט על דיאטה רצח. איך יש לי יותר סיכוי: אם יהיה לי במקרר עוגות שוקולד קצפת מגרות, או אם המקרר יהיה מלא בגזר וכרוב, וכדי להגיע לעוגות, אצטרך לצאת מהבית וללכת לסופרמרקט?
עצם המרחק הפיזי שמצריך יציאה והליכה - כבר שווה מאוד - נותן לי את הזמן לחשוב האם אני באמת רוצה להכניס עכשיו 1000 קלוריות לגוף שלי... -
אני כבר עבדתי על זה הרבה זמן בסוף מכמה סיבות הבנתי שזה לא כל כך יילך (בעיקר בגלל עלות ai לא משתלמת ולכן חייבים גם "הודים" שיסננו את התמונות. והחלטתי לשתף את הפרויקט (לשימוש אישי. לשימוש מסחרי צריך לבקש ממני רשות.)
לדעתי גם זה צריך להיות כמו נטפרי בשרת ולא על הלקוח (זה יוצר הרבה בעיות, בעיקר בגלל שא-אפשר לאבטח את זה שאכן התוצאות נכונות ולרוב האנשים גם אין מחשב שיכול להריץ ai ברמה נורמלית (qwen3 vl 8B q8 מהבדיקה שלי מבצע את העבודה בלי טעויות)
הנה הפרויקט שלי תהנו:
https://github.com/Mordechay0000/goallm
(אשמח לשמוע הערות/הארות, אפשר לפתוח issus ב github לא מתחייב לפתור)
שימו-לב שהפרויקט כולל אתר (השתלדתי להיצמד לנטפיר עם שדרוגים נוספים)
בהגדרה ראשונית יתאפשר להוסיף משתמש כמנהל לאחר מכן כל המשתמשים הם לא מנהלים, למנהל יש אפשרות להגיב לפניות לפתוח ולחסום אתרים גלובלית להפעיל ולכבות סינונים ועוד.
אשמח לשמוע את חוות דעתכם. -
C CSS 0 התייחס לנושא זה
-
@CSS-0 עברתי על המודלים.
חייב לציין שהם לא מסננים טקסט.
1- מה תעשה עם טקסט מבוסס הקשר?
2- מה עם ווידאו?
3- תמונות בsvg/קנבס/בייס64? המודלים הישנים האלה לא בהכרח יזהו אותם.
4- מה עם הרבה תמונות בדף אחד?
יש כמה דברים שחשוב לוודא, כדי להיות בטוח שזה אפשרי.
תעבור על מה שהבאתי לעיל אחד אחד.
כל הערה שהובאה שם חשובה.כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
1- מה תעשה עם טקסט מבוסס הקשר?
2- מה עם ווידאו?
3- תמונות בsvg/קנבס/בייס64? המודלים הישנים האלה לא בהכרח יזהו אותם.
4- מה עם הרבה תמונות בדף אחד?
יש כמה דברים שחשוב לוודא, כדי להיות בטוח שזה אפשרי.
תעבור על מה שהבאתי לעיל אחד אחד.
כל הערה שהובאה שם חשובה.@mefateach איך אתה סידרת את הבעיות האלה?
-
כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
1- מה תעשה עם טקסט מבוסס הקשר?
2- מה עם ווידאו?
3- תמונות בsvg/קנבס/בייס64? המודלים הישנים האלה לא בהכרח יזהו אותם.
4- מה עם הרבה תמונות בדף אחד?
יש כמה דברים שחשוב לוודא, כדי להיות בטוח שזה אפשרי.
תעבור על מה שהבאתי לעיל אחד אחד.
כל הערה שהובאה שם חשובה.@mefateach איך אתה סידרת את הבעיות האלה?
@המלאך ווידיאו יחולק לפריימים.
תמונות בבייס64 זה ישאב אותם מה CSS של הדף וישים מעליהם את התמונה של הבדיקה,
הרבה תמונות בדף זה לא בעיה הם יבדקו אחד אחרי השני
כל תמונה תעבור סינון הרי לכל תמונה לוקח בערך שניה עד שתיים אז בזמן הבדיקה זה יראה תמונה של בדיקה לכמה ששניות עד שזה יפתח..
מקווה שעניתי על הכל -
@המלאך ווידיאו יחולק לפריימים.
תמונות בבייס64 זה ישאב אותם מה CSS של הדף וישים מעליהם את התמונה של הבדיקה,
הרבה תמונות בדף זה לא בעיה הם יבדקו אחד אחרי השני
כל תמונה תעבור סינון הרי לכל תמונה לוקח בערך שניה עד שתיים אז בזמן הבדיקה זה יראה תמונה של בדיקה לכמה ששניות עד שזה יפתח..
מקווה שעניתי על הכל -
@CSS-0
1 - לא ענית על טקסט מבוסס הקשר.
2- קל להגיד שזה יעבור פריים פריים, אבל מציע לשאול את הבינה כמה זמן זה יקח...
3- זה לא יבדוק בייס64, זה מודלים ישנים מדי בשביל זה.
הרבה תמונות בדף אחד יקח כמה דקות עד שזה יסנן את כולם.@המלאך זה לא יעבור על כל הפריימים של הסרטון, אלא יעבור על 20 פריימים מסרט אני יודע שזה לא יהיה טוב לסרטים ארוכים, אז לסרטים ארוכים זה יקח יותר וזה יקח הרבה זמן אני יודע .... לכל 3 דקות זה יקח 20 פריימים) זה יהצא הרבה יותר מהיר מנטפרי תאמין לי...
ולא המודלים יחלצו מבייס 44 כי הם בכלל לא מענין אותם המקור של התמונות גוגל לא גוגל, התוכנה תחלץ עבורם את זה.. -
@המלאך זה לא יעבור על כל הפריימים של הסרטון, אלא יעבור על 20 פריימים מסרט אני יודע שזה לא יהיה טוב לסרטים ארוכים, אז לסרטים ארוכים זה יקח יותר וזה יקח הרבה זמן אני יודע .... לכל 3 דקות זה יקח 20 פריימים) זה יהצא הרבה יותר מהיר מנטפרי תאמין לי...
ולא המודלים יחלצו מבייס 44 כי הם בכלל לא מענין אותם המקור של התמונות גוגל לא גוגל, התוכנה תחלץ עבורם את זה.. -
@CSS-0
.
ממש מהר.
זה לא נכון.
סרט של שעה שווה ערך לכ100,000 פרימים.
כל פריים זה תמונה.
ובכל מקרה זה יזלול משאבים למחשב בינתיים. -
@המלאך לא צריך כל פריים, גם 20 זה די הרבה. נגיד כל 10 שניות יספיק... (תלוי כמה פריימים לשניה...)
-
@דאבל זה עדיין מדי הרבה.
ולהגדיל את מרווח הזמן יגרום לירידה ברמת הסינון.
דרך אגב 20 שניות ו20 פרימים זה הבדל עצום.@המלאך קצת ירודה בסינון, נכון. אבל מצד שני גם נטפרי לא רואים את כל הסרטון כשפותחים...
קרה לי לא פעם שפתחו משהו ותוך כדי יש שניה אחת של תמונה שאמורה להיחסם.
השאלה אם זו הרמה שמצופה מהסינון הזה...@המלאך כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
דרך אגב 20 שניות ו20 פרימים זה הבדל עצום.
כמובן, זה מה שיגרום להרבה פחות עיכוב.
-
@המלאך קצת ירודה בסינון, נכון. אבל מצד שני גם נטפרי לא רואים את כל הסרטון כשפותחים...
קרה לי לא פעם שפתחו משהו ותוך כדי יש שניה אחת של תמונה שאמורה להיחסם.
השאלה אם זו הרמה שמצופה מהסינון הזה...@המלאך כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
דרך אגב 20 שניות ו20 פרימים זה הבדל עצום.
כמובן, זה מה שיגרום להרבה פחות עיכוב.
-
כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
1- מה תעשה עם טקסט מבוסס הקשר?
2- מה עם ווידאו?
3- תמונות בsvg/קנבס/בייס64? המודלים הישנים האלה לא בהכרח יזהו אותם.
4- מה עם הרבה תמונות בדף אחד?
יש כמה דברים שחשוב לוודא, כדי להיות בטוח שזה אפשרי.
תעבור על מה שהבאתי לעיל אחד אחד.
כל הערה שהובאה שם חשובה.@mefateach איך אתה סידרת את הבעיות האלה?
- כמו נטפרי (באמת צריך בדיקה אנושית לאתר חדש, לאחר מכן יש סינון מלל וסינון תמונות)
- כרגע אין סינון אבל בעקרון זה צריך להיות מחולק לפריימים ולהישלח למודל (לוקחים 2 פריימים משניה)
- מומר לתמונה רגילה ועובר סינון
- בעיה... (זה אמור לשבת על שרת מאוד מאוד חזק ואז זה אמור לעשות בערך בין 5 ל 20 תמונות בשנייה, בכל מקרה זה אכן לא משתלם לכן ביטלתי את הפרויקט)
לסיכום אין בעיה בעצם המודל (אני משתמש ב qwen זה מודל הרבה יותר חזק בלי השוואה בכלל ל מה ש @css-0 משתמש ולכן זה דורש משאבים הרבה יותר חזקים, אלא שאני מאמין שהוא היחיד שעושה את העבודה, אני יוצא מנקודת הנחה שבשביל לסנן תמונה חייבים מודל ש"מבין" את התמונה ולא מודל שרק מחפש פרטים, כי במציאות יש הרבה פעמים חלק מאוד קטן מהתמונה שגורם לה להיות בעייתית או סיטואציה וכו'), מה שכן חייב להיות שרת חזק (ואם רוצים שזה יישתלם חיביים גם הודים לסינון תמונות שפחות חשוב המהירות)
-
- כמו נטפרי (באמת צריך בדיקה אנושית לאתר חדש, לאחר מכן יש סינון מלל וסינון תמונות)
- כרגע אין סינון אבל בעקרון זה צריך להיות מחולק לפריימים ולהישלח למודל (לוקחים 2 פריימים משניה)
- מומר לתמונה רגילה ועובר סינון
- בעיה... (זה אמור לשבת על שרת מאוד מאוד חזק ואז זה אמור לעשות בערך בין 5 ל 20 תמונות בשנייה, בכל מקרה זה אכן לא משתלם לכן ביטלתי את הפרויקט)
לסיכום אין בעיה בעצם המודל (אני משתמש ב qwen זה מודל הרבה יותר חזק בלי השוואה בכלל ל מה ש @css-0 משתמש ולכן זה דורש משאבים הרבה יותר חזקים, אלא שאני מאמין שהוא היחיד שעושה את העבודה, אני יוצא מנקודת הנחה שבשביל לסנן תמונה חייבים מודל ש"מבין" את התמונה ולא מודל שרק מחפש פרטים, כי במציאות יש הרבה פעמים חלק מאוד קטן מהתמונה שגורם לה להיות בעייתית או סיטואציה וכו'), מה שכן חייב להיות שרת חזק (ואם רוצים שזה יישתלם חיביים גם הודים לסינון תמונות שפחות חשוב המהירות)
@mefateach יפה מאוד..
רק זה -@mefateach כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
כרגע אין סינון אבל בעקרון זה צריך להיות מחולק לפריימים ולהישלח למודל (לוקחים 2 פריימים משניה)
שתי פריימים לשניה זה יותר מדי זמן.