בקשת מידע | בונה מערכת סינון מה צריך להיות שם?
-
אני באמצע לבנות תוכנת סינון אינטרנט, למחשבים, התוכנה בודקת אתרים בזמן אמת עם AI, חוסמת נשים, תמנות לא צנועות, התוכנה משתמשת במחשב של המשתמ למשאבי AI זאת אומרת המודלים של ה AI הם אופליין לחלוטין!!! יש רשימה שחורה של אתרים, זאת אומרת עם זה מצא 15 תמונות אסורות, וגם 5 מילים אסורות מרשימה שחורה שיש לה, היא מייד חוסמת את הדף, ומכניסה אותו לרשימה שחורה פנימית, וכנ"ל על תמונות שהיא בודקת (לוקח לה פחות משניה לתמונה!!!) יש לה רשימה שחורה ולבנה כדי שהיא לא תבדוק את זה שוב בפעם הבאה, גם על סרטונים, שנכנסים לסרטונים ביוטיוב או בכל מקום אחר, התוכנה בודקת את הסרטון עם מודלים אופליין! ועם יש נשים או דברים לא צנועים היא חוסמת, התוכנה נקראת בשם "סננקל"
התוכנה בזמן שהיא בודקת היא מראה את התמונה הזו:

תמונה או אתר שנחסם מופיע בו התמונה הזו:

אני נעזר ב AI לכתיבת התוכנה...
מה אתם חושבים עוד שצריך להיות שם? ואיך? מה אתם חושבים שצריך להיות יותר טוב מהסינונים האחרים? מה חסר? ונפתח...
-
@CSS-0 אם אתה מתכוון למודלי למידת מכונה (ML), אז אתה צודק שהם יכולים לרוץ במהירות אפילו על החומרה של הקומקום של פסח, אבל האמינות שלהם מוטלת בספק, ונשמע שעדיין אין לך מודלים כאלה (היה פה עוד אחד שחיפש ולא מצא). תצטרך לאמן מאפס, ובמודלים כאלו אמנם האימון הוא חינמי (יש פלטפורמות של גוגל), אבל תצטרך מערך נתונים עצום.
אם אתה מתכוון למודלי LLM VL, במקרה הטוב ביותר המהירות תהיה 2 דקות לכל תמונה במחשב עם 16 RAM. -
@CSS-0 אם אתה מתכוון למודלי למידת מכונה (ML), אז אתה צודק שהם יכולים לרוץ במהירות אפילו על החומרה של הקומקום של פסח, אבל האמינות שלהם מוטלת בספק, ונשמע שעדיין אין לך מודלים כאלה (היה פה עוד אחד שחיפש ולא מצא). תצטרך לאמן מאפס, ובמודלים כאלו אמנם האימון הוא חינמי (יש פלטפורמות של גוגל), אבל תצטרך מערך נתונים עצום.
אם אתה מתכוון למודלי LLM VL, במקרה הטוב ביותר המהירות תהיה 2 דקות לכל תמונה במחשב עם 16 RAM. -
יתכן באמת שעדייף יהיה לעשות את זה אונליין, השאלה מה עדיף סינון יותר טוב יותר חזק, אבל אולי בתשלום (עוד לא בטוח...) או שמערכת מאד חלשה וקשה, אבל בחינם?
@CSS-0 כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
יתכן באמת שעדייף יהיה לעשות את זה אונליין, השאלה מה עדיף סינון יותר טוב יותר חזק, אבל אולי בתשלום (עוד לא בטוח...) או שמערכת מאד חלשה וקשה, אבל בחינם?
תתחיל באופליין בחינם, תעשה קבוצות בודקים ודיווחים, אחר כך (או תוך כדי) תשדרג לאופצייה עם מנוי על אונליין
-
@א.מ.ד. דווקא יש לי כבר מודלים וכבר שלחתי לאנשים בפרטי את הקישורים, והם אני יודע שהם לא הטובים שיש היום כמובן שמי שעל נטפרי לא יעבור לזה...
@CSS-0 עברתי על המודלים.
חייב לציין שהם לא מסננים טקסט.
1- מה תעשה עם טקסט מבוסס הקשר?
2- מה עם ווידאו?
3- תמונות בsvg/קנבס/בייס64? המודלים הישנים האלה לא בהכרח יזהו אותם.
4- מה עם הרבה תמונות בדף אחד?
יש כמה דברים שחשוב לוודא, כדי להיות בטוח שזה אפשרי.
תעבור על מה שהבאתי לעיל אחד אחד.
כל הערה שהובאה שם חשובה. -
@CSS-0 אם אתה מתכוון למודלי למידת מכונה (ML), אז אתה צודק שהם יכולים לרוץ במהירות אפילו על החומרה של הקומקום של פסח, אבל האמינות שלהם מוטלת בספק, ונשמע שעדיין אין לך מודלים כאלה (היה פה עוד אחד שחיפש ולא מצא). תצטרך לאמן מאפס, ובמודלים כאלו אמנם האימון הוא חינמי (יש פלטפורמות של גוגל), אבל תצטרך מערך נתונים עצום.
אם אתה מתכוון למודלי LLM VL, במקרה הטוב ביותר המהירות תהיה 2 דקות לכל תמונה במחשב עם 16 RAM. -
@אאA
הסינון לא כולל חסימת תוכנות במחשב,
שום דבר לא קורה בצד שרת, הכל אופליין,
זה נועד למחשבים.
האם זה חשוב שיהיה גם חסימת תוכנות במחשב?@CSS-0 כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
זה נועד למחשבים.
אם זה באמת מודלים קטנים ספציפים ניתן יהיה בעתיד להשתמש בהם ולפתח גם סינון לפלאפון/טאבלט?
-
@css-0
יש הרבה חסרונות בסינון שרץ על המחשב ולא על שרת.- ברגע שהמידע עובר במחשב הרבה יותר קל לעקוף אותו כי כל המידע מגיע אלי רק לא מוצג, לעומת זאת אם הוא עובר בשרת אני רק מקבל את הנתונים המסוננים.
- עבודה מיותרת של המודל בכל מחשב ומחשב על אותם תמונות ואתרים, לעומת זאת אם זה שמור על שרת הוא בודק כל אתר פעם אחת ושומר בזיכרון.
- המחשב איטי יותר משרת ויקח לו זמן לעבד את הנתונים הרבה יותר. (כמובן גם משתנה בין מחשבים).
- אתה צריך לייצר מערכת סינון לכל מכשיר ומכשיר בפני עצמו ולהתאים אותו, אבל אם זה רץ על שרת זה יכול להתאים בקלות יותר ליותר סוגי מכשירים ויכול לרוץ על כל הרשת הביתית.
- המודל יחצוץ את הHTTPS באתרים כמו בנקים וכו', וזה פרצת אבטחה חמורה!
@טופטופיסט כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
המודל יחצוץ את הHTTPS באתרים כמו בנקים וכו', וזה פרצת אבטחה חמורה!
בהקשר הזה דווקא עדיף לוקאלי ולא שרת...
-
@css-0 ומה עושים כשיש בעיות וחוסם סתם, אין למי לפנות כדי לבדוק מחדש..
-
@טופטופיסט אין פרצות אבטחה על אופליין
וגם אין בזה כל בעיה שאנשים יוכלו לפרוץ את הסינון... אף אחד לא כופה עליהם..@CSS-0 כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
וגם אין בזה כל בעיה שאנשים יוכלו לפרוץ את הסינון... אף אחד לא כופה עליהם..
@אורי כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
מה שאתה אומר שקול לאמירה שבוא כבר נשתמש במחשב ללא סינון - מי כופה עלינו לחפש תכנים שלא ראויים לבני תורה....
הסביר לי פעם מתכנת בחברת סינון אחת,
שמבחינתו סינון הוא כלי כלומר סינון מאפשר לך לגלוש ברשת בבטחה בלי לחשוב לפני שלוחצים על קישור,
ולדעת שהסינון תמיד צעד אחד לפניך, בודק בשבילך כול דבר לפני שתמשיך.כלומר סינון הוא כלי דבר שאמור לסנן את הרשת ולא את המשתמש (או במילים אחרות הוא לא בא להיות הורה שלך)
יש היגיון בטענה הזו כי הרי הסינון לא יוכל למנוע אותך מלקנות מכשיר חדש עם סים חדש וכדו'כמובן יש הרבה מה להתווכח על הגישה הזאת אבל סתם ככה זו צורה אחרת להסתכל על הדברים.
-
@CSS-0 כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
וגם אין בזה כל בעיה שאנשים יוכלו לפרוץ את הסינון... אף אחד לא כופה עליהם..
@אורי כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
מה שאתה אומר שקול לאמירה שבוא כבר נשתמש במחשב ללא סינון - מי כופה עלינו לחפש תכנים שלא ראויים לבני תורה....
הסביר לי פעם מתכנת בחברת סינון אחת,
שמבחינתו סינון הוא כלי כלומר סינון מאפשר לך לגלוש ברשת בבטחה בלי לחשוב לפני שלוחצים על קישור,
ולדעת שהסינון תמיד צעד אחד לפניך, בודק בשבילך כול דבר לפני שתמשיך.כלומר סינון הוא כלי דבר שאמור לסנן את הרשת ולא את המשתמש (או במילים אחרות הוא לא בא להיות הורה שלך)
יש היגיון בטענה הזו כי הרי הסינון לא יוכל למנוע אותך מלקנות מכשיר חדש עם סים חדש וכדו'כמובן יש הרבה מה להתווכח על הגישה הזאת אבל סתם ככה זו צורה אחרת להסתכל על הדברים.
@cfopuser כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
כלומר סינון הוא כלי לא דבר שאמור לסנן את הרשת ולא את המשתמש (או במילים אחרות הוא לא בא להיות הורה שלך)
יש היגיון בטענה הזו כי הרי הסינון לא יוכל למנוע אותך מלקנות מכשיר חדש עם סים חדש וכדו'גם אם זה נכון בעיקרון, עדיין יש הורים שרוצים לקנות לבנים מכשיר עם סינון, וכדו'
-
@טופטופיסט כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
המודל יחצוץ את הHTTPS באתרים כמו בנקים וכו', וזה פרצת אבטחה חמורה!
בהקשר הזה דווקא עדיף לוקאלי ולא שרת...
-
@מישהו12 כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
בהקשר הזה דווקא עדיף לוקאלי ולא שרת...
למה?
לוקאלי דורש תעודת אבטחה, זה בעצם לעקוף את האבטחה המובנית של הhhtps.
משא"כ שרת שזה רק מונע גישה.
אני טועה?@המלאך תסתכל על מה הוא הגיב.
בלוקאלי אין סכנה כיון שהמידע לא עוזב את המחשב שלך לא מוצפן כך שחוץ מהאתר איש לא קורא את התעבורה,
מה שאין כן בשרת שהמידע חייב לעבור לשרת הסופי ששמה לא בטוח יש לך אמון לדוג' כך זה עובד בנטפרי.כמובן זה תלוי איך בדיוק זה התבצע לוקאלית אבל לא אמורה להיות שום בעיה ורק יתרון על פני שימוש לשרת.
-
@מישהו12 כתב בבקשת מידע | בונה מערכת סינון מה צריך להיות שם?:
בהקשר הזה דווקא עדיף לוקאלי ולא שרת...
למה?
לוקאלי דורש תעודת אבטחה, זה בעצם לעקוף את האבטחה המובנית של הhhtps.
משא"כ שרת שזה רק מונע גישה.
אני טועה? -
@cfopuser יש טעם בטענת החבר שלך, למרות שזו לא הדרך שאני רואה את הדברים.
לגבי הטענה שתמיד אפשר ללכת לקנות סים וסמארטפון: נניח שאני רוצה להוריד את ה12 קילו העודפים ומחליט על דיאטה רצח. איך יש לי יותר סיכוי: אם יהיה לי במקרר עוגות שוקולד קצפת מגרות, או אם המקרר יהיה מלא בגזר וכרוב, וכדי להגיע לעוגות, אצטרך לצאת מהבית וללכת לסופרמרקט?
עצם המרחק הפיזי שמצריך יציאה והליכה - כבר שווה מאוד - נותן לי את הזמן לחשוב האם אני באמת רוצה להכניס עכשיו 1000 קלוריות לגוף שלי... -
אני כבר עבדתי על זה הרבה זמן בסוף מכמה סיבות הבנתי שזה לא כל כך יילך (בעיקר בגלל עלות ai לא משתלמת ולכן חייבים גם "הודים" שיסננו את התמונות. והחלטתי לשתף את הפרויקט (לשימוש אישי. לשימוש מסחרי צריך לבקש ממני רשות.)
לדעתי גם זה צריך להיות כמו נטפרי בשרת ולא על הלקוח (זה יוצר הרבה בעיות, בעיקר בגלל שא-אפשר לאבטח את זה שאכן התוצאות נכונות ולרוב האנשים גם אין מחשב שיכול להריץ ai ברמה נורמלית (qwen3 vl 8B q8 מהבדיקה שלי מבצע את העבודה בלי טעויות)
הנה הפרויקט שלי תהנו:
https://github.com/Mordechay0000/goallm
(אשמח לשמוע הערות/הארות, אפשר לפתוח issus ב github לא מתחייב לפתור)
שימו-לב שהפרויקט כולל אתר (השתלדתי להיצמד לנטפיר עם שדרוגים נוספים)
בהגדרה ראשונית יתאפשר להוסיף משתמש כמנהל לאחר מכן כל המשתמשים הם לא מנהלים, למנהל יש אפשרות להגיב לפניות לפתוח ולחסום אתרים גלובלית להפעיל ולכבות סינונים ועוד.
אשמח לשמוע את חוות דעתכם. -
C CSS 0 התייחס לנושא זה