בירור | מה דעתכם - איזה בינה הכי מועילה כיום לקוד?
-
אני חושב שבכול המודלים הקיימים כיום אפשר להוציא תוצאות מעולות ביחוד במודלים המתקדמים.
קלוד 4.6 (opus) וגי'מיני 3.1 די שווים בcli ספציפית קלוד קוד הוא כלי יותר טוב (לאו דווקא מודל יותר טוב),ולג'ימיני יש יתרון ענק שהוא יכול לקבל כמויות גדולות מאוד ולשלוף בדיוק מה שצריך,
מה שאין כן בשאר המודלים. -
רק סליחה אבל השיח על ההבדלים בכמויות הטוקנים הוא לא מקצועי ומתאים יותר לסוקרי מנועי AI. שאלה: נשמע לכם הגיוני שקלוד יבנו מודל פגז על ויגבילו את הטוקנים שלו לרמת שימוש של מפתח מתחיל עם מאות אלפי טוקנים בלבד?!
רק מה? לא משתמשים בקלוד בסביבת WEB (דפדפן), אלא בסביבות עבודה ייעודיות הידועה שבהם קורסור שבונה אינדקס מקיף של פרויקט הקוד הכולל אפילו מיליארדי טוקנים (נניח ומדובר ברוויט למשל...), וקלוד מסתכל על התמהיל המוכן ומבצע את האנליזה על שורות הקוד המתאימות, היכולות המצוינות של קלוד (עד לגמיני פרו 3) פיצתה על הפער העדין בין ניתוח טוקנים ישיר לבין ניתוח אינדקס שעלול לזייף מעט.
חשוב! הסיבה היחידה שגמיני מבית גוגל מתמודד בהצלחה עם מליוני טוקנים, אינה יכולת חשיבה מתקדמת במיוחד, אלא סיבה טכנית לחלוטין שגוגל מחזיקה במילארדי שבבי עיבוד וחוות שרתים אדירות וזה מאפשר לה להקצות למשתמשי העולם ניתוחים של מיליוני טוקנים בלי לתקוע את השרתים הראשיים.
וכל זה דוקא מתחבר למה שכתבתי למעלה שגוגל רכשו את אנתרופיק, אכן לא מדויק לגמרי שהם 'רכשו' אלא קנו מניות שליטה בחברה, אבל כבר לפני יותר משנה, גוגל החכירה תשתיות ענק של AI לאנתרופיק עבור קלוד... או במילים אחרות חיברה את החמצן של קלוד לחוות השרתים המפלצתיות שלה. יפה.
@ביוס סליחה אבל זה לא נכון.
אנו לא דיברנו פה על סביבות פיתוח, מה גם שסביבת הפיתוח של קלוד קוד הינה בתשלום, כמו שכבר ציינו פה,
דיברנו על מודלי שפה שיש להם התמחות טובה בקוד.
ובנוגע לזה בוודאות הכמות טוקנים במודל החינמי בהחלט מתאימה למפתח מתחיל ולא למקצועי.
חוץ מזה שזה שג'מיני מתמודד עם כמויות טוקנים לא בהכרח מעידה על איכות יתר בקוד.
ו @cfopuser וודאי ואין לאף אחד חולק שקלוד קוד יותר טוב מכולם.
כל מה שדיברנו היה על הצ'אט הרגיל של קלוד.
[וכבר אמרו פה שקלוד קוד עולה כסף]. -
@ביוס סליחה אבל זה לא נכון.
אנו לא דיברנו פה על סביבות פיתוח, מה גם שסביבת הפיתוח של קלוד קוד הינה בתשלום, כמו שכבר ציינו פה,
דיברנו על מודלי שפה שיש להם התמחות טובה בקוד.
ובנוגע לזה בוודאות הכמות טוקנים במודל החינמי בהחלט מתאימה למפתח מתחיל ולא למקצועי.
חוץ מזה שזה שג'מיני מתמודד עם כמויות טוקנים לא בהכרח מעידה על איכות יתר בקוד.
ו @cfopuser וודאי ואין לאף אחד חולק שקלוד קוד יותר טוב מכולם.
כל מה שדיברנו היה על הצ'אט הרגיל של קלוד.
[וכבר אמרו פה שקלוד קוד עולה כסף]. -
@המלאך תודה על כיבוד רצוני. אכן עייפתי מלהתווכח וגם אין לי אינטרס בזה. אבל למי שכן רוצה לשמוע דעתי אתמול נתתי לקלוד וגמיני 5 בעיות קשות מאוד שמבחינתי הן חידות לכל דבר למתכנתים מומחים, גמיני פתר 3/5 וקלוד פתר 1/5 ואידך זיל גמור.
וראיתי שגם המודל החדש סונט 4.6 עדיין ללא ביטחון עצמי ונותן מספר כיוונים במקום להיות ממוקד.
אגב קראתי מאמר שאחת הסיבות המרכזיות שאפל בחרו בגמיני (מלבד הדריכה הטכנולוגית במקום של GPT) היא בגלל שהוא קיבל בדירוגים מקום 1 בחיסכון במלל ופתרון מדויק לבעיית המשתמש. קלוד וגפט באופן רשלני מאוד מנצלים את זמן יצירת התשובה עבור חשיבה. -
@המלאך תודה על כיבוד רצוני. אכן עייפתי מלהתווכח וגם אין לי אינטרס בזה. אבל למי שכן רוצה לשמוע דעתי אתמול נתתי לקלוד וגמיני 5 בעיות קשות מאוד שמבחינתי הן חידות לכל דבר למתכנתים מומחים, גמיני פתר 3/5 וקלוד פתר 1/5 ואידך זיל גמור.
וראיתי שגם המודל החדש סונט 4.6 עדיין ללא ביטחון עצמי ונותן מספר כיוונים במקום להיות ממוקד.
אגב קראתי מאמר שאחת הסיבות המרכזיות שאפל בחרו בגמיני (מלבד הדריכה הטכנולוגית במקום של GPT) היא בגלל שהוא קיבל בדירוגים מקום 1 בחיסכון במלל ופתרון מדויק לבעיית המשתמש. קלוד וגפט באופן רשלני מאוד מנצלים את זמן יצירת התשובה עבור חשיבה. -
@המלאך תודה על כיבוד רצוני. אכן עייפתי מלהתווכח וגם אין לי אינטרס בזה. אבל למי שכן רוצה לשמוע דעתי אתמול נתתי לקלוד וגמיני 5 בעיות קשות מאוד שמבחינתי הן חידות לכל דבר למתכנתים מומחים, גמיני פתר 3/5 וקלוד פתר 1/5 ואידך זיל גמור.
וראיתי שגם המודל החדש סונט 4.6 עדיין ללא ביטחון עצמי ונותן מספר כיוונים במקום להיות ממוקד.
אגב קראתי מאמר שאחת הסיבות המרכזיות שאפל בחרו בגמיני (מלבד הדריכה הטכנולוגית במקום של GPT) היא בגלל שהוא קיבל בדירוגים מקום 1 בחיסכון במלל ופתרון מדויק לבעיית המשתמש. קלוד וגפט באופן רשלני מאוד מנצלים את זמן יצירת התשובה עבור חשיבה. -
@ביוס תראה, לא דיברתי על מבחני arc adi שבהם ג'מיני במודל החדש [3.1]זכה במקום הראשון בפער גבוה מהמתחרים.
אני דיברתי על יכולות coding שבהם קלוד נמצא במקום הראשון. -
רק סליחה אבל השיח על ההבדלים בכמויות הטוקנים הוא לא מקצועי ומתאים יותר לסוקרי מנועי AI. שאלה: נשמע לכם הגיוני שקלוד יבנו מודל פגז על ויגבילו את הטוקנים שלו לרמת שימוש של מפתח מתחיל עם מאות אלפי טוקנים בלבד?!
רק מה? לא משתמשים בקלוד בסביבת WEB (דפדפן), אלא בסביבות עבודה ייעודיות הידועה שבהם קורסור שבונה אינדקס מקיף של פרויקט הקוד הכולל אפילו מיליארדי טוקנים (נניח ומדובר ברוויט למשל...), וקלוד מסתכל על התמהיל המוכן ומבצע את האנליזה על שורות הקוד המתאימות, היכולות המצוינות של קלוד (עד לגמיני פרו 3) פיצתה על הפער העדין בין ניתוח טוקנים ישיר לבין ניתוח אינדקס שעלול לזייף מעט.
חשוב! הסיבה היחידה שגמיני מבית גוגל מתמודד בהצלחה עם מליוני טוקנים, אינה יכולת חשיבה מתקדמת במיוחד, אלא סיבה טכנית לחלוטין שגוגל מחזיקה במילארדי שבבי עיבוד וחוות שרתים אדירות וזה מאפשר לה להקצות למשתמשי העולם ניתוחים של מיליוני טוקנים בלי לתקוע את השרתים הראשיים.
וכל זה דוקא מתחבר למה שכתבתי למעלה שגוגל רכשו את אנתרופיק, אכן לא מדויק לגמרי שהם 'רכשו' אלא קנו מניות שליטה בחברה, אבל כבר לפני יותר משנה, גוגל החכירה תשתיות ענק של AI לאנתרופיק עבור קלוד... או במילים אחרות חיברה את החמצן של קלוד לחוות השרתים המפלצתיות שלה. יפה.
-
@ביוס המגבלה של הטוקנים היא מגבלה קשיחה עוד באימון של המודל וההבדל במשאבי האימון וההסקה בכמויות של הטוקנים הם החזקות.
למעשה גם אם זה לא מוסיף לאיכות החשיבה, אבל זה נצרך מאוד לכמות המידע שניתן לעבד.
@ע-ה-דכו-ע וודאי, אבל אל תהפוך את המגבלות טוקנים לשל 30 טוקנים.
זה עדיין מספיק טוקנים בשביל פרויקט רגיל ולא גדול או מסובך. -
@ע-ה-דכו-ע וודאי, אבל אל תהפוך את המגבלות טוקנים לשל 30 טוקנים.
זה עדיין מספיק טוקנים בשביל פרויקט רגיל ולא גדול או מסובך.@המלאך זה לא רק השאלה איזה מודל יותר חכם, זה גם המערכת של הסוכן/סוכנים, ובזה אין שום ספק שקלוד קוד עובד הכי יעיל עם הכלים וסוכני המשנה, אני חושש שיש להם יתרון כי האימון של קלוד אופוס עצמו היה מראש בהתאמה לשיטת העבודה של קלוד קוד, ולכן הפער האמיתי הוא בין קלוד קוד - ה CLI לבין שאר כלי הקידוד, וזה פער מאוד משמעותי.
-
@המלאך זה לא רק השאלה איזה מודל יותר חכם, זה גם המערכת של הסוכן/סוכנים, ובזה אין שום ספק שקלוד קוד עובד הכי יעיל עם הכלים וסוכני המשנה, אני חושש שיש להם יתרון כי האימון של קלוד אופוס עצמו היה מראש בהתאמה לשיטת העבודה של קלוד קוד, ולכן הפער האמיתי הוא בין קלוד קוד - ה CLI לבין שאר כלי הקידוד, וזה פער מאוד משמעותי.
-
@המלאך זה לא רק השאלה איזה מודל יותר חכם, זה גם המערכת של הסוכן/סוכנים, ובזה אין שום ספק שקלוד קוד עובד הכי יעיל עם הכלים וסוכני המשנה, אני חושש שיש להם יתרון כי האימון של קלוד אופוס עצמו היה מראש בהתאמה לשיטת העבודה של קלוד קוד, ולכן הפער האמיתי הוא בין קלוד קוד - ה CLI לבין שאר כלי הקידוד, וזה פער מאוד משמעותי.
-
@sivan22 שוב.
וודאי שקלוד קוד הוא הכי טוב בפער בקוד.
דיברנו על אופוס - הצ'אט הרגיל...
ולא נכון לומר שלא מנהלים פרויקטים עם צ'אט רגיל, כיוון שהקלוד קוד אינו חינמי.
[לפחות הapi, ומה יעשה מי שלא רוצה להעמיס תכונות על המחשב?].