הסבר | סדר במודלים החינמיים של Gemini...
-
ראיתי בכמה נושאים בפורום שיש אי סדר לגבי המודלים הזמינים בחינם ב-API של Gemini, אז הנה טבלה מפורטת של מגבלות הקצב של המודלים השונים של גוגל (הזמינים בחינם בלבד!).
העמודה הראשונה מימין (RPD) זה מספר בקשות ליום, העמודה אחריה (TPM) זה מספר טוקנים לדקה (בד"כ פחות רלוונטי), והעמודה אחריה (RPM) זה מספר בקשות לדקה.

ניתן לעקוב כאן אחרי התקדמות המימוש של המודלים על ידיכם.
-
ראיתי בכמה נושאים בפורום שיש אי סדר לגבי המודלים הזמינים בחינם ב-API של Gemini, אז הנה טבלה מפורטת של מגבלות הקצב של המודלים השונים של גוגל (הזמינים בחינם בלבד!).
העמודה הראשונה מימין (RPD) זה מספר בקשות ליום, העמודה אחריה (TPM) זה מספר טוקנים לדקה (בד"כ פחות רלוונטי), והעמודה אחריה (RPM) זה מספר בקשות לדקה.

ניתן לעקוב כאן אחרי התקדמות המימוש של המודלים על ידיכם.
@א.מ.ד. יש לך מושג למה כשאני מבצע קריאה ל-Gemini 3 - זו התשובה שאני מקבל?:
{ "error": { "code": 429, "message": "You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. To monitor your current usage, head to: https://ai.dev/rate-limit. ", "status": "RESOURCE_EXHAUSTED", "details": [ { "@type": "type.googleapis.com/google.rpc.Help", "links": [ { "description": "Learn more about Gemini API quotas", "url": "https://ai.google.dev/gemini-api/docs/rate-limits" } ] } ] } }למרות שמעולם לא נגעתי ב-API של המודל הזה עד עכשיו.
ומה שיותר מוזר זה שהבעיה הזו קורית רק בפנייה מהשרת, כשאני פונה מפוסטמן חוזרת תשובה תקנית.
ובנוסף לכך, משהו מאוד מוזר בשגיאת ה-429 הזו, אין שום פירוט של המגבלה או משהו בשונה ממגבלות של דקה או יום שחוזרת שגיאה כזו:
{ "error": { "code": 429, "message": "You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. To monitor your current usage, head to: https://ai.dev/rate-limit. \n* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 5, model: gemini-3-flash\nPlease retry in 19.125333688s.", "status": "RESOURCE_EXHAUSTED", "details": [ { "@type": "type.googleapis.com/google.rpc.Help", "links": [ { "description": "Learn more about Gemini API quotas", "url": "https://ai.google.dev/gemini-api/docs/rate-limits" } ] }, { "@type": "type.googleapis.com/google.rpc.QuotaFailure", "violations": [ { "quotaMetric": "generativelanguage.googleapis.com/generate_content_free_tier_requests", "quotaId": "GenerateRequestsPerMinutePerProjectPerModel-FreeTier", "quotaDimensions": { "location": "global", "model": "gemini-3-flash" }, "quotaValue": "5" } ] }, { "@type": "type.googleapis.com/google.rpc.RetryInfo", "retryDelay": "19s" } ] } } -
@א.מ.ד. יש לך מושג למה כשאני מבצע קריאה ל-Gemini 3 - זו התשובה שאני מקבל?:
{ "error": { "code": 429, "message": "You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. To monitor your current usage, head to: https://ai.dev/rate-limit. ", "status": "RESOURCE_EXHAUSTED", "details": [ { "@type": "type.googleapis.com/google.rpc.Help", "links": [ { "description": "Learn more about Gemini API quotas", "url": "https://ai.google.dev/gemini-api/docs/rate-limits" } ] } ] } }למרות שמעולם לא נגעתי ב-API של המודל הזה עד עכשיו.
ומה שיותר מוזר זה שהבעיה הזו קורית רק בפנייה מהשרת, כשאני פונה מפוסטמן חוזרת תשובה תקנית.
ובנוסף לכך, משהו מאוד מוזר בשגיאת ה-429 הזו, אין שום פירוט של המגבלה או משהו בשונה ממגבלות של דקה או יום שחוזרת שגיאה כזו:
{ "error": { "code": 429, "message": "You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. To monitor your current usage, head to: https://ai.dev/rate-limit. \n* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 5, model: gemini-3-flash\nPlease retry in 19.125333688s.", "status": "RESOURCE_EXHAUSTED", "details": [ { "@type": "type.googleapis.com/google.rpc.Help", "links": [ { "description": "Learn more about Gemini API quotas", "url": "https://ai.google.dev/gemini-api/docs/rate-limits" } ] }, { "@type": "type.googleapis.com/google.rpc.QuotaFailure", "violations": [ { "quotaMetric": "generativelanguage.googleapis.com/generate_content_free_tier_requests", "quotaId": "GenerateRequestsPerMinutePerProjectPerModel-FreeTier", "quotaDimensions": { "location": "global", "model": "gemini-3-flash" }, "quotaValue": "5" } ] }, { "@type": "type.googleapis.com/google.rpc.RetryInfo", "retryDelay": "19s" } ] } } -
@א.מ.ד. יש לך מושג למה כשאני מבצע קריאה ל-Gemini 3 - זו התשובה שאני מקבל?:
{ "error": { "code": 429, "message": "You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. To monitor your current usage, head to: https://ai.dev/rate-limit. ", "status": "RESOURCE_EXHAUSTED", "details": [ { "@type": "type.googleapis.com/google.rpc.Help", "links": [ { "description": "Learn more about Gemini API quotas", "url": "https://ai.google.dev/gemini-api/docs/rate-limits" } ] } ] } }למרות שמעולם לא נגעתי ב-API של המודל הזה עד עכשיו.
ומה שיותר מוזר זה שהבעיה הזו קורית רק בפנייה מהשרת, כשאני פונה מפוסטמן חוזרת תשובה תקנית.
ובנוסף לכך, משהו מאוד מוזר בשגיאת ה-429 הזו, אין שום פירוט של המגבלה או משהו בשונה ממגבלות של דקה או יום שחוזרת שגיאה כזו:
{ "error": { "code": 429, "message": "You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. To monitor your current usage, head to: https://ai.dev/rate-limit. \n* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 5, model: gemini-3-flash\nPlease retry in 19.125333688s.", "status": "RESOURCE_EXHAUSTED", "details": [ { "@type": "type.googleapis.com/google.rpc.Help", "links": [ { "description": "Learn more about Gemini API quotas", "url": "https://ai.google.dev/gemini-api/docs/rate-limits" } ] }, { "@type": "type.googleapis.com/google.rpc.QuotaFailure", "violations": [ { "quotaMetric": "generativelanguage.googleapis.com/generate_content_free_tier_requests", "quotaId": "GenerateRequestsPerMinutePerProjectPerModel-FreeTier", "quotaDimensions": { "location": "global", "model": "gemini-3-flash" }, "quotaValue": "5" } ] }, { "@type": "type.googleapis.com/google.rpc.RetryInfo", "retryDelay": "19s" } ] } }תנסה עם הקוד הזה? עדיין אותה שגיאה עולה לך?! (שים לב, לשנות את הAPI)
import requests API_KEY = "הכנס כאן את המפתח" URL = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent?key={API_KEY}" def ask(text): # מבנה הבקשה לפי הפרוטוקול של Gemini payload = {"contents": [{"parts": [{"text": text}]}]} # שליחת הבקשה ופענוח ה-JSON res = requests.post(URL, json=payload).json() # שליפת התשובה הטקסטואלית מהמבנה return res['candidates'][0]['content']['parts'][0]['text'] print(ask("מה המצב?"))לכאורה זה לא מוסיף לך הרבה, כי כפי שאמרת זה כן רץ לך במקומי, אבל בכל זאת, לך תדע, הקוד שהבאתי הוא כמעט הכי מינימאלי כדי לשאול שאלה את גמיני בAPI..
-
ראיתי בכמה נושאים בפורום שיש אי סדר לגבי המודלים הזמינים בחינם ב-API של Gemini, אז הנה טבלה מפורטת של מגבלות הקצב של המודלים השונים של גוגל (הזמינים בחינם בלבד!).
העמודה הראשונה מימין (RPD) זה מספר בקשות ליום, העמודה אחריה (TPM) זה מספר טוקנים לדקה (בד"כ פחות רלוונטי), והעמודה אחריה (RPM) זה מספר בקשות לדקה.

ניתן לעקוב כאן אחרי התקדמות המימוש של המודלים על ידיכם.
@א.מ.ד. אשמח אם תכתוב גם מה השמות שצריך לכתוב בקוד כדי שזה יעבוד.. (לדוגמה שצריך לכתוב preview אחרי gemini-3-flash)
-
תנסה עם הקוד הזה? עדיין אותה שגיאה עולה לך?! (שים לב, לשנות את הAPI)
import requests API_KEY = "הכנס כאן את המפתח" URL = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent?key={API_KEY}" def ask(text): # מבנה הבקשה לפי הפרוטוקול של Gemini payload = {"contents": [{"parts": [{"text": text}]}]} # שליחת הבקשה ופענוח ה-JSON res = requests.post(URL, json=payload).json() # שליפת התשובה הטקסטואלית מהמבנה return res['candidates'][0]['content']['parts'][0]['text'] print(ask("מה המצב?"))לכאורה זה לא מוסיף לך הרבה, כי כפי שאמרת זה כן רץ לך במקומי, אבל בכל זאת, לך תדע, הקוד שהבאתי הוא כמעט הכי מינימאלי כדי לשאול שאלה את גמיני בAPI..