Лимиты
Лимиты RPM и параллельных генераций на ключ, заголовки RateLimit-* и обработка ответа 429.
Каждый API-ключ ограничен по умолчанию 120 запросами в минуту (RPM) и 10 параллельными генерациями; эти значения настраиваются. При превышении RPM запрос отклоняется с кодом 429 rate_limit_exceeded и заголовком Retry-After, указывающим, через сколько секунд можно повторить.
Лимиты по умолчанию
Prop
Type
Заголовки ответа
Заголовки RateLimit-* приходят на каждый ответ и позволяют отслеживать оставшийся бюджет, не дожидаясь 429.
Prop
Type
Ответ 429
HTTP/1.1 429 Too Many Requests
RateLimit-Limit: 120
RateLimit-Remaining: 0
RateLimit-Reset: 37
Retry-After: 37{
"error": {
"type": "rate_limit_error",
"code": "rate_limit_exceeded",
"message": "Превышен лимит запросов. Повторите позже."
}
}Соблюдайте Retry-After
При 429 подождите ровно столько секунд, сколько указано в Retry-After (или RateLimit-Reset), и только потом повторяйте. Это надёжнее фиксированной задержки.
Параллельность ограничена отдельно
Лимит в 10 одновременных генераций не зависит от RPM. Если у вас много долгих видео-задач, ставьте их в очередь на своей стороне, чтобы не упереться в потолок параллельности.