подключение
Документация
Один endpoint, один API-ключ, одна цена. Подставляется в любой CLI или SDK, который умеет в OpenAI или Anthropic. Ниже — копипаст для популярных клиентов.
base url
ваш ключ
rly_xxxxxxxxxxxxxxxxxxxxxxxxуправлять Anthropic-compat·
POST /v1/messagesOpenAI-compat·
POST /v1/chat/completionsСписок моделей·
GET /v1/modelsБаланс·
GET /v1/balanceUsage за 24h / 30d·
GET /v1/usageИнфо о ключе·
GET /v1/keyClaude Code
официальный CLIClaude Code из коробки умеет в кастомный endpoint через переменные окружения. Просто экспортите две переменные перед запуском claude.
~/.bashrc / ~/.zshrc·shell
export ANTHROPIC_BASE_URL="https://gate.routy.lol"
export ANTHROPIC_AUTH_TOKEN="rly_xxxxxxxxxxxxxxxxxxxxxxxx"
# дальше как обычно
claudeесли хотите — модель по умолчанию
export ANTHROPIC_MODEL="claude-sonnet-4-5"
# или claude-opus-4-7 / claude-haiku-4-5noteClaude Code поддерживает thinking, кеш и tool-use — всё прокидывается на наш gateway и дальше в Anthropic. Prompt caching beta сейчас доступен не на всех каналах, остальное работает 1:1.
Аккаунт-API
баланс + usageЛюбым клиентским ключом можно проверить остаток и потребление — без сессий и логинов. Удобно если делаете автоматическую отчётность или хотите показать пользователю текущий баланс в своей системе.
GET /v1/balance·bash
curl -sS https://gate.routy.lol/v1/balance \
-H "Authorization: Bearer rly_xxxxxxxxxxxxxxxxxxxxxxxx"
# → {"balance_credits":4996947,"balance_usd":4.996947,"banned":false}GET /v1/usage·bash
curl -sS https://gate.routy.lol/v1/usage \
-H "Authorization: Bearer rly_xxxxxxxxxxxxxxxxxxxxxxxx"
# → {
# "balance_credits": 4996947,
# "balance_usd": 4.996947,
# "last_30d": { "requests": 44, "spent_usd": 0.003 },
# "last_24h": { "requests": 12, "spent_usd": 0.0008 }
# }noteНа каждый успешный
/v1/messages и /v1/chat/completions возвращаются заголовки x-relay-balance-credits и x-relay-balance-usd — баланс сразу после списания, так что клиент видит расход в real-time без отдельного запроса.Thinking / reasoning
расширенная фичаНа моделях с поддержкой thinking (Claude Opus и Sonnet, GPT-5.x) — есть два способа включить:
| формат | параметр | пример |
|---|---|---|
| Anthropic | thinking.budget_tokens | {"type":"enabled","budget_tokens":2048} |
| OpenAI | reasoning_effort | "low" | "medium" | "high" |
noteКонвертация автоматическая в обе стороны: если client прислал
reasoning_effort на Claude-модель — мы соберём thinking. И наоборот.Response headers
для дебагаx-relay-modelимя модели как видит наш каталогx-relay-attemptsсколько попыток ушло (1 = с первого раза)x-relay-balance-creditsтекущий баланс в кредитах (после списания)x-relay-balance-usdто же в долларах с 6 знаками точностиx-relay-cachehit | stored | miss | skip — статус response-кэшаx-relay-cache-ageвозраст кэшированного ответа в секундах (только при hit)