подключение

Документация

Один endpoint, один API-ключ, одна цена. Подставляется в любой CLI или SDK, который умеет в OpenAI или Anthropic. Ниже — копипаст для популярных клиентов.

base url
ваш ключ
rly_xxxxxxxxxxxxxxxxxxxxxxxxуправлять
Anthropic-compat·
POST /v1/messages
OpenAI-compat·
POST /v1/chat/completions
Список моделей·
GET /v1/models
Баланс·
GET /v1/balance
Usage за 24h / 30d·
GET /v1/usage
Инфо о ключе·
GET /v1/key
Claude Code
официальный CLI

Claude Code из коробки умеет в кастомный endpoint через переменные окружения. Просто экспортите две переменные перед запуском claude.

~/.bashrc / ~/.zshrc·shell
export ANTHROPIC_BASE_URL="https://gate.routy.lol"
export ANTHROPIC_AUTH_TOKEN="rly_xxxxxxxxxxxxxxxxxxxxxxxx"

# дальше как обычно
claude
если хотите — модель по умолчанию
export ANTHROPIC_MODEL="claude-sonnet-4-5"
# или claude-opus-4-7 / claude-haiku-4-5
noteClaude Code поддерживает thinking, кеш и tool-use — всё прокидывается на наш gateway и дальше в Anthropic. Prompt caching beta сейчас доступен не на всех каналах, остальное работает 1:1.
Аккаунт-API
баланс + usage

Любым клиентским ключом можно проверить остаток и потребление — без сессий и логинов. Удобно если делаете автоматическую отчётность или хотите показать пользователю текущий баланс в своей системе.

GET /v1/balance·bash
curl -sS https://gate.routy.lol/v1/balance \
  -H "Authorization: Bearer rly_xxxxxxxxxxxxxxxxxxxxxxxx"

# → {"balance_credits":4996947,"balance_usd":4.996947,"banned":false}
GET /v1/usage·bash
curl -sS https://gate.routy.lol/v1/usage \
  -H "Authorization: Bearer rly_xxxxxxxxxxxxxxxxxxxxxxxx"

# → {
#   "balance_credits": 4996947,
#   "balance_usd":     4.996947,
#   "last_30d": { "requests": 44, "spent_usd": 0.003 },
#   "last_24h": { "requests": 12, "spent_usd": 0.0008 }
# }
noteНа каждый успешный /v1/messages и /v1/chat/completions возвращаются заголовки x-relay-balance-credits и x-relay-balance-usd — баланс сразу после списания, так что клиент видит расход в real-time без отдельного запроса.
Thinking / reasoning
расширенная фича

На моделях с поддержкой thinking (Claude Opus и Sonnet, GPT-5.x) — есть два способа включить:

форматпараметрпример
Anthropicthinking.budget_tokens{"type":"enabled","budget_tokens":2048}
OpenAIreasoning_effort"low" | "medium" | "high"
noteКонвертация автоматическая в обе стороны: если client прислал reasoning_effort на Claude-модель — мы соберём thinking. И наоборот.
Response headers
для дебага
x-relay-modelимя модели как видит наш каталог
x-relay-attemptsсколько попыток ушло (1 = с первого раза)
x-relay-balance-creditsтекущий баланс в кредитах (после списания)
x-relay-balance-usdто же в долларах с 6 знаками точности
x-relay-cachehit | stored | miss | skip — статус response-кэша
x-relay-cache-ageвозраст кэшированного ответа в секундах (только при hit)