Выбор Vendor

OpenAI vs Anthropic vs Open-Source LLMs

5 измерений для оценки каждого vendor — возможности, стоимость, latency, compliance, lock-in — с multi-vendor паттерном, к которому сходятся большинство зрелых AI-команд.

5 измерений в трёх классах vendor

🧠

1. Потолок возможностей

OpenAI frontier (GPT-4): лидер в agent/tool use, structured output.
Anthropic frontier (Claude 4): лидер в long context, code generation, refusal calibration.
Open-source: 6–12 месяцев отставания в широком reasoning; конкурентен в focused fine-tuned задачах.

💰

2. Структура стоимости

OpenAI / Anthropic: per-token, предсказуемо. Дорого при очень высоком объёме.
Self-hosted: GPU CapEx + ops + engineering. Дешевле при ~10M+ queries/month.

3. Latency

API: p50 ~500ms, p95 ~1.5s, иногда outages.
Self-hosted: настраиваемо; sub-200ms p50 достижимо.

⚖️

4. Compliance

OpenAI / Anthropic: SOC 2, GDPR DPA, HIPAA через Azure/AWS.
Self-hosted open-source: необходим для жёсткой residency (152-ФЗ, некоторые EU public sector).

🔓

5. Риск Lock-in

API: средний — gateway позволяет swap. Реальный риск в vendor-specific features.
Open-source: низкий на модели; высокий на ops stack (vLLM, serving).

📊

Распространённый паттерн

Primary: Anthropic Claude или OpenAI GPT.
Secondary: другой frontier как A/B.
Fallback: self-hosted open-source для outage resilience.
Specialized: fine-tuned small open-source для high-volume узких задач.

Паттерн Gateway

Паттерн, побеждающий: каждый LLM call идёт через ваш gateway. Gateway маршрутизирует по типу задачи (дешёвая модель для classification, frontier для reasoning), retry на vendor outage, лог для evaluation, и позволяет A/B vendor без изменения кода. LiteLLM и OpenRouter реализуют большую часть; стройте свой при custom routing.

С gateway вопрос "какой vendor" становится "какая смесь" — и смесь меняется каждые 6 месяцев, когда лидерборд сдвигается.

Типичные ошибки в выборе vendor

⚠️

Выбор по leaderboard

Публичные бенчмарки слабо коррелируют с вашей задачей. Постройте domain-specific eval set (50–200 примеров с golden answers) до procurement.

⚠️

Single-vendor commitment

Outage, повышение цены, deprecation или policy change — столкнётесь в течение 18 месяцев. Multi-vendor с gateway — страховка.

⚠️

Self-hosting без зрелости ops

Self-hosted open-source LLM требует 24/7 GPU monitoring, обновлений модели, regression testing, incident response. Без MLOps команды API дешевле.

⚠️

Игнорирование compliance edge

Некоторые юрисдикции (152-ФЗ России, EU public sector) фактически исключают US-hosted APIs. Согласуйте с legal до закрепления архитектуры.

Что применить завтра

Сначала постройте domain-specific eval set. Выберите один frontier vendor как primary, другой как A/B. Добавьте self-hosted open-source как fallback для outage resilience и compliance edge cases. Абстрагируйте всё за gateway. Пересматривайте mix каждые 6 месяцев — лидерборд движется быстро.