🧠
1. Потолок возможностей
OpenAI frontier (GPT-4): лидер в agent/tool use, structured output.
Anthropic frontier (Claude 4): лидер в long context, code generation, refusal calibration.
Open-source: 6–12 месяцев отставания в широком reasoning; конкурентен в focused fine-tuned задачах.
💰
2. Структура стоимости
OpenAI / Anthropic: per-token, предсказуемо. Дорого при очень высоком объёме.
Self-hosted: GPU CapEx + ops + engineering. Дешевле при ~10M+ queries/month.
⚡
3. Latency
API: p50 ~500ms, p95 ~1.5s, иногда outages.
Self-hosted: настраиваемо; sub-200ms p50 достижимо.
⚖️
4. Compliance
OpenAI / Anthropic: SOC 2, GDPR DPA, HIPAA через Azure/AWS.
Self-hosted open-source: необходим для жёсткой residency (152-ФЗ, некоторые EU public sector).
🔓
5. Риск Lock-in
API: средний — gateway позволяет swap. Реальный риск в vendor-specific features.
Open-source: низкий на модели; высокий на ops stack (vLLM, serving).
📊
Распространённый паттерн
Primary: Anthropic Claude или OpenAI GPT.
Secondary: другой frontier как A/B.
Fallback: self-hosted open-source для outage resilience.
Specialized: fine-tuned small open-source для high-volume узких задач.