🧠
1. תקרת יכולת
OpenAI frontier (GPT-4): מובילה ב-agent/tool use, structured output.
Anthropic frontier (Claude 4): מובילה ב-long context, code, refusal calibration.
Open-source: 6–12 חודשים מאחור ב-reasoning רחב; תחרותית במשימות fine-tuned.
💰
2. מבנה עלות
OpenAI / Anthropic: per-token, חיזוי גבוה. יקר בנפח גבוה מאוד.
Self-hosted: GPU CapEx + ops + engineering. זול יותר ב-~10M+ שאילתות/חודש.
⚡
3. Latency
API: p50 ~500ms, p95 ~1.5s, תקלות מדי פעם.
Self-hosted: מתכווננת; sub-200ms p50 אפשרי.
⚖️
4. ציות
OpenAI / Anthropic: SOC 2, GDPR DPA, HIPAA דרך Azure/AWS.
Self-hosted open-source: נדרש ל-residency קשוח (152-FZ, EU public sector).
🔓
5. סיכון Lock-in
API: בינוני — gateway מאפשר swap. הסיכון בפיצ'רים ספציפיים-vendor.
Open-source: נמוך במודל; גבוה במחסנית הפעלה (vLLM, serving).
📊
תבנית נפוצה
Primary: Anthropic Claude או OpenAI GPT.
Secondary: ה-frontier השני כ-A/B.
Fallback: self-hosted ל-resilience.
Specialized: fine-tuned קטן למשימות בנפח גבוה.