📚
1. טריות ידע
Corpus יציב, עדכונים נדירים (1–2): fine-tune. עדכונים יומיים/שבועיים, תחום מוסדר (4–5): RAG.
🎯
2. מבנה פלט
פורמט/טון/persona ספציפי (1–2): fine-tune. תשובות free-form מגרון במקור (4–5): RAG.
🔍
3. דרישת ציטטה
אין או אסתטית בלבד (1–2): fine-tune. דרישה רגולטורית קשה (רפואי, משפטי, פיננסי) (4–5): RAG.
💰
4. נפח שאילתות
10M+ שאילתות/שנה, תחום צר (1–2): fine-tune משתלם. תחת 1M או תחום רחב (4–5): RAG.
⚡
5. תקציב Latency
נדרש sub-300ms p95 (1–2): fine-tune (קריאת LLM אחת). 500–2000ms מקובל (4–5): RAG.
🔐
6. רגישות נתונים
ידע ציבורי (1–2): שניהם עובדים. Corpus סודי שלא יוצא מ-VPC (4–5): RAG עם self-hosted embeddings.
📊
פסי החלטה
סכום 6–14: Fine-tune (או prompt קודם).
סכום 15–22: היברידי.
סכום 23–30: RAG בלבד.