🌱
רמה 1: עד 1M וקטורים
מנצח: pgvector. כמעט תמיד יש לכם Postgres. HNSW מגיע ל-sub-100ms p95 כאן. Hybrid keyword+vector ע"י tsvector + cosine לא דומה ל-DBs ייעודיים. עלות תפעולית: קרובה לאפס.
🌿
רמה 2: 1M–10M וקטורים
Managed: Pinecone (הכי מהיר, מחיר צפוי) או Weaviate Cloud (hybrid עשיר, פתח לצאת ל-open-source).
Self-hosted: Qdrant (תפעול פשוט) או pgvector אם הצוות שולט ב-Postgres.
🌳
רמה 3: 10M–100M וקטורים
Managed: Pinecone serverless או Weaviate Cloud; עלות הופכת ממשית. חשבו per-query ו-per-million-stored.
Self-hosted: Qdrant או Milvus; צריך פלטפורמה ו-monitoring 24/7.
🏔️
רמה 4: 100M+ וקטורים
Managed: Pinecone או Vespa Cloud.
Self-hosted: Milvus — אופציה בוגרת ל-billion-scale; Qdrant סוגר את הפער מהר. משלמים ל-SREs.
🔍
Hybrid Search
pgvector + tsvector מנצח ל-joins עם structured filters. Weaviate עם hybrid implementation הטוב ביותר (BM25 + vector). Pinecone עם hybrid אך מאחור. Qdrant תומך דרך payload filtering.
📊
Lock-in
גבוה: Pinecone (proprietary API).
בינוני: Weaviate Cloud (export open-source אפשרי).
נמוך: pgvector, Qdrant, Milvus (open-source, portable).