🌱
Band 1: до 1M векторов
Winner: pgvector. У вас почти наверняка есть Postgres. HNSW indexes держат sub-100ms p95 здесь. Hybrid keyword+vector через tsvector + cosine непревзойдён выделенными DBs. Операционная стоимость: близка к нулю.
🌿
Band 2: 1M–10M векторов
Managed preference: Pinecone (самый быстрый запуск, предсказуемо) или Weaviate Cloud (богаче hybrid, путь к open-source).
Self-hosted preference: Qdrant (проще ops, чем Milvus) или pgvector если команда fluent в Postgres.
🌳
Band 3: 10M–100M векторов
Managed: Pinecone serverless или Weaviate Cloud; стоимость становится реальной. Считайте per-query и per-million-stored.
Self-hosted: Qdrant или Milvus; нужна platform команда и 24/7 monitoring.
🏔️
Band 4: 100M+ векторов
Managed: Pinecone или Vespa Cloud.
Self-hosted: Milvus — зрелая опция для billion-scale; Qdrant догоняет быстро. На этом масштабе вы платите SREs.
🔍
Hybrid Search
pgvector + tsvector выигрывает для joins со structured filters. Weaviate имеет лучшую dedicated hybrid реализацию (BM25 + vector с tunable alpha). Pinecone добавил hybrid но отстаёт. Qdrant поддерживает через payload filtering, well-engineered.
📊
Lock-in
Высокий: Pinecone (proprietary API).
Средний: Weaviate Cloud (open-source export возможен).
Низкий: pgvector, Qdrant, Milvus (open-source, portable).