Porovnanie vektorových databáz: Pinecone, Weaviate, Qdrant, Milvus, pgvector a spol. v enterprise teste
Porovnanie vektorových databáz hodnotí vektorové databázy podľa hostingu, škálovania, filtrovania metadát, hybrid-search, konzistencie, nákladov a vyspelosti. V DACH enterprise prostredí je voľba v roku 2026 primárne rozhodnutím o suverenite a GDPR: pgvector pokrýva väčšinu prípadov pod približne 50 miliónmi vektorov, Qdrant platí za DACH-blízkeho šampióna.
Key Takeaways
- ✓Voľba vektorovej databázy je v DACH enterprise prostredí v roku 2026 primárne rozhodnutím o suverenite a GDPR, až potom čisto otázkou výkonu.
- ✓Pre väčšinu projektov stredne veľkých podnikov pod približne 10 až 50 miliónmi vektorov postačuje pgvector 0.8+ na existujúcom Postgrese pri IONOS, STACKIT, OTC alebo Hetzner.
- ✓Qdrant (Berlín, Apache 2.0) je s Hybrid Cloud na STACKIT najatraktívnejšia dedikovaná topológia vektorovej DB pre regulované DACH workloady.
- ✓Pinecone ponúka EU regióny, ale žiadny self-hosting, a preto je pre citlivé dáta akceptovateľný len so zmluvnou sovereign-exit klauzulou (stav 2026).
- ✓Hybrid-search z dense plus BM25 plus reranker znižuje chybovosť pri vyhľadávaní podľa štúdie Anthropic až o 67 percent.
- ✓SAP HANA Cloud Vector Engine je štandardom pre dáta rezidentné v SAP; neštruktúrované dokumenty patria do komplementárnej vektorovej DB.
Porovnanie vektorových databáz hodnotí vektorové databázy podľa kritérií hosting, škálovanie, filtrovanie metadát, hybrid-search, konzistencia, náklady a vyspelosť. V DACH enterprise prostredí je voľba správnej vektorovej databázy v roku 2026 primárne rozhodnutím o suverenite a GDPR v inžinierskom šate. Pre väčšinu projektov pod približne 50 miliónmi vektorov postačuje pgvector na existujúcom Postgrese; Qdrant platí za DACH-blízkeho šampióna pre dedikované požiadavky.
Nasledujúce tri rýchle odpovede zhŕňajú kľúčové výroky pre rozhodovateľov:
- Suverenita poráža benchmark. Nie surové QPS alebo recall@10, ale otázka „kde ležia embeddings, kto k nim môže pristupovať, dá sa stack stiahnuť on-prem" dominuje DACH architektonickému rozhodnutiu.
- pgvector je default pre stredné podniky. Až do približne 10 až 50 miliónov vektorov je pgvector na suverénnom managed Postgrese (IONOS, STACKIT, OTC, Hetzner) prevádzkovo najjednoduchší a z hľadiska GDPR najmenej rizikový.
- Qdrant Hybrid Cloud na STACKIT je najatraktívnejšia dedikovaná topológia vektorovej DB pre regulované workloady, pretože dátová rovina zostáva v perimetri zákazníka.
Prečo je voľba vektorovej databázy rozhodnutím o suverenite
Vrstva vektorovej DB sa v roku 2026 na úrovni API do veľkej miery stala komoditou: HNSW je dostupné všade, hybrid-search je povinnosťou, multimodálne postupy (ColPali, ColQwen) sú novou frontou. Skutočná diferenciácia preto leží v štyroch bodoch: pozícia suverenity a nasaditeľnosť, kvalita hybrid-search v nemčine s kompozitami a odborným jazykom, multimodálna podpora dokument-obraz, ako aj prevádzková vyspelosť v rozsahu od 10 do viac ako 100 miliónov vektorov.
Tri štrukturálne posuny vynucujú túto perspektívu: Po prvé je EU-US transferový režim nestabilný; rozsudok CJEU C-413/23 P (SRB v EDPS, september 2025) objasnil, že pseudonymizované dáta nie sú automaticky pre každého príjemcu osobné, no DACH dozorné orgány naďalej zaobchádzajú s embeddingmi odvodenými z osobných údajov ako s in-scope. Po druhé sa suverénna cloudová vrstva stala vyspelou (STACKIT, IONOS, OTC, SAP Sovereign Cloud, Delos, AWS European Sovereign Cloud od 15. januára 2026). Po tretie sa každý engine bez seriózneho self-host alebo on-prem riešenia štrukturálne diskvalifikuje pre regulované DACH workloady.
Hodnotiace kritériá pre porovnanie vektorových databáz
Nasledujúce kritériá štruktúrujú každé seriózne enterprise porovnanie:
- Hosting a EU región: Managed Cloud, self-hosting na vlastnom Kubernetes, alebo suverénna DACH cloud. Rozhodujúca je jurisdikcia, nielen voľba regiónu.
- Škálovanie: Praktická horná hranica na node a čistá cesta k vyšším rádom veľkostí.
- Filtrovanie metadát: Korektnosť filtrovaných ANN dotazov (pgvector 0.8 uzavrel s iterative scan starú medzeru overfilteringu).
- Podpora hybrid-search: dense plus BM25/SPLADE a fúzia cez Reciprocal Rank Fusion.
- Konzistencia a vymazateľnosť: Efektívne mazanie bodov je relevantné pre GDPR (čl. 17).
- Náklady a vyspelosť: Pamäť pracovnej množiny, licenčný model, produkčné referencie.
Priame porovnanie vedúcich vektorových databáz
Nasledujúca tabuľka zhŕňa vedúce možnosti pozdĺž najdôležitejších kritérií. Semafor suverenity sleduje výskum: zelená = sovereign-nasaditeľné, žltá = EU-región-managed akceptovateľné, oranžová = US cloud len pre necitlivé workloady, červená = US-only.
Engine | Sídlo / Licencia | Hosting | Škálovanie (orientačná hodnota) | Hybrid-search | Multi-vector / ColPali | Suverenita |
|---|---|---|---|---|---|---|
pgvector 0.8+ | PostgreSQL licencia | Všade, kde beží Postgres | ~10-50M / node | tsvector, ParadeDB pg_search | manuálne (multi-row) | zelená |
pgvectorscale | PostgreSQL licencia | Self-host / Timescale EU | až miliardy (StreamingDiskANN) | dedí pgvector | dedí pgvector | zelená |
Qdrant | Berlín DE / Apache 2.0 | OSS, Cloud EU, Hybrid Cloud, Private Cloud | ~100M+ / cluster | BM25, SPLADE++, miniCOIL | natívne (ColBERT/ColPali) | zelená (DACH-šampión) |
Weaviate | Amsterdam NL / BSD-3 | OSS, Cloud EU, Embedded | 100M+ so shardingom | BM25 + dense vstavané | experimentálne | zelená (EU-native) |
Milvus / Zilliz | US / Apache 2.0 (OSS) | OSS, Zilliz Cloud EU | miliardy (IVF-PQ, DiskANN) | sparse + dense | áno (2.4+) | zelená self-host / žltá Cloud |
pgvector cez Postgres-DB | rôz. | IONOS, OTC, STACKIT, Hetzner | viď pgvector | tsvector | manuálne | zelená |
Elasticsearch / Elastic | NL/US / Elastic License | self-host / Cloud EU | veľmi vysoké | best-in-class (BM25+dense+ELSER+RRF) | obmedzené | zelená self-host / žltá Cloud |
Chroma | US / Apache 2.0 | OSS embedded; Cloud US-only | malé/embedded | basic | obmedzené | zelená self-host / červená Cloud |
Pinecone | US / proprietárny SaaS | len managed; EU regióny | vysoké (serverless) | sparse-dense | obmedzené | oranžová (žiadny self-host) |
pgvector profituje od verzie 0.8.0 (október 2024) z iterative scan, halfvec (polovičná pamäť pri zanedbateľnej strate recall) a binary_quantize. Praktická horná hranica pre stock-pgvector s HNSW leží v rozsahu 10 až 50 miliónov vektorov na node; nad to je pgvectorscale so StreamingDiskANN čistou Postgres cestou.
Qdrant si pre DACH zaslúži osobitnú zmienku: sídlo v Berlíne, Apache 2.0, jadro v Ruste, podľa výskumu približne 250 miliónov stiahnutí a 29 000 GitHub hviezdičiek začiatkom roka 2026, Series B nad 50 miliónov amerických dolárov v marci 2026 (lead AVP, s Bosch Ventures). Produkčné referencie zahŕňajú Bosch, Tripadvisor a HubSpot. Qdrant Hybrid Cloud bol explicitne spustený so STACKIT, Aleph Alpha a Civo ako suverénnymi partnermi.
Pinecone, Turbopuffer a Vectara nie sú paušálne diskvalifikované, ale je ich potrebné zaradiť ako oranžové až červené: EU regióny existujú, no CLOUD Act a FISA 702 expozícia zostáva. Pre regulované workloady sú typicky štrukturálne mimo hry.
Hybrid-search a konzistencia v praxi
Takmer každý produktívny DACH RAG systém by mal v roku 2026 prevádzkovať hybrid-search plus reranker. Štúdia Anthropic Contextual Retrieval kvantifikovala zisk: embeddings plus BM25 znižujú chybovosť o približne 49 percent oproti čisto vektorovému vyhľadávaniu, s dodatočným rerankerom až o 67 percent. Na nemeckých benchmarkoch zdvíha cross-encoder reranker recall@5 typicky o 5 až 15 percentuálnych bodov.
Pri konzistencii je sémantika mazania tvrdým procurement-gate: HNSW grafy nepodporujú efektívne mazanie bodov. Podľa výskumu pgvector maže efektívne (Postgres MVCC), Qdrant podporuje efektívne mazanie bodov, Milvus pracuje s tombstones a následnou kompaktáciou, SAP HANA Vector cez štandardný SQL DELETE. Kto musí splniť čl. 17 (právo na vymazanie), overí si to pred uzavretím zmluvy.
Praktický príklad: výpočet pamäte a nákladov
Konkrétny príklad výpočtu pre 10 miliónov vektorov pri 1024 dimenziách objasňuje nákladové páky (HNSW):
- float32 (baseline): surové vektory 40 GB, HNSW overhead 50 až 100 percent, efektívna pracovná množina 60 až 80 GB.
- halfvec (float16): približne 30 až 40 GB pri zanedbateľnej strate recall.
- SQ8 (Scalar Quantization): približne 10 až 20 GB, asi 1 až 3 percentá straty recall.
- Binary plus rescore: približne 5 až 10 GB, ale len s full-vector rescore top-N kandidátov.
Dôležité: naivná binary quantization bez rescore stráca na tvrdých benchmarkoch 30 až 60 percent recall@10. Pre nemecké právne, medicínske a finančné obsahy je preto konzervatívnym defaultom halfvec plus SQ8 s voliteľným binary rescore. Na STACKIT, IONOS, OTC, Hetzner a Delos je pamäťovo optimalizovaná cenotvorba inštancií pre tieto veľkosti pracovnej množiny konkurencieschopná, s typickou prirážkou za suverenitu približne 10 až 20 percent (stav 2026), v súlade s AWS European Sovereign Cloud premium pri spustení v januári 2026.
Kedy pgvector postačuje a kedy nie
Pre väčšinu RAG projektov stredne veľkých podnikov pod približne 50 miliónmi vektorov je správnou odpoveďou roka 2026 pgvector na suverénnom managed Postgrese s upgrade cestou na pgvectorscale. Prevádzkovo to znamená jednu databázu, jeden backup príbeh a jeden GDPR AVV reťazec, teda výrazne menšiu plochu suverenity ako zavedenie dedikovanej vektorovej DB. Timescale zverejnený benchmark na 50 miliónoch Cohere-768 embeddingov ukazuje pgvectorscale s 28-násobne nižšou p95 latenciou a 16-násobne vyšším QPS oproti Pinecone s1 pri 99 percentnom recall (údaj výrobcu, rád veľkosti plauzibilný).
Dôvody na odklon od pgvector: natívne multi-vector/ColPali požiadavky (potom Qdrant, Weaviate, Milvus 2.4+ alebo Vespa ako najvyspelejší ColBERT engine), škálovanie za hranicu 100 miliónov vektorov (Milvus s IVF-PQ/DiskANN), alebo dáta rezidentné v SAP. Pre tie posledné je SAP HANA Cloud Vector Engine štandardom, pretože odpadá jeden sovereignty-hop, jeden AVV link a jedna zodpovednosť za pohyb dát. Typický korporátny vzor roka 2026 je preto HANA Vector pre dáta rezidentné v SAP plus Qdrant alebo Weaviate (alebo pgvector pre tých, čo dbajú na náklady) pre neštruktúrované dokumenty, komplementárne, nie konkurenčne.
Krátka poznámka ku compliance: Tento článok nenahrádza právne poradenstvo. Uvedené články GDPR, EDPB dokumenty a rozsudky slúžia na orientáciu; konkrétne zaradenie embeddingov, AVV reťazcov a posúdení rizika re-identifikácie patrí do rúk kvalifikovaných expertov na ochranu údajov a právo.
Pre agentúry a B2B rozhodovateľov
Pre marketingové agentúry a AI-native produktové spoločnosti sa oplatí stupňovitá stratégia: pgvector na managed Postgrese (IONOS, STACKIT, Hetzner, Aiven EU) so schémou-na-mandanta ako multi-tenant default, Qdrant Cloud EU alebo Qdrant na zákazníckom Kubernetes pre tenantov za hranicou približne 10 miliónov chunkov. Pre DACH B2B rozhodovateľov platí: Zaobchádzajte s voľbou vektorovej DB ako s rozhodnutím o suverenite, uprednostňujte OSS engines kvôli konkrétnej exit-portabilite a ukotvite sovereign-exit klauzuly v každej managed zmluve. Blck Alpaca z Viedne sprevádza DACH podniky práve pri tomto architektonickom rozhodnutí, od pilotovania pgvector až po suverénny Qdrant Hybrid Cloud setup na STACKIT.
Často kladené otázky
Kedy postačuje pgvector a kedy je potrebná dedikovaná vektorová databáza?
Ktorá vektorová databáza je najlepšia pre enterprise workloady v súlade s GDPR?
Sú embeddings podľa GDPR osobnými údajmi?
Čím sa líšia Qdrant, Weaviate a Milvus v enterprise nasadení?
Čo prináša hybrid-search v porovnaní s čisto vektorovým vyhľadávaním?
Ísť hlbšie?
Získajte nové analýzy priamo do schránky – alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.