4.4Pokročilý8 min

Porovnanie vektorových databáz: Pinecone, Weaviate, Qdrant, Milvus, pgvector a spol. v enterprise teste

Blck Alpaca·9. júna 2026

Definition

Porovnanie vektorových databáz hodnotí vektorové databázy podľa hostingu, škálovania, filtrovania metadát, hybrid-search, konzistencie, nákladov a vyspelosti. V DACH enterprise prostredí je voľba v roku 2026 primárne rozhodnutím o suverenite a GDPR: pgvector pokrýva väčšinu prípadov pod približne 50 miliónmi vektorov, Qdrant platí za DACH-blízkeho šampióna.

Key Takeaways

✓Voľba vektorovej databázy je v DACH enterprise prostredí v roku 2026 primárne rozhodnutím o suverenite a GDPR, až potom čisto otázkou výkonu.
✓Pre väčšinu projektov stredne veľkých podnikov pod približne 10 až 50 miliónmi vektorov postačuje pgvector 0.8+ na existujúcom Postgrese pri IONOS, STACKIT, OTC alebo Hetzner.
✓Qdrant (Berlín, Apache 2.0) je s Hybrid Cloud na STACKIT najatraktívnejšia dedikovaná topológia vektorovej DB pre regulované DACH workloady.
✓Pinecone ponúka EU regióny, ale žiadny self-hosting, a preto je pre citlivé dáta akceptovateľný len so zmluvnou sovereign-exit klauzulou (stav 2026).
✓Hybrid-search z dense plus BM25 plus reranker znižuje chybovosť pri vyhľadávaní podľa štúdie Anthropic až o 67 percent.
✓SAP HANA Cloud Vector Engine je štandardom pre dáta rezidentné v SAP; neštruktúrované dokumenty patria do komplementárnej vektorovej DB.

Porovnanie vektorových databáz hodnotí vektorové databázy podľa kritérií hosting, škálovanie, filtrovanie metadát, hybrid-search, konzistencia, náklady a vyspelosť. V DACH enterprise prostredí je voľba správnej vektorovej databázy v roku 2026 primárne rozhodnutím o suverenite a GDPR v inžinierskom šate. Pre väčšinu projektov pod približne 50 miliónmi vektorov postačuje pgvector na existujúcom Postgrese; Qdrant platí za DACH-blízkeho šampióna pre dedikované požiadavky.

Nasledujúce tri rýchle odpovede zhŕňajú kľúčové výroky pre rozhodovateľov:

Suverenita poráža benchmark. Nie surové QPS alebo recall@10, ale otázka „kde ležia embeddings, kto k nim môže pristupovať, dá sa stack stiahnuť on-prem" dominuje DACH architektonickému rozhodnutiu.
pgvector je default pre stredné podniky. Až do približne 10 až 50 miliónov vektorov je pgvector na suverénnom managed Postgrese (IONOS, STACKIT, OTC, Hetzner) prevádzkovo najjednoduchší a z hľadiska GDPR najmenej rizikový.
Qdrant Hybrid Cloud na STACKIT je najatraktívnejšia dedikovaná topológia vektorovej DB pre regulované workloady, pretože dátová rovina zostáva v perimetri zákazníka.

Prečo je voľba vektorovej databázy rozhodnutím o suverenite

Vrstva vektorovej DB sa v roku 2026 na úrovni API do veľkej miery stala komoditou: HNSW je dostupné všade, hybrid-search je povinnosťou, multimodálne postupy (ColPali, ColQwen) sú novou frontou. Skutočná diferenciácia preto leží v štyroch bodoch: pozícia suverenity a nasaditeľnosť, kvalita hybrid-search v nemčine s kompozitami a odborným jazykom, multimodálna podpora dokument-obraz, ako aj prevádzková vyspelosť v rozsahu od 10 do viac ako 100 miliónov vektorov.

Tri štrukturálne posuny vynucujú túto perspektívu: Po prvé je EU-US transferový režim nestabilný; rozsudok CJEU C-413/23 P (SRB v EDPS, september 2025) objasnil, že pseudonymizované dáta nie sú automaticky pre každého príjemcu osobné, no DACH dozorné orgány naďalej zaobchádzajú s embeddingmi odvodenými z osobných údajov ako s in-scope. Po druhé sa suverénna cloudová vrstva stala vyspelou (STACKIT, IONOS, OTC, SAP Sovereign Cloud, Delos, AWS European Sovereign Cloud od 15. januára 2026). Po tretie sa každý engine bez seriózneho self-host alebo on-prem riešenia štrukturálne diskvalifikuje pre regulované DACH workloady.

Hodnotiace kritériá pre porovnanie vektorových databáz

Nasledujúce kritériá štruktúrujú každé seriózne enterprise porovnanie:

Hosting a EU región: Managed Cloud, self-hosting na vlastnom Kubernetes, alebo suverénna DACH cloud. Rozhodujúca je jurisdikcia, nielen voľba regiónu.
Škálovanie: Praktická horná hranica na node a čistá cesta k vyšším rádom veľkostí.
Filtrovanie metadát: Korektnosť filtrovaných ANN dotazov (pgvector 0.8 uzavrel s iterative scan starú medzeru overfilteringu).
Podpora hybrid-search: dense plus BM25/SPLADE a fúzia cez Reciprocal Rank Fusion.
Konzistencia a vymazateľnosť: Efektívne mazanie bodov je relevantné pre GDPR (čl. 17).
Náklady a vyspelosť: Pamäť pracovnej množiny, licenčný model, produkčné referencie.

Priame porovnanie vedúcich vektorových databáz

Nasledujúca tabuľka zhŕňa vedúce možnosti pozdĺž najdôležitejších kritérií. Semafor suverenity sleduje výskum: zelená = sovereign-nasaditeľné, žltá = EU-región-managed akceptovateľné, oranžová = US cloud len pre necitlivé workloady, červená = US-only.

Engine	Sídlo / Licencia	Hosting	Škálovanie (orientačná hodnota)	Hybrid-search	Multi-vector / ColPali	Suverenita
pgvector 0.8+	PostgreSQL licencia	Všade, kde beží Postgres	~10-50M / node	tsvector, ParadeDB pg_search	manuálne (multi-row)	zelená
pgvectorscale	PostgreSQL licencia	Self-host / Timescale EU	až miliardy (StreamingDiskANN)	dedí pgvector	dedí pgvector	zelená
Qdrant	Berlín DE / Apache 2.0	OSS, Cloud EU, Hybrid Cloud, Private Cloud	~100M+ / cluster	BM25, SPLADE++, miniCOIL	natívne (ColBERT/ColPali)	zelená (DACH-šampión)
Weaviate	Amsterdam NL / BSD-3	OSS, Cloud EU, Embedded	100M+ so shardingom	BM25 + dense vstavané	experimentálne	zelená (EU-native)
Milvus / Zilliz	US / Apache 2.0 (OSS)	OSS, Zilliz Cloud EU	miliardy (IVF-PQ, DiskANN)	sparse + dense	áno (2.4+)	zelená self-host / žltá Cloud
pgvector cez Postgres-DB	rôz.	IONOS, OTC, STACKIT, Hetzner	viď pgvector	tsvector	manuálne	zelená
Elasticsearch / Elastic	NL/US / Elastic License	self-host / Cloud EU	veľmi vysoké	best-in-class (BM25+dense+ELSER+RRF)	obmedzené	zelená self-host / žltá Cloud
Chroma	US / Apache 2.0	OSS embedded; Cloud US-only	malé/embedded	basic	obmedzené	zelená self-host / červená Cloud
Pinecone	US / proprietárny SaaS	len managed; EU regióny	vysoké (serverless)	sparse-dense	obmedzené	oranžová (žiadny self-host)

pgvector profituje od verzie 0.8.0 (október 2024) z iterative scan, halfvec (polovičná pamäť pri zanedbateľnej strate recall) a binary_quantize. Praktická horná hranica pre stock-pgvector s HNSW leží v rozsahu 10 až 50 miliónov vektorov na node; nad to je pgvectorscale so StreamingDiskANN čistou Postgres cestou.

Qdrant si pre DACH zaslúži osobitnú zmienku: sídlo v Berlíne, Apache 2.0, jadro v Ruste, podľa výskumu približne 250 miliónov stiahnutí a 29 000 GitHub hviezdičiek začiatkom roka 2026, Series B nad 50 miliónov amerických dolárov v marci 2026 (lead AVP, s Bosch Ventures). Produkčné referencie zahŕňajú Bosch, Tripadvisor a HubSpot. Qdrant Hybrid Cloud bol explicitne spustený so STACKIT, Aleph Alpha a Civo ako suverénnymi partnermi.

Pinecone, Turbopuffer a Vectara nie sú paušálne diskvalifikované, ale je ich potrebné zaradiť ako oranžové až červené: EU regióny existujú, no CLOUD Act a FISA 702 expozícia zostáva. Pre regulované workloady sú typicky štrukturálne mimo hry.

Hybrid-search a konzistencia v praxi

Takmer každý produktívny DACH RAG systém by mal v roku 2026 prevádzkovať hybrid-search plus reranker. Štúdia Anthropic Contextual Retrieval kvantifikovala zisk: embeddings plus BM25 znižujú chybovosť o približne 49 percent oproti čisto vektorovému vyhľadávaniu, s dodatočným rerankerom až o 67 percent. Na nemeckých benchmarkoch zdvíha cross-encoder reranker recall@5 typicky o 5 až 15 percentuálnych bodov.

Pri konzistencii je sémantika mazania tvrdým procurement-gate: HNSW grafy nepodporujú efektívne mazanie bodov. Podľa výskumu pgvector maže efektívne (Postgres MVCC), Qdrant podporuje efektívne mazanie bodov, Milvus pracuje s tombstones a následnou kompaktáciou, SAP HANA Vector cez štandardný SQL DELETE. Kto musí splniť čl. 17 (právo na vymazanie), overí si to pred uzavretím zmluvy.

Praktický príklad: výpočet pamäte a nákladov

Konkrétny príklad výpočtu pre 10 miliónov vektorov pri 1024 dimenziách objasňuje nákladové páky (HNSW):

float32 (baseline): surové vektory 40 GB, HNSW overhead 50 až 100 percent, efektívna pracovná množina 60 až 80 GB.
halfvec (float16): približne 30 až 40 GB pri zanedbateľnej strate recall.
SQ8 (Scalar Quantization): približne 10 až 20 GB, asi 1 až 3 percentá straty recall.
Binary plus rescore: približne 5 až 10 GB, ale len s full-vector rescore top-N kandidátov.

Dôležité: naivná binary quantization bez rescore stráca na tvrdých benchmarkoch 30 až 60 percent recall@10. Pre nemecké právne, medicínske a finančné obsahy je preto konzervatívnym defaultom halfvec plus SQ8 s voliteľným binary rescore. Na STACKIT, IONOS, OTC, Hetzner a Delos je pamäťovo optimalizovaná cenotvorba inštancií pre tieto veľkosti pracovnej množiny konkurencieschopná, s typickou prirážkou za suverenitu približne 10 až 20 percent (stav 2026), v súlade s AWS European Sovereign Cloud premium pri spustení v januári 2026.

Kedy pgvector postačuje a kedy nie

Pre väčšinu RAG projektov stredne veľkých podnikov pod približne 50 miliónmi vektorov je správnou odpoveďou roka 2026 pgvector na suverénnom managed Postgrese s upgrade cestou na pgvectorscale. Prevádzkovo to znamená jednu databázu, jeden backup príbeh a jeden GDPR AVV reťazec, teda výrazne menšiu plochu suverenity ako zavedenie dedikovanej vektorovej DB. Timescale zverejnený benchmark na 50 miliónoch Cohere-768 embeddingov ukazuje pgvectorscale s 28-násobne nižšou p95 latenciou a 16-násobne vyšším QPS oproti Pinecone s1 pri 99 percentnom recall (údaj výrobcu, rád veľkosti plauzibilný).

Dôvody na odklon od pgvector: natívne multi-vector/ColPali požiadavky (potom Qdrant, Weaviate, Milvus 2.4+ alebo Vespa ako najvyspelejší ColBERT engine), škálovanie za hranicu 100 miliónov vektorov (Milvus s IVF-PQ/DiskANN), alebo dáta rezidentné v SAP. Pre tie posledné je SAP HANA Cloud Vector Engine štandardom, pretože odpadá jeden sovereignty-hop, jeden AVV link a jedna zodpovednosť za pohyb dát. Typický korporátny vzor roka 2026 je preto HANA Vector pre dáta rezidentné v SAP plus Qdrant alebo Weaviate (alebo pgvector pre tých, čo dbajú na náklady) pre neštruktúrované dokumenty, komplementárne, nie konkurenčne.

Krátka poznámka ku compliance: Tento článok nenahrádza právne poradenstvo. Uvedené články GDPR, EDPB dokumenty a rozsudky slúžia na orientáciu; konkrétne zaradenie embeddingov, AVV reťazcov a posúdení rizika re-identifikácie patrí do rúk kvalifikovaných expertov na ochranu údajov a právo.

Pre agentúry a B2B rozhodovateľov

Pre marketingové agentúry a AI-native produktové spoločnosti sa oplatí stupňovitá stratégia: pgvector na managed Postgrese (IONOS, STACKIT, Hetzner, Aiven EU) so schémou-na-mandanta ako multi-tenant default, Qdrant Cloud EU alebo Qdrant na zákazníckom Kubernetes pre tenantov za hranicou približne 10 miliónov chunkov. Pre DACH B2B rozhodovateľov platí: Zaobchádzajte s voľbou vektorovej DB ako s rozhodnutím o suverenite, uprednostňujte OSS engines kvôli konkrétnej exit-portabilite a ukotvite sovereign-exit klauzuly v každej managed zmluve. Blck Alpaca z Viedne sprevádza DACH podniky práve pri tomto architektonickom rozhodnutí, od pilotovania pgvector až po suverénny Qdrant Hybrid Cloud setup na STACKIT.

Často kladené otázky

Kedy postačuje pgvector a kedy je potrebná dedikovaná vektorová databáza?

pgvector 0.8+ je bez prekvapení únosný približne do 10 miliónov vektorov na node (HNSW, float32, 1024 dimenzií, 64 GB RAM) a s halfvec plus iterative scan až do približne 50 miliónov na inštancii s 128 GB. Nad to vedie čistá Postgres cesta cez pgvectorscale (StreamingDiskANN) až do oblasti miliárd. Až keď ani to nestačí alebo je potrebná natívna multi-vector/ColPali podpora, oplatí sa dedikovaná DB ako Qdrant, Weaviate alebo Milvus. Pre väčšinu prípadov stredne veľkých podnikov, ktoré zriedka prekročia 5 až 20 miliónov vektorov, je pgvector správnym defaultom.

Ktorá vektorová databáza je najlepšia pre enterprise workloady v súlade s GDPR?

Neexistuje paušálne najlepšia vektorová DB, ale pre DACH workloady podliehajúce povinnosti suverenity sú nastavené open-source, self-hostovateľné engines: pgvector/pgvectorscale, Qdrant, Weaviate, Milvus, Elastic/OpenSearch self-host. Qdrant Hybrid Cloud na STACKIT platí za najatraktívnejšiu dedikovanú topológiu, pretože ponúka managed model pri súčasne zákaznícky riadenej dátovej rovine. US-only spravované služby ako Pinecone alebo Turbopuffer sú pre regulované dáta (BFSI, Health, KRITIS, Public Sector) štrukturálne mimo hry.

Sú embeddings podľa GDPR osobnými údajmi?

Podľa výskumu je úprimná odpoveď s najväčšou pravdepodobnosťou áno, pokiaľ sú odvodené z osobných údajov, v spojení s dokumentovaným posúdením rizika re-identifikácie podľa EDPB Opinion 28/2024 a Guidelines 01/2025. Rozsudok CJEU C-413/23 P (september 2025) vyžaduje posúdenie špecifické pre príjemcu a controllera. Prakticky to znamená: embeddings osobných údajov patria do suverénnej infraštruktúry, musia byť vymazateľné (čl. 17) a reťazec AVV (zmluvy o spracovaní) sa rozširuje na poskytovateľov embeddingov a hostiteľa vektorovej DB. Toto nie je právne poradenstvo.

Čím sa líšia Qdrant, Weaviate a Milvus v enterprise nasadení?

Qdrant (Berlín, Apache 2.0) je komfortný pri 100 miliónoch vektorov na cluster, má plnú podporu multi-vector a late-interaction a GPU-akcelerované indexovanie. Weaviate (Amsterdam, BSD-3) škáluje so shardingom na 100 miliónov plus a prináša vyspelý ekosystém modulov, multi-vector je experimentálny. Milvus (Apache 2.0, LF AI & Data) škáluje najkonzistentnejšie na miliardy vektorov s IVF-PQ a DiskANN. Pre natívne ColBERT/ColPali workloady je Vespa najvyspelejším engine.

Čo prináša hybrid-search v porovnaní s čisto vektorovým vyhľadávaním?

Hybrid-search kombinuje dense vektorové vyhľadávanie so sparse BM25 a fúzuje cez Reciprocal Rank Fusion. Podľa štúdie Anthropic Contextual Retrieval znižuje dense plus BM25 chybovosť o približne 49 percent oproti čisto vektorovému vyhľadávaniu, s dodatočným rerankerom až o 67 percent. Práve pri nemeckých kompozitách, odbornom jazyku a identifikátoroch ako spisové značky, SAP čísla materiálov alebo IBANy je zisk konzistentne 5 až 15 nDCG@10 bodov. Hybrid plus cross-encoder reranker je preto produkčným štandardom roka 2026.

Ísť hlbšie?

Získajte nové analýzy priamo do schránky, alebo sa pozrite, ako tieto poznatky nasadzujeme pre firmy.

Odoberať newsletter →Naše služby

Previous← Porovnanie embedding modelov 2026: text-embedding-3, Cohere, BGE-M3, Voyage a Jina NextPinecone vs. Weaviate vs. Qdrant: Porovnanie vektorových databáz z pohľadu DACH/EU hostingu →