Azure Cosmos DB entwickelt sich zur Search-Native Database
Montag, 15. Dezember 2025
Microsoft treibt die Verschmelzung von klassischen Datenbanken und Suchsystemen voran. Azure Cosmos DB soll künftig beide Welten unter einem Dach vereinen, ohne dass du separate Systeme wie Elasticsearch betreiben musst.
Warum Datenbank und Suche zusammenwachsen
Bisher lagen Datenbanken und Suchsysteme in unterschiedlichen Lagern. Während OLTP-Datenbanken auf strukturierte Daten, Transaktionsgarantien und niedrige Latenz setzten, konzentrierten sich Suchsysteme auf Volltextsuche und semantische Relevanz. Mit KI-First-Anwendungen löst sich diese Grenze auf, denn moderne Anwendungen benötigen beides gleichzeitig. Separate Systeme bedeuten nicht nur zusätzlichen Overhead, sondern liefern auch suboptimale Ergebnisse.
Was Azure Cosmos DB mitbringt
Die Grundlage bildet ein hochoptimierter Inverted Index, der ähnlich wie bei Elasticsearch partitioniert ist. Dieser Index behandelt JSON-Dokumente als Bäume, bei denen sowohl Strukturen als auch Werte einheitlich als Pfade repräsentiert werden. Als Speicher-Engine kommt der BW-Tree zum Einsatz, eine schreiboptimierte Struktur, die hohe Durchsatzraten bei niedrigen Latenzen ermöglicht.
Für die Vektorsuche speichert Cosmos DB Embeddings direkt im Inverted Index mit speziellen Encodings. Du hast drei Indexierungsmodi zur Auswahl: Flat Index für exakte Ergebnisse, Quantized-Flat für schnellere Performance bei reduziertem Speicherbedarf und DiskANN für eine sog. Nearest-Neighbor-Suche bei großen Datenmengen. Neu ist Sharded DiskANN, das für jeden Tenant einen isolierten Vektorindex pflegt.
Bei der Volltextsuche setzt Microsoft auf Tokenisierung, Stemming, Phrase Search, Proximity Search und Fuzzy Matching. Für das Ranking nutzt das System BM25-Scoring basierend auf Term Frequency, Document Length und weiteren Signalen.
Hybrid Search als neuer Standard
Die Query-Engine kombiniert Vektorsuche und Volltextsuche in einer einzigen SQL-Abfrage. Mit Reciprocal Rank Fusion (RRF) kannst du Ergebnisse aus beiden Welten zusammenführen und nach Relevanz ranken.
Demnächst kommen zwei weitere Features: Ein Semantic Re-Ranker, der Hybrid-Search-Ergebnisse über Cross-Encoder oder LLMs nachbewertet, sowie automatische Embedding-Generierung direkt in der Datenbank.
Microsoft positioniert Azure Cosmos DB als All-in-One-Lösung für moderne KI-Anwendungen. Statt externe Vektordatenbanken oder Suchsysteme anzubinden, läuft künftig alles in einem global verteilten, hochverfügbaren System.
Microsoft Azure
Setze deine Ideen noch schneller in Lösungen um – mit einer vertrauenswürdigen Cloud.
Microsoft Azure Dokumentation
Beliebte Dienste zwölf Monate lang kostenlos nutzen.
Erweitern Sie Ihre Kenntnisse, um Anwendungen in der Cloud, lokal und am Edge zu erstellen und zu verwalten.