ニーズ

検索の課題は、何十億ものエントリにインデックスを付けると同時に、関連する結果を可能な限り迅速に見つけることです。 ほとんどの検索は、キーワード一致やエンジニアリングおよびインフラストラクチャを使用する、転置インデックスに依存しています。

アイデア

ベクトルを使用して検索を改善します。 ディープ ラーニング モデルはデータをベクトルとして表し、ベクトル間の距離は類似性を反映しています。 近似最近傍 (ANN) アルゴリズムは数十億のベクトルを検索し、結果をミリ秒で返します。

ソリューション

ベクトル検索は、テキスト、マルチメディア、画像、推奨事項などの検索といった多くのアプリケーションに適用できます。 コードを独自のアプリケーションに組み込んで、ディープ ラーニングの洞察を広く活用できます。

Bing ベクトル検索に関する技術的な詳細

ベクトル検索では、ディープ ラーニング モデルを使用して、データセットを意味のあるベクトル表現にエンコードします。ベクトル間の距離は、アイテム間の類似性を表します。 次に、近似最近傍 (ANN) 検索アルゴリズムを使用して、数十億のベクトルを検索し、最も関連性の高い結果をわずか数ミリ秒で返すことができるベクトル インデックスを作成します。

アーキテクチャの図をダウンロードする

ベクトル検索は、Web テキスト検索、マルチメディア + 画像検索、推奨など、さまざまなアプリケーションに適用できます。 例として、ベクトル検索を使用して、動物、猫、犬などの複数の画像データベースにわたる画像類似検索アプリケーションを強化しました。 まず、PyTorch の事前トレーニング済みディープ ラーニング モデルを使用して、オープン ソース データ セット (スタンフォード ドッグ、オックスフォード フラワーなど) をベクトルにエンコードしました。 次に、Space Partition Tree and Graph (SPTAG) アルゴリズムを使用して、k 平均バランス ツリーと最近傍グラフを使った近似最近傍 (ANN) ベクトル インデックスを生成しました。 入力画像が入ってくると、アプリケーションは最初に PyTorch モデルを使用して画像をベクトルに変換します。 そして、SPTAG アルゴリズムでクエリ ベクトルを使用して、数ミリ秒で最も関連性の高いベクトルを見つけます。 返されたベクトルは画像に対応し、「最も関連性の高い」結果として返されます。

この画像類似性検索は、今日のアプリケーションにおけるベクトル検索の、多くの可能なアプリケーションの 1 つにすぎません。 ベクトル検索を独自のアプリケーションに組み込んで、ディープ ラーニングの洞察を広く活用してみましょう。

リソース:

ベクトル検索に関連するプロジェクト

ビジネス シナリオのプロジェクトをもっと見る

AI の可能性を探る

Microsoft AI の学習リソースと開発ソリューションで、独自の AI イノベーションをすぐに始めることができます。