モビリティと IT を軸としたビジネスを展開するトヨタコネクティッドの中で、次世代の事業の柱を見つけ具現化することをミッションとしている先行企画部。ここで生まれたのが、生成 AI を活用した「店舗内AI音声」で店舗内放送を変革していくというアイデアでした。これをマイクロソフトのハッカソン形ワークショップ Azure Light-up で提案したところ、参加者全員が「面白い」と評価。その翌週にはわずか 2 日間で、実際に動くシステムが作られています。
構築されたシステムは、独立性の高い 5 つの機能モジュールで構成されており、これらがオーケストレーション機能で連携するようになっています。このアーキテクチャのベースとなったのは、マイクロソフトが提唱するマルチエージェントの考え方でした。Azure AI 音声で生成される音声はきわめて自然な発音を実現しており、アプリケーションコード内で音質やトーンを選択できるため、カスタマイズにも向いていると評価されています。
実際に複数の小売業者や広告代理店にデモとインタビューを行った結果、「人が録音しなくてもこれだけ自然な音声が生成できるのか」「これなら導入したい」という声をいただいています。店舗内放送での生成 AI 活用は、シナリオ作成や録音のコスト削減、オンデマンド コンテンツ追加による地域情報の発信やそれによる来店動機創出などの効果が期待されていますが、他にも災害情報の迅速な反映やインバウンドへの対応、小売店舗以外での活用などのアイデアも生まれています。
Microsoft をフォロー