半導体製造装置のグローバル リーディング カンパニーであり、フィールド ソリューションも積極的に展開することで、「装置✕サービス」の両輪で安定的な成長を続けている東京エレクトロン。社内はもちろんのこと顧客に納入した装置からも、膨大なデータを収集しています。しかし従来のデータ基盤は複数のデータベースや ETL ツールで構成されており、運用管理が極めて煩雑でした。そのためデータを十分に活用できず、個人のスプレッドシートの中に埋もれてしまうケースも少なくありませんでした。
この問題を解決するために導入されたのが Azure Databricks です。すでに活用していた Azure の各種サービスと親和性が高いことや、フルマネージド サービスで運用負荷が低いこと、多様なワークロードに対応可能でスケールも柔軟にコントロールできることなどが高く評価されました。マイクロソフトの支援を受けて PoC を実施し、2020 年 10 月頃から一部ユーザーへの提供を開始。2025 年 4 月には RAG のデータ基盤としての活用も始まっています。
データ基盤を Azure Databricks へと統合していくことで、データの流れが可視化しやすくなり、データ フローの設計・実装も容易になりました。またフレッシュなデータをほぼリアルタイムで活用可能になり、夜間バッチの処理時間も半減すると期待されています。さらに RAG での活用では、アクセス管理を統合できることや精度評価を統一可能なことなどを高く評価。今後は Azure Databricks をコアとした「AI Data Platform」を全社標準のデータ基盤にしていく計画です。
Microsoft をフォロー