Trace Id is missing
ミーティングの様子 写真です。

スタートアップ支援の事例

データ サイエンティストの価値をさらに向上。特徴量設計を AI で自動化する dotData のユニークネス

dotData CEO 藤巻 遼平 氏

今や企業活動に不可欠となったデータ サイエンス。分析の中核を担うデータ サイエンティストは、知識の専門性と領域の先進性ゆえに、世界中で人材が不足している。そこで注目されるのが、AI や機械学習を活用したデータ分析のプロセスを自動化する動きだ。 
なかでも、米国を拠点に世界中にプロダクトを展開する dotData は、データ サイエンスの工程全体を自動化するプラットフォームを構築した、同領域のトップランナーだ。日本国内でも導入企業が急増し、業務プロセスに大きな変革をもたらしている。

今回は従来の機械学習の常識を塗り替え、データ サイエンス分野を加速する同社の取り組みと、『Microsoft for Startups』参画によって生まれるシナジーについて、CEO の藤巻遼平氏(以下、敬称略)に話を聞いた。

データ分析の AI 活用は、人と時間の問題を抱えている

 ――データ サイエンスにおける AI や機械学習の活用は、どのように進展してきたのでしょうか。

dotData, Inc. CEO 藤巻 遼平 氏

dotData, Inc. CEO 藤巻 遼平 氏

藤巻 ビッグデータという言葉が流行した 2010 年代前半、企業が蓄積されたデータを可視化し、活用しようとする動きが活性化しました。データをプロアクティブに活用するために、人間が担っていたデータ分析の工程を自動化したり、コンピュータの計算力でより高度な意思決定を支援したりと、新たなしくみが求められていきます。こうした流れから、AI や機械学習を導入する流れが生まれました。 
2010 年代後半、「AI 活用で既存の業務を効率化し、新たな価値を生む」という考えが、徐々に定着しました。そして現在は、「AI を利用できなければ企業はその活動を持続できない」といわれるほど、重要度を高めつつあります。 
しかし、実際に企業がデータ活用で AI を取り入れる上では、課題がいくつかあります。

一つは「人」の問題です。機械学習は新しい領域である上、数理や統計、ソフトウェアの技術を理解していなければ扱えない分野。これらを扱えるデータ サイエンティストは、世界的に不足しています。特に日本では顕著で、データ サイエンティストチームを抱える企業はまだまだ少ない状況です。米国であっても、スモール/ミディアム エンタープライズのマーケットとなると、100 人規模の会社にデータ サイエンティストが 1 人か 2 人いるといった程度なんです。 
もう一つは、「時間」の問題です。データを用意して課題を設定し、モデルを組んでハンドリングするのには、何か月もかかります。そもそもの人材が少ないのに、プロセスにも時間がかかる。この 2 点は AI 導入の大きな障壁となっていました。

仮に導入されたとしても、それが機能するかはまた別の話です。よく “PoC(概念実証)疲れ” といわれますが、何か月も分析・実証を行なった挙句、求めていた成果にたどり着けず、経営層の理解を得られないことで結局定着しないというケースも多いです。本来 AI は、もっとクイックに、試行錯誤をしながら運用していくもの。しかし実際にはハードルが高く、業務に適用するところまで到達しないんです。 
本来あるべき世界は、全ての業務にAIなどを用いたインテリジェントなモデルを組み込み、より高度な意思決定がされること。その理想に対して、大きなギャップが存在していたのです。

 ――そうした問題にアプローチするため、どんな機械学習部分に目をつけて dotData を立ち上げたのでしょうか。

藤巻 プロジェクトとしての dotData は、研究員として所属していた NEC で 2015 年頃から行なってきたものです。その後、事業をカーブアウトする形で、2018 年、米国で現在の会社を創業しました。  
私は機械学習の専門家ですが、最初から機械学習の自動化を目指していたわけではないんです。自動化したのは、機械学習の前処理にあたる、蓄積された生のデータを加工する部分。この「特徴量(※)設計」は、分析工数の 8 割を占めるともいわれる、手のかかる工程です。 
※特徴量: コンピュータの学習指標となる対象データの特徴を数値にして表したもの

今思うと、特徴量設計を AI で自動化するという考えはユニークだったと思います。機械学習そのものは結局のところ数理・統計の世界で、計算によって最適化するのは比較的簡単なので、オープンソースが現れ、コモディティ化することは、当時からなんとなく見えていました。一方、業務に関する知見をベースにデータを加工する特徴量設計は、どこか泥臭く、自動化しづらいものです。そこに早い段階でアプローチしたことが功を奏したように思います。

――企業が AI を導入する動きは加速の一途をたどっていますが、今後はどのようなソリューションが求められていくのでしょうか。

藤巻 海外では、AI が「特別な技術ではない」というフェーズに移行したと考えていいと思います。ただし、AI はあくまで手段。ビジネスのユースケースの中で初めて価値を生みます。企業においては、「どのようなユースケースに AI を活用することが最も効果的か」という、もっとも本質的な課題を見つけ出す力が重要になってきています。 
そのため、自動化技術もアジャイルな開発が求められてきています。これまでは万全なモデルを一つ構築して、長い時間をかけてシステムを作り込んでいく方法が主流でした。しかし現在は、AI が力を発揮するユースケースを素早く見つけ出す企業が成功します。そこでは、万全な一つのモデルでなく、何百もの小さなモデルを組み、運用と検証を繰り返していくことが必要です。だからこそ、人材や時間の問題を解決することが急務になっているんです。

リソースの最適化へ。データ サイエンティストの役割を変える dotData の可能性

――dotData のプロダクトについて教えてください。

dotDataによるAIの自動化と民主化 データを準備 仮説を設定 モデルを開発 業務へ適用 課題 設定 データ 収集 データ 加工 (分析用) 特徵量設計 機械学習 可視化 運用 数ヶ月 数週間 数か月 .d dotData 数日 https://dotdata.com .d

dotData 資料より抜粋

藤巻 エンタープライズ向けのソフトウェア「dotData Enterprise」は、データ サイエンスにおけるプロセスの大部分を自動化します。コーディングやビジュアル プログラミング、フローの書き込みなど、専門的な作業は必要ありません。基本的には使用したいデータを選ぶだけで、あとは自動で進んでいきます。これまで必要だった、大量の SQL を書いたり、複雑なデータフローをキャンバスに書き込んだり、Python などを用いて機械学習を行う作業をしなくても、多少のクリック操作だけで特徴量から機械学習のモデル開発までを行うことができるのです。

dotDataとは? dotDataは、データサイエンスのプロセスを自動化する画期的なソフトウェアです。 データ分析の試行錯誤に費やす時間·労力が解消され、ビジネス施策検討に注力できるようになります。 また、導きだされる結果からは、人が思いもよらなかったインサイトを発見できます。 課題 (目的設定) 過去/事実から 仮説、検証 (ビジネスの洞察) 未来の 予測モデル 作成 運用 Data Science Automation

ただし、dotData Enterprise はあくまでツールなので、どのようなユースケースを解くかという設定は人間が行います。この部分はある意味で最も難しいのですが、ビジネスにおいて最も重要な部分でもあります。その本質的な部分に人間が専念できるという点も、dotData が提供できる重要な価値だと考えています。

dotData Enterprise を取り入れた企業の方から、「モデルや特徴量をつくることが劇的に楽になった。その分、新たな部分が課題になった」という声をいただいたことがあります。この「新たな部分」というのは、AI のプロジェクトを継続的に運用していくか、各部門のスタッフが AI をいかに活用していくかなど、“カルチャー” にあたるところです。ビジネス部門が AI を活用して業務を改善するためのマインドセットや、それを推進するリーダーの育成、そうした本質的な部分にフォーカスできるようになったことは、自動化がもたらすポジティブな変化だと捉えています。

――プロセスの自動化に伴い、「データサイエンティスト」または「人」の課題はどう解決されますか? 

藤巻 自動化の利点は、汎用的なプロセスを誰もが効率的に解くことができることです。一方、自動化が苦手なのは、そうではない “特化” したケースでしょう。一つ一つの問題に対してカスタマイズをしていく作業は、人間の方が得意なので、データサイエンティストが必要になるシーンは多いです。 
では、どのように「人」の問題が解消されるかというと、一人のデータサイエンティストが生み出す価値が高まるということです。誰でも解けるような問題は自動化し、より難解な問題に専念する、エバンジェリストのように AI を社内に布教する動きをするなど、もっとコアな部分にコミットすることができるようになります。

単純にいうと、それまでデータ サイエンティストが解かなければならなかった 100 の問題のうち、80 を自動化して、本質的な部分にコミットするわけです。データ サイエンティスト自体は不要になるのでなく、むしろ重要性を増していくものと考えています。

――では、「時間」の課題はどのように解決されるのでしょうか。 

藤巻 導入後にどれだけ使いこなせるようになったかにもよるのですが、米国の導入企業からは、データ サイエンティストがいないほぼゼロベースで開始して、数週間程度で優れたモデルを構築し、年間売り上げの 1% 増を実現できたという評価をいただいたことがあります。ペイメントのトランザクションで問題を抱えていた企業で、支払いが滞っていた顧客に催促をするプロセスに AI を取り入れ、回収の効率化に成功したという事例です。

――改め てdotData の強みを教えてください。

dotDataの 活用·協業 イメージ 業務ノウハウ·データを活用した 新規事業開発 全社AI活用·DX推進 AIによる製品·サービスの 強化 AI人材の教育·育成 12 https://dotdata.com .d

dotData 資料より抜粋

藤巻 機械学習自動化の技術はここ 2〜3 年で急速に発展しており、現在は多くの企業が開発しています。dotData Enterprise を活用する場合でも、機械学習の部分においては、他社のツールを使うこともできます。しかし、どのツールを使おうと、特徴量設計で入力するデータを作らなければ、分析は始まりません。そのデータを自動でつくるのが私たちのプロダクトです。この領域においては世界ではじめて実現した技術であり、現在もマーケットのリーダーであると自負しています。2019 年には、米国の調査会社フォレスター・リサーチが行なった機械学習自動化に関するリポートで、最高ランクの「リーダー」に認定されました。

――データサイエンスの自動化は、どのような社会課題を解決していくのでしょうか。

藤巻 まずは人材の不足でしょう。特に日本は、労働人口そのものが足りないというフェーズに入っています。その中で国際競争力を高めるためには、業務の自動化によるリソースの最適化は不可避です。一方、AI や機械学習が、IT のように普通のインフラとなっていけば、自ずと専門的人材も増えていきます。この循環さえ生まれれば、日本も新たな戦い方ができるはずです。

例えば日本の製造業のお客さまで、dotData を導入したことをきっかけに、200 人規模のデータ分析者を教育するプロジェクトを始めたという事例があります。製造業では、工場の膨大なデータを収集して、生産性を上げていくことができるかは死活問題。このプロセスの大部分が自動化されたことで、むしろ AI のリテラシーを向上する意識が高まっているのです。このように自動化は、多くの人が AI にコミットする帰結をもたらすこともあります。

信頼の獲得と先行投資のバックアップで、スタートアップを加速した

――マイクロソフトの 『Microsoft for Startup』 プログラムに参画された理由を教えてください。

Microsoft for Startup Webページ

藤巻 クライアントである企業から、マイクロソフトの担当者の方を紹介していただきました。きっかけ自体は dotData が Azure をインフラとしてサポートしていなかったことなのですが、マイクロソフトの担当者とざっくばらんに事業内容について話をすることができ、Azure の連携が可能である 『Microsoft for Startup』 を勧めていただきました。 
現在は 『Microsoft for Startup』 のプログラムからは卒業したという立ち位置ですが、データウェアハウスをはじめとしたさまざまな Azure サービスとの連携など、新たな形での協業が始まっています。

――スタートアップ時代、『Microsoft for Startup』のどのようなサービスが役立ちましたか。

藤巻 エンタープライズの場合、多くの企業がユーザー管理で Active Directory を使用しています。AI や機械学習では、センシティブなデータにアクセスすることもできてしまうことから、ユーザー管理におけるガバナンスが非常に重要となります。この領域でマイクロソフトが高い信頼を獲得していることは大きく、dotData のユーザー管理にマイクロソフト側のガバナンスを使用するなど、連携を深めることで、顧客の評価を高めることができました。 
また、Azure の開発クレジットをいただけたのは大きかったです。売れるかどうかわからない段階で、どこまで先行投資をするかは、経営者として難しい判断。Azure 上に dotData を構築する開発に投資をすべきかと悩んでいたところ、マイクロソフトから、dotData を Azure で提供することを条件に、開発クレジットいただくという進め方を提案していただきました。

ほかにも、米国や欧州での販路拡大で、マイクロソフトのコネクションでサポートしていただくなど、事業拡大で積極的な支援を受けています。dotData の成長がマイクロソフトに対しても貢献するという、同じ視点に立ったパートナーシップが、良いサイクルを生んだのではないでしょうか。ビジネス ユーザーから信頼されるプロダクトを多数持っている点も魅力で、それらと連携しながら、dotData のビジョンを実現したいですね。

AI インフラが Excel のようになる未来

――dotData は今後、どのようなポジションを目指していくのでしょうか。

手を振る株式会社データ代表取締役社長 藤巻良平氏

藤巻 5 年後の世界では、AI は企業のインフラになり、何百というモデルをそれぞれの企業が運用しているでしょう。そうしたシーンで、インフラ部分の有力なプレイヤーになっていたいですね。 
最終的には、全てのビジネス ユーザーが気軽に活用できるようなソフトウェアに仕上げていきたいと思います。ビジネスに生かされてこその AI なのですが、ビジネス部門の人たちが AI の活用をするようになるには、米国でも日本でもまだ隔たりがある。そこを埋めなければなりません。

dotData Enterprise によって、技術的な障壁を下げることを達成できましたが、それでも AI や機械学習は難しい領域です。まだまだユーザビリティを高める余地は残っていると考えています。Excel のように、高度な作業からちょっとしたメモ書きまで、全てのビジネス ユーザーが使えるようなソフトウェアとなれることが理想的な状態なので、そこまで AI が身近になる未来を目指していきたいと思います。