データレイクが具現化する次世代AI基盤―ReNom、NVIDIA DGX-1

ディープラーニングの登場により到来した第3次AIブームの中、実際にAIをビジネスに活用する動きが活発化している。ただし、そのためにはマシンラーニングやディープラーニングの多様なアルゴリズムを簡単に利用できる環境が不可欠であり、将来的にはリアルタイム分析などにも対応できるAI基盤が求められる。そこにいち早く踏み出し、ビジネスで着実な成果を上げるためのAI開発フレームワーク、GPUアプライアンス、データレイクについて解説した。

 point 
 ■ 
日本発のAIフレームワーク「ReNom(リノーム)」

 ■ IT基盤の進化を読み解くキーワード、データレイクとGPU

あえてAIフレームワークを活用し自分自身の価値も高めるべき

人口減少が続く日本において、企業はどのようにAIを活用していくべきだろうか。

この答を探る前に、まずはビジネスを席巻する現在のAIがいかなるものなのかを整理しておく必要がある。AIはこれまでも何度かブームを繰り返しており、現在は第3次AIブームとされるが、これは機械学習(マシンラーニング)や深層学習(ディープラーニング)の革新的な進化によるものだ。

伊藤忠テクノソリューションズ株式会社(略称:CTC)AI技術推進課のエキスパートエンジニアである寺澤豊氏が、今回のAIブームの“火付け役”として挙げたのは、グーグル傘下の英ディープマインド社が開発した囲碁AIの「アルファ碁」である。

アルファ碁は過去のプロ棋士による棋譜データを画像情報としてディープラーニングを重ね、さらにアルファ碁同士のセルフ対戦を重ねる強化学習によって知識を深めた。これによりアルファ碁はその時々の局面を瞬時に判断し、答えを出す能力を身に着けたのである。そしてついに世界最強と称されるプロ棋士にも勝利し、AIを懐疑的に見ていた人々にも衝撃を与えた。

人間と同じように思考して汎用的な処理を行う“強いAI”が、現時点ですでに実用化されているわけではない。「いま実現されているのは、人間が行う作業や思考の一部を、方法にかかわらず結果的に実施できる仕組みをもった“弱いAI”です」と寺澤氏は語った。

だが、“弱い”といっても、それはあくまでもコンピュータサイエンスの観点からの評価であり、AIは世界に大きな影響を与え始めている。英オックスフォード大学のマイケル・A・オズボーン准教授は2014年、米国労働省のデータに基づき702の職種について調査した結果、今後10~20年程度で約47%の仕事が自動化されると予測を示した。

「この衝撃的な論文が発表されてから2~3年が過ぎた現在、実際にいくつかの職種が自動化され、コンピュータに置き換わろうとしています」と寺澤氏。たとえば2016年12月にアマゾンが本社ビルに併設した実験的食料品店「Amazon Go」は、レジに並ばずに商品を購入することができる。2015年7月にハウステンボスにオープンした「変なホテル」は、フロントやクローク、荷物運びなどの業務をロボットが担っている。また、歯科においては3次元カメラで患者の歯型を採取し、わずか15分ほどでセラミックの被せ物を製作するセレックシステムが普及しつつあり、歯科技工士をなくすかもしれない。

寺澤氏によれば、「今後もAIはロボットやIoTをはじめ、さまざまな技術と結びつきながら、世界を大きく変えていくことになるでしょう」。そうした中で、AI市場にはすでに無数のサービスやアプリケーションが登場しているが、おすすめするのはこれらのポイントソリューションの導入ではなく、AIフレームワークの活用だ。

「開発環境であるためプログラミングスキルも要求されるなど、決して楽とは言えませんが、多くの業務要件に対応することが可能です。必要なサービスを誰かに作ってもらう手もありますが、費用の割に応用範囲は限られてしまいます。あえて『自分で作る』という道を選ぶことで自分自身の価値を高め、企業にとってなくてはならない人材になることができます」。

そうした狙いからCTCが取り扱いを開始したのが、株式会社グリッドが開発した日本発のAIフレームワーク「ReNom(リノーム)」である。実用的に使えるマシンラーニングやディープラーニングの最新アルゴリズムを提供するもので、「CTCはグリッドとのパートナシップを通じて技術支援、導入支援にあたります」と寺澤氏は語る。

CTCが提供する最新のAIフレームワーク「GRID ReNom」

IT基盤の進化を読み解くキーワード、データレイクとGPU

さらに寺澤氏と代わって登壇した伊藤忠テクノソリューションズ株式会社 ITインフラビジネス推進第2部の課長を務める小野友和氏は、「ビッグデータ」と「ハードウェア」の2つのキーワードから次世代AI基盤の進化に言及した。

まずビッグデータの観点から取り上げたのがデータレイクである。多様なデータソースに分散している画像や映像、センサーデータ、SNSのコメント、各種文書などのデータを1か所にまとめて収集できるデータ統合基盤だ。「データがサイロ化し、分析基盤と分離していた状態をデータレイクが解消します。あらゆるデータを一元管理するとともに、収集したデータに対してその場でHadoopの適用を可能とするなど、リアルタイムの分析・活用を実現します」と、小野氏。

そしてハードウェアの観点からスポットを当てたのがGPU(Graphics Processing Unit)である。その名のとおりGPUはもともと3Dなどのグラフィックス処理のために作られたプロセッサであるが、「近年、AIやHPC(high performance computing)の分野で活用が広がっています」。

最新CPUでも搭載コア数は10~20個程度に過ぎない。これに対して最新GPUはその数百倍にあたる5,120個ものコアを搭載しているのだ。1コアあたりの性能こそCPUより劣るものの、小野氏によれば「単純な並列演算に関してはGPUが圧倒的に有利で、この特徴がディープラーニングの学習処理にマッチしたのです」という。

GPUとは

 

そうした中で大手GPUベンダーのNVIDIAがリリースしたのが「DGX-1」というサーバ製品である。3Uサイズの筐体に最新GPUを8基搭載。さらにディープラーニングのために最適化されたOSや仮想化ハイパーバイザー、AIフレームワークなどをあらかじめ組み込んだアプライアンスで、960テラフロップスという圧倒的な高性能を発揮する。

唐突に960テラフロップスと言われてもピンとこないかもしれないが、そこで小野氏が引き合いに出したのが、2011年に10.51ペタフロップスの演算性能を記録し、当時の世界一となったスーパーコンピュータ「京」である。京は864ラックに搭載された計88.126個のCPUから構成された巨大なシステムだが、「これと同じ演算性能を、DGX-1は理論的にはわずか11台(88GPU)で得られることになります」と小野氏は語る。

たとえばディープラーニングで「顔認識」を行わせるための学習に必要な演算処理量は30エクサフロップスとされているが、この膨大な処理をDGX-1は1台でも8時間41分、2台用いれば4時間21分で終えることができるのである。

小野氏によると、CTCではこのDGX-1についても近日中に取り扱いを開始すべく、準備を進めているようだ。
(※編集注:2017年9月12日より取り扱い開始済み。詳細はこちら。)

先に寺澤氏が紹介したAIフレームワークのReNom、ディープラーニングに最適化されたGPUアプライアンスのNVIDIA DGX-1、さらにデータレイクをインテグレーションしたAIの共通IT基盤を構築し、データの収集から加工、学習までCTCは一貫してサポートしていくという。AIの取り組みを、生産設備の予知保全やクルマの自動運転、株式のトレード、創薬など、すぐにビジネスに活用できる時代が到来しているのである。

関連記事はこちら