研究

東工大ニュース

東京工業大学に「産総研・東工大 実社会ビッグデータ活用 オープンイノベーションラボラトリ」(RWBC-OIL)を設立

2017.02.21

東京工業大学に「産総研・東工大 実社会ビッグデータ活用 オープンイノベーションラボラトリ」(RWBC-OIL)を設立
―実社会ビッグデータ活用技術による新たな価値創造を実現―

国立研究開発法人産業技術総合研究所(理事長 中鉢良治、以下「産総研」という)は、2017年2月20日に「産総研・東工大 実社会ビッグデータ活用 オープンイノベーションラボラトリ」(AIST- Tokyo Tech Real World Big-Data Computation Open Innovation Laboratory; RWBC-OIL)を国立大学法人 東京工業大学(学長 三島良直、以下「東工大」という)と共同で東工大 大岡山キャンパス内に設立しました。産総研のオープンイノベーションラボラトリ(OIL)[用語1]は、産総研の第4期中長期計画(平成27年度~31年度)で掲げている「橋渡し」を推進していくための新たな研究組織の形態で、RWBC-OILがその6件目となります。

実社会にはテキスト文書や画像ファイルといったデータベース化が容易ではなく種類の異なるデータ(非構造化データ)が膨大に計測・蓄積されています。これらビッグデータを実社会における課題解決に活用するためには、異種・大量なデータの効率的な処理を複数の計算機を適材適所に組み合わせることができる計算プラットフォームの構築が必要です。また、その計算プラットフォーム上で、異種・大量のデータを処理して知識を導き出すためのデータ解析技術も必要となります。こうした実社会のビッグデータを迅速かつ的確に分析することで、業務効率の向上や適切な状況判断の実現だけではなく、これまでになかった新しい製品やサービスを創出することが可能になります。

産総研は、計算機の能力を最大化して高速・大量にデータを処理する高性能計算の研究においてトップレベルの技術を有しています。非構造化データの解析技術としては、サービスや生活中で生成される各種のビッグデータを統合し現象の背後にある関係を5W1H化するなど構造的に表現して、現象の予測やシミュレーションを可能にする確率モデリングの研究開発を進めています。また、データの次元が増えるほど偶発的な検出が増え、真の発見が難しくなる課題を解決するために、出現頻度の低い組み合わせをデータから取り除き、予測値を比較することで格段に精度の高い予測値を算出する独自アルゴリズムの研究開発も進めています。

東工大は、計算プラットフォームの構築技術として、世界トップクラスのスーパーコンピューターであるTSUBAMEシリーズに代表される大規模スーパーコンピューター構築技術やTSUBAME-KFC[用語4]で実現された世界一の省電力計算機技術を有しています。また、大規模スーパーコンピューター上で高性能を発揮するビッグデータ処理技術や高速・省資源型の深層学習技術[用語2]やそれらのアプリケーション分野への応用技術、さらには交通量や株価といった社会・経済に関する実社会規模の現象の分析に適した大規模エージェントシミュレーション技術などの、卓越したビッグデータを活用する解析技術の研究開発を進めています。

今般、産総研と東工大は新たな産総研の拠点(RWBC-OIL)を東工大 大岡山キャンパスに設置し、産総研と東工大が有する計算プラットフォーム構築技術とビッグデータ処理技術を融合します。さまざまな分野に適用できるビッグデータの処理・解析技術を提供するオープンプラットフォームを構築することで、新たな価値を創造するための研究開発を行います。またRWBC-OILでは民間企業と密接に連携し共同研究や技術移転を進めることで、得られた成果の速やかな産業化と社会実装を目指します。

産総研・東工大 実社会ビッグデータ活用オープンイノベーションラボラトリ(RWBC-OIL)

図1. 産総研・東工大 実社会ビッグデータ活用オープンイノベーションラボラトリ(RWBC-OIL)

RWBC-OILで行う主な研究

研究課題1 ビッグデータ処理オープンプラットフォームの確立

大規模スーパーコンピューター技術を最大限活用したビッグデータ処理プラットフォームを研究開発します。DNAの塩基配列を読みとるゲノムシーケンサーからのデータやソーシャルネットワークにおける関係を示す大規模グラフデータの処理、画像認識といったこれまでのスーパーコンピューターではあまり適用されないタイプのデータに対して、大規模データ処理技術を適用し、世界最高性能のAIプラットフォームとして開発中のAI橋渡しクラウド(ABCI)[用語3]や世界トップクラスの大規模スーパーコンピューターTSUBAME 3.0/2.5[用語4]上に実装する研究を行い、さまざまなアプリケーションへの適用を可能とするオープンなプラットフォームを構築します。さらに、このプラットフォームの運用を通して、ビッグデータを活用するためのエコシステムとオープンプラットフォームのあり方について検討し、データセンター事業者などへの技術移転を通した産業応用を目指します。

研究課題2 ビッグデータを活用するデータ処理技術の開発

社会に埋め込まれるさまざまな高精度センサー(ドライブレコーダー、監視カメラ、航空機・人工衛星)を通じて得られる、異種・大量データに対して、深層学習処理基盤を用いた解析を行い、省人化や新たな社会サービス創出につなげます。

また、確率モデリング技術と大規模エージェントシミュレーション技術を融合し、例えば工業分野における組み立て作業工程の最適化や大規模構造物の診断、政策分野における地域振興のための意思決定支援、サービス分野における高齢者の健康推移・将来予測などの適用を目指します。

さらに、データを特徴づける要素が多いもののデータ量が十分でないヘルスケア・ゲノム解析・IT創薬などの分野におけるデータを対象に、独自のアルゴリズムを実装し自動的に実行する汎用ツール・ライブラリを開発します。ABCIとTSUBAME3.0上で効率的に並列計算処理を行うことができるシステムとして実装し、大規模な実データでの評価を行います。

用語説明

[用語1] オープンイノベーションラボラトリ(OIL) : 経済産業省が2016年度から始めた「オープンイノベーションアリーナ」事業の一環として行われるもので、卓越した基礎研究に基づく技術シーズをもつ大学などに、産総研が研究拠点を設置し、その大学と産総研が集中的・組織的に研究を行うことにより、技術の実用化・「橋渡し」の加速や、「橋渡し」につながる目的基礎研究の強化を目指すものです。これまで、2016年4月に名古屋大学と共同で「産総研・名大 窒化物半導体先進デバイスオープンイノベーションラボラトリ」(GaN-OIL)を、2016年6月に東京大学と共同で「産総研・東大 先端オペランド計測技術オープンイノベーションラボラトリ」(OPERANDO-OIL)を、また同月に東北大学と共同で「産総研・東北大 数理先端材料モデリングオープンイノベーションラボラトリ」(MathAM-OIL)を、2016年7月に早稲田大学と共同で「産総研・早大 生体システムビッグデータ解析オープンイノベーションラボラトリ」(CBBD-OIL)を、2017年1月に大阪大学と共同で「産総研・阪大 先端フォトニクス・バイオセンシングオープンイノベーションラボラトリ」(PhotoBIO-OIL)を設立しています。

[用語2] 深層学習技術 : 極めて大規模な階層構造を用いて、データが持つ規則性やパターンを自動的に学習することにより、未知のデータに対する予測や分類を可能にする技術です。データからパターンを学習する技術は一般に機械学習と呼ばれ、さまざまな手法が存在しますが、深層学習はパターンを階層的に表現して学習する点に特徴があります。現在では、人間の脳の神経回路を模倣した人工ニューラルネットワークと呼ばれる機械学習手法を大規模化(深層化)したものや、それらを用いた認識・解析技術全般を指して深層学習技術と呼ぶことが多いです。2010年頃から音声や画像処理分野で適用され従来方法を大きく超える性能を示したことで注目を集め、既にさまざまな分野で実用化されています。大規模な計算資源を必要とするもので、近年の計算機技術の進歩により、初めて可能になりました。

[用語3] AI橋渡しクラウド(ABCI) : 産総研が実施する2016年度第2次補正予算「人工知能に関するグローバル研究拠点整備事業」(総事業費195億円)の一環として構築する計算機「人工知能処理向け大規模・省電力クラウド基盤(AI Bridging Cloud Infrastructure、ABCIという)です。世界最高水準の機械学習処理性能を提供するAIのためのクラウドで、産学連携のための計算インフラとして2017年度中に稼働予定です。機械学習用の性能目標は130ペタフロップス以上です。

[用語4] TSUBAME 3.0/2.5/KFC : 東工大に設置されたGPUによって加速された、我が国を代表する大規模クラスター型スーパーコンピューター群です。TSUBAME2.0は2010年に稼働し、2013年に2.5にアップグレードされて、その性能は単精度で17.1ペタフロップス、倍精度で5.7ペタフロップスと世界でもトップクラスです。TSUBAME-KFCはスパコンの電力や冷却効率の究極を探訪し、かつTSUBAME3.0のプロトタイプとして開発され、油浸冷却や種々の電力制御技術によって電力効率・世界ランキングを示すGreen500では世界一を2013年と2014年に達成し、更に機械学習・ビッグデータ用のアップグレードがなされて1ラックで1.5ペタフロップスの性能を誇ります。TSUBAME3.0は2017年8月に稼働予定です。

お問い合わせ先

(RWBC-OILに関すること)

国立研究開発法人産業技術総合研究所
産総研・東工大 実社会ビッグデータ活用オープンイノベーションラボラトリ
副ラボ長 小川宏高

Tel : 029-861-3092

取材申し込み先

国立研究開発法人産業技術総合研究所
企画本部 報道室

E-mail : press-ml@aist.go.jp
Tel : 029-862-6216 / Fax : 029-862-6212

東京工業大学 広報センター

E-mail : media@jim.titech.ac.jp
Tel : 03-5734-2975 / Fax : 03-5734-3661