White Paper

深層学習の視座

深層学習は計算機科学における革新的技術である。Preferred Networks (PFN)はこの技術を広範な応用分野にいち早く適用している。この文書は、深層学習がなぜ革新的なのかを示した上で、深層学習によって初めて可能になる様々な応用について議論する。その上で、PFNが、この領域で競争力を持つと信じる理由について述べる。

深層学習:情報処理の革新

深層学習はITの世界を大きく変えようとしている。古典的な情報処理では、プログラマが処理の各ステップを明示的に指定しなければならなかった。深層学習では、入出力の例示を与えて深層ニューラルネットワークを訓練することでプログラミングが行われる。このことは、入出力の仕様が明示的に書きくだすことの難しい問題、たとえば画像認識やがんの診断などをITによって自動化することに道をひらく。

深層学習によるプログラミングの変化は、1940年代にデジタル計算機が発明されて以来の大きな変革であることは間違いない。深層学習によって、情報システムで解ける問題の範囲が、ロボティクス、自動運転、がん診断、創薬、スポーツ解析など、格段に拡がっている。PFNでは、深層学習を適用することで新たな価値を生むことのできる分野において、先進的な企業・組織と戦略的な協業を行っている。以下にいくつかの例を示す。

がん診断

PFNは、国立がんセンターと血液中の細胞外RNAを分析することにより、がんを診断する試みを行っている。RNAは通常細胞内にあるが、その断片が細胞外に出てくることがあり、exRNAと呼ばれる。血液中のexRNAの発現量を調べることで、様々な種類のがんを診断できることが期待されている。科学者たちは、4,000以上の種類があるexRNAのうち、それぞれのがんに支配的に効くものを探していた。PFNのチームは、4,000種以上のexRNA発現量全部による総合的なパターンを深層学習によって解析することにより、今までよりも高い診断精度を得ることに成功した。

血液検査によるがん診断のステップ。血液サンプルは遺伝子シーケンサで分析され、4,000種を超えるexRNA発現量が深層ニューラルネットワークで解析される。

エンターテインメント

深層学習はエンターテインメント業界も変革しつつある。PFNのCrypkoは、最新の深層生成モデルを使って、訓練データセットに現れない、すなわち他人の著作権を侵害しない、独自のキャラクタを事実上無限に生成することができる。また、複数のキャラクタを合成して、それぞれの特徴を併せ持ったキャラクタを生成することもできる。

Crypkoにおけるキャラクタの合成。上の2名のキャラクタを合成することで、下の段にあるような、元キャラクタの特徴を組み合わせた新しいキャラクタを生み出すことができる。

スポーツ解析

プロ野球やサッカーなどのスポーツは、今では大量のデータを生成している。より強いチームを作るためのデータ解析はすでに広く行われている。しかし、サッカーなどのチームスポーツにおいては、ボールを保持していない時の選手の貢献を定量化することは技術的に難しかった。すべての選手の状態を全体的に分析できる深層学習は、このような貢献を可視化する。PFNは、Sports Technology Lab社(STL)と共同で、サッカー分析における深層学習の利用を進めていて、プレー解析アルゴリズムおよび選手の姿勢推定アルゴリズムを開発している。STL社はこの技術に基づく製品のリリースを2019年に発表した。

サッカーの解析例。選手の姿勢の認識

選手の位置と向き

戦術レベルの分析

製油所の最適化

PFNは、JXTGホールディングス社と共同で製油所の最適化・自動化のための共同研究を行っている。典型的な製油所は、数百のプロセスと何千ものセンサ・アクチュエータを持つ、極めて複雑なシステムである。製油所が生産する石油化学製品の生産量は極めて大きいので、僅かな生産性の向上が大きなコスト削減につながる。PFNの深層学習技術と最適化技術を組み合わせることにより、巨大で複雑な製油所の最適化・自動化を狙っている。

ロボティクス

2018年10月のCEATEC Japanで、PFNはトヨタ自動車のHSR(Human Support Robot)を用いた全自動お片付けロボットを展示した。このロボットは、家庭のリビングルームに散らかっている衣類や玩具などを識別し、予め指定された場所に片付ける。これまでの画像認識技術やロボット制御技術では、このような自由な環境での作業は困難だった。深層学習による世界最高レベルの画像認識と、それぞれの物体の姿勢認識を利用して、PFNはこの難しいタスクを解くのに成功した。このロボットはさらに、人間の音声やジェスチャによって、直感的にコントロールすることもできる。

CEATEC Japan 2018で展示された自動お片付けロボット。ロボットは、リビングルームの床に散らかった様々な物体を画像認識する

さらに物体の姿勢を認識して正しく掴み上げる

教育

深層学習は、新しいタイプのプログラミング、すなわち例示による「帰納的プログラミング」を可能にする。プログラミングの考え方が今までと全く異なるため、プログラミング用の教材も新たに作る必要がある。PFNは文部科学省に協力して、帰納的プログラミングの教材を用意している。

「火星語認識器」とそれを使った小学校での授業の様子。「火星語」の数字を子供たちが考え出し、それを認識する深層ニューラルネットワークを訓練する

このツールを使って「帰納的プログラミング」の概念を説明

上記のように、深層学習で可能になる様々な応用の一端を示した。これらの応用は、私たちの眼前に広がる可能性のごく一部にすぎない。PFNは、今後も様々な業界の先進的企業と協力して、これらの可能性を追求していく。

次に、深層学習が必要とする計算環境について考えてみよう。

PFNの計算環境

深層学習は今までのプログラミングと大きく異る計算負荷(ワークロード)を持つ。このため、今までのコンピュータ・アーキテクチャでは、深層学習が必要とする計算を効率的に実行できない。PFNは、深層学習の技術開発を加速するために、深層学習に特化した計算環境に大規模な投資を行っている。PFNのように、ハードウェアからソフトウェアに渡るフルスタックの深層学習技術を持つ企業は、世界でも数少ない。

Chainer™:柔軟な深層学習フレームワーク

Chainer はオープンソースの深層学習フレームワークである。2015年5月に、PFN社内の研究開発を加速するために開発され、同年6月にオープンソースとして公開された。深層学習に関連する技術は非常に活発に研究開発されていて、毎週のように新しい種類の深層ニューラルネットワークが提案されている。Chainerの “define-by-run” 機能、すなわち深層ニューラルネットワークを入力データを見ながら動的に構成できる機能によって、新たなアイディアをいち早く再実装し、テストすることが可能になった。この “define-by-run” 機能は、近年になってGoogleのTensorFlowやFacebookのPyTorchにも取り入れられている。

Chainerは、多くのデータサイエンティストが常用するプログラミング言語Pythonの自然な拡張として設計され、さらにNVIDIA社が提供するCUDAとシームレスに統合されていて、GPU上での効率的な計算を可能にする。これにより、Pythonに慣れたプログラマであれば、短時間で深層学習のシステムを開発することができ、既存のデータやデータ分析アプリケーションと統合することができる。2019年現在、ChainerはNVIDIA、Intel、AWS、OpenPowerなどの主要プラットフォームでサポートされている。

Optuna™:ハイパーパラメータの最適化ツール

現在の深層学習においては、性能向上のために、訓練反復数、ニューラルネットワークの層やチャネルの数、学習率、バッチサイズなどのハイパーパラメータのチューニングが欠かせない。多くの開発者が手作業の試行錯誤によって行っているこの作業を自動化するのがハイパーパラメータ最適化ツールOptunaである。Optunaは、PFNが開発したオープンソースソフトウェアであり、ベイズ最適化などの最新技術を利用して効率的な最適なハイパーパラメータの組み合わせを探索することができる。OptunaはChainerと組み合わせるだけでなく、汎用のブラックボックス最適化ツールとして利用することもできる。

スケーラブルな深層学習インフラストラクチャ

深層学習技術が進化するにつれ、より大きく複雑な深層ニューラルネットワークが使われるようになり、それらの訓練は単独のGPUでは時間がかかりすぎるようになってきている。このため、深層学習のための計算インフラはスケーラブルである必要がある。2019年9月現在、PFNは3台のGPUクラスタ(スーパーコンピュータ)を持ち、合計で2,560基のGPUを運用している。合計の計算能力は200ペタフロップスに達する。加えて、私たちは独自設計の深層学習アクセラレータチップを開発している。このチップは、2020年に稼働予定の大規模クラスターMN-3に用いられ、電力あたりの性能を飛躍的に高める予定である。

1,024基のNVIDIA社 Volta GPUを持つスーパーコンピュータMN-2

PFNの独自設計による深層学習アクセラレータチップMN-Core。2020年に我々のデータセンタでの利用を予定している

PFNの組織としての強み

PFNは若い会社だが、既にその実績を証明している。例えばトヨタ、FANUC、NTTなどから戦略的な投資を受け、また2017年のFinancial Times 2017 ArcelorMittal Boldness in Business Awards – Technology Award や、 Forbes Japan’s CEO of the Year 2016.など国際的な賞も受賞している。

「最新技術を最短時間でお客様に届ける」のがPFNのミッションである。PFNの研究員、エンジニアは常に研究コミュニティやオープンソースコミュニティなどの動向をウォッチし、コンピュータサイエンス(特に深層学習)やロボティクスの最新技術に精通している。新しいアイディアは、すぐに社内でテストされ、良いものであれば私たちのソリューションにただちに取り入れられる。これは、PFNの研究員・エンジニアがそれぞれワールドクラスの技術力を持っていることにもよるが、加えて、私たちは次の4つの “Value Statement” を持っていて、常に「PFNとは何か」を私たち自身に問い続けていることにもよる。

  • Motivation Driven(熱意をもとに)
  • Learn or Die(死ぬ気で学べ)
  • Proud but Humble(誇りを持って、しかし謙虚に)
  • Boldly do what no one has done before(誰もしたことがないことを大胆に為せ)

このように、PFNにとって最も重要な経営資産は社員である。研究員やエンジニアの多くは、国際学生プログラミングコンテスト(ICPC)、TopCoder、Kaggle、国際情報オリンピックなどで国際的に高い評価を得ている。同時に、PFNは多様な才能の集まりであり、コンピュータサイエンスのみならず、様々な専門分野を持ち、また世界各国の出身者の集合体でもある。深層学習とその応用分野における世界トップレベルの才能と、他に類を見ない計算資源により、PFNは深層学習における世界のプレーヤとなっている。

社内のテクノロジーカンファレンス “PFN Day”.

Contact

お問い合わせはこちらまで。