• Home
  • News
  • Preferred Networksの深層学習用スーパーコンピュータMN-3がスーパーコンピュータ省電力性能ランキングGreen500で世界1位を獲得

News

Preferred Networksの深層学習用スーパーコンピュータMN-3がスーパーコンピュータ省電力性能ランキングGreen500で世界1位を獲得

21.11 Gflops/Wの超省電力性能を実現

2020.06.23

株式会社Preferred Networks(本社:東京都千代田区、代表取締役 最高経営責任者:西川徹、プリファードネットワークス、以下、PFN)と国立大学法人神戸大学(本部:神戸市灘区、学長:武田廣、以下、神戸大学)は、共同開発した超低消費電力の深層学習用プロセッサーMN-Core™を搭載した、PFNの深層学習用スーパーコンピュータMN-3が、最新のGreen500*1リストにおいて、世界第1位に認定されたことを発表します。

PFNの深層学習用スーパーコンピュータMN-3

PFNの深層学習用スーパーコンピュータMN-3

MN-3は、スーパーコンピュータの電力あたりの演算性能(省電力性能)を示すHigh Performance Linpack(HPL)ベンチマーク*2で21.11Gflops/W*3(1W・1秒あたり約211億回の演算)の処理性能を実現しました。

これは、Green500リストにおける歴代の最高性能(18.404Gflops/W、2018年6月)の1.15倍であり、世界が競い合う「深層学習用スーパーコンピュータの超低消費電力化」において、MN-CoreおよびMN-3の技術が世界をリードするものであることが証明されました。

MN-3は、JAMSTEC (国立研究開発法人 海洋研究開発機構) 横浜研究所 シミュレータ棟に設置され、2020年5月より稼働を開始しています。

今回の測定に使ったシステムは、MN-3全体のうち40ノード、MN-Core160個です。

  • ピーク性能(理論値):3.92Pflops
  • 連立一次方程式を解く計算速度(HPLベンチマーク):1.62Pflops
  • 消費電力1Wあたりの性能:21.11 Gflops/W

https://www.top500.org/system/179806/
(リンク中のCores: 2080の内訳はMN-Core 160個、Intel Xeon 1920個です。HPLベンチマークでは主にMN-Coreが演算を担当しています)

今回の省電力性能を達成した主な技術は次の通りです。

1.超低消費電力を実現する深層学習専用回路を持つ「MN-Core」
MN-Coreは、PFNと神戸大学が、理化学研究所AICS/R-CCSの協力のもとに開発しました。

MN-Coreボード

MN-Coreボード

2.高速・高効率のノード間データ転送を実現するインターコネクト「MN-Core DirectConnect」

3.HPLベンチマークの中核部分である倍精度行列積演算を効率化する最適化技術
この最適化技術は深層学習の計算処理においても有効であり、深層学習計算の効率化にも応用していきます。

4.多数のMN-Coreを集約して電力効率を最大化する技術

電力消費による環境負荷と運転コストを大幅に削減したこれらの技術は、次々世代深層学習用スーパーコンピュータの基礎技術となるだけでなく、将来の超低消費電力情報システム全般を構築する基礎技術としての応用も期待されます。

今後MN-3は、実装方法、冷却方法、MN-Core専用ミドルウェア*4の改良により、省電力性能をさらに数十%向上できる見込みです。

(参考URL)

Green500リスト:http://www.green500.org/ 
TOP500リスト:http://www.top500.org/
PFNのスーパーコンピュータについて:https://projects.preferred.jp/supercomputers/

*1:これからのスーパーコンピュータはエネルギー効率が最重要である、という見地から、2005 年に始まったプロジェクト。バージニア工科大学の Feng 教授を中心とするグループが 2007年11月から年 2回発表している。対象となるのはHPLベンチマークでTOP500 にランク入りしたシステムで、演算性能/消費電力比で順位が決まる。

*2:多様なスーパーコンピュータの性能評価法としてもっとも普及し、上位 500 システムの順位付けを出す TOP 500 で用いられているベンチマーク。巨大な連立一次方程式を直接法で解くことを要求する。最新のGreen500は、2020年6月22日のInternational Supercomputing Conference(ISC)で発表。

*3:プログラム実行において、1Wの電力で実行できる浮動小数点演算回数(単位は1秒あたり10億演算)であり、省電力性能の目安となる。

*4:ハードウェアと深層学習フレームワークとの橋渡しを行うソフトウェア。

Contact

お問い合わせはこちらまで。