世界454チームが参加した物体検出コンペティション Google AI Open Images – Object Detection Trackで準優勝
2018.09.07
株式会社Preferred Networks(本社:東京都千代田区、代表取締役社長CEO:西川徹、以下、PFN)は、Kaggle※1の物体検出コンペティション「Google AI Open Images – Object Detection Track」に挑戦し、出場した454チーム中で2位になりました。
物体検出(Object Detection)技術は、コンピュータビジョン分野の主要研究課題の一つであり、自動運転、ロボティクスの基礎技術としても非常に重要です。これまでもImageNetやMS COCOなどの大規模データセットを使った検出精度を競う大会が研究コミュニティーの求心力となって、そのアルゴリズムや物体検出技術を飛躍的に向上させています。
2018年7月3日~8月30日の期間で開催された、Kaggleの物体検出コンペティション「Google AI Open Images – Object Detection Track」は、今年Googleが新たに公開したOpen Images V4※2が使用され、これまでにない大規模かつ複雑なデータセットでのコンペティションとして、多くの研究者の注目を集め、世界各国から454チームが参加しました。
PFNは分散深層学習ライブラリChainerMNの開発チームを中心に、深層学習による画像処理ライブラリChainerCV開発チーム、自動運転、ロボティクス分野の有志メンバーが集まり、チーム「PFDet」としてこのコンペティションに挑戦しました。今回、今年7月に新しく構築したNVIDIA(R) Tesla(R) V100 32GB 512基の大規模クラスター「MN-1b」を初めてフル稼働させ、さらに、深層学習を並列化して大規模データセットでの学習を高速化する技術や、自動運転、ロボティクスの各分野で培ってきた研究成果を総合的に投入しました。その結果、最終順位は1位チームと0.023%の僅差のスコアで準優勝することができました。
本コンペティションの解法に関する論文「PFDet:2nd Place Solution to Open Images Challenge 2018 Object Detection Track」を公開しました。https://arxiv.org/abs/1809.00778
その内容は、ドイツで開催されるEuropean Conference on Computer Vision (ECCV)2018の併設ワークショップにおいて発表します。
また、本コンペティションで開発した技術の一部はChainerMNおよびChainerCVの機能として公開予定です。
- 分散深層学習フレームワーク ChainerMN https://github.com/chainer/chainermn
- 画像認識フレームワーク ChainerCV https://github.com/chainer/chainercv
PFNでは、今後も画像解析や物体検出技術の研究開発に取り組み、PFNが重点事業領域とする交通システム、製造業、バイオヘルスケア分野などでの実用化を推進していきます。
※1:機械学習コンペティションのプラットフォーム
※2:170万枚の画像からなる大規模データセット(500種類の物体を計1200万個含む)