ディープラーニングの産業応用とそれを支える技術
- 2. 株式会社Preferred Networks (PFN)
l 設 ⽴:2014年3⽉
l 所在地:東京本社、カリフォルニア州サンマテオ(⽶国⼦会社)
l 社員数:⽇本約100名、⽶国8名
l 出資者:トヨタ、FANUC、NTT
2
⼈⼯知能技術
(ディープラーニング)
産業応⽤
(Industrial IoT)
パートナー
顧客
- 14. ⾃動運転応⽤(2/3):LIDARなど豊富なセンサー vs. カメラ中⼼
l 多種センサー:⾼精細な深度情報 ←→ ⾒た⽬の課題、⾼コスト(改善中)
l 画像センサー中⼼:低コスト ←→ 深度・遠⽅情報が不⾜し低精度(改善中)
Lyft and Drive.ai partner on Bay Area self-driving ride-hailing
pilot, Darrel Etherington, TechCrunch
⾬天夜間⾛⾏のデモ動画あり [youtube]
Drive.ai
Tesla Autopilot:前後左右遠近8種類のカメラ+超⾳波+レーダー
https://www.tesla.com/autopilot
- 15. ⾃動運転応⽤(3/3):個別モジュール vs. ⼀気通貫モデル
l 個別モジュール:旧来の認識→経路計画→制御の⼀部をディープラーニングに
l ⼀気通貫:センサー⼊⼒から直接アクセル・ブレーキ・ハンドル制御を出⼒
Adding Navigation to the Equation: Turning Decisions for
End-to-End Vehicle Control [Hubschneider+, 2017]
Perception, Planning, Control, and Coordination for
Autonomous Vehicles [Pendleton+, 2017]
- 18. エンターテイメント応⽤(2/2):モーション⽣成, セレブ顔合成
Progressive Growing of GANs for Improved Quality,
Stability, and Variation [Karras+, 2017]
Phase-Functioned Neural Networks for Character Control [Holden+, 2017]
https://www.youtube.com/watch?v=Ul0Gilv5wvY
l 3DCGキャラの⾃然な動きや、実在しないセレブの⾼精細画像も合成
- 25. ハードウェア(2/2):よりフレキシブルなCPU、より効率の良いASIC
l CPU: GPUよりプログラミングが容易、DL特化の命令セット+ライブラリの導⼊
l ASIC: 拡張性は低いが、必要な機能を固定すれば消費電⼒あたりの性能は⾼い
Machine Learning Gets a 2.2x Performance Boost
MKL MKL-DNN
AVX-512: 主にベクトル演算を⾼速化する
Intel Xeon向け新命令セット
Intel Python
Apple iPhone X with
A11 bionic neural engine
• 3D顔認証(Face ID)
• 画像認識(animoji変換)
• リアルタイムAR処理
ルネサス スマートカメラSoC R-Car V3M
• ディープラーニング専⽤回路内蔵
• 画像認識アクセラレータ
• Image Signal Processor
- 28. AIビジネスコミュニティとしてDeep Learning Lab (DLL)を⽴ち上げ
l AzureとChainerを主要プラットフォーム・フレームワークとするコミュニティ
l https://dllab.connpass.com/
l DLLコミュニティイベント4回(159→239→260→386名)
l NVIDIA Deep Learning Instituteとの共催イベントを地⽅4都市開催
l 参加企業のキカガク様のセミナー、Ridge-i様のNHK⽩⿊映像カラー化事例等
https://www.kikagaku.co.jp/services/dnn-seminar/ 第4回イベントの様⼦(Ridge-i様撮影)
- 31. l データ解析に必要なものが全てパッケージング(Windows/Linux両対応)
l 分析:開発環境 / データ基盤 / 機械学習ツール
l GPUサポート:CUDA / cuDNN
l DL:フレームワーク / 関連ツール
ChainerおよびCV/RLはAzure Data Science VMにプリインストール済み
https://azure.microsoft.com/en-us/services/virtual-machines/data-science-virtual-machines/
- 33. 予測環境の分離と標準化(2/2):MSとFacebookのONNXフォーマット
l Open Neural Network Exchange Format: Protobufによるネットワーク表現
l 他にKhronos groupのNNEF等も今後出てくる
message ModelProto {
optional int64 ir_version = 1;
:
optional GraphProto graph = 7;
};
message GraphProto {
repeated NodeProto node = 1;
optional string name = 2;
repeated TensorProto initializer = 5;
optional string doc_string = 10;
repeated ValueInfoProto input = 11;
repeated ValueInfoProto output = 12;
repeated ValueInfoProto value_info = 13;
}
message TensorProto {
repeated int64 dims = 1;
optional DataType data_type = 2;
optional Segment segment = 3;
repeated float float_data = 4 [packed =
true];
:
optional string name = 8;
}
message NodeProto {
repeated string input = 1;
repeated string output = 2;
optional string name = 3;
optional string op_type = 4;
repeated AttributeProto attribute =
5;
optional string doc_string = 6;
}
Node
Tensor
Tensor
- 36. ⾼速化・⼤規模化(3/3):分散学習の⼤規模を⽀えるノウハウ
l GPUとバッチサイズを増やせば⾼速化 ←→ モデル同期頻度が減るので精度悪化
l パラメータ調整、NVIDIAライブラリの有効活⽤、Infiniband等の⾼速通信…
GPUとデータセットを並列にしAll-Reduceで勾配情報の共有
各GPUの毎回の処理数=バッチサイズが⼤きすぎると破綻
Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour [Goyal+, 2017]
ChainerMN: Scalable Distributed Deep Learning Framework
[Akiba, Fukuda, Suzuki, 2017]
- 38. ChainerMN on Azure: 伸び続ける学習時間を解決
l Azure内のInfiniBand環境を活⽤し128GPUで約100倍の⾼速化を実現可能
l XTREME DESIGN様のHPCテンプレートでChainerMN環境を10⽉から提供
1
10
100
1 2 4 8 16 32 64 128
https://www.slideshare.net/hironojumpei/chainermnxtreme-dna-hpc-cloud
- 40. まとめ
l ディープラーニングの産業応⽤
l 画像認識アプリケーションを中⼼とした商⽤化が加速
l 多種多様なデータを⽤いた複雑な実問題への取り組みも開始
l それを⽀える技術
l ソフトウェアとハードウェア双⽅の激しい開発競争:⾼速化、⼤規模化、標準化、
l ユーザー層の拡⼤、研究者だけでなく技術を使いこなせるエンジニアの育成
l Preferred Networksの取り組み
l Chainerをコアに、最先端の研究やMS等パートナーとの協業、⼤規模DL基盤の整備
l 製造業や⾃動運転、バイオヘルスケアを中⼼としたビジネス展開を推進
Preferred Networksでは⼀緒に戦うパートナー・仲間を募集しています