One Big Net For Everything: ONE

深層学習 強化学習

概要

2018.02 時点のテクニカルレポート.

Basic Ideas

1. goal input vectors

2. Incremental black box optimization

既にいくつかのタスクを獲得した時点で新しいタスクを学習する時、以前の状態のONEを複製して、 そこから学習を始めることで高速にタスクの獲得が完了する. 自動的な転移学習 (algorithmic transfer learning) である.

3. CM system

"learning to think" を読め

読みます。