人工知能してみる

人工知能の中の人が機械学習とか統計とかAI的なことを書き連ねます

SCAN: 視覚概念による抽象的な階層構成の学習

こんにちは、Grahamianです。
先日発表されたDeep Mindの論文がなかなかに衝撃的なのでザックリと紹介を書いてみます。
深く読めていないので誤りがあったら指摘願います。

SCAN: Learning Abstract Hierarchical Compositional Visual Concepts
deepmind.com

概要

Deep Mindが新しいニューラルネットワークコンポーネント SCAN(Symbol-Concept Association Network)を発表した。
SCANは人間の視覚と単語の獲得を模倣したモデルである。
これにより視覚と単語の概念を結びつけ、それらを階層化して学ぶことができる。
かつてのモデルに比べて少量の学習データから学習することが可能。
そして経験したことの無い概念でも、その概念に対応する視覚例を想像することができる。

新規性

少量の画像と単語の組み合わせから学習できる
概念を階層化し経験の無い概念でも視覚例を想像させることができる

やってることは?

壁、床、オブジェクトのの3つが存在する画像とそれを見るカメラが存在する。
この画像は色や回転などで変化が生じる。
f:id:Grahamian:20170716212247g:plain
これは赤ちゃんの視覚を単純化したものである。
この画像に対して言語入力を行う。
"red suitcase, yellow wall"
このような入力を繰り返すことでSCANは次第に"red", "suitcase", "yellow", "wall" の概念を覚えていく。

これを利用して"AND", "IS", "IN COMMON"のような論理演算子を覚えさせることもできる。
例えば"golden delicious"(黄色いリンゴのこと)のイメージと"golden delicious IS yellow AND apple"という言語入力と画像を与える。

このようにして学んだ単語概念をもとに似た概念を結合したりして新しい概念を作るように指示することができる。
これによって経験したことの無い概念でも視覚例を想像させることができる。
たとえば、青いりんごは"blue AND apple"、Granny Smith(青りんご)は"granny smith IS golden delicious IGNORE yellow, AND green"といった具合だ。

何が嬉しいの?

既存の概念を再構築することで新しい概念を学ぶことができる。
これはまさに人間の学習方法である。
人間のように教師なしで様々な物事を学ぶアルゴリズム開発の大きな一歩といえる。

いやーDeep Mindの進化は凄まじいですね。
世界の技術力に対して2歩は先を行っていると言っても過言ではないですね。
さらなる進化に注目です。