機械学習とディープラーニングの基本

ディープラーニングは機械学習の一種で、これまで人工知能(AI)が解決できなかった複雑な問題を高い性能で処理するので、企業の注目が集まっている。ディープラーニングと従来の機械学習との仕組みの違いを説明し、併せて、ディープラーニングによって可能になる事柄を事例とともに紹介する。

シェアする

2016年にGoogleの開発したアルファ碁が、囲碁の世界チャンピオンであるイ・セドルに勝利したのは記憶に新しい。このアルファ碁に使用された技術が、ディープラーニング(深層学習)である。ディープラーニングは機械学習の一種で、これまで人工知能(AI)が解決できなかった複雑な問題を高い性能で処理するので、企業の注目が集まっている。

とはいえ、ディープラーニングについていまいち理解できていない人も多いだろう。そこで、ディープラーニングと従来の機械学習との仕組みの違いを説明する。併せて、ディープラーニングによって可能になる事柄を事例とともに紹介しよう。

ところで機械学習とは何なのか?

そもそも機械学習とはいかなる仕組みなのか。まずは次の画像をご覧いただきたい。そうヒトの顔だ。では誰がこの顔を描いたのか。

実は機械がこの絵を生み出したのだから驚きだろう。17世紀の画家レンブラントの絵を大量に入力し、機械に学習させることで、あたかもレンブラントが描いたような絵を出力してみせたのだ。この機械が行なった処理こそ、まさに機械学習の本質的部分である。

機械学習が驚くべき技術なのは、その仕組みにある。われわれ人間は、ヒトの顔を他の動物の顔から識別できる。ところが、機械にこれを識別させるのは容易ではない。従来、この部位はヒトの顔で、中央にヒトの鼻があり…というように、判別する方法(アルゴリズム)を機械に教える必要があった。

つまり人間がヒトの顔を識別するプログラムを作り、機械はそれに従って答えを導くだけだった。ところが、機械学習はこのような従来の手法とまったく違う仕組みで答えを導き出す。

ヒトの顔のデータを大量に入力し、機械が自ら学習してヒトの顔だと識別するのだ。機械がどんな方法でヒトの顔を識別するのかは重要ではない。大量の入力データさえあれば、判別する方法を与えなくても学習を自動的に行ない答えを導出するのが、機械学習の核心である。

機械学習とディープラーニングの違いはどこに?

Googleが開発したアルファ碁によって、ディープラーニングが一気に世間に広まったと言っても過言ではない。ではディープラーニングとはいかなる仕組みなのか。機械学習とは異なるものなのか。

結論を言うと、ディープラーニングは機械学習の一種である。アルファ碁の場合、囲碁の棋譜を集めて囲碁の打ち方を機械が自動的に学習したのだ。まさに先述の機械学習の説明と同じである。

ではディープラーニングは、従来の機械学習とどの点が違うのか。キーワードは「特徴量」だ。

具体例を示そう。顔の美しさを評価したいとする。年齢や肌つや、髪型などさまざまな要因によって、美しさは決まるだろう。この年齢などの要因が「特徴量」である。

機械学習では、機械が解釈できるように特徴量は数値化される。機械に最適な数値を求めさせれば、美しい顔を判定できるのでは、と勘のいい人なら気づくだろう。

ところが従来の機械学習だと、年齢などの特徴量を人間が機械に教える必要があった。他方ディープラーニングでは、特徴量自体をデータから決める仕組みになっている。だから思いもよらない特徴量が、美しさを決定していると判明することもありうる。ディープラーニングが画期的な機械学習だと言われるのは、この点にある。

そうは言っても、機械が本当に特徴量を導けるのか疑問に思うだろう。実はディープラーニングの理論自体は、1980年代から盛んに研究されたニューラルネットワーク理論に基づく。ニューラルネットワークは入力層・中間層・出力層に分かれ、入力層に与えられたデータを中間層で処理し、出力される仕組みである。この中間層が多層構造であるのがディープラーニングであり、深層(ディープ)学習と呼ばれる所以である。

話はそれたが、着目すべきがこの中間層だ。中間層で処理されるのが、特徴量の抽出である。与えられたデータから特徴量を抽出し、学習することで最適な値を導き出す。美しさの例だと、顔のデータから特徴量を抽出し、学習によってベストな美しさを導出するのがこの中間層なのだ。

ニューラルネットワーク理論は長いあいだ下火だったが、再び2012年に注目される。物体を認識するコンテストで、ディープラーニングの基となる技術(ディープ・ビリーフ・ネットワーク)を使うことで誤識別率15.3%(従来は25.7%)という圧倒的な精度で優勝した。この研究を進めていたのが、トロント大学のHinton教授である。

ニューラルネットワークという理論はあったのに、なぜディープラーニングのような人間さながらの作業を行なう機械がこれまで存在しなかったのか。その原因は、大量のデータを素早く処理できるコンピュータ自体がなかったということに尽きる。物体の識別や囲碁の次の手を考えるために、月単位もかかっては話にならない。ディープラーニングによる処理を可能にしたのは、コンピュータの高速化が大きい。

気になるのは、ディープラーニングで可能なこと

囲碁の例に話を戻すと、ディープラーニングを搭載したアルファ碁が囲碁のチャンピオンに勝利を収めた。囲碁はボードゲームの中でも、チェスや将棋と較べて複雑度(局面数の多さ)の高いゲームだ。アルファ碁が囲碁でチャンピオンに勝つのは難しいと当初予想された。従来の技術だとプロには到底及ばない実力しか発揮できなかったためだ。ところが、アルファ碁はその予想を覆した。このことは、ディープラーニングが極めて優れた機械学習だと証明したのに等しい。

Googleなどの企業がディープラーニングに熱狂するのは、いくらでも応用の利くのが大きい。つまり特徴量を使って機械に答えさせる問題なら、すべてディープラーニングによって処理可能だろう。たとえば、画像認識や言語認識といったパターン認識をはじめ、株価の変動のような注目する量の変化から未来の株価を予測(時系列解析)することは、ディープラーニングが得意とする領域である。みずほフィナンシャルグループといった金融機関が株価を予測する人工知能の開発に投資するのも、ディープラーニングのような機械学習によって実現可能だと踏むからに他ならない。

ディープラーニングは万能なのか?

ディープラーニングはまさに画期的な技術である。囲碁や株価予想の例は、複雑な思考が実現可能なだけでなく、応用の効く仕組みであることを示している。

しかしヒトのように心をもった知能にまで拡張するためには、さらなる飛躍が必要だ。ヒトが行なう複雑な思考のすべてをディープラーニングによって置き換わるかは不確定である。しかしここで提示した例を確認しただけでも、ディープラーニングが多くの分野で期待させる技術なのは想像つくであろう。


<参考>

  1. 【連載第1回】ニューラルネットの歩んだ道、ディープラーニングの登場で全てが変わった。(日経BigData)
    http://business.nikkeibp.co.jp/article/bigdata/20150419/280107/
  2. そもそもディープラーニングとは何か?(シンクイット)
    https://thinkit.co.jp/story/2015/08/31/6364
  3. みずほFGが日本株取引にAI導入へ、MiFID2に先行-関係(ブルームバーグ)
    https://www.bloomberg.co.jp/news/articles/2017-09-20/OWKB5L6JTSE801
  4. コンピュータ囲碁(Wikipedia)
    https://ja.wikipedia.org/wiki/コンピュータ囲碁
  5. 大関真之 (2016)『機械学習入門 ボルツマン機械学習から深層学習まで』オーム社.
    瀧 雅人(2017) 『これならわかる 深層学習入門』講談社.
  6. 堅田洋資、菊田遥平、谷田和章、森本哲也(2017)『フリーライブラリで学ぶ』機械学習入門.
  7. 上野晴樹(2017)「AlphaGoのAI情報論的考察ー囲碁がサイエンスとなった意義ー」,『信学技報』2017-09, 25-30, 電子情報通信学会.
  8. 浅川信一(2016)「深層学習をめぐる最近の熱狂」,「基礎心理学研究」, 35(2),149-162, 日本基礎心理学会.
  9. 植田康孝、菊池修登(2016)『「人工知能」が導く棋界の進化: 「シンギュラリティ」(技術的特異点)に対する「受容」と「焦燥」』141-165, 「江戸川大学紀要」27, 江戸川大学.