【この記事は約 8 分で読み終わります。】

チャットボットは何をしているのか? ~AIを用いた自然言語処理について~

最近よく目にするチャットボットとその仕組みを徹底解説する。

シェアする

  • RSSで記事を購読する
  • はてなブックマークに追加
  • Pokcetに保存する

chatbot

チャットボットの概要

最近「チャットボット」という言葉が世の中にあふれている。企業のWebサイトで、
「AIが質問にお答えします」

と書かれた小さなメッセージウィンドなどが表示されたりしているのをご覧になられた方もおられるだろう。キーボードで質問事項を入力し、問い合わせをすると、それに即座に答えてくれるのは、人間ではなく、どんどんAIを利用した「チャットボット」に置き換わっている。2018年時点ではチャットボットを提供している企業も増え、Buffalo やI・O DATAなどのコンシューマー向けIT機器を販売している会社のWebサイトでは、製品についての問い合わせにAIベースのチャットボットを導入している。これにより24時間365日、人間の代わりにユーザーからの質問に答えてくれるシステムを構築しているのだ。

チャットボット,仕組み

(出典:http://buffalo.jp/support_s/va/viii.html

また、もっと進化したモノでは日本マイクロソフトが提供する女子高生AI「りんな」も、LINEやTwitterで会話をできるチャットボットの一種と言えるだろう。さらにはGoogleが「Google I/O 2018」で発表した、AIが電話予約を受けるシステムも、AIを活用した「音声チャットボット」という位置付けになる。

ではチャットボットは何をやっているのだろうか。先ほど、チャットボットは「人間の代わりに質問に答えてくれる」と書いた。しかし、「何でも答えてくれる」わけではない。企業がWeb上でユーザーからの問い合わせに対して答えるという形で提供しているサービスは、あくまでもこれまでサイトに載せていた「よくある質問」つまり「FAQ」の内容を、質問者に対して提示しているだけなのだ。

ただし、そのまま載せたのではこれまでのFAQと何も変わらない。例えば、
「無線LANが上手く繋がらないんだけど、何が理由か教えて欲しい」
という場合、詳しい人であれば幾つかの原因を想定していて、どう対処すれば良いのかについてはある程度のキーワードも頭に浮かんでいるはずである。しかしITに詳しくない人の場合は、そもそも「繋がらない」という現象しかわかっていないため、解決まで丁寧に導いていく必要がある。それも、専門用語をあまり使わないようにしながら。こういうのはWebサイト上の既存のFAQでは対応できず、だからこそ人間が対応していたわけである。

つまりチャットボット化する上で重要なのは、これまでの知見をもって、トラブルの解消や疑問の解決に正しく導くというのはもちろんのこと、専門用語がわからず、そもそもその分野に明るくない人であっても、回答をキッチリと得られるだけの丁寧さを兼ね備えている事、というのが重要な要件だ。

とはいえ、質問の仕方は人によって千差万別である。これをミスなく「何を訊かれているのか」を振り分けるのは、大変難しい事だった。これを解決できるようになったのは、2010年代に入って一気に成長してきた「第3世代AI」に依るところが大きいのだ。

第3世代AIの基礎

では、このチャットボットが上手く動くようになった背後にある、第3世代AIというのはどの様なものなのだろうか。特に大きな特徴は「ディープラーニング(深層学習)による統計的な処理が可能になった事」だ。これが、大きな発展に寄与した。

では、第3世代AIの基礎となっている「ディープラーニング(深層学習)」について説明しよう。これを一言で説明すると
「人間の脳の構造を、数学モデルとして(精度の高さは別として)構築した」
ということである。と言われてもよく分からないと思うので、まずは人間がどの様に判断するのかを考えてみよう。

例えば、目の前に四本の足で歩き、時々「ワン」と鳴くものが現れたとする。おそらくあなたはこれを「イヌだ」と思う事だろう。しかし、生まれたばかりの赤ん坊はこれを見ても「イヌ」とは思わないはずだ。そもそも「イヌ」というものを知らないためである。

人間は目や耳から入ってくる情報によって、日々脳の中を更新し、これまでは知らなかった事があると、それを追加してわかるようにしていく。そして十分に情報が溜まると、
「これは初めての経験だけど、たぶん○○に近いな」
とか
「これは初めて見るけど、△△に似ている気がする」
という判断をするようになる。脳の中に整備されたデータベースと比較して、確率的に高いものを選び出すのだ。

この脳内のモデルは、言語学者のフェルディナン・ド・ソシュールによって「シニフィエ」「シニフィアン」という2つの概念で説明されている。先ほどのイヌの例で言うと、「四本足」「歩く事ができる」「ワンと鳴く」という幾つかの特徴がある。この特徴の事をソシュールは「シニフィエ」と呼んだ。つまりイヌには「四本足」というシニフィエ、「歩く事ができる」というシニフィエ、「ワンと鳴く」というシニフィエなど、複数のシニフィエから出来上がっているわけだ。もちろん、細かく言えば、他にももっと多くのシニフィエを持っている。

チャットボット,仕組み

そして、こういった幾つかのシニフィエをまとめたシニフィエがあり、これに対して日本語では「イヌ」、英語では「dog」という単語を割り当てている。この単語の事を「シニフィアン」と呼ぶ。

「深層学習」がやっているのは、まさにこれである。数多くの情報から特徴量である「シニフィエ」を抽出して、「識別器」というものを作成する。そしてこの識別器をどのレベルの精度で構築できるのかが、AIの精度に直結する。それには識別器構築のための学習データが数多く、しかも片寄りなく準備することが重要である。

チャットボットでは、AI側で「要はこれについて質問されている」という理解をしなければいけないわけだから、それを識別するためのデータが多いに越した事はない。このデータを集めるのがいかに大変であるかは、サポートセンターを経験した人はよく分かるのではないかと思う。

日本語シソーラスの充実

さて、とは言いながら日本語などの自然言語処理を行うためには、識別器が優秀であればそれで良いかというと、それだけではなかなか上手くいかない。それは日本語をはじめとした(自然)言語には、同じ言葉の言い換え方法など、表現方法がたくさんあるからだ。なので、そういう言い換えなどの辞書に当たる「シソーラス」をしっかりと整備する事が求められる。例えば、同じ様な意味合いの同義語や類義語等の整備である。どんな言語でも、同義語や類義語があり、どれを使われても同じであると認識しなければいけない。また「コーパス」という言語構造に関するデータも必要だ。

これらをどうやって精度の高いものを作るのか。AIを利用したチャットボットを構築する場合には、ここが実は大変である。今のところ業界で精度の高さに定評があるのは「クイズ番組で人間に勝つ」を目標に作られたIBMのWatson、音声通信を中心に言語について突き詰めてきたNTT系のCOTOHA、そして同じく日本語の研究を長年やってきた野村総合研究所のTRAINAだろうか。ただし、ここで紹介しなかったAIも、今後の進展によっては高い精度を出し、業界の勢力図も変わってくる可能性がある。それだけ、AIの世界は日進月歩だという事だ。

最後に:チャットボットが生み出す価値

では、こうやって精度を高めたチャットボットやその類似サービスには、どの様なものがあるのか、そしてどのような分野がチャットボット導入に向いているのかを紹介しよう。これはあくまでも筆者の私見ではあるが、これまでの導入事例を考えると、チャンスがあると思われる部分だと考えている業種業界であると考えて欲しい。

まず、「チャットボットの概要」でも紹介したが、製品に対する問い合わせについては、FAQやコールセンターなどのデータをキッチリと整備できているのであれば、導入に向くと考えて良い。このような、手順や手続きを案内するといったような、答えが決まっているものは、チャットボット化することで人間の手間を減らし、24時間サービスが可能になるなど、ビジネスチャンスにも繋がっていく。

実はAIはコールセンターとも相性が良く、Watsonを導入したみずほ銀行では、10年以上コールセンターで働いている職員の回答をデータベース化し、お客様から電話がかかってきた時、オペレーターが聞くと同時に、Speech to Text機能でテキストデータ化し、何について質問されているのかをWatsonがリアルタイムで判別し、最適な返答をオペレーターの見ている画面に表示するというシステムを構築している。

また法律相談など、士業を営んでいる方や組織も、チャットボット導入には向いている。特にこの手の士業関係の問い合わせでは、問い合わせに対する事例は揃っているものの、FAQでは専門用語が羅列されていて、一般人では自分の知りたい答えを見つけられないということが良く起こる。しかしチャットボットを使えば、自分の言葉で質問をしても、AIが何について質問されているのかを自動で判断し、それに対応する答えを自動で探し出してくれる。もちろん表示する回答内容も一般人向けの言葉に直してデータ化しておけば、「回答は見つかったけど、何を書いているのか意味が分からない」という事も起こらない。こちらも簡単な相談についてはある意味、手順や手続きの案内でしかないため、士業を営んでいる方にしても、良くある質問に回答するという「作業」に時間を取られる事なく、より高度で難易度の高いミッションに注力する事ができるようになる。

一方、向かない業界業種もある。それは相手によって回答を変えなければいけない問い合わせについてである。

例えば、学校や学習塾。これらは学習内容を理解しなければいけないが、理解力は前提となる知識量によって変わってくる。簡単に言うと、小学校4年生で学習する内容を理解できていなければ、中学校や高校の内容を理解する事はできない。そのため、学習塾が問い合わせにチャットボットを導入した場合、入塾手続きなどは導入による効果がみられるだろう。だが、問題や宿題については、答えを教える事はできるが、質問者が「何故そうなるのか」について理解できるようにはならない。そうなるには、今の理解度を事前に計測するという、チャットボットではできない事前準備が必要になる。

また、介護事業の現場でも問い合わせに対する精度の高い返答を返すチャットボットは難しいと思われる。介護対象者の要介護度、状態、その日の体調、その方の性格など、一律に決められない事が多いからだ。もちろん、一般的な対応についてはチャットボット化することでリーダーなどの負担は減ると思うし、育成機関においては重宝されるシステムにできると考えられる。

なので、まずは手順や手続きがどんな相手に対しても決まっているものはチャットボット化することで、人間はより難易度が高く、より付加価値の高い仕事に注力できるようになる。導入に関しては、自分の会社が顧客に対して行っているサービスで、定型処理になっている部分がないかを調べ、もしそういうものがあるのであればチャットボット化を検討してみてはいかがだろうか。


<参考>

  1. 今さら聞けない「AI」 ひとまずおさえておきたい「AI技術」の基礎知識(博報堂DYグループ”生活者データ・ドリブン”マーケティング通信)
    http://seikatsusha-ddm.com/article/03276/
  2. 日本語WikipediaからSolr用の類義語辞書を自動作成する(RONDHUIT)
    https://www.rondhuit.com/nlp-%E6%97%A5%E6%9C%AC%E8%AA%9Ewikipedia%E3%81%8B%E3%82%89solr%E7%94%A8%E3%81%AE%E9%A1%9E%E7%BE%A9%E8%AA%9E%E8%BE%9E%E6%9B%B8%E3%82%92%E8%87%AA%E5%8B%95%E4%BD%9C%E6%88%90.html
  3. 自然言語処理(NLP)ってなんだろう?(Qiuta @MahoTakara)
    https://qiita.com/MahoTakara/items/b3d719ed1a3665730826
  4. 対話エンジン”COTOHA”で実現するコグニティブの世界(NTT Communications)
    http://gartner-em.jp/symposium/report2017/JXP17_13A_NTTCom_DL_Rev.pdf?o=
  5. シソーラス(Wikipedia)
    https://ja.wikipedia.org/wiki/%E3%82%B7%E3%82%BD%E3%83%BC%E3%83%A9%E3%82%B9
  6. コーパス(Wikipedia)
    https://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%BC%E3%83%91%E3%82%B9
  7. Communication Engine COTOHA(NTT Communications)
    https://www.ntt.com/business/services/application/ai/cotoha.html
  8. TRAINA(野村総合研究所)
    https://www.traina.ai/
  9. 自社のデータを強みに変えるビジネスのためのAI(IBM)
    https://www.ibm.com/watson/jp-ja/what-is-watson.html
  10. Buffalo Webサイト(Buffalo)
    http://buffalo.jp/support_s/va/viii.html
  11. サポート情報(I・O DATA)
    http://www.iodata.jp/support/
  12. みずほ銀行のコールセンターで人工知能を積極的に使った取り組み(ロボスタ)
    https://robotstart.info/2016/09/29/mizuho-watson-yt.html
  13. 第2回 IBM Watson日本語版ハッカソン(サムライインキュベート)
    http://event.samurai-incubate.asia/watson-hack/
  14. 『人工知能は人間を超えるか』(松尾豊著 角川EPUB選書)
  15. 『人工知能の核心』 (羽生善治、NHKスペシャル取材班著 NHK出版選書)
  16. 『AIの衝撃』(小林雅一著 講談社現代新書)
  17. 『ソシュールと言語学』(町田健著 講談社現代新書)
シェア

役にたったらいいね!
してください

シェアする

  • RSSで記事を購読する
  • はてなブックマークに追加
  • Pokcetに保存する