iPhoneのシリ(Siri)は、スマホに話しかけると言葉で返してくれる、とても不思議な機能だ。シリに「山田さんにメールを送って」と指示を出すと、シリはスマホ内のアプリを勝手に操作してメールを打つ準備を整えて、「文面はどうしますか」と尋ねる。
シリに代表される、スマホやパソコンと「会話」する機能を、チャットボットという。実はチャットボットとの「会話」は「本物の会話」ではない。
では、海外の企業が提供している現代のチャットボットは、何ができて何ができないのだろうか。チャットボットの性能と仕組みを解説する。
IBMのワトソン
IBMのワトソンは、次のことができる。
・ユーザーの質問に答える
・大量の資料の中からユーザーが求めている情報を取り出す
・複数のデータの間にある関係性を見抜く
ワトソンがこれだけの「仕事」を行えるのは、情報を集め、集めた情報を解析し、保有する知識を強化していくからだ。
自分で情報を集めることはできないが情報の整理は得意
まず情報集めだが、現代のワトソンはまだ、ネットサーフィンをして情報を拾ってくることはできない。ユーザーが、ワトソンに大量のデータや情報や書籍の内容や論文のテキストをインプットしていかなければならない。
人がワトソンに入力していく情報のことを「知識のコーパス」という。知識のコーパスはいわばデータベースである。
ではワトソンは知識のコーパスから、ユーザーが必要とする情報をピックアップするだけなのか。もちろんそのようなことはない。
ワトソンは知識のコーパスの中から古くなったり間違っていたりする情報を除外することができる。情報の除外が適切に行われるかどうかは、知識のコーパスの量による。知識のコーパスの量が多いほど、情報の除外は適切に行われ、本当に不要な情報しか除外しないようになる。
またワトソンは、知識のコーパスの中の情報どうしを連係することもできる。重要な情報を連係させてまとめておけば、ユーザーから情報を求められたときに拾い上げやすくなる。
つまりワトソンは常に知識のコーパス内を整理しているのである。この連係させた複数の情報のことを「メタデータ」という。
ユーザーがワトソンに情報提供を指示したときに、ワトソンがどれだけ過不足なくメタデータを示せるかどうかが力の見せどころとなる。
がん治療の医師をこのようにサポートする
さて、ワトソンを賢く使うと、がんの治療をしている医師を支援することができる。
まずは医師が、ワトソンに次々がん治療に関する資料を入力していく。ありったけの論文、ありったけの抗がん剤情報、ありったけの患者情報を入力していくと、知識のコーパスができあがる。
このとき医師は、情報を選別する必要はない。医師がもし誤って「かつては標準的治療だったが現代はどの医師も使っていない治療法」に関する情報を、ワトソンに入力してしまったとする。ワトソンはそのほかの大量の資料から、「その治療はもはや主流ではない」と判断する。または、その治療法を否定する論文もどこかで入力していたら、ワトソンは「その治療法は主流でない上に論文で否定されているから正しい治療法とはいえない」とみなすのだ。これがメタデータである。
ここまで仕上がれば、あとは医師がワトソンに質問するだけでよい。医師があるがん患者の症状や検査画像などをワトソンに教えれば、ワトソンは標準的な治療法を医師に教える。
ワトソンの今後の課題
これだけ聞くと「すごい」と感じるかもしれないが、実はまだ「本当のすごさ」までは達してない。
ワトソンはまだ、「回答を教わらないと回答できない」レベルなのだ。これでは本物の医師を超えることはできない。なぜならワトソンに回答を教えるのは医師だからである。
例えば医師が自身のすべての知識をワトソンに渡したとする。しかし後からその医師が学会に出かけていき、そこでまったく新しい治療法を学んだとする。その時点でワトソンはその新しい治療法を知らない。
ワトソンは「超優秀な秘書」ではあるが、完全には人を凌駕することはできない。
iPhoneのシリの仕組み
IBMはかなり詳しくワトソンの構造や仕組みについて自社のホームページで解説しているが、アップルはiPhoneのシリの仕組みについてそこまで明かしていない。しかし多くの研究者やマスコミがシリの仕組みを推測している。
これから解説する内容は、そのようなコンピュータの専門家が推測したシリのしくみであることを断っておく。
頭脳はアップルのサーバーの中にある
iPhoneでシリを体験した人は、その「会話らしさ」に驚いたはずだ。例えばユーザーが「山田さんにメールを送ってほしい」と言うと、シリは「山田さんに送るメールの本文はどうしますか」と聞き返してくる。
しかしシリの「頭脳」は、iPhoneの中にはない。シリの頭脳はiPhoneとネットでつながっているアップルのサーバーの中にある。
つまり、ユーザーがシリに「山田さんにメールを送ってほしい」と言うと、シリはユーザーの音声データをインターネット回線でサーバーに送り、サーバー内で音声の情報の内容を確認する。
サーバーはとても賢いので「ya-ma-da-sa-n-ni-me-e-ru-o-o-ku-tte-ho-si-i」という「音」を「山田さんにメールを送ってほしい」と理解する。
さらにサーバーはこの「山田さんにメールを送ってほしい」という文章から、「メール送信というアクションを起こせと命令された」と理解する。
命令を命令と判断し命令されたことを実行する
つまりサーバーは、「ユーザーのiPhoneのメールアプリを操作して、山田さん宛てのメールをつくる用意をしなければならない。さらに、そのメールの本文をどうするか、ユーザーに尋ねなければならない」と判断するのである。
そしてやはりネット回線を使ってiPhoneのシリにアクセスし、「山田さんに送るメールの本文はどうしますか」と尋ねる一方で、メールアプリを立ち上げ、山田さんのメールアドレスをメールアプリに入力し、ユーザーの答えを待つのである。
まとめ~チャットボットをAI化する2つの壁
チャットボットは完全な会話ではない。まだまだ「会話のようにみえる」ぐらいである。本物の会話にするには、本物のAIを搭載しなければならない。
しかしスマホやパソコンで気軽に本物の会話ができるまでには、少なくともまだ2つの壁がある。1つめの壁は、音声認識技術の精度を向上することだ。複雑な内容でも正確に文章化し、その文章の意味を的確にとらえないと会話は成立しない。これは、大人が小学生と夕食の打ち合わせはできても、政治経済の議論ができないのと同じである。
もう1つの壁はAIのコストだ。それだけ高性能の音声認識技術と大量の情報を持つAIをつくるには莫大な費用がかかる。それを無料、または格安で提供することは、いまはまだ難しいだろう。
<参考>
- IBM Watson の仕組み:機械学習で洞察の精度を高める(前編)(IBM)
https://www.ibm.com/think/jp-ja/watson/machinelearning-1/ - Siriが話を聞いて答えたり、何かをやってくれるしくみ(Ascii)
http://ascii.jp/elem/000/001/253/1253779/ - Siri(アップル)
https://www.apple.com/jp/ios/siri/
役にたったらいいね!
してください
NISSENデジタルハブは、法人向けにA.Iの活用事例やデータ分析活用事例などの情報を提供しております。