AIスピーカーの仕組みとは?【徹底解説】

「実はAIスピーカーについてよく知らない」という人は少なくない。せめてその仕組みとグーグル製、アマゾン製、LINE製のAIスピーカーについては知っておこう。

シェアする

AIスピーカーとは、AI(人工知能)技術を搭載したスマート家電の一種である。スマート家電とは、インターネットにつないで利便性を高めた家電のことである。

――と聞いても、AIスピーカーを知らない人は想像しにくいだろう。

それは無理からぬことで、AIスピーカーが世の中に登場して数年が経過するが、認知度が高い割に「要するに何ができるんだ」と感じている人は少なくない。それはAIスピーカーはまだ、かつてのウォークマンや現代のスマホのように爆発的にヒットしているわけではないからである。

AIスピーカーをよく知らない人は、ここから始めよう。

AIスピーカーは手のひらサイズの筒型の装置で、ユーザーがAIスピーカーに向かって明日の天気予報やタラコスパゲッティのつくり方を口頭で尋ねると、インターネットで調べて音声で回答してくれる便利装置である

とりあえずこれだけ押さえておけば、あとは基本的な仕組みと主要3製品の特徴を覚えておけば、一般ビジネスで支障が出ることはないだろう。

AIスピーカー 仕組み

AIスピーカーとは

「スピーカー」と聞くと、オーディオのスピーカーをイメージするかもしれないが、AIスピーカーはそれとはまったく異なる装置である。

AIスピーカーは音声(言葉)を発するので本物のスピーカーが内蔵されているが、それはパソコンのスピーカー同様、メーンの部品ではない。

またAIスピーカーはユーザー(人間)の音声を収録するので、マイクも内蔵されている。

冒頭と重複する部分もあるが、AIスピーカーの特徴を箇条書きにする。

AIスピーカー 仕組み

この5項目のうち特に重要なのは、「クラウド上にAIアシスタントがある」「AIスピーカー本体にはAIが入っていない」「会話ができる」の3点だ。

つまり、ユーザーの自宅に置いてあるAIスピーカー本体は、単なる端末にすぎないということだ。

最近はパソコンを使っていても、パソコン本体に入っているソフトより、クラウド上のソフトやWebサイトサービスのほうを多用する、という人もいるだろう。

AIスピーカーはそれをもっと極端にしたもので、本体では情報処理や計算処理をしていない。情報処理も計算処理もすべて、ネットの向こうのクラウドというサーバーコンピュータのなかのAIアシスタントという「頭脳と心臓」に丸投げしている。

それでは次に、AIスピーカーで何ができるのか解説する。もちろん、明日の天気予報とタラコスパゲティのレシピを教える以外にも、たくさんできることがある。

AIスピーカーでできることとは

AIスピーカーのできることのうち、基本機能は次のとおり。

・「音楽をかけて」と声をかけると、音楽をかけてくれる

・「アラームを午前6時にかけて」と声をかけると、アラームをセットしてくれる

・天気を教えてくれる

・料理レシピを教えてくれる

・ウィキペディアで調べられるようなことを教えてくれる

・「ニュースを聞かせて」と声をかけると、ニュースを読み上げてくれる

これらをタスク機能と呼ぶことがある。

そしてAIスピーカーは、家電を動かすこともできる。ただし、AIスピーカー対応の家電を買いそろえなければならない。

現在は、照明、コンセント(電源)、カーテン、エアコン、住宅の玄関の鍵などで、AIスピーカー対応商品が発売されている。これらの家電を家に装着すると、ユーザーがAIスピーカーに「照明をつけて」「エアコンを消して」と声をかければ、照明がついたりエアコンが消えたりする。

さて、ここまでの解説で「スマホと家電のリモコンがあれば、AIスピーカーは要らないのではないか」と感じた人もいるだろう。

AIスピーカーがまだ爆発的に売れていないのは、まさにそのためだ。「やや便利」だが「超便利」ではない。

しかしAIスピーカーは高い知名度を誇っているし、メーカー各社は研究開発を進めている。そして少なくないユーザーが、AIスピーカーを楽しんでいる。

なぜか。

理由は2つある。

1つ目の理由は、圧倒的に楽しいからだ。AIスピーカーの本体にはAI機能はおろか、高性能のソフトも入っていない。しかし、筒状の物体に声をかけるだけでコミュニケーションを取ることができ、ユーザーの指示にしたがってくれる。

これは快感であり、不思議な体験だ。

AIスピーカーの開発が進んでいる理由その2は、未来志向であることだ。

AIスピーカーを使っていると「もっと通信速度が上がれば、もっとできることが増えるだろう」と感じるに違いない。そしてつい、「自分がAIスピーカーの開発者だったら、こんな機能をつけたい」と考えてしまうかもしれない。

未来志向の人たちは、例えまだ完璧な機能を搭載していなくても、それが時代の先頭を走っている製品であれば、お金を出して自分の手元におきたくなるのだ。

そして開発者たちは、もっと強い未来志向を持っているのである。

AIスピーカーの仕組み

AIスピーカーの仕組みはメーカーによって異なるところがあるが、ここでは大体すべてのAIスピーカーに共通していることを紹介する。

AIスピーカーには、ユーザーの声を拾うマイクと、回答の音声を流すスピーカーのほかに、「フロントエンド処理」装置と、「ネットワーク処理」装置が内蔵されている。

フロントエンド処理では、ユーザーの声をインターネット送信できるデータに変換する。またAIスピーカーから流す内容を、人が理解できる音声に変換する。

ネットワーク処理では、データの送受信を担う。

ユーザーの声のデータはインターネットを経由して、「クラウドサービス」を行うサーバーに届く。クラウドサービスが先ほど紹介した「AIアシスタント」に該当する。

AIはユーザーの声のデータから「意味」を見出し、明日の天気を調べたり、照明をオンにするジョブを準備したりする。

明日の天気を調べたAIは、その情報をデータに変換してインターネットでAIスピーカーに送る。AIスピーカーはそのデータを人が理解できる「天気情報の文章」して読み上げる。

またはAIスピーカーが家のなかの証明を点灯させる。

この流れを要約するとこうなる。

ユーザーの音声(「明日の天気は?」または「照明をつけて」)

AIスピーカーが受信

AIスピーカーが音声をデータにしてネット送信

サーバー(クラウドサービスまたはAIアシスタント)が受信

AIが理解

AIが処理(天気を調べたり、照明をつけるジョブを準備したりする)

天気情報や照明をつけるジョブをデータ化してネットで送信

AIスピーカーが受信

天気情報を人が理解できる音声で読み上げる、または照明をつける

主要AIスピーカー3選

AIスピーカーはIT企業やWeb企業が製造、販売しているが、ここではグーグルの「ホーム(Home)」とアマゾンの「エコー(Echo)」とLINEの「クローバ(Clova)」の3つを紹介する。

3種とも先ほど紹介した、アラームをセットしたり、照明をつけたりすることができる。以下では、その機種に特徴的な機能を重点的に解説する。

グーグルは「ホーム(Home)」

グーグルはユーチューブという魅力的な動画コンテンツを所有しているので、これとホームとの連携に力を入れている。

家庭のテレビをインターネットにつなぎ、ユーチューブをみることができるようにしておくと、ホームに「オッケー、グーグル。かわいいウサギの動画をみせて」というと、テレビの電源がオンになり、ユーチューブが起動しウサギが登場する動画が流れる。

そして動画をみているときに「オッケー、グーグル、動画を一時停止」というと、一時停止する。30秒早送りも可能だ。

ホームに呼びかけるとき、最初に「オッケー、グーグル」といわなければならない。これを「ウェイクワード(眠りを覚ます言葉)」といい、他社のAIスピーカーにも同じものがある。

また、自分が写した写真を大量に登録しておけば、「オッケー、グーグル、パリ旅行の写真を出して」というだけで、テレビ画面にパリ旅行の写真だけが登場する。

ホームを使うには、スマホで「グーグルホーム」のアプリを開き、クロームキャストとホームをリンクさせる必要がある。クロームキャストとは、メディアストリーミングデバイスの一種で、要するに「テレビとホームをつなぐ機器」である。

この設定は一度行えばよく、あとは声だけで操作できるようになる。

ホームは約1万4千円で、廉価版のホームミニは6,000円ほど。

アマゾンは「エコー(Echo)」

アマゾンのエコーは対話力が高いといわれている。例えば台所にエコーを置いておき、料理をしながら「アレクサ、大さじ3杯は何グラム?」と尋ねると、「大体30グラムです」などと回答する。

エコーのウェイクワードは、「エコー」ではなく「アレクサ」である。

アレクサの特徴は、鍛えるとさらに「できるようになる」ことだ。

エコーの価格は性能によって約6,000円から約3万円まである。最上位機種のエコーショー(Echo Show)は、筒状ではなくタブレットのような大きなディスプレイが付いている。

エコーショーのユーザー同士なら、テレビ電話のように使うこともできる。例えば「アレクサ、お母さんに電話をして」といえば、先方のエコーショーが立ち上がり、ディスプレイで顔を確認しながら会話できる。

LINEは「クローバ(Clova)」

クローバの最大の特長は、無料チャットアプリLINEが使えることだろう。

自宅にいる妻が、クローバに「クローバ、夫にLINEを送って」と声をかけると、クローバは「メッセージ内容をどうぞ」と答える。

妻がクローバに「きょうなんじにかえりますか」と声かけすると、スマホのLINEアプリが起動し「今日、何時に帰りますか?」という文章をつくり、夫のLINEに送信する。

そして夫がスマホのLINEで「今晩は早く帰ることができる」とチャットで返信したとする。

スマホのLINEに返信が届いたことを知った妻が、「クローバ、LINEを読んで」と声かけすると、クローバは夫からの返信チャットを読み上げる。

もちろん、「クローバ、織田信長って誰?」と質問すれば、「織田信長は戦国時代から安土桃山時代にかけての武将・戦国大名です」と教えてくれる。

クローバの価格は約5千円から1万4千円。

まとめ~初期のガラケーやウィンドウズ95を思い出す

スマホを使い始めてから、昔の初期のガラケーを操作したことはないだろうか。もしくは最近、ウィンドウズ95のパソコンを開いたことはないだろうか。

いずれも、「よくこのようなスペックで満足できていたものだ」と驚くだろう。

きっと5年後に、現代のAIスピーカーを起動させることができたら、似た印象を持つに違いない。

しかし現代のAIスピーカーは、現代の最新鋭機器であることには間違いない。いずれ古くなることはIT機器の宿命である。そして古くなることを恐れていては、最新機器をいつまでも使えなくなることは、ITユーザーの宿命である。


<参考>

  1. あらゆる生活シーンをサポート。Google Home のご紹介(グーグル)
    https://store.google.com/jp/product/google_home?hl=ja-JP&hl=ja-JP&utm_source=google&utm_medium=cpc&utm_campaign=japac-JP–jp-dr-bkws-all-all-buy-e-dr-1005572&utm_content=text-ad-none-none-DEV_c-CRE_289784308523-ADGP_Hybrid+%7C+AW+SEM+%7C+BKWS+~+Exact+%7C+Home+%7C+%5BM:1%5D+%7C+JP+%7C+ja+%7C+Google+Home-KWID_43700037843848922-kwd-368250639095-userloc_1009054&utm_term=KW_%E3%82%B0%E3%83%BC%E3%82%B0%E3%83%AB%E3%83%9B%E3%83%BC%E3%83%A0-ST_%E3%82%B0%E3%83%BC%E3%82%B0%E3%83%AB%E3%83%9B%E3%83%BC%E3%83%A0&gclid=Cj0KCQiAvebhBRD5ARIsAIQUmnlcP_3vbCDB1DTl3tJ_OBNQXEGgN9SVNLmTgr4YjFYSOEOzeaA-0sIaAiGQEALw_wcB&gclsrc=aw.ds
  2. Echo Show (アマゾン)
    https://www.amazon.co.jp/dp/B07GN4TLLQ/ref=fs_ods_fs_aucc_bip/358-1289446-6988305
  3. 製品一覧(LINE Clova)
    https://clova.line.me/device/
  4. AIスピーカーとは?概要や種類、できることを分かりやすく解説(SmartHacks Magazine)
    https://smarthacks.jp/mag/22891
  5. 【日本で買える】AIスピーカーに対応してるスマート家電・IoTデバイス一覧(SmartHacks Magazine)
    https://smarthacks.jp/mag/19224
  6. 呼び掛けにどう応答しているのか? Amazon EchoやGoogle Homeが動く仕組み(INTERNET Watch)
    https://internet.watch.impress.co.jp/docs/column/nettech/1107574.html#001_s.png
  7. 【AI入門】今話題のスマートスピーカー(AIスピーカー)を知ろう!(Samurai)
    https://www.sejuku.net/blog/62029#Google_Home-2
  8. Alexaスキル開発トレーニングシリーズ 第1回 初めてのスキル開発 (改訂版)(アマゾン)
    https://developer.amazon.com/ja/blogs/alexa/post/6e716e5c-55b0-445b-b936-9cfac4712e7b/training-1