明石家さんまさんのテレビCMで知られるAI通訳機器「ポケトーク」は、手のひらにすっぽり収まるほど小さいのに、大きな未来を感じさせる。なぜならポケトークは、見知らぬ国のレストランで不自由なく注文できたり、南国の鮮魚市場で値段交渉をしながら買い物を楽しめたりするだけの道具ではないからだ。
ポケトークは十分ビジネスシーンでも活用できる。
日本経済は、グローバル化しなければ立ち行かなくなることは誰もが知っているが、日本人は世界有数の「外国語苦手民族」だ。
多くの日本人が社会人になる前に10年近く英語を勉強するが、ほとんどは英語を自由に使いこなすことができない。ビジネスを拡大するにはフランス語、ドイツ語、中国語、韓国語、タイ語、ロシア語などの習得も欠かせないが、それらの言語にいたってはほぼ全滅状態である。
そこに、簡単、安価、高性能の「新AI通訳」機器、ポケトークが登場したわけである。ポケトークが「言葉の壁」に空けた小さな穴が壁の崩壊を引き起こせば、日本経済復権の足掛かりになるかもしれない。
AI通訳は国家プロジェクト
ポケトークは後で紹介するように、民間企業が開発した一般消費者向けの製品だ。しかしAI通訳の開発自体は、国家プロジェクトでもある。その証拠に、国立研究開発法人情報通信研究機構(NICT)という公的機関がAI通訳の開発に力を入れている。
NICTは国内唯一のIT専門の公的研究機関で、ここで行われる基礎研究の結果は、企業などによって使われる。公的機関が基礎研究を担えば、企業は基礎研究のコストを減らすことができ、その分ビジネスに専念できるというわけだ。
NICTの運営は税金で賄われていて、2017年度末の政府からの出資金の残高は約1,443億円となっている。
そのため、NICTの研究テーマは、日本経済に寄与するものに限定される。
そのNICTに先進的音声翻訳研究開発推進センターという部署があり、そのセンターで多言語音声翻訳技術の研究開発と社会実装が進められている。
多言語音声翻訳技術こそ、AI通訳である。だからAI通訳は国家プロジェクトなのだ。
AI通訳の仕組みとは
NICTの多言語音声翻訳技術は無料で公開されている。ポケトークのメーカーもこの技術を使っているし、富士通研究所や凸版印刷といった大企業もこの技術を利用して翻訳機器をつくっている。
多言語音声翻訳は、次の3ステップで進む。
日本語を翻訳機に読み込ませて、翻訳機に英語を発音させるケースでみていこう。
日本人が日本語で、多言語音声翻訳技術を搭載した翻訳機に話しかけると、翻訳機のなかのAIは「日本語の音声だ」と認識する。これはとても重要な技術で、AIに音声と騒音の違いを教えなければ、AIはこの「仕事」をすることはできない。
「日本語の音声」を認識した翻訳機は、やはりAIの力を使って「日本語の文字」に変換していく。AIは、例えば「ohayou(お・は・よ・う)」という音声をダイレクトに「good morning(gúd mɔ’ːrniŋ)」と翻訳し発音化することはできない。
イメージ的にはおよそ次のような流れになる。
・ohayouという音声
↓
・「おはよう」という文字に変換
↓
・「日本語の朝の挨拶の言葉だ」と認識する
↓
・英文「good morning」に訳す
この過程もAIが行う。
そして最後に「good morning」という英文を「good morning(gúd mɔ’ːrniŋ)」という音声に変換し、翻訳機のスピーカーから流すことになる。
もちろんこの過程もAIの技術を必要とする。
これだけでもAIを3回使わなければならず、高度な技術を用いているといえる。しかしこれだけでは翻訳した音声は自然な言葉にならない。
3ステップの後に、さらに自然な言語に置き換えるAIを使うことで、例えば
「This area is the area where inundation has been assumed in the Great Kanto Earthquake type.」
という英文が
「この地域は浸水想定地域は関東大震災のタイプです」
といった不自然な日本語に翻訳されることなく、
「この地域は関東大震災型で浸水が想定されている地域です」
と正しい日本語で翻訳されるようになる。
ポケトークの紹介
ポケトークは手の平サイズの機械で、ある言語で話しかけると、瞬時に指定した別言語に翻訳してスピーカーからその音声を流す。
開発したのはソースネクスト株式会社(本社・東京都港区)だ。
同社はIT系企業としては老舗の部類に入る1996年の創業で、パソコンやスマホのハードウェアとソフトウェアの企画、開発、販売を手掛けてきた。社員数は連結で139人ながら東証一部に上場している。
ポケトークの操作方法
ポケトークには画面と2つのボタンしかない。このシンプルなインターフェースもポケトークの魅力のひとつだ。
日本人が使う場合、「日本語ボタン」を押して日本語を話す。話し終えたら「日本語ボタン」を離す翻訳された外国語がスピーカーから流れる。その時間は「一瞬」である。
またこのとき画面には、元の日本語と翻訳された外国語が表示される。
ポケトークは、外国人が話す外国語を日本語に変えることもできる。画面から言語を切り替えると、今度は「英語→日本語」が可能になる。
つまり、自分と外国人の間にポケトークを置き、それぞれがボタンを押して母国語で話せば会話が成立するわけだ。
ポケトークの「すごい」ところは、日常会話や旅行用会話のような単純かつ短文の翻訳だけでなく、複雑な長文も易々(やすやす)と翻訳してしまうことだ。
例えば、格安SIMの認知度に関する市場調査の報告や、年末年始の海外旅行者数と成田空港の利用者数に関するレポートなども次々外国語にしていく。
ポケトークが対応する言語は、英語、フランス語、ドイツ語、中国語、韓国語、タイ語、イタリア語など74言語に及ぶ。
スペイン語は、アメリカ系スペイン語とアルゼンチン系スペイン語とコロンビア系スペイン語を用意している。フランス語には、フランス系フランス語とカナダ系フランス語がある。
ポケトークはクラウドで動く
ポケトークが高性能なのは、ネットにつなげてクラウド上のAI翻訳エンジンで翻訳しているからだ。
そのため、ポケトークはWi-Fiなどのネット環境の下でないと動かない。
ポケトークは24,880円から
ポケトークの価格は、グローバル通信なしが24,880円、グローバル通信2年付きが29,880円となっている。
AI通訳のこれまでと未来
AI通訳は2000年からの約20年で飛躍的に進化してきた。
2000年ころはそもそもAIすら使われていない。このころの機械翻訳の仕組みのことを「ルールベース」といい、1万語ほどしか対応していなかった。しかも特定の話者が定型文は話さなければ翻訳機は意味を理解できず、雑音がない静かな室内で使う必要があった。
1回目のブレークスルーは「コーパスベース」の誕生だ。コーパスベースとは統計モデルと機械学習を足したもので、10万語ほどまで対応できるようになった。不特定の人が発した音声を理解できるようになり、生活会話も翻訳できるようになった。
ただ「丁寧に」話しかける必要があった。
これが大体2014年ごろまでの話である。
2015年ごろからAI開発が急加速しAI通訳の概念が定着し始めた。大規模コーパスと深層学習を足したニューラル翻訳は、2回目のブレークスルーといえる。100万語に対応できるようになり、一般社会でストレスなく使えるポケトークのような翻訳機器が誕生し始めた。
ではAI通訳はどこまで進むかというと、先述のNICT・先進的音声翻訳研究開発推進センターは「言葉の壁がない世界」になると明言している(*)。
ポケトークのようなAI翻訳機がスマホくらい普及すれば、その世界は十分実現可能だ。
*:https://www8.cao.go.jp/cstp/stmain/nict_open.pdf
<関連記事>
ニューラルネットワークがAI翻訳を「使える」ツールに変えた。グーグルの革新と日本の現状
まとめ~日本経済を「本当の」再興に導くか
バブル崩壊で壊滅的な状態に陥った日本経済は、失われた20年を経て再興したといわれている。しかし大手家電メーカーは台湾資本の参加に入り、日本の最大最高のお家芸である自動車産業でも大手メーカーがフランスメーカーのコントロール下に置かれている。
そしてITやAIの分野を見渡すと、経済ニュースをにぎわせているのはアメリカ企業と中国企業ばかりである。日本経済は規模だけでなく質においても第3位以下に沈んだままだ。
外国語スキルの弱さは、日本経済の明確な弱点のひとつだ。これまで英語教育を強化してこの難題を乗り切ろうとしてきたが、教育現場を何度変革しても目立った成果は出ていない。
だからAI通訳による日本経済の弱点克服は、とても新鮮に映る。NICTが予測するように言葉の壁がない世界が訪れれば、より多くの日本のビジネスパーソンが世界に挑戦できるようになり、「本当の」経済振興をもたらすのではないだろうか。
<関連記事>
ITの巨人は店をこう変える
<参考>
- 74言語に対応、まるで通訳がいるかのように対話できる夢のAI翻訳機、POCKETALK(ポケトーク)
http://pocketalk.jp/?i=aff_vc&utm_source=vc&utm_medium=aff&utm_campaign=vc&argument=HGtSAqRz&dmai=a5b87a9ec6a764&vc_lpp=NDExYzNlZDEzNyY1YzI1ZTQ4MyYyNDQzODEmNWM3NGZlODMmMDg4NTM0MTMyNjAyODE2MTI4MTgxMjI4MDg1MzIz - ボタンを押しながら、話しかけるだけ(ポケトーク)
http://pocketalk.jp/howto/?i=pwc - 翻訳機を超えた、夢のAI通訳機(ポケトーク)
http://pocketalk.jp/product/?i=pwt - 会社概要(ソースネクスト株式会社)
https://sourcenext.co.jp/business/profile/ - NICTにおける多言語音声翻訳技術の研究開発と社会実装(先進的音声翻訳研究開発推進センター)
https://www8.cao.go.jp/cstp/stmain/nict_open.pdf - 国立研究開発法人 情報通信研究機構平成29年度 事業報告書(NICT)
https://www.nict.go.jp/pdf/business-report-2017.pdf - 事業報告書(NICT)
https://www.nict.go.jp/about/report.html
役にたったらいいね!
してください
NISSENデジタルハブは、法人向けにA.Iの活用事例やデータ分析活用事例などの情報を提供しております。