ニューラルネットワークがAI翻訳を「使える」ツールに変えた。グーグルの革新と日本の現状

グーグル翻訳を劇的に変えたのは「ニューラル機械翻訳」という技術である。キーワードは「新しいAI(人工知能)」と「ニューラル」だ。そんなグーグル翻訳について見て行こう。

シェアする

「いまのグーグルの自動翻訳はすごく使える」そのように感じているビジネスパーソンは多いだろう。2016年11月に、グーグルの無料翻訳サービスが革新的にアップデートされた。それまでのネット上の翻訳サイトといえば、グーグルも含めて単語を調べることくらいにしか使えなかった。

しかし今のグーグル翻訳は、ネイティブが書いた英文を瞬時に違和感の少ない日本語にしてくれる。これなら使用者が少し文章を手直しすればビジネス文書に使える。

グーグル翻訳を劇的に変えたのは「ニューラル機械翻訳」という技術である。キーワードは「新しいAI(人工知能)」と「ニューラル」だ。

ちなみに自動翻訳と機械翻訳はほとんど同じ意味で使われているが、経済記事などでは機械翻訳のほうが多く使われているので、本稿もそれにならう。

グーグル機械翻訳の実力

アメリカの新聞社NEW YORK POSTのサイトに、大リーグ・ニューヨークヤンキースの田中将大投手に関する記事が掲載された。その見出しは以下の通り。


This time Masahiro Tanaka makes a good first impression.
(NEW YORK POST)

グーグル翻訳はこれを次のように翻訳した。

「今回は田中雅裕さんが一番いい印象を与える」

この見出しの記事は、田中投手が新しいシーズンで好投した内容を伝えている。よって、この翻訳された日本語は、十分意味が通じている。何より「makes」を「作る」ではなく「与える」としている点が秀逸である。

またユニークなのは、「Masahiro」を無理やり漢字の「雅裕」に当てはめているところだ。グーグル機械翻訳のA.Iが「ローマ字のMasahiroは、日本語では雅裕と書かれることが多い」と判断したのだ。

機械翻訳とAIとディープラーニングの関係

AIを使った機械翻訳は、ルールベースから統計ベース、そして現代のニューラルベースへと進化していった。

ルールベースと統計ベースの違い

ルールベースの機械翻訳では、AIに英語の構文(ルール)を学ばせていた。AIに「英語は最初にくる単語が主語になり、次に動詞がきて、目的語がくる」と覚えさせれば「(主語)は(目的語)を(動詞)する」と日本語に訳すことができる。

しかしこれでは「flies」が「飛ぶ」という意味の動詞なのか「ハエ」という意味の名刺なのか判断できない。そこで統計の考え方が導入された。AIが「このような文章で使われる『flies』は統計上、『飛ぶ』より『ハエ』という意味で使われることが多い」と判断すれば、AIは「ハエ」と翻訳する。

しかし統計ベースの機械翻訳は「より多く使われているほう」しか選択できない。前後の文脈から訳語を導き出すことができないのだ。文脈を読むことを可能にしたのが、ニューラルベースの機械翻訳である。

現代のニューラルベースとは

ニューラル機械翻訳のニューラルとは、ニューラルネットワークことである。ニューラルネットワークとは、人間の脳神経の仕組みに着想を得たコンピューター上の数学モデルだ。このニューラルネットワークによってAIは「深層学習(ディープラーニング)という学び方」を獲得することができた。

ルールベースのAIに犬を覚えさせる場合、

・体が小さい
・全身に毛が生えている
・4本脚で歩く
・耳が三角で頭の上についている

といったことを覚え込ませる必要がある。しかしこれでは猫のことを犬と判断するかもしれない。

ニューラルネットワーク型AIには、犬の写真を何千枚か見せるだけでよい。AIが自分で犬の特徴を算出する。その後、猫の写真を何千枚か見せれば、AIは自分で犬と猫の違いの法則をみつける。

このニューラルネットワークを機械翻訳に導入すると、AIは文脈を読みに行こうとする。つまり1文を翻訳するときに、テキストの全文を読むのだ。それにより、これから翻訳しようとしている1文が、経済記事なのか家電の取扱説明書なのか判断し、それに則した訳文を考えるのである。

これだけの技術が投じられている現代の機械翻訳を、グーグルは惜しげもなく世界各国で無料提供している。

グーグルと百度(バイドゥ)が先行

ニューラル機械翻訳では、圧倒的に海外勢が先行している。中でもアメリカのグーグルと、中国の百度(バイドゥ)が頭ひとつリードしているイメージだ。

グーグルは100以上の言語を翻訳

グーグルの無料翻訳サービスは現在、100以上の言語に対応している。このように聞くと、「英語とフランス語の間の機械翻訳を完成させれば、あとは他言語の単語をあてはめるだけなのではないか」と感じるかもしれないが、もちろんそのような単純な話ではない。

ニューラル機械翻訳を実現させるには、GPU(グラフィック・プロセッシング・ユニット)というコンピューターに使われる高性能部品が必要になる。GPUは三次元コンピューターグラフィックの制作にも使われるほどで、膨大な計算処理を瞬時に実行する能力を有する。

グーグルは、英語とフランス語の間のニューラル機械翻訳を実行するために、NVIDIA製のTesla K80という最高級モデルのGPUを96個も使った。そして96個のGPUを6日間フル稼働させて、AIに英語とフランス語を覚えさせたのである。

GPU1個を約1万4千時間稼働させたことになる。つまりAIは1万4千時間かけて英語=フランス語翻訳を学んだのである。人が休みなく1日8時間勉強しても、1万4千時間勉強するには5年近くかかる。

グーグルが次に日本語と英語の間のニューラル機械翻訳をつくるには、またAIに人間5年分の勉強をさせなければならないのである。

「中国のグーグル」バイドゥは自動翻訳機を開発

バイドゥは日本ではあまりなじみがないが、中国で最も使われているネット検索エンジンを提供している企業で「中国のグーグル」といった存在である。

そのバイドゥが2017年9月、小型の自動翻訳機を開発したと発表した。大きさは縦15センチ、横6センチ、厚さ2センチほどで手の平にすっぽりおさまる。

中央のボタンを押しながらしゃべると、翻訳された音声が出る。中国語、日本語、英語に対応している。

海外勢を追う日本の取り組み

機械翻訳においては、日本企業はグーグルやバイドゥの後追いとなっている。

KDDIやNTTコミュニケーションズはAI翻訳サービスを有料で提供しているが、いずれも法人向けである。一般の人が気軽に利用できる高性能な機械翻訳を、無料で提供している日本企業は少数だ。

ウェブリオ株式会社はサイト上で機械翻訳サービス「weblio英語翻訳」を無料提供している数少ない日本企業だ。しかし先ほどグーグル翻訳で使った以下の例文を翻訳してみると、グーグル翻訳の凄さが際立つ。

上記の英文をweblio英語翻訳にかけたら、以下の2つの日本語が表示された。

1.「田中将大が良い最初の印象を作るこの時」
2.「この時間は、田中将大は良い最初の印象を作ります」

田中将大選手の漢字を言い当てたのは見事であるが、「makes」を「作る」としている。また2番目の訳文は「This time」を「この時間」と直訳してしまっている。

まとめ~官民あげた取り組みが必要

総務省が管轄する国立研究開発法人・情報通信研究機構も機械翻訳の研究を進めている。この分野で遅れをとっている日本勢であるが、日本は官と民がタッグを組んだ産業育成が得意なので、機械翻訳の研究でもその力を発揮してもらいたい。


<参考>
1.This time Masahiro Tanaka makes a good first impression(NEW YORK POST)
https://nypost.com/2018/03/31/this-time-masahiro-tanaka-makes-a-good-first-impression/
2.機械翻訳の新しいパラダイム:ニューラル機械翻訳の原理(中澤敏明)
https://www.jstage.jst.go.jp/article/johokanri/60/5/60_299/_html/-char/ja/
3.「Google翻訳」の精度が劇的に向上したワケ(日経トレンディネット)
http://trendy.nikkeibp.co.jp/atcl/column/16/032300106/090700005/
4.完全“自動翻訳”時代がやって来る! 商業化レース加速と関連株(Kabutan)
https://kabutan.jp/news/marketnews/?b=n201710050563
5.KDDI AI翻訳(KDDI)
http://www.kddi.com/business/mobile/m2m-solution/translation/
6.音声翻訳アプリ(情報通信研究機構)
https://www.nict.go.jp/data/app/voice/index.html
7.weblio英語翻訳(weblio)
https://translate.weblio.jp/
8.NTTコム、AI超高精度自動翻訳を実現する企業向け「AI翻訳プラットフォームソリューション」の提供を開始(日本経済新聞)
https://www.nikkei.com/article/DGXLRSP468315_V10C18A1000000/