AI(人工知能)大国の中国に新勢力が登場した。アイフライテック(科大訊飛、iFLYTEK)だ。先行する3大AI企業のBAT(バオドゥ、アリババ、テンセント)を猛追している。
アイフライテックは音声認識と、認識した音声を文章にする技術に強みがあり、これに自動翻訳の機能を加えて製品で世界進出を目論んでいる。
そのようなアイフライテックの実力を探った。
音声認識とは
アイフライテックの「すごさ」を理解するには、音声認識の基礎知識を身につけておく必要があるだろう。
人にとって便利だがコンピュータにとってはとても不便
人間にとって音声ほど便利なコミュニケーション手法はない。「言えばいいだけ」だからだ。書く必要もないし、パソコンのキーボードもカメラもジェスチャーも要らない。しかも人と人との音声コミュニケーションはときに、映像を伝えることもできる。話者が「中国の国旗は赤地に黄色い星が5つあしらわれている」といえば、聞き手は頭のなかで大体の映像を想像できる。
一方、コンピュータやITやAIにおいて、音声ほどやっかいなものはない。音声は、文字の要素と音の要素が含まれているから複雑なのだ。人であれば「あ」という音を聞いたら、一瞬で「ア行の最初の文字」と認識できるが、コンピュータはまず、単なる音なのか意味を持つ音なのかを判断しなければならない。
なおかつ音声をデータにするにはコンピュータの聞き取り能力も高めなければならない。コンピュータに仕事をさせるには最終的には電子データにしなければならず、音声は電子データに変換しづらい情報源だ。
このようにして音声を認識する
音声を認識するコンピュータはまず、言葉の「音素」をとらえる。「おはよう」という言葉は、「お」という音素と「は」という音素と「よ」という音素と「う」という音素に分かれる。例えば「お」には低い音が含まれ、「は」は高い音が含まれるので、音声認識コンピュータはその特徴を覚えることになる。
コンピュータに「お」と「は」の違いを区別させるには、音声のサンプルを事前に用意しておく必要がある。コンピュータ企業は、例えばコールセンターの声を集めて、そのなかの「お」や「は」をすべてピックアップしてコンピュータに教える。とても地道な作業だ。音声サンプルは数千人分、数千時間分必要といわれる。
しかしこれだけでは、コンピュータはまだインプットした音声を、音声とおりにアウトプットすることしかできない。
そのアウトプットは例えば「おはようございますきょうはなにをしますかかいしゃにいきますかやすみますか」となる。文章がこれほど短くても解読に苦労するのに、これが1万字も続いたら文字情報としてほとんど価値を持たない。
単なる音素の羅列を「おはようございます。今日は何をしますか? 会社に行きますか? 休みますか?」とアウトプットするには、コンピュータが「。」や「?」のニュアンスを汲み取り、さらに「きょうは」を「今日は」と理解する力が必要になる。
そのために音声コンピュータには、言語モデルと専門辞書を覚え込ませることになる。
しかし過去の開発では、言語モデルと専門辞書を備えたコンピュータでも、誤認識率が下がらなかった。特に日本語だと「えき」にも「駅、液、益、易…」があり、同音異義語の多さから音声認識技術の開発は難航した。
この難問を解決したのが、人間の脳のように考えるAIのディープラーニング(深層学習)技術だった。
そして中国のアイフライテックは、AI音声認識を飛躍的に発展させて「使える」
システムを販売して急成長を果たしたのである。
アイフライテックのAIサービス
アイフライテックは2018年4月、従来の翻訳機「訊飛翻訳機1.0」を発展させた「2.0」を販売した。中国語を含む34の言語で発せられた音声を瞬時に翻訳するだけでなく、中国の4つの方言(広東語、河南語、四川語、東北語)も識別する。
さらに翻訳機に内蔵されているカメラで紙に書かれた外国語の文字を撮影すると、母国語に翻訳してくれる機能も備えている。例えば海外のレストランでメニューを撮影すれば、画面に母国語が表示されるというわけだ。
また中国でAIを搭載したロボットが医師国家試験に合格したことが話題になったが、文章読解能力と医療知識の実装は、アイフライテックが開発した。
まだある。
アイフライテックの音声電子カルテは、医師がコンピュータに音声で指示を出すだけでカルテをつくりあげてしまう。さらにアイフライテックの画像認識技術は、レントゲンやCTで撮影した画像のなかから、通常の医師であれば見逃してしまいそうな小さな病変も見つけ出す。患者が訴える症状から病名を推測する機能もある。
アイフライテックは教育ビジネスにも進出している。授業の管理や生徒・学生の学習進捗度の把握、試験問題の作成までをこなし、海外への輸出実績もある。
アイフライテックの実力
アイフライテックはすでに海外からも注目されていて、アメリカ・マサチューセッツ工科大学(MIT)が2017年に選出したグローバルスマート企業50で6位にランクインした。
アイフライテックより上の企業は、1位エヌビディア、2位スペースX、3位アマゾン、4位23andMe、5位グーグルという布陣だ。
そして中国3大AIのひとつであるテンセントは8位だし、あのインテルは13位、iPhoneのアップルでも16位にすぎなかった。アイフライテックの実力の高さがうかがえる。
このMITグローバルスマート企業の選考基準には、現在の実力だけでなく、将来に支配的な企業になれるかどうかも含まれている。だからアイフライテックの6位の意味はとても大きい。ちなみ日本企業は1社もランクインしなかった。
米スタンフォード大学は、企業が発売しているAIシステムの実力を測る「SQuAD(スタンフォード・クエスチョン・アンサーリング・データセット」を発表していて、ここでもアイフライテックのシステムがランクインしている。
中国の未来を背負う
バイドゥ、アリババ、テンセントのBATが「中国の未来を背負う」といわれているのは、中国科学技術部が強く期待しているからだ。
中国科学技術部とは科学技術事業を管轄する政府機関で、日本でいえば旧科学技術庁(現在は文部科学省に吸収された)のような存在だ。
その中国科学技術部はBATを、他のIT企業をけん引するリーダー企業に育成しようと後押ししている。そして政府が後押しする企業にもう1社加わった。それがアイフライテックである。
BATもアイフライテックも民間企業だが、それと同時に国策企業でもあるのだ。
国策民間企業戦略
国策の民間企業を「社会主義の中国らしいやり方」とネガティブに考えるのは正しくはない。日本を世界の経済大国に押し上げた新日鉄や三菱重工、日本航空、JRも、少なからず「国策」の要素があった。
新興国の経済がジャンプアップするときに国策民間企業は大きな力を発揮する。だから中国政府とAI4社のタッグは、世界のAI業界の脅威になる。
AIを4分割して四天王に振り分ける
中国科学技術部は2017年11月に、AIプラットフォーム発展計画を発表した。
この計画では、AIの世界を4分割し、BTA+アイフライテックの4社に割り当てている。
自動運転車はバイドゥ、医療技術はテンセント、スマートシティはアリババがそれぞれ担当し、そしてアイフライテックは音声認識分野を開発する。
政府の援助では、もちろん助成金などの資金面での支援も魅力的だが、それより特例的な規制緩和のほうが企業の力を増強させる。中国政府は特にアメリカのIT企業に厳しく接しているので、その間にアイフライテックなどが力をつけていくことができる。
技術屋集団から大企業に成長
アイフライテックはいまでこそ国策企業だが、元は技術屋集団が興した会社だ。その成り立ちは、日本企業で例えるとソニーやホンダに近い。
アイフライテックCEOの劉慶峰氏は、中国科学技術大の博士課程に在籍しているときに同社を設立した。中国科学技術大は理系専門の大学で、東京工業大学のような存在になる。
劉CEOは「AIは水道や電気のように社会インフラとなる」という持論を持っていた。それで音声認識や画像認識、ディープラーニングの研究開発に没頭していった。
AI企業というと、新興企業、ベンチャー企業、スタートアップ企業というイメージがあり、「尖っているが企業規模はそれほど大きくはない」という印象を持つかもしれない。
しかしアイフライテックは深セン証券市場に株式を上場していて、2017年12月ごろの時価総額は1兆4,000億円に達する。
富士通の時価総額が1兆6,000億円ほど、NECが8,000億円ほどなので、「アイフライテックはかなり大きな会社」といえる。
技術屋集団はビジネス化が得手ではないので、大企業に成長することが難しい。しかし大企業に成長した元技術屋集団は、ビジネスの種が枯渇しにくい特長がある。イノベーションを興しやすいからだ。
アイフライテックはまさにそれに一致する。
まとめ~アイフライテックの脅威はまだまだ強まる
中国はAI先進国であるだけでなく、AI大国である。
日本はAI先進国の仲間入りはしているが、まだAI大国ではない。
中国と日本のAIの差は、実用化レベルだ。中国ビジネスは良くも悪くも、見切り発車が多い。だから中国製品は市場で鍛えられる。自動車やプラントやインフラは人の命に関わるものなので見切り発車はしないほうがいいが、AIはまだ「海のモノとも山のモノともつかないモノ」なので、とりあえず市場に出して欠点をあぶりだし、改良を重ねていったほうが開発は早い。
アイフライテックは次々とAI製品を市場に出している。しかも投資を呼び込んでいる。だから脅威なのだ。
<参考>
- 機械が人間の音声を理解する仕組みとは?(日経ビジネス)
https://business.nikkeibp.co.jp/atcl/report/15/226265/072600154/?P=2 - 科大訊飛の新型AI翻訳機、33言語との瞬間音声翻訳を実現(CRIonline)
http://japanese.cri.cn/2021/2018/04/22/142s272067.htm - MITが選ぶ「2017年 世界で最もスマートな企業50」前編:1位〜25位(NEWSPICKS)
https://newspicks.com/news/2450307/body/ - SQuAD2.0
https://rajpurkar.github.io/SQuAD-explorer/ - The Stanford NLP Group
https://nlp.stanford.edu/ - China’s First AI-Assisted Diagnosis and Treatment Center Opens in Hefei(YiCai)
https://www.yicaiglobal.com/news/china%E2%80%99s-first-ai-assisted-diagnosis-and-treatment-center-opens-hefei - Education Product(iFLYTEK)
http://www.iflytek.com/en/educational/index.html - 中国科学技術部が次世代4大人工知能プラットフォーム発展計画を策定、その一翼を担うアイフライテック(科大訊飛/iFLYTEK)とは!(GloTechTrends)
https://glotechtrends.com/iflytek-china-ai-4-platform-171221/ - 利用者は5億人超、謎のAI企業の音声アプリが変える中国の風景(Small Start.biz)
http://smallstart.biz/%E3%83%8B%E3%83%A5%E3%83%BC%E3%82%B9/%E5%88%A9%E7%94%A8%E8%80%85%E3%81%AF5%E5%84%84%E4%BA%BA%E8%B6%85%E3%80%81%E8%AC%8E%E3%81%AEai%E4%BC%81%E6%A5%AD%E3%81%AE%E9%9F%B3%E5%A3%B0%E3%82%A2%E3%83%97%E3%83%AA%E3%81%8C%E5%A4%89%E3%81%88 - 富士通(Yahoo!ファイナンス)
https://stocks.finance.yahoo.co.jp/stocks/detail/?code=6702.T - NEC(Yahoo!ファイナンス)
https://stocks.finance.yahoo.co.jp/stocks/detail/?code=6701.T
役にたったらいいね!
してください
NISSENデジタルハブは、法人向けにA.Iの活用事例やデータ分析活用事例などの情報を提供しております。