AIは画像認識の分野でも使われている。具体的には画像認識を使って何ができるのかという議論になっている。このコラムでは画像認識とは何かから始まり、画像認識がどのように使われているのか、その具体例を3つ紹介している。このコラムを読めば、画像認識でどのようなことができるのか分かるだろう。
続きを読む画像認識とは
画像認識とは対象を画像として認識することだが、人間と違い、コンピュータはどれが対象の画像なのかを判断しなければならない。例えば人が何人か映っている写真を見せて、人を認識するためにはどの部分が人なのかを判断する必要がある。人間であればどれが人か判断することはないが、コンピュータは人と周りの風景との区別がつかない。そのため、画像を処理して人だけを抽出しなければならない。そのため画像を認識しやすくするために処理をする必要がある。まずノイズやゆがみを取り除く。そして画像の領域を認識しやすいように処理を行い、オブジェクトを取り出す。つまり画像を認識する前に領域抽出をしなければならないということだ。
スマホで写真を撮ろうとすると、顔のところが□で囲まれるところを見たことがあるだろう。それが領域抽出である。写真であれば顔をアップにするなどの処理をするだけで良いが、画像認識となると対象物を認識して判断する必要がある。例えば人の画像を人であると判断するためには、人の特徴をコンピュータが理解する必要がある。例えば人間の顔であれば、目が二つ、鼻と口がそれぞれ1つずつあるので、学習していく。学習をしていくことで、人間の顔を正確に認識できるようになるのだ。このような学習の結果、人間の顔が映っている画像をコンピュータに見せると、「この画像は人間の顔である」確率が表示される。確率が高いほど、人間の顔である可能性が高いということだ。こうした人間の顔を認識するという画像認識技術は、セキュリティ分野で応用されている。コンピュータが画像を分析することで、誰が来たのか分かるということだ。そうすることで例えばオフィスに入ることができる人を瞬時に判断できるということだ。
こうした画像認識技術は人間の顔を認識するだけの技術ではない。文字認識技術にも使われている。文字を認識するのは人間にとっては難しくないかもしれないが、コンピュータはそれぞれの文字の特徴を理解した上で、文字を認識しなければならない。特に手書き文字の場合、人によって特徴もあり、正確に認識するのは難しい。また英語のようにアルファベットであればよいが、漢字などがある日本語の認識は特に難しいのだ。それでも現在、90%以上の精度で認識が可能である。そのため近い将来、ほぼ100%の確率で文字を認識できる時代が来て、100%認識できる前提でどのようにその技術を使うという話になっているという。
このように画像認識はすでに応用のレベルに入っていると言える。この技術を使ってどのような製品があるのか、これから紹介していく。
IBM ─ Watson
WatsonはAIを少しでも知っている人であれば、名前を聞いたことがある存在だ。そのWatsonにも画像認識の技術はある。その技術を「Watson Visual Recognition」という。すでに学習済みのモデルも用意されており、自社のサービスに簡単に導入できるのも特徴だ。人だけでなく、食べ物なども瞬時にそれが何かを認識できる。自社のサービスに導入する場合は、そのサービスで使用する画像を学習する必要があるが、自社でAIを開発するよりも低コストで使うことができるのが魅力的だ。
例えばオートバックスではこの技術を使って、タイヤの摩耗状態をチェックできるアプリを開発し、消費者に提供している。Watsonの画像認識技術を使うことで、短期間で低コストでの開発が可能になったという。またWatsonの画像認識技術を使って検品作業を効率化することも可能だ。これまで目視で確認していたので、どうしてもベテランの経験に頼っていたものが、Watsonを使うことで経験が少ない人でも検品作業をすることができる。また、ご確認の割合も減るという。実際に、4人2時間の作業を2人20分に短縮した企業もある。また医療分野ではWatsonが胃カメラなどのカメラ画像をもとに、瞬時に異常があるかないかを判断することもできる。AIであるため、大量の画像を瞬時でできるため、医師の経験に頼らず正確な判断ができるようになる。このようにWatsonはさまざまな分野ですでに利用されているのである。
Computer Vision API
AIで画像を認識するソフトは多いが、「Computer Vision API」はAIで認識した画像に文章を付けてくれるという。この機能を使えば、自動的に写真に名前をつけて分類することも可能だ。体調の画像を見てタイトルを付けていく作業は思った以上に大変な作業である。この作業をAIが自動で行ってくれることで、業務改善ができる。他にも画像内の文字認識や著名人の認識もできる。著名人の認識機能を使えば、権利侵害をAIが探知することも可能である。また画像認識によってアダルトサイトのフィルタリングもできる。この技術を応用する場面は増えてくるはずである。
Einstein
セールスフォース・ドットコムが開発したのが「Einstein」だ。このサービスはソーシャルメディアに投稿された写真を検知して分析できる。こうした分析を自動で行うことで、現在、消費者が何に関心があるのか分析することが可能だ。例えばツイッター上でどのような料理に人気があるか分析し、それと同じような料理を作って販売するということもできるようになる。今後もSNSの投稿を分析し、それを商品に生かすというやり方は続いていくであろう。
まとめ
これまでAIにおける画像認識を利用した企業3社を紹介してきた。こうした技術は発展してきており、今後はこれらの技術を使って何ができるかという話になってくるはずである。AIの画像認識をどのように使えばビジネスチャンスになるのか、誰もが考えていくべきだろう。
<参考>
- 【保存版】8企業のAIを“使ってみた記事”13個まとめ! 画像認識・音声認識・自然言語処理まで網羅(Ledge.ai)
https://ledge.ai/ai-api-allstar/ - 【事例付き】様々なサービスに活用!画像認識技術とは(TECH ACADEMY)
https://techacademy.jp/magazine/17068 - 【 AIでできること】画像処理編 ~画像認識から画像生成まで~(Samurai)
https://www.sejuku.net/blog/67205 - Watson Visual Recognitionでオリジナル画像認識AIを作る(Ledge.ai)
https://ledge.ai/watson-visual-recognition/ - 無料の「IBM Cloudライト・アカウント」でWatson APIを試してみた(Ledge.ai)
https://ledge.ai/ibmcloud_watson/ - Visual Recognition (画像認識)(IBMホームページ)
https://www.ibm.com/watson/jp-ja/developercloud/visual-recognition.html - [IBM] 検品支援ソリューション(IBMホームページ)
https://www-01.ibm.com/common/ssi/cgi-bin/ssialias?htmlfid=WR112365JPJA - 「かんたん タイヤ画像診断」の提供開始(オートバックスホームページ)
https://www.autobacs.co.jp/images/data/news/2017/09/26/4L8rv9.pdf - Microsoftの画像認識AI「Computer Vision API」でファイル名付けを自動化(Ledge.ai)
https://ledge.ai/microsoft-computer-vision-api/ - Microsoft Azureの画像認識API「Computer Vision API」5つの機能を使い倒す(Ledge.ai)
https://ledge.ai/microsoft-computer-vision-api-2/ - Salesforceの画像認識AI『Einstein Vision』試してみた(Ledge.ai)
https://ledge.ai/einstein_vision/ - セールスフォース・ドットコム、「Einstein Vision for Social Studio」を提供開始(日経新聞)
https://www.nikkei.com/article/DGXLRSP455093_Y7A820C1000000/
役にたったらいいね!
してください
NISSENデジタルハブは、法人向けにA.Iの活用事例やデータ分析活用事例などの情報を提供しております。
No related posts.