AI(人工知能)に1枚の写真を見せただけで、AIはそれを「回転寿司店の店内」と言い当てることができる。これはAIが写真から「人が集まっている」「人が座っている」「寿司がある」「壁がある」「天井がある」といった情報を抽出し、イタリアンレストランでも衣料品売り場でもなく回転寿司店である、と判断したからである。
画像の中から情報を抜き出し、コンピュータで解析するのが画像認識技術である。
画像認識技術とAI技術がともに発達すると、空港内に紛れ込んだ犯人を発見したり、サイトを閲覧している人が好む洋服の種類を予測したりすることができる。
顧客の好みが予測できれば、効果的な広告やPRを打つことができる。
画像認識技術によってAIの用途が広がり、生活がより便利になる。AIについて学び始めたばかりの人も、画像認識について知っておいたほうがいいだろう。画像認識の入門書を5冊紹介する。
1冊目 画像認識(機械学習プロフェッショナルシリーズ)
書名:画像認識(機械学習プロフェッショナルシリーズ)
著者:原田達也
出版社:講談社
価格:3,000円(税別)
スマホカメラやデジカメを被写体に向けると、人物の顔を特定し「四角枠」が現れる。なぜスマホやカメラは顔を認識できるのか。
本書の「第1章 画像認識の概要」と「第2章 局所特徴」を読むと、画像認識の仕組みが見えてくるだろう。
さらに「第6章 畳み込みニューラルネットワーク」では、画像認識とAIの関連性を把握できる。
「AI領域における画像認識の位置」をつかみきれていない人が本書を通読すれば、それが見えてくる。
本書の章立ては以下のとおり。
第1章 画像認識の概要
第2章 局所特徴
第3章 統計的特徴抽出
第4章 コーディングとプーリング
第5章 分類
第6章 畳み込みニューラルネットワーク
第7章 物体検出
第8章 インスタンス認識と画像検索
第9章 さらなる話題(セマンティックセグメンテーション/画像からのキャプション生成/画像生成と敵対的生成ネットワーク)
著者の原田氏は、東京大学大学院情報理工学系研究科知能機械情報学専攻教授。研究テーマは大規模画像認識やパターン認識など。
2冊目 画像認識の極み“ディープラーニング”
書名:画像認識の極み“ディープラーニング”
編集:映像情報インダストリアル
出版社:産業開発機構
価格:2,000円(税別)
執筆陣は企業の技術者たちで、自社製品を紹介する形で画像認識について言及している。読者は、画像認識技術が実際にどのように使われているのかがわかる。
AIや画像認識技術はすでに、遠いものではなく、身近なものになっていることを感じられるだろう。
本書で掲載されている記事のタイトルは以下のとおり。
・ディープラーニングとはなにか?
・深層学習がもたらした画像認識技術の飛躍的向上
・ディープラーニングへの取り組み~異常検知エンジン「gLupe」の紹介~
・従来の概念を変えるディープラーニングを用いた画像解析ソフトウェア「SuaKIT」
・Deep Learning を活用した外観検査システム「WiseImaging」
・“データを価値に変える”人工知能でビジネスをサポートするブレインパッドの取り組み
・産業用画像処理におけるディープラーニングの真価
・トンネル切羽 AI 自動評価システム Deep Learning 活用による取り組み
・エッジコンピューティング向け組込み特化のディープラーニングフレームワーク「KAIBER」の活用法
・画像診断におけるAI 活用推進について
・個体差がある物体でも瞬時に識別 画像識別技術「AI-Scan」
・人間の感覚をもった画像検査システム「Deep Inspection」
・画像認識および Deep Learning 開発サービス「TrustSense」
読み進めるほど専門的になるが、理解が難しい記事は読み飛ばしてもよいだろう。
ただ冒頭の2本「ディープラーニングとはなにか?」「深層学習がもたらした画像認識技術の飛躍的向上」は専門知識がなくても読み込むことができ、さらにこの分野を概観できる良記事である。
3冊目オリジナルの画像認識AIを簡単に作ろう!
書名:オリジナルの画像認識AIを簡単に作ろう!
著者:安田恒
出版社:秀和システム
価格:2,000円(税別)
本書は大胆にも、画像認識装置を自分でつくってみようと提案する。しかも実際の本を手に取ると、表紙に「知識ゼロでも大丈夫」と書いてある。
著者は本を読むだけではAIもIoTも身につかないと考えている。AI初心者こそ実際に手を使ってAIづくりに挑戦したほうがよいのだ。
本書の第2、3章に、画像認識装置をつくるために必要なハードウェアとソフトウェアが紹介されている。もちろんここで紹介されているハードもソフトも一般の人が買うことができる製品である。
本書の指示に従ってつくりあげた画像認識装置は、猫を認識できるようになるという。
本書の章立ては以下のとおり。
第1章 本書で製作する画像認識装置の構成
第2章 人工知能による猫の認識
第3章 ハードウェアの準備
第4章 ソフトウェアの準備
第5章 猫除け装置への応用例
4冊目 改訂版 ディジタル画像処理の基礎と応用―基本概念から顔画像認識まで
書名:ディジタル画像処理の基礎と応用―基本概念から顔画像認識まで
著者:酒井 幸市
出版社:CQ出版
価格:3,000円(税別)
デジタル画像処理の基礎から応用までを解説している。特に、数字認識や顔画像認識といった、実社会ですでに使われている技術について詳述している。
プログラミングの基礎が身についている人なら、本書の付録を開けば自宅のパソコンで画像処理を体験できる。
本書の章立ては次のとおり。
第1章 ディジタル画像処理の基礎
第2章 濃度変換
第3章 空間フィルタ
第4章 2値化画像
第5章 パターン認識
第6章 カラー画像処理
第7章 フーリエ変換による線図形処理
第8章 直交変換による画像処理
第9章 ディジタルフィルタ
第10章 ウェーブレット変換
第11章 ニューラルネットワーク
第12章 KL変換
付録A Visual C# .NETによるプログラミング
付録B 簡易作図ソフトの作成
付録C テスト画像の作成
付録D Visual Basic .NETによるプログラミング
5冊目 画像処理の基礎
書名:画像処理の基礎
著者:藤岡弘、中前幸治
出版社:オーム社
価格:2,900円(税別)
「ここにある画像」と「コンピュータの認識」の間には画像処理という過程があり、その技術こそ画像認識の肝になっている。そこで5冊目として画像処理の基礎を学べる本書を紹介する。
画像処理は人間の知覚システムと比較すると理解しやすい。「第2章 ディジタル画像処理の基本的トピックス」を読めば人間の知覚システムとデジタル画像処理の相違点がわかる。
「基礎」というだけであって数式は極力抑えてあるので、初心者でも読み進めることは可能であろう。また著者のコラムがあって、息抜きできる編集もよい。
各章には演習が用意されていて、スキルアップしたい読者のニーズにも応えている。
デジタル画像の歴史から、現代の技術の解説まで幅広く網羅できる1冊である。
本書の章立ては以下のとおり。
第1章 序論
第2章 ディジタル画像処理の基本的トピックス
第3章 ディジタル画像の基礎
第4章 画像強調と復元
第5章 画像解析
第6章 画像圧縮
著者の藤岡氏は、大阪大学大学院情報科学研究科情報システム工学専攻の教授などを歴任し、現在は同大学名誉教授。
中前氏は大阪大学大学院情報科学研究科教授。研究テーマは、超LSIや量子コンピュータなど。
まとめ~AIの可能性を広げる画像認識
「百聞は一見に如かず」という言葉とおり、説明を100回聞くより写真を1枚見せてもらったほうが、物事をよく理解できる。それは画像のほうが情報量が多いからだ。
その傾向は、AI領域で一層強くなる。例えばAIにCT検査画像を見せて微小ながんを見つけさせるときは、画像だけが頼りになる。当然だが、CT検査画像をテキストに変換してAIに教えることはできない。
このように画像認識ができるAIほど、リアルなビジネスに直結しやすい。一般のビジネスパーソンが画像認識の基礎を学ぶことは、スキルの差別化につながるのである。
<参考>
- 画像認識(機械学習プロフェッショナルシリーズ)(講談社)https://www.kspub.co.jp/book/series/S043.html
- 原田達也(東京大学)
http://www.isi.imi.i.u-tokyo.ac.jp/~harada/index.html - 画像認識の極み“ディープラーニング”(産業開発機構)
https://prtimes.jp/main/html/rd/p/000000002.000030238.html - オリジナルの画像認識AIを簡単に作ろう!(秀和システム)
http://www.shuwasystem.co.jp/products/7980html/5209.html - ディジタル画像処理の基礎と応用―基本概念から顔画像認識まで(CQ出版)
http://www.cqpub.co.jp/hanbai/books/30/30951.htm - 画像処理の基礎(オーム社)
http://shop.ohmsha.co.jp/shopdetail/000000003917/
役にたったらいいね!
してください
NISSENデジタルハブは、法人向けにA.Iの活用事例やデータ分析活用事例などの情報を提供しております。