Laboro.AI

Laboro.AIコラム

画像認識AIの世界。その仕組みと活用事例

2021.3.12

概 要

人間の知能を模した機能をもって高度なコンピュータ処理を行う技術、AI。AIは様々な領域で活用が進められていますが、とくに進歩が著しい技術が機械学習と呼ばれる技術領域であり、その中でもとくにビジネス活用が積極的に進んでいるのが画像認識の分野です。このコラムでは、機械学習による画像認識の仕組みや活用事例などについてご紹介します。

目 次

画像認識AIの仕組み
 ・画像認識とは
 ・画像内の顔を認識する方法
 ・画像認識の流れ
ディープラーニングを用いた画像認識
 ・ニューラルネットワークとディープラーニング
 ・ディープラーニング × 画像認識
画像系AIの進歩
 ・画像生成
 ・物体検出(物体検知)
 ・異常検知
画像認識AIのビジネス活用例
 ・航空写真からの停止線・横断歩道の検出
 ・動画解析からの感情推定
 ・インフラ設備の劣化箇所検出
 ・顧客の行動や属性を分析して店内を最適化
 ・製造ラインでの不良品検知
 ・AIドローンによる低農薬農法
さまざまに進化する画像認識AIの世界

画像認識AIの仕組み

AIの技術領域の一つである機械学習は、昨今話題のディープラーニングにはじまり画像分野で大きなブレークスルーがあったことから、とくに画像認識の領域で力を発揮しています。

画像認識とは

機械学習を用いた画像認識は、読んで字のごとく、画像内に写っているものが何かをコンピュータに認識してもらう技術です。

コンピュータは通常、画像をピクセル(画素)の集まりとしてしか認識できません。ですが、その画像には人や動物の姿、イラスト、文字など、必ず何かしらの情報や意味が含まれています。コンピュータは組み込まれた演算処理を通して、ピクセルのパターンから特徴を抽出し、その類似の範囲や差異を学習することでそこに写ったものを認識し、識別、分類などの処理を行えるようになります。

画像内の顔を認識する方法

画像認識の活用例の1つとして、カメラの映像から人の顔を認識する活用例があります。画像から人の顔を認識する技術は、従来からカメラのオートフォーカス機能などにも使用されていますが、AI技術の発展によってその精度は現在も向上を続けています。

コンピュータが人の顔を認識できるようになるには、画像の中にあるピクセルの色や組み合わせから「人の顔」のパターンを学習する必要があります。人の顔を構成するピクセルのパターンを大量に学習することで人の顔の特徴を覚え、画像の中から顔を認識できるようになっていきます。

画像認識の流れ

画像内に写ったものを認識する際、以下のような流れで処理が行われます。例として、文字を認識する場合を考えてみます。

まず、画像内には認識を行うAIにとって邪魔になる要素が多く含まれます。そのため、邪魔なノイズや背景などを除去し、より正確に、精度高く認識結果が得られるよう前処理が施されます。

次に、AIが「文字らしい」部分の特徴を抽出し、予想される文字情報の特徴と照らし合わせます。その特徴が一致すれば、その文字として認識し結果として出力します。一方、一致しない場合には、別の文字の可能性を予測して照合を行う、あるいはどの文字にも一致しなければ文字として認識しない、というように処理を繰り返し、文字や言葉、文章を認識していきます。

ディープラーニングを用いた画像認識

機械学習の中でも、より高度な学習が行える技術がディープラーニング(深層学習)です。ディープラーニングは、ニューラルネットワークと呼ばれるアルゴリズムを用いた学習手法です。

ニューラルネットワークとディープラーニング

ニューラルネットワークは、人間の脳内にある神経回路「ニューロン」の仕組みに着想を得て開発された機械学習アルゴリズムです。入力層、中間層、出力層の3層で構成されるニューラルネットワークに対して、中間層の数を増やし、多層化した仕組みを持たせることでより高度な処理を可能とする学習手法が、ディープラーニングです。

ですが、ニューラルネットワークをベースとするディープラーニングは、たしかに一般的な手法よりも高度な処理を実現する一方で、やはり高度な計算処理に耐えうるだけのマシンパワーも必要となります。

ディープラーニング × 画像認識

「教師あり学習」に代表される一般的な機械学習の手法では、画像データを学習する際、コンピュータが「どの特徴に着目して学習すればよいか」を示す特徴量を人が指定する必要があります。一方、ディープラーニングではこの特徴量を半自動的に抽出するため、人手による手間を省きつつ、また、人では気付かないような特徴点を見つけ出す可能性も秘めています。

画像系AIの進歩

ディープラーニングをはじめとしたAI技術を用いることで、画像分野では次のようなことが可能になってきています。

画像生成

十分な量と質のデータを学習させることで、AIに新しい画像を生成させるといったことも実現されています。なかでも近年話題となったアルゴリズムの一つが、GAN(Generative Adversarial Networks:敵対的生成ネットワーク)です。

GANは生成モデルの一種で、データから特徴を学習することで、実在しないデータを生成したり、存在するデータの特徴に沿って変換するといったことを得意とします。GANはそのアーキテクチャの柔軟性から、アイデア次第で広範な領域に摘用できるため、応用研究や理論研究も急速に進んでおり、今後のさらなる活用が期待されています。

例えば、実際には存在しないCMタレントの画像・映像を生成したり、手書きの線画から着色を施したり、そのほか、写真をアニメキャラクターに変換する、低画質な画像を高画質化するなど、様々な活用事例が生まれています。

なお、AIによる画像生成ですが、こちらも昨今話題になった「ディープフェイク」のように、悪意さえあれば実在する人物が動いたり話したりしている架空の動画を作成することも原理的には可能で、その扱いには十分な注意とモラルが求められます。

引用:”Generative Adversarial Networks

物体検出(物体検知)

厳密には画像認識という技術は、あくまで画像内にある特定の対象物が「そこにある」と、その存在を認識するまでの技術領域を言います。一方で、画像の中から「そこに、○○がある」と特定の物を見つけ出す技術は、物体検出(物体検知)と呼ばれます。

つまり、人間であれば見ている画像から物の位置とそれが何であるかの判断が即座に行えますが、コンピュータにとっては、認識することと検出することは別のプロセスであり、分けて実行する必要があるということです。

市場への普及が期待される自動運転車でも、AIによる物体検知が非常に重要な役割を担っています。自動車に搭載されたカメラから周囲の状況を撮影し、その映像中に映る標識や障害物、人などの物体を認識・検出し、さらにそれらに対応すべき適切な操作を瞬時に判断することができて、はじめて自動運転車が現実のものへと近づいていくからです。

異常検知

画像系AIは、工場などの製造現場での異常の検出・検知にもよく利用されています。例えば、ライン上で製造している製品の正常な状態、異常な状態の画像データを大量にAIに読み込ませ、相互の共通点や相違点などを比較分析し、パターンを学習することで、撮影した画像や映像から不良品や損傷箇所を検出し、品質の向上に役立てることも期待されています。

画像認識AIのビジネス活用例

AIを用いた画像認識技術は、実際に様々なビジネスシーンで活用されています。

航空写真からの停止線・横断歩道の検出

カーナビや地図アプリに必要なデジタル地図データには、建物や店舗、道路情報、道路標識などの交通情報を網羅することが求められますが、このデジタル地図データの開発にも画像認識AIが用いられています。

一般的なデジタル地図データの開発は、担当者が現場の写真を細かく目視で確認し、交通情報を記録・更新するといった手作業で支えられており、膨大な工数が必要になります。そこでディープラーニングによるAIを用いてコンピュータに航空写真を分析させ、停止線と横断歩道を検出するといった試みが行われています。

もちろん停止線と横断歩道だけではすべての交通情報を網羅することはできませんが、膨大な作業工数を考えると、一定の業務効率化につながるだけでなく、人為的な抜け漏れのミスを避けられるようになることが期待されています。

参考:航空写真からの停止線・横断歩道の検出

動画解析からの感情推定

一言で画像と言っても、静止画に比べると動画に対するAIの活用は、まだ実用的なものが少ない状況ですが、その技術開発も進められています。

例えば、動画に映っている人の表情や動作から感情を推定するための研究開発を行なった事例もあり、こうした技術の精度が高くなれば、対話型システムを始めとしたさまざまなサービスに活用されることが期待できます。

参考:動画解析からの感情推定

インフラ設備の劣化箇所検出

インフラ設備を保有する企業にとっては、経年によって発生する設備の劣化は大敵です。ある大手インフラ企業では、それまで人の目視で行なっていた劣化箇所の確認作業に、ディープラーニングを用いた画像検出技術を導入し、人の作業や判断をサポートするツールとして役立てています。

参考:インフラ設備の劣化箇所検出

顧客の行動や属性を分析して店内を最適化

小売業で画像認識AIを活用した例として、店舗に来店した客がどのように行動したかを分析し、マーケティングデータとして活用する試みが行われています。

具体的には、店舗内に複数のネットワークカメラを設置し、来店者の性別や大まかな年代、どのような動線で店内を移動したかなどを画像から解析する取り組みです。さらに、POSデータや会員情報、天候情報、商品棚に設置したセンサーからのデータ、外部データとの連携によって、より詳細な顧客分析をする例も生まれています。

こうして得られた分析結果は、商品棚や陳列レイアウトの変更や、来店者の属性データを加味した商品ラインナップの拡充、また運営面でもシフトの最適化や防犯対策などに活用されることが見込まれています。

製造ラインでの不良品検知

製造業では、不良品の発見で画像認識AIが活用されています。従来、工場の検品作業は人が目視で行うことが通常でしたが、最近ではAIを活用して自動化する取り組みも増えています。

AIを活用することでチェック漏れなどのヒューマンエラーの低下や、不良品の発見精度の向上といった効果のほかに、働き方改革で作業員の負担を減らす目的からも導入が進められています。

具体的には、工場の製造ラインにカメラを設置、製品を撮影し、学習済みのAIによって不良品を判別するという適用の仕方が代表的です。その判別方法はさまざまですが、不良品と判別されたデータを教師データとして学習させ、それ以外を良品と判別する方法や、ディープラーニングで良品のみを学習し、それ以外を不良品と判別する方法などもあります。個体差があるため、良不良の判別が難しい面もある一方で、熟練者のノウハウを伝承する手段として一層の活用が期待されています。

AIドローンによる低農薬農法

AI搭載ドローンによる画像認識により、害虫や虫に食われた葉の位置を特定し、必要な箇所に必要な量の農薬を散布するといった活用も行われています。

害虫のいる箇所にピンポイントで散布できることから、本来であれば撒く必要のない農薬を削減することになり、また農薬を散布する人手も削減できるなど、コストカットに貢献することが期待されています。

さらに“低農薬”は、農産物にブランドとしての付加価値ももたらしており、低農薬農法で栽培した農産物が「スマート枝豆」や「スマート米」として一般的な農産物よりも高値で取引されています。

さまざまに進化する画像認識AIの世界

画像認識技術は日進月歩で進化しており、ここでは紹介し切れないほどの多様な活用事例が誕生しています。その効果としても、業務効率化やコスト削減、商品・サービス品質の向上、付加価値の創出など様々です。

一方で、技術開発に関する専門的知識がないままプロジェクトに取り掛かってしまったり、ビジネスでいかに成果を生み出すかということを蔑ろにしてしまう例も少なくありません。意味あるテクノロジー活用に向けてAIの導入をお考えの方は、ソリューションデザインを強みとするLaboro.AIへ、ぜひご相談ください。

カスタムAIの導入に関する
ご相談はこちらから

お名前(必須)
御社名(必須)
部署名(必須)
役職名(任意)
メールアドレス(必須)
電話番号(任意)
件名(必須)
本文(必須)