Laboro.AI

Laboro.AIコラム

画像認識AIの世界。その仕組みと活用事例

2021.3.12
(2022.7.26 更新)

概 要

人間の知能を模した機能をもって高度なコンピュータ処理を行う技術、AI。AIは様々な領域で活用が進められていますが、とくに進歩が著しい技術が機械学習と呼ばれる技術領域であり、その中でもとくにビジネス活用が積極的に進んでいるのが画像認識の分野です。このコラムでは、機械学習による画像認識の仕組みや活用事例などについてご紹介します。

目 次

画像認識AIの仕組み
 ・画像認識とは
 ・画像認識の進化
 ・画像認識ネットワークの進化
 ・画像内の顔を認識する方法
 ・画像認識の流れ
ディープラーニングを用いた画像認識
 ・ニューラルネットワークとディープラーニング
 ・ディープラーニング × 画像認識
画像系AIの進歩
 ・画像生成
 ・物体検出(物体検知)
 ・異常検知
画像認識AIのビジネス活用例
 ・航空写真からの停止線・横断歩道の検出
 ・動画解析からの感情推定
 ・インフラ設備の劣化箇所検出
 ・顧客の行動や属性を分析して店内を最適化
 ・製造ラインでの不良品検知
 ・AIドローンによる低農薬農法
 ・農産物の育成状況や収穫時期の解析
 ・走行中に取得した路面画像の分析
 ・顔認証による公共交通機関の乗車システム
さまざまに進化する画像認識AIの世界

画像認識AIの仕組み

AIの技術領域の一つである機械学習は、昨今話題のディープラーニングにはじまり画像分野で大きなブレークスルーがあったことから、とくに画像認識の領域で力を発揮しています。

画像認識とは

機械学習を用いた画像認識は、読んで字のごとく、画像内に写っているものが何かをコンピュータに認識してもらう技術です。

コンピュータは通常、画像をピクセル(画素)の集まりとしてしか認識できません。ですが、その画像には人や動物の姿、イラスト、文字など、必ず何かしらの情報や意味が含まれています。コンピュータは組み込まれた演算処理を通して、ピクセルのパターンから特徴を抽出し、その類似の範囲や差異を学習することでそこに写ったものを認識し、識別、分類などの処理を行えるようになります。

画像認識の進化

画像認識の技術自体は新しいものではなく、さかのぼれば1960年代に登場した「バーコード」も画像認識の一つです。バーコードは日本では1972年に導入され、スキャナによってバーコードの太さやパターンを認識し、商品情報を読み取るための技術として国内での活用が始まりました。また、写真や画像の中にあるものを判定する技術としては、「テンプレートマッチング」と呼ばれるものがあります。これはテンプレート画像を用意し、これと一致するものが該当の画像の中にあるかないかを判定するという技術です。

時を経てディープラーニングなどの機械学習技術の進化が進んだ現代、よりコンピュータが対象物の特徴を正確に把握するためのさまざまな方法が確率され、画像認識は飛躍的に活用の機会を広げています。

画像認識ネットワークの進化

画像認識の技術は2015年には人の認識能力を超えたと言われていますが、ディープラーニングベースの画像認識に用いられるAIのネットワークにも種類があり、それぞれ精度や速度に関わる処理方法や処理能力が異なります。画像認識で発端的なアルゴリズムとしてよく紹介されるものが「畳み込みニューラルネットワーク(CNN: Convolutional Neural Network)」で、さらにそのルーツは日本人研究者 福島邦彦氏が1982年に発表した「ネオコグニトロン」というネットワークであると言われています。

CNNによるディープラーニングが大きく注目されることになったのは2012年のことで、ILSVRC 2012という国際的な画像認識コンペティションで、今では「AI BIG5」の一人に挙げられる研究者ジェフリー・ヒントンが開発したCNNを採用したAlexNetというモデルが、他の競合を大きく引き離す前代未聞の実績を残したからでした。CNNはその後、進化版として登場したLeNet、R-CNN、Fast R-CNN、Faster R-CNN、Google Net、Res Netなど、様々な画像認識ネットワークの元祖的なものとして位置づけられています。

画像内の顔を認識する方法

画像認識の活用例の1つとして、カメラの映像から人の顔を認識する活用例があります。画像から人の顔を認識する技術は、従来からカメラのオートフォーカス機能などにも使用されていますが、AI技術の発展によってその精度は現在も向上を続けています。

コンピュータが人の顔を認識できるようになるには、画像の中にあるピクセルの色や組み合わせから「人の顔」のパターンを学習する必要があります。人の顔を構成するピクセルのパターンを大量に学習することで人の顔の特徴を覚え、画像の中から顔を認識できるようになっていきます。

画像認識の流れ

画像内に写ったものを認識する際、以下のような流れで処理が行われます。例として、文字を認識する場合を考えてみます。

まず、画像内には認識を行うAIにとって邪魔になる要素が多く含まれます。そのため、邪魔なノイズや背景などを除去し、より正確に、精度高く認識結果が得られるよう前処理が施されます。

次に、AIが「文字らしい」部分の特徴を抽出し、予想される文字情報の特徴と照らし合わせます。その特徴が一致すれば、その文字として認識し結果として出力します。一方、一致しない場合には、別の文字の可能性を予測して照合を行う、あるいはどの文字にも一致しなければ文字として認識しない、というように処理を繰り返し、文字や言葉、文章を認識していきます。

ディープラーニングを用いた画像認識

機械学習の中でも、より高度な学習が行える技術がディープラーニング(深層学習)です。ディープラーニングは、ニューラルネットワークと呼ばれるアルゴリズムを用いた学習手法です。

ニューラルネットワークとディープラーニング

ニューラルネットワークは、人間の脳内にある神経回路「ニューロン」の仕組みに着想を得て開発された機械学習アルゴリズムです。入力層、中間層、出力層の3層で構成されるニューラルネットワークに対して、中間層の数を増やし、多層化した仕組みを持たせることでより高度な処理を可能とする学習手法が、ディープラーニングです。

ですが、ニューラルネットワークをベースとするディープラーニングは、たしかに一般的な手法よりも高度な処理を実現する一方で、やはり高度な計算処理に耐えうるだけのマシンパワーも必要となります。

ディープラーニング × 画像認識

「教師あり学習」に代表される一般的な機械学習の手法では、画像データを学習する際、コンピュータが「どの特徴に着目して学習すればよいか」を示す特徴量を人が指定する必要があります。一方、ディープラーニングではこの特徴量を半自動的に抽出するため、人手による手間を省きつつ、また、人では気付かないような特徴点を見つけ出す可能性も秘めています。なお、ディープラーニングについては以下のコラムでも紹介しています。

Laboro.AIコラム:「AIと機械学習、ディープラーニング(深層学習)の違いとは

画像系AIの進歩

ディープラーニングをはじめとしたAI技術を用いることで、画像分野では次のようなことが可能になってきています。

画像生成

十分な量と質のデータを学習させることで、AIに新しい画像を生成させるといったことも実現されています。なかでも近年話題となったアルゴリズムの一つが、GAN(Generative Adversarial Networks:敵対的生成ネットワーク)です。

GANは生成モデルの一種で、データから特徴を学習することで、実在しないデータを生成したり、存在するデータの特徴に沿って変換するといったことを得意とします。GANはそのアーキテクチャの柔軟性から、アイデア次第で広範な領域に摘用できるため、応用研究や理論研究も急速に進んでおり、今後のさらなる活用が期待されています。

例えば、実際には存在しないCMタレントの画像・映像を生成したり、手書きの線画から着色を施したり、そのほか、写真をアニメキャラクターに変換する、低画質な画像を高画質化するなど、様々な活用事例が生まれています。

なお、AIによる画像生成ですが、こちらも昨今話題になった「ディープフェイク」のように、悪意さえあれば実在する人物が動いたり話したりしている架空の動画を作成することも原理的には可能で、その扱いには十分な注意とモラルが求められます。

引用:”Generative Adversarial Networks

物体検出(物体検知)

厳密には画像認識という技術は、あくまで画像内にある特定の対象物が「そこにある」と、その存在を認識するまでの技術領域を言います。一方で、画像の中から「そこに、○○がある」と特定の物を見つけ出す技術は、物体検出(物体検知)と呼ばれます。

つまり、人間であれば見ている画像から物の位置とそれが何であるかの判断が即座に行えますが、コンピュータにとっては、認識することと検出することは別のプロセスであり、分けて実行する必要があるということです。

市場への普及が期待される自動運転車でも、AIによる物体検知が非常に重要な役割を担っています。自動車に搭載されたカメラから周囲の状況を撮影し、その映像中に映る標識や障害物、人などの物体を認識・検出し、さらにそれらに対応すべき適切な操作を瞬時に判断することができて、はじめて自動運転車が現実のものへと近づいていくからです。

異常検知

画像系AIは、工場などの製造現場での異常の検出・検知にもよく利用されています。例えば、ライン上で製造している製品の正常な状態、異常な状態の画像データを大量にAIに読み込ませ、相互の共通点や相違点などを比較分析し、パターンを学習することで、撮影した画像や映像から不良品や損傷箇所を検出し、品質の向上に役立てることも期待されています。

画像認識AIのビジネス活用例

AIを用いた画像認識技術は、実際に様々なビジネスシーンで活用されています。

航空写真からの停止線・横断歩道の検出

カーナビや地図アプリに必要なデジタル地図データには、建物や店舗、道路情報、道路標識などの交通情報を網羅することが求められますが、このデジタル地図データの開発にも画像認識AIが用いられています。

一般的なデジタル地図データの開発は、担当者が現場の写真を細かく目視で確認し、交通情報を記録・更新するといった手作業で支えられており、膨大な工数が必要になります。そこでディープラーニングによるAIを用いてコンピュータに航空写真を分析させ、停止線と横断歩道を検出するといった試みが行われています。

もちろん停止線と横断歩道だけではすべての交通情報を網羅することはできませんが、膨大な作業工数を考えると、一定の業務効率化につながるだけでなく、人為的な抜け漏れのミスを避けられるようになることが期待されています。

参考:航空写真からの停止線・横断歩道の検出

動画解析からの感情推定

一言で画像と言っても、静止画に比べると動画に対するAIの活用は、まだ実用的なものが少ない状況ですが、その技術開発も進められています。

例えば、動画に映っている人の表情や動作から感情を推定するための研究開発を行なった事例もあり、こうした技術の精度が高くなれば、対話型システムを始めとしたさまざまなサービスに活用されることが期待できます。

参考:動画解析からの感情推定

インフラ設備の劣化箇所検出

インフラ設備を保有する企業にとっては、経年によって発生する設備の劣化は大敵です。ある大手インフラ企業では、それまで人の目視で行なっていた劣化箇所の確認作業に、ディープラーニングを用いた画像検出技術を導入し、人の作業や判断をサポートするツールとして役立てています。

参考:インフラ設備の劣化箇所検出

顧客の行動や属性を分析して店内を最適化

小売業で画像認識AIを活用した例として、店舗に来店した客がどのように行動したかを分析し、マーケティングデータとして活用する試みが行われています。

具体的には、店舗内に複数のネットワークカメラを設置し、来店者の性別や大まかな年代、どのような動線で店内を移動したかなどを画像から解析する取り組みです。さらに、POSデータや会員情報、天候情報、商品棚に設置したセンサーからのデータ、外部データとの連携によって、より詳細な顧客分析をする例も生まれています。

こうして得られた分析結果は、商品棚や陳列レイアウトの変更や、来店者の属性データを加味した商品ラインナップの拡充、また運営面でもシフトの最適化や防犯対策などに活用されることが見込まれています。

製造ラインでの不良品検知

製造業では、不良品の発見で画像認識AIが活用されています。従来、工場の検品作業は人が目視で行うことが通常でしたが、最近ではAIを活用して自動化する取り組みも増えています。

AIを活用することでチェック漏れなどのヒューマンエラーの低下や、不良品の発見精度の向上といった効果のほかに、働き方改革で作業員の負担を減らす目的からも導入が進められています。

具体的には、工場の製造ラインにカメラを設置、製品を撮影し、学習済みのAIによって不良品を判別するという適用の仕方が代表的です。その判別方法はさまざまですが、不良品と判別されたデータを教師データとして学習させ、それ以外を良品と判別する方法や、ディープラーニングで良品のみを学習し、それ以外を不良品と判別する方法などもあります。個体差があるため、良不良の判別が難しい面もある一方で、熟練者のノウハウを伝承する手段として一層の活用が期待されています。

AIドローンによる低農薬農法

AI搭載ドローンによる画像認識により、害虫や虫に食われた葉の位置を特定し、必要な箇所に必要な量の農薬を散布するといった活用も行われています。

害虫のいる箇所にピンポイントで散布できることから、本来であれば撒く必要のない農薬を削減することになり、また農薬を散布する人手も削減できるなど、コストカットに貢献することが期待されています。

さらに“低農薬”は、農産物にブランドとしての付加価値ももたらしており、低農薬農法で栽培した農産物が「スマート枝豆」や「スマート米」として一般的な農産物よりも高値で取引されています。

農産物の育成状況や収穫時期の解析

上の例と同じくドローンを組み合わせた農業向けソリューションとして、上空から農地を撮影・画像化し、AIによる分析を通して農業支援を行うサービスが登場しています。このサービスでは、ドローンが撮影した農地の画像から作物の状態や雑草の種類、育ち具合、収穫時期などを判定することが可能で、オンラインにて記録・共有することもできるとのことで、AIを活用した産業応用の分かりやすい例だと言えます。

出典:葉色解析サービス「いろは」

なお、農業におけるAIの活用については、以下のコラムでも詳しくご紹介しています。

Laboro.AIコラム:「守れ、農業。AIが描く第一次産業の進化像

走行中に取得した路面画像の分析

運送トラックが安全に道路を走行したり、自治体が道路上の防災対策を万全に施したりするためには、道路の安全監視が欠かせません。この監視業務を画像認識AIによって実施しようという取り組みも進められています。具体的には、専用のカメラを搭載したトラックから路面の画像データを取得し、気象データと組み合わせて分析することで「乾燥」「積雪」「凍結」などの状態を判定するというものです。

出典:PR TIMES『スペクティ、AIによる車両の運行データ解析の実証実験を実施 ー トラックの走行画像データの防災・危機管理活用へ』

顔認証による公共交通機関の乗車システム

顔認証は画像認識の代表格とも呼べる技術の一つですが、こうした顔情報から個人を認識・特定する技術はさまざまな分野で活用が模索されており、例えば、公共交通機関への乗車システムの実証実験が行われています。この実験では、駅の改札に顔認証システムを設置し、本人確認を行うことでシームレスな乗降を実現しようというもので、実現すればその場での決済などが不要になり、公共交通機関の利用をより便利にする新たな乗車システムとしての実現が期待されます。近年、複数の移動サービスの統合的な利用を目指した「MaaS」も身近にになりつつあり、こうした新たな社会インフラの素地として画像認識技術が発展・活用されていくことが見込まれます。

出典:ITmedia ビジネスオンライン『顔認証で鉄道・バスに乗車 山万ユーカリが丘線などで実証実験

さまざまに進化する画像認識AIの世界

画像認識技術は日進月歩で進化しており、ここでは紹介し切れないほどの多様な活用事例が誕生しています。その効果としても業務効率化やコスト削減、商品・サービス品質の向上、付加価値の創出など様々です。

一方で、技術開発に関する専門的知識がないままプロジェクトに取り掛かってしまったり、「とりあえずAI使いたい」という目的のないDXが推進されてしまったりと、結果として目的と手段が逆転し、ビジネス上で何の価値も生み出さないAI導入プロジェクトが後を絶たないことも実際です。進化が著しい華やかな先端技術であるからこそ、その限界を知り、どのようにAI技術をビジネスオペレーションに適用させるかを徹底的に考え抜くことが、AI導入プロジェクトの成否を握っています。ビジネスに価値あるテクノロジー活用に向けてAIの導入をお考えの方は、ソリューションデザインを強みとするLaboro.AIへ、ぜひご相談ください。

カスタムAIの導入に関する
ご相談はこちらから

お名前(必須)
御社名(必須)
部署名(必須)
役職名(任意)
メールアドレス(必須)
電話番号(任意)
件名(必須)
本文(必須)