Laboro.AI

Laboro.AIコラム

事例から知る。機械学習の基礎と活用5ジャンル

2020.11.12

概 要

人間の知能を模したコンピュータ技術と言われるAIの領域のうち、特に知られる技術が機械学習です。機械学習はコンピュータ自身が予測や分類などのパターンを学習していく技術で、すでにさまざまなサービスとして世の中で活用されています。

このコラムでは、機械学習について理解を深めながら、実際に私たちの生活で使われている事例についてもご紹介していきます。

目 次

機械学習とディープラーニングの違い
 ・機械学習の手法
 ・教師あり学習
 ・教師なし学習
 ・半教師あり学習
 ・強化学習
機械学習の活用5ジャンル
 ・①予測
 ・②画像認識
 ・③音声認識
 ・④データ分析
 ・⑤自然言語処理
機械学習がこれまでになかったサービスを創出していく

機械学習とディープラーニングの違い

機械学習は、大量のデータをコンピュータに読み込ませることでパターンやルールを学ばせ、予測・分類などのタスクを自動で行えるようにする技術です。例えば、リンゴの画像を大量に取り込ませて学ばせることでコンピュータはリンゴの特徴について学び、赤リンゴと青リンゴの画像の違いを特徴から抽出、次に来る新しいリンゴの画像を高い確率で分類するといったことが可能になります。

ディープラーニングは、機械学習と同様に現在のAI活用の文脈でよく語られる用語ですが、カテゴリーとしては機械学習の1種であり、機械学習を発展させたものでもあります。

主要な機械学習技術とディープラーニングの大きな違いは、「特徴量」を人間が指定するかコンピュータ自身が学習するかという点にあります。例えばリンゴの画像を分類しようとした場合、形に着目してしまうと赤リンゴと青リンゴを見分けるのは困難ですが、色に着目すれば見分けができそうです。この「色」が特徴量のひとつで、ディープラーニングではコンピュータ自身が大量の画像を学習する過程で「色に着目すべき」と判断します。

機械学習の手法

ディープラーニングを含め、機械学習の手法には大きく分けて4つあります。

教師あり学習

赤リンゴか青リンゴかの違いを学習させる際、画像に「赤リンゴ」や「青リンゴ」のラベルをつけた上でコンピュータに学ばせることを「教師あり学習」と言います。教師あり学習では入力に対しての正解が示されているので、コンピュータはそのパターンを学習していきます。

画像の識別はわかりやすい例ですが、他にも迷惑メールのフィルタリングにこの技術が使われています。安全なメールと迷惑メールにそれぞれラベルをつけて学ばせることで、コンピュータはそれぞれの境界線がどこにあるかを学び、次に来たメールが安全かどうかを判断できるようになっていきます。

教師なし学習

「教師なし学習」は、データにラベルをつけずにコンピュータに学習させます。ラベルがないのでコンピュータは正解が何か分かりませんが、与えられたデータの中から規則性や分類項目を見つけ出していきます。

教師なし学習の代表的な活用方法として、顧客データの分類が挙げられます。顧客データには性別や年齢、取引内容、取引の日付などが含まれていますが、リンゴの画像のように一意の正解があるわけではありません。しかしコンピュータは顧客データにさまざまな項目があることを学習し、データの分類を行うことができるようになります。

半教師あり学習

教師あり学習と教師なし学習の間に位置するのが、「半教師あり学習」です。教師あり学習を行いたくても、ラベル付きのデータを大量に用意することは困難なケースもあります。その場合は、少量の教師あり学習でパターンを学習させ、さらに教師なし学習でその精度を深めていくというアプローチが取られます。

強化学習

「強化学習」は、正解となるラベルがつかない点では教師なし学習と一緒ですが、違いは、コンピュータが出した出力内容を評価し報酬を与える点にあります。強化学習は、コンピュータが高い報酬を得るように動くことを求め、コンピュータ自身に処理方法を試行錯誤させていく技術です。

強化学習は、投資やゲームなど結果に優劣がつく分野での応用に用いられます。Googleの子会社であるDeepMindが開発し、当時の囲碁世界チャンピオンを打ち破り世界を驚かせた「AlphaGo」は、強化学習を用いて囲碁の勝ち方を学習したAIです。

機械学習の活用5ジャンル

機械学習を用いたAIサービスは、すでに私たちの生活のさまざまなところで展開されています。ここでは、予測・画像認識・音声認識・データ分析・自然言語処理の5つのジャンルに分けて事例をご紹介します。

①予測

予測は、機械学習が得意とするジャンルのひとつです。過去のデータを大量に学習することで、将来どのような結果が起こりうるかを予測することができます。

この事例としては、タクシーの乗車予測が挙げられます。どこに行けば利用客に乗車してもらえるかの予測は経験によって培われていくものですが、機械学習により過去のデータを学習することで、新人ドライバーでも利用客がいそうな場所の情報を得られるようになっています。ある実証実験では、AI導入の4ヶ月後、ドライバー1人あたりの1日の売上が1,400円以上も向上したという結果も報告されています。

(出典:NTT DOCOMOテクニカル・ジャーナル Vol. 26 No. 2 「AIタクシー ─交通運行の最適化をめざしたタクシーの乗車需要予測技術― 」

※画像はイメージです。

画像認識

画像認識も機械学習が得意としており、応用や組み合わせによりさまざまなサービスが登場しています。

シンプルなものでは、手書き書類の自動データ化です。手書きの書類をデータ化するには、従来であれば人が入力する必要がありましたが、機械学習により文字を識別する機能が進化し、入力作業を大幅に削減することが可能になっています。人的リソースを別の業務に活かせるだけでなく、入力内容も人が行うより正確だというメリットもあります。

画像データを用いたAIサービスとしては、動画のダイジェストやハイライトの生成なども行われています。長時間の動画から見どころを抜き出して短時間の動画を生成するもので、撮影後すぐにダイジェストを配信したい報道機関や手軽に動画編集を行いたいコンシューマー向けなどに展開されています。

(出典:NHK放送技術研究所

③音声認識

大量のデータを収集しやすい音声の認識も機械学習の得意なジャンルであり、自然言語処理や自動応答まで含めて現時点でも高いレベルに達していると言われています。

音声認識の技術が活用されている業種としては、コールセンターが挙げられます。顧客の問い合わせ音声からコンピュータが自動で何を要望しているか認識し、オペレーターがFAQや顧客データを検索するまでもなくディスプレイに表示させるサービスも登場しています。

コンピュータが自動応答まで対応することで、コールセンターの営業時間外でも受付が可能になっています。

(出典:PRTIMES「Hmcommが、通販大手ディノス・セシールとコールセンター集中呼自動応答(音声Bot)」の共同開発を開始」

※画像はイメージです。

④データ分析

大量のデータを収集しても、それを人の手で加工して分析するには膨大な時間がかかりますが、機械学習によりAIに学習させればより早く正確に分析を行うことが可能になります。

店舗の来客分析への応用はその一つの例です。店内に分析用のカメラを設置して顧客属性ごとの商品の購買傾向、売り場の移動の仕方などを分析する技術は、機械学習により高精度に行う技術も登場しています。これにより、従来以上にターゲットを意識した仕入れや商品配置、導線を意識した売り場作りなどの店頭施策の実施が可能になってきています。

(出典:monoist 2020年2月26日「トライアルが首都圏初のスマートストア、リテールAIによる流通情報革命の現場に」

自然言語処理

AIは目的に合わせたパターンを学習することで、人間が話す言葉を処理する「自然言語処理」の精度を高めていくことも可能です。

例えば、Laboro.AIではテキストを認識し、文書分類を自動で行う事例を手掛けました。ある大手通信企業では申込書の分類が担当者による手作業で行われていましたが、数が膨大なため、未振り分けのまま送られる伝達不要な情報まで伝達されてしまうという課題がありました。機械学習の1種であるニューラルネットワークによる文書分類アルゴリズムを構築することで、自然言語処理によるAIがテキストを分類、結果として業務改善につながっています。

(参考:プロジェクト事例 文書分類による業務自動化率の向上

※画像はイメージです。

機械学習がこれまでになかったサービスを創出していく

AI技術のひとつである機械学習は、人間ではリソース的にも精度的にも不可能だったデータの出力を可能とし、さまざまなサービスの創出につながっています。多くの応用例が登場しているため、こうした情報をキャッチしながら、自社内でのAI活用の可能性を探ってみるのがおすすめです。

Laboro.AIでは、オーダーメイドによるAIソリューション、「カスタムAI」を開発・ご提供しています。こちらに過去の導入事例・活用事例をまとめていますので、ぜひご覧下さい!

Laboro.AI カスタムAI導入事例