Laboro

Laboro.AIコラム

無意識で意識的な自然言語処理

2022.10.21
株式会社Laboro.AI リードマーケター 熊谷 勇一

概 要

インターネット検索、ニュース記事などのウェブページの機械翻訳、スマートフォンでの音声認識、問い合わせの際のチャットボットなどなど、私たち人間が扱う言葉を認識して何かしらの出力を返すサービスは、最も身近なAIの実装例と言えるでしょう。これらに共通するAI技術は「自然言語処理」と呼ばれ、AIの中でも最近になって特に発展している分野です。

目 次

自然言語処理とは
 ・無意識に使っている自然言語処理
 ・意識的に使うべき自然言語処理
自然言語処理の仕組み
 ・コーパス
 ・フェーズ1:形態素解析
 ・フェーズ2:構文解析
 ・フェーズ3:意味解析
 ・フェーズ4:文脈解析
自然言語処理の活用事例​
 ・検索エンジン
 ・音声対話システム​
 ・大量の文書データを分類・評価
 ・大規模な調査業務における文章抽出作業
 ・適切なテキストを自動生成
自然言語処理との付き合いはもう始まっている

「自然言語処理」とは

自然言語とは、我々人間が操る言語のことを指しており、「自然」は人間のことを指しています。AI活用における自然言語処理について話すとき、自然言語の対になる概念は、機械語などを要素として持つプログラミング言語です。

自然言語は人同士がコミュニケーションを取るために発達してきたもので、ある程度の曖昧性(一つの文字列で意味が複数成り立つこと)を含んでいます。例えば同じ言葉の並びでも、切り方で意味が違ったり、状況によって捉え方が変わったりします。

一方のプログラミング言語は、記述された文は一意であり、コンピュータはプログラミング言語に従って決められた処理を行います。

自然言語処理とは、コンピュータをプログラミング言語ではなく自然言語に対応させることを指します。AIの代表的な技術である機械学習、とりわけディープラーニングが発達し、ゲームや画像認識などで先に活用・実装例が出てきましたが、自然言語処理は後述するBERT(Bidirectional Encoder Representations from Transformers、Transformerによる双方向のエンコード表現)というモデルを基に近年大きく発展してきています。

こうした自然言語処理は、Natural Language Processingの和訳で、エンジニアの間では専ら略称のNLPと呼ばれています。ただ、NLPというと、Neuro-Linguistic Programming、神経言語プログラミングの略称でもあり、プログラミングという名前が付いていますが、学問としては心理学の領域です。文脈によってどちらを指すか変わってきますので、注意が必要です。

無意識に使っている自然言語処理

パソコンやスマートフォンで使えて私たちが最も頻繁に使っているNLPは、予測変換かもしれません。日本語の場合、単語ごとではなく、1文などある程度の長さの文字列を入力すると、品詞ごとに変換候補を示してくれることがあります。これは後述する形態素解析ができている状態です。また、採用数が多い変換候補は次に出てきたときは最初に示してくれたり、Wordなど文書作成ソフトの製作者側に形態素解析や変換候補表示の質についてフィードバックを与えるとゆくゆくは改善されたりします。

インターネット検索も、NLPの賜物です。検索したい言葉を入力して、その文字列と一致する文字列を含むウェブページを提示するのはもちろん、検索したい言葉と一緒によく検索されている言葉を提示(サジェスト)したり、検索語にスペルミスやタイプミスがあっても正しいであろう文字列で検索してくれたり、といった機能が拡張しています。

意識的に使うべき自然言語処理

近年、急速に精度が上がってきたと言われているのが、機械翻訳です。英語ではMachine Translationなので、略してMTと呼ばれることもあります。例えば、2017年にサービス提供を始めたドイツのDeepL(ディープエル)は、それまで精度がかなり高いと見られていたGoogle翻訳よりも精度が高いという評判を集めています。現在、日本語を含む27言語に対応しています。

しかしいくら精度が高いといっても、出てきた訳文がそのまま翻訳書となって出版できるレベルには全く到達していません。仕事上で外国語で書かれた資料を要約してリポートを作るなどという場合にも、MTが生成した訳文をそのまま使うのは避けた方がいいでしょう。もし使うとしても、大幅な書き直しを前提とした土台の文章を出力してくれるシステムとして捉えるべきです。

けれども機械翻訳は、外国の好きなアーティストや友人のSNS投稿などの意味をなんとなく知るくらいであれば、価値があるでしょう。特に英語以外の言語で書かれていればなおさらで、従来であれば多くの人にとって全く調べようがなくお手上げだった文章の意味が少しでも分かるようになったのは画期的です。グローバルなコミュニケーションが促進されているとも言えるでしょう。

文字起こしや議事録作成サービスもAIの恩恵で生まれた便利なシステムです。従来は他人が話していることをその場でなるべく文字入力していくなり、ノートや録音を駆使して記録して後で見返し・聴き返しするなりして、文書を作成する必要がありました。しかし現在実現している文字起こし・議事録作成サービスは、精度はもちろん完璧ではありませんが、感覚的にいえば「しょうがない、直してやるか」と作業したくなるほどの精度で仕上がってきます。この「作業したくなる」というのが重要で、後で一から録音データを聴き直して文書を作成することと比べたら、格段に気が楽です。行動経済学で言うところの「ナッジ(そっと促す)」にも通じるでしょう。「AIは人間活動の補助をするためにある」ことにもつながります。

東京大学・松尾豊研究室発のAIベンチャーELYZA(イライザ)は2021年に、文章の要約文を生成するAI「ELYZA DIGEST」を試せるデモサイトを公開しました。どんな文章も3行(正確には3文)で要約するということで、やや古いですがインターネットミーム「今北産業」(話の展開が早いスレッドの流れを「今来た(今北)から手っ取り早く3行(産業)で教えてくれ」とお願いすること)にもセンスが通じます。

Wordなどの文書作成ソフトにも実装されているのが、校正機能です。誤字脱字や表記揺れや文法上誤った表現などを拾ってくれます。こちらももちろん、人間が不適切と思う点を全部拾ってくれるわけではありませんが、校正という間違いをなくす作業をする上で、使わない手はありません。

自然言語処理の仕組み

AIが自然言語を処理するときに必要となるのが「コーパス」というツールです。これを用い、四つのフェーズで処理していきます。以下、コーパスとフェーズを一つずつ解説します。

コーパス

コーパスは、簡単に言えばその言語において実際に使用されている例文を集め、文法などの構造情報を整理したデータベースです。新聞記事や小説、辞書、インターネット上の記事、SNSなどから文章を集めたものをテキストコーパス、インタビューや講演などを収録した音声データを集めたものを音声コーパスと言います。

人間が母国語以外の言語を学ぶとき、単語や熟語の辞書的な意味を覚えるだけでは不十分で、例文にいくつも触れることで学習を進めていきます。AIによる自然言語処理も同様で、辞書的な意味を覚えさせるだけでは不十分のため、学習のためにコーパスが使用されます。

コーパスの中には、各単語に品詞のタグを付けたコーパスや、語義のタグを付けたコーパスなどがあります。自然言語処理をするAIは、このコーパスを使って頻出する単語同士の関係性やよく使われる会話パターンなどを学習していきます。 テキストコーパスはオンライン辞書サービスであるWeblioなどで見たことがあってなじみがある方が多いかもしれませんが、音声コーパスはちょっとイメージがつきづらいかもしれません。 Laboro.AIではTV録画から長時間音声と字幕テキストを抽出して音声コーパスを自動構築する独自システムを用い、約2000時間に及ぶ音声データから構築した日本語音声コーパス「LaboroTVSpeech(ラボロティービースピーチ)』を開発し、学術研究用に無償公開しました。

フェーズ1:形態素解析

自然言語処理の第1段階として行われるのが、形態素解析です。

形態素とは、意味を持つ最小単位を指します。厳密には、形態素は品詞よりもさらに細かく分類したものを指しますが、さしずめ品詞と言っても差し支えありません。「私は犬が好きです」という文があったとき、形態素に分割すると以下のようになります。

私 は 犬 が 好き です

形態素解析では読み込んだ文を上記のように一つひとつの形態素に分割し、名詞や助詞といった品詞に分類し、コンピュータが一つひとつの意味を認識できるようにします。

形態素解析には、専用の形態素解析エンジンが使われます。

フェーズ2:構文解析

形態素解析の次は、文の構造を理解するための構文解析が行われます。

構文解析では、分割した形態素同士がどのような関係になっているかを解析し、構文としてつなげていきます。

例えば、上記の例では「私は」「犬が」といったように文節(日本語の言語単位の一つ。文の構成要素で、文を実際の言葉として不自然にならない程度に区切ったとき得られる最小のひとまとまりのもの)にまとめることはできますが、「は犬」「が好き」でまとめることはできません。構文解析を行うことで、文を構成する形態素がそれぞれどのような関係なのかを解析していきます。

フェーズ3:意味解析

構文解析の次は、意味解析が行われます。

これは名前の通り、解析した構文がどのような意味を持つかをコンピュータが判断するために行われます。コーパスを使って学習するなどしてさまざまな意味を学習しているAIが、解析した構文を参照し、どのような意味になっているかを解析します。文が曖昧さを持っていて解釈の可能性が複数ある場合、どの解釈が妥当かの判断もここで行われます。

フェーズ4:文脈解析

最後に、文脈解析が行われます。

文脈解析では、複数の文を解析し、その文脈ではどのような意味を持つのかを判断します。自然言語は同じ単語でも文脈によって意味が変わることがあるため、ここではそうした意味の変化をAIが認識します。

自然言語処理の活用事例​

AIによる自然言語処理を活用することで、我々の生活を便利にするさまざまなサービスが登場しています。ここでは、いくつかの活用事例についてご紹介します。

検索エンジン​

検索エンジンとして世界一のシェアを誇るGoogleは2018年、前述のBERTを発表し、2019年から日本語も含む検索エンジンにも導入されています。

BERTは機械学習による自然言語処理技術の1種で、特に文脈を読み取って意味を判別できることに強みを持っています。例えば、文の中に「アップル」「Apple」という言葉が出てきても、カタカナならIT企業、英語なら「リンゴ」の意味、といった具合に意味を前もって付与しているわけではなく、前後に「iPhone」や「スティーブ・ジョブズ」が出てきたらIT企業、「農家」や「収穫」などが出てきたら「リンゴ」、と文脈を踏まえて判断していきます。

BERTからはその後、派生モデルがつくられ続け、数十以上も生まれています。また日本でもなじみが深いLINEは、BERTとは異なる新たな大規模汎用言語モデル「HyperCLOVA」を開発しています。

Laboro.AIでは、BERTを独自に事前学習させた日本語版モデル「Laboro BERT」を開発し、オープンソースとして公開しています。さらにこのLaboro BERTに「蒸留」を施し、より一層の軽量・高速化を図った言語モデル「Laboro DistilBERT」を開発し、非商用途にオープンソースとして公開しています。

出典:WIRED「Googleの検索エンジンに「過去5年で最大の飛躍」。新たな言語処理モデル「BERT」の秘密
  :SB Technology「最先端の AI を活用してテキスト分析をしよう ~Transformers を活用した BERT と ELECTRA の利用~
  :Laboro.AIコラム「Laboro.AIオリジナル日本語版BERTモデルを公開
  :Laboro.AIコラム「オリジナル日本語版BERTモデルをさらに軽量・高速化『Laboro DistilBERT』を公開

音声対話システム​

自然言語処理はテキストベースだけではなく、音声ベースでも発達を続けています。音声の自然言語処理を用いたサービスとして代表的なのが、音声対話システムです。

音声対話システムには、SiriやGoogle Assistant、Amazon Alexa、前述のHyperCLOVAも開発しているLINE CLOVAなどが挙げられます。これらのシステムでは話者であるユーザーの発話内容を解析し、意味を判断した上で音声を返答することができます。さらなる開発で精度が上がれば、質問に的確に答えたり、アプリを操作したりといった利便性の向上につながっていきます。

また、AIを用いることで高いレベルでの音声入力に対応した事例として、日本語入力アプリ「Simeji」があります。Simejiでは早口で話してもある程度正確に入力ができるとしており、句読点を自動で入力する他、文脈に合った絵文字や顔文字の提案を行うこともできます。

出典:ITmedia「AIによる音声入力機能を「Simeji」に提供 顔文字をレコメンド、句読点も自動で

AIによる音声認識については、以下の記事で詳しく解説しています。
音声認識AIのいま。その技術や事例を知る

大量の文書データを分類・評価

自然言語処理を活用することで、大量の文書データを解析し、分類したり評価したりすることも可能となります。

Laboro.AIでは、AIが文章の内容を解析する「文章分類・評価ソリューション」を提供しています。

文章分類・評価ソリューションでは、大量の文書データを分類したり、特定のタグを付けたり、内容を評価してスコアリングしたりできます。これにより、大量にある文書の中から必要な情報だけを抜き出したい、人の手では処理できない文書を分類したいといった要望を実現することができます。

大規模な調査業務における文章抽出作業

日本総合研究所様の事例として、大規模な調査業務の煩雑な作業をカスタムAIによって解決した事例があります。

年々データ量が増えていく調査では、従来は人力で情報を収集していましたが、Laboro.AIではカスタムAIを作成し、インターネットから自動で文章を収集し必要な情報を抽出できるようにしました。

このカスタムAIにより、調査を行うアナリストの負担が大幅に削減されることが見込まれています。

この事例について詳しくは、以下のページをご参照ください。
ESG企業調査での情報収集・評価

適切なテキストを自動生成

日本経済新聞は早くも2017年1月から「AI記者」を採用し、企業が開示した決算発表資料から業績データや要点を抽出して記事の体裁に整える「決算サマリー」を導入しています。サイバーエージェントは2022年に効果的な広告テキストの自動生成を開発し、人気ゲーム「ウマ娘 プリティーダービー」の広告制作に導入しました。

出典:日本経済新聞「決算サマリー AIによる自動作成
  :サイバーエージェント「自然言語処理を用いた効果的な広告テキストの自動生成【CADC2022】

高性能な言語モデルとしては、Open AIが2020年に発表したGPT-3(ジーピーティースリー)があります。GPT-3は、桁違いに膨大なテキストデータを用いて学習することで、従来必要だった再学習(ファインチューニング)を必要としない言語モデルを実現しています。マイクロソフトが独占ライセンスを取得し、同社のクラウドサービス「Microsoft Azure」上で利用できるAPI(申請制)として公開されています。これにより、記事や小説を自動生成したり、ゲームでストーリーに沿った会話をインタラクティブに生成したり、文章でイメージを伝えるだけでアプリケーションのデザインを生成させたりすることなどができるようになります。

出典:NRI“GPT-3

自然言語処理との付き合いはもう始まっている

以上のように、自然言語処理は私たちの生活や仕事の中にかなり入ってきています。「自然言語処理による出力の精度はまだまだ高くないので、なるべく使わないようにしよう」ではなく、精度に注意しつつどううまく付き合っていくかを探り続けるのが、生活や仕事での変化に対応していくのに求められる態度でしょう。

Laboro.AIでは自然言語処理に関して多くのソリューション提供だけでなく、独自の開発でも複数の実績があります。ぜひお気軽にご相談ください。

カスタムAIの導入に関する
ご相談はこちらから

お名前(必須)
御社名(必須)
部署名(必須)
役職名(任意)
メールアドレス(必須)
電話番号(任意)
件名(必須)
本文(必須)

(プライバシーポリシーはこちら