Laboro

プロジェクト事例

  • 金融
  • 保険
  • 画像認識
  • 画像識別
  • OCR
  • 業務効率化

画像アプローチからの手書き文字の読み取り

大手生命保険会社 様

  • 手書きOCRでは実現不可だった課題を画像AIで解決
  • 従来業務の大幅な効率化を実現

保険金の請求・支払業務の課題

生命保険の保険金請求は、手書きの紙ベースで行われるのが一般的です。保険会社はその内容を精査し、支払う保険金額の算定や支払可否の判断を行いますが、この作業は間違いが許されない非常にセンシティブな業務であり、同社では、申請書の内容を確実に処理するために多くの人材と時間を費やしていました。そこで同社では、手書きOCR技術を活用し、病名や手術名の読み取り作業を自動化することを計画しました。ですが、検討を進めていく中で、次の2点が容易に解決できないことが分かってきました。

①一般的なOCRパッケージ製品では、病名や手術名などの専門用語に対応できず、誤った判断をするケースが多い
②病名や手術名は表現の揺らぎ(同じ病気でも表現の仕方が複数あること)が多く、OCRで文字を読み取った後も、病名・手術名を熟知した作業者が名寄せ(社内の統一コードに変換する作業)を行う必要がある

とくに後者は致命的で、たとえどれだけ精度高く文字の認識ができたとしても、それを人手で振り分ける作業が残ってしまえば効率化につながることはありません。

カスタムAIの開発内容

そこでLaboro.AIでは、発想を転換したご提案を行いました。一般的にOCRを導入する目的は「テキスト化」にありますが、同社の場合、最終的に社内の統一コードに変換しているため、「画像識別でそれがどのコードに該当するかさえわかれば、テキスト化は必要ない」と考えたのです。

機械学習による画像識別では、一般的にそれぞれを指定する画像を大量に用意し、特徴を学習させるというアプローチが取られます。同社のケースでも、例えば「心臓病」と「がん」を区別するために、その記載のある手書き文字と最終的に振り分けたいコードをセットで学習したモデルを作り、識別を行ないました。また、「がん」と「悪性新生物」というように同一の疾病内で表現の揺らぎがある場合も、それぞれの画像に対して同一コードを紐づけておけば、AIがコード単位で識別を行うことができます。

このアプローチは、OCRのようにテキスト化の工程を踏まないため、読み取りの精度や表現の揺らぎといった問題にぶつからない利点もありました。

導入後の成果

このケースでは文字を読み取った後に病名コードに変換する必要があったことから、OCRのように文章解読を目指すことから発想を転換させ、画像として識別することによって「文字→コード変換」を実現しました。

同社では、この手法で申請書に記載されている手書き文字の読み取りを行なった結果、約80%の精度で正しいコードに置き換えることができました。もちろん、保険金の支払いというセンシティブな内容であるため、80〜90%の精度では完全に業務を自動化するには十分ではありません。ですが、ある程度の精度で確かな候補を判断できるようになったことで、担当者が一から該当項目を探したり、人手で内容を入力するといった手間が大きく減り、作業工数の削減につながっています。

一覧に戻る