画像識別 手書OCR

大手生命保険会社

ビジネスプロセスを理解し、問題を広く捉え直す事で、手書帳票の自動認識精度を飛躍的に向上

企業情報

事業
生命保険
課題
審査プロセスにおける手書帳票読み取りと内容確認作業の効率化・外注の削減
導入部門
審査部門

導入のポイント

  • 保険金請求の審査における、手書帳票の読み取りに機械学習技術を導入
  • 「手書き文字認識」+「認識結果名寄せ」のビジネスプロセスを、統合した画像識別の問題として捉え直し、End-to-endで処理する事で高い精度での認識を実現

課題

生命保険の保険金請求は、契約者からの申請が手書きの紙ベースで行われており、その読み取りと確認に社内外のリソースを費やしていた。

また、病名や手術名は同一の病名でも複数の表現があるなど表記の揺らぎが大きく、手書き文字を読み取った後も、病名・手術名を名寄せ(社内の統一コードに変換)する必要があった。この作業は病名・手術名コードを熟知した作業者が、二重三重のチェック体制の下で実施していた。

しかし、通常のOCRシステムでは、病名や手術名などの一般的で無い表現には対応できないため誤りが多く、既存ソリューションによる自動化は難しかった

対策

手書き文字を読んだ後に、名寄せ(コード変換)が必要なことに着目し、手書OCR+自然言語識別の組み合わせ問題では無く、手書き文字の画像を直接コードに変換する画像識別の問題として捉え直した。

最先端の画像識別ニューラルネットワークモデルのXceptionをベースに、手書き帳票の横長の入力に対応できるようにカスタマイズして適用した。

保険請求という問題の性質上、最終的な人手での確認は必須であることから、Top 5までの候補をその確率と共に提示した。

効果

最終的なコード変換の正解率は、Top 1で80%、Top 5で90%を超え、従来の手書OCR+自然言語識別を直列に適用した場合と比べて飛躍的に高い認識精度を実現

Top 5までの提示で、人間のサポートツールとして用いる事で工数を大きく削減できる事を検証した。