このページの本文へ

AI OCRとは?成功のポイントは認識精度を理解し業務全体を見直すこと

  • 生産性向上
だんだん明らかになってきたAI OCRの限界 業務全体を今一度見直すことが成功のポイント

AI OCRは、手書き文字の認識処理工程にAI技術を組み込むことで、読み取り精度を大きく向上することができます。しかし、AI OCRでも、あらゆる手書き文字を100%の精度で読み取れるわけではありません。「AI OCRの認識精度の限界」とどう向き合い、どのような検討が必要になるのかを解説します。



AI OCRとは

AI OCRとはAI技術を活用したOCRの仕組みやサービスのこと。海外ではICR(Intelligent Character Recognition)と呼ぶこともあります。AIの特徴である機械学習やディープラーニングによって、文字の補正結果を学習し、文字認識率を高められます。

AI技術がない、一般的なOCRの場合、シンプルな文字ほど誤認率が高くなる傾向にあります。この現象はOCRの文字認識をする過程で、線が交差する箇所を数えるという特徴からくるものです。カタカナの「エ」と工事の「工」などをイメージするとわかりやすいでしょう。

一般的なOCRソフトでは誤認しやすいこのような文字の違いも、AI OCRならば学習を重ねることで認識しやすくできます。AI OCRだからといって100%の識別ができるわけではありませんが、大きな業務効率化につなげられます。

AI OCRとOCRの機能の違い

AI OCRとOCRの大きな違いはAIを活用しているか否かという点とAIの学習による読み取り精度の向上に差が出てくる点です。

日本では、契約書類、依頼書などの各種申込用紙やアンケート用紙など、デジタル化が進んだ今日でも紙帳票からの入力が数多くあります。これらの入力作業では、活字のOCRによる効率化は進んできましたが、手書きの認識率は高くなく、実用化が難しい領域と言われてきました。特に、日本語の漢字やひらがな、カタカナには複雑なパーツが分かれている文字が多く、OCRによる入力効率化が困難でした。

OCRにAI技術をかけ合わせるメリット

この課題を解決するのが、AI技術です。OCRにAI技術をかけ合わせることで2つのメリットがあります。

  • ディープラーニングにより読み取り精度が継続的に向上
    誤認識を学習することにより文字認識率を継続的に向上できます。また、手書き文字に対応できます。
  • 業界用語に対応可能
    トレーニングデータを用意することで、さまざまな言語、業界用語の手書き文字認識への応用もできます。

AI OCRによる業務効率の向上が見込める業務例

文字認識率が高く、フォーマットが統一されていない帳票でも対応できる「AI OCR」は、契約登録やFAX処理などの業務を大幅に効率化できます。

金融機関 金融機関銀行口座開設申込書、公共料金申込書、口座振替依頼書、振込依頼書、クレジットカードの申込書、リース申込書
電気・ガス・水道 公共料金の申込書
企業のマーケティング・CSR部門 お客さまの声やアンケート用紙
医療機関 問診票、診断書
教育機関 テスト答案

具体的な活用例をいくつか紹介します。

①流通業のFAX注文処理業務

Before

  • FAX受注の翌日には出荷するため、深夜帯にも入力対応が必要
  • パンチ入力の負荷が大きく、処理が間に合わない場合があり、翌日セールスドライバーが代行入力するイレギュラー対応がある

After

  • ペーパレスFAXと発信番号別振り分けにより帳票仕分けの手間を削減
  • 手書き帳票のOCRによりパンチ入力が不要になり、事務工数を削減

②製造業の保守登録業務

キヤノンマーケティングジャパンの自社事例です。クラウド型AI OCRとRPAを活用し、1件平均31分かかっていた処理業務を約2/3に短縮しました。

Before

  • 手書き申込書のパンチ入力負荷が大きい
  • 最終登録時に、書類とPC画面を見ながらの確認作業に時間が掛かる

After

  • 自動仕分け・自動テキスト化により作業負荷を軽減
  • 最終登録時の確認用に専用画面を開発し、確認時間を削減

AI OCRの注意点は?
100%の認識精度は不可能だと知ることがまず大事

イメージ:AI OCRの認識精度は100%ではない

画像として取り込んだ文字を読み取り、テキストデータとして抽出できるOCR(Optical Character Recognition:光学的文字認識)。文字入力の手間を削減できることから、書類や帳票の内容を業務システムにデータ入力する際などに重宝されてきました。しかし、活字の読み取りはお手のものであるOCRも、手書き文字の認識には弱く、実務での活用は難しいという状況が長く続きました。

そんな中、次世代のOCR技術として新たに研究開発されたのが、文字の認識処理工程にAI技術を組み込み、読み取り精度を大きく向上させたAI OCRです。もっとも、AI OCRと言えども、あらゆる手書き文字を100%の精度で読み取れるわけではありません。実用においては、読み取りの実力値のみにフォーカスするのではなく、OCRに最適な画像クオリティを確保する前処理を行ったり、後処理として辞書テーブルとのマッチングで読取結果を補正したりするなど、包括的なアプローチが必要不可欠です。

そうした「AI OCRの限界」とどう向き合い、どのようなスタンスで付き合っていくことがベストなのかを改めて考える必要があります。

人間によるチェック&修正は必須でも、手間やミスが減るなら導入の価値あり

一億総活躍社会を目指して政府が推し進める働き方改革を背景に、さまざまな業務改善につながる新テクノロジーとして注目を集めているAI OCRですが、今後も100%の精度を実現することは理論上不可能であり、実務で有効活用するためにはどう発想を転換できるかが一つのカギとなります。

重要なのは、「AI OCR=すべてを任せっきりにできる」という発想は捨てること。読み取り精度ばかりにとらわれず、AI OCRは不完全なものだと認識した上で、ベストな付き合い方を見つけることが大切なのです。すなわち、AI OCRを利用する際には必ず人間によるチェック&修正作業が不可欠になりますが、そうした手間を加味しても業務効率化や費用対効果につながるかどうか、まずは慎重に見極める必要があります。

人手によるデータ入力は、業務時間の長さや疲労の蓄積にともない、どうしても打ち間違いや入力漏れなどのミスが起こりやすくなるもの。たとえチェック&修正作業が必要になったとしても、データ入力からすべて人間が行っていた時と比べて手間が軽減され、ミスの削減につながるのであれば、十分に導入する意味があるのです。

情報を取得し、学習を繰り返すことで、精度が向上していくAI

例えば、目の前の書類に「工事」と書いてあるとします。皆さんは特に意識しなくても、瞬時に「こうじ」と読むと思いますし、「工」という字をカタカナの「エ」と間違えることもないでしょう。これは、今まで生きてきた過程の中で身につけた文字や言語情報、シーンを判断するバックボーンがあるからであり、その書類がどういう目的のもので、他に何が書かれているかも重要な判断材料となります。

同じように、AIもその能力を発揮するためには、まず情報を得ることが大前提となります。AIの識字率向上に寄与するもの、それはさまざまなパターンのデータを取り込み、膨大な量の学習を繰り返すことで「違いを見分ける力」をつけるディープラーニングという学習法です。ディープラーニングは人間の脳神経回路にヒントを得た学習アルゴリズム「ニューラルネットワーク」をベースにした機械学習の手法であり、入力層、中間層、出力層の3層のうち中間層部分を多層にすることで、AI自らより複雑な判断ができるようにしたものです。

例えば、猿を猿と認識するためには、あらかじめ学習しておいた猿の特徴と照合する必要がありますが、ディープラーニングで大量に学習することで人が直接関与しなくてもAIが自動で学んでいきます。そしてその精度は、学習するデータの質と量に影響を受け、学習に適した良質なデータが増えれば増えるほど継続的に向上していきます。

実は単純な文字のほうが誤認されやすいってホント!?

ひらがな、カタカナ、漢字と、実にたくさんの種類の文字がある日本語。画数の多い漢字など複雑な文字ほど、AIも苦手なのでは?と思いませんか。でも、本当は逆です。細かな特徴を見分けなければならないという意味で、実はカタカナなどシンプルな文字のほうが、違いを判断するのが難しいのです。「ソ」と「ン」、「ハ」と「へ」、「イ」と「ト」など、カタカナは単純であるがゆえに、ほんの少しの傾きやずれで全く別の文字に見えてしまいます。

特に手書き文字はその人の個性やくせが出やすく、より判断が難しくなります。前述のとおり、AIの読み取り精度は学習してきたデータが増えるほど向上していきますが、AI側がいくら学習を重ねても人のくせ字は治りませんし、微妙な違いをAIに正確に識別させることはこれからも困難でしょう。

AI OCRの導入事例

AI OCRの導入で実際にどのような業務課題が解決されるのでしょうか? 業務で紙書類が多く使用されている銀行の事例です。

1日100枚近く発生する紙書類の処理をAI OCRとRPAで自動化|横浜銀行

イメージ:AI OCRとRPAの導入事例

2020年に創立100周年を迎えた横浜銀行。同行では行員の生産性向上による営業強化のためルーティン業務の見直しに着手しました。AI OCRとRPAでネットバンキングの申込書類の処理などを自動化し、業務効率化を実現しています。

課題

  • 営業面に力を注ぐために、コストを抑えながら業務を効率化する必要があった
  • 効率化すべき900の業務のうち、約半数で紙のやり取りをしていることが判明
  • 紙は手書き書類が多く、膨大な手入力業務が発生し、RPA導入のボトルネックに

効果

  • 手書きされた紙を起点とする業務もRPAの対象として処理の自動化に成功
  • 書類の処理スピードが向上し、業務量についても大幅に削減できる見込み
  • 手書きAI OCRシステムの活用により、今後もRPAの対象業務拡大を予定

AI OCRソリューションを比較

クラウド型AI OCRソリューション「CaptureBrain」

「CaptureBrain」はキヤノンが長年培った独自の画像処理技術と、AIエンジンを組み合わせたAI OCRソリューション。手書き帳票などをクラウドへアップロードすることで、自動的に帳票種別を判断、OCR処理を実行します。

キヤノン独自の画像処理技術により、OCRで読み取りやすい画像にAIが自動補正することで高い文字認識を実現しています。もちろんOCRで出力したデータは修正、編集が可能。API連携により、自社の業務システムやRPAなどとの連携もできるため、多くの業務に対応できます。

手書きAI OCRソリューション

手書きOCRソリューションのフロー図

[手書きAI OCRソリューション]は、これまで、認識率が低いと言われてきた手書き文字のOCRによる文字認識に、AI技術を活用し、実用的なものにするソリューションです。キヤノン独自の画像処理技術によるOCR開発キット「Rosetta-Stone-Components」とコージェントラボのAIを活用した手書き文字OCRサービス「Tegaki」(Cogent Labs社)を連携させたシステムとしてご提供します。

AI OCRの導入を成功させるには、人間のマネジメントが不可欠

AIと混同されがちな概念としてRPA(Robotic Process Automation:ロボット技術による業務の効率化や自動化に向けた取り組み)がありますが、AIとRPAは本来全く異なるカテゴリーの技術です。AIが人工知能の名のとおり、情報をもとに自身で分析したり、やるべきことを判断するのが得意なのに対し、繰り返し作業を行うことに長けているのがRPA。両者の連携によって、AIが判断したデータをもとにRPAが作業したり、RPAの作業データを取り込んでAIが分析したりと、相互に作業を補完し合いながらこれまで人間が時間を掛けて行ってきた事務作業を効率的に処理することが可能になります。

もちろん、AIが一から自分で考えて行動するわけではなく、事務作業の効率化を実現するには知識や経験に長けた人間によるマネジメントが欠かせません。具体的には、AI、RPAが代替できる事務作業と人が引き続き対応すべき事務作業の線引きを行うことがまず大事であり、処理のスタートからゴールまでどのステップでどの程度の工数短縮が見込めるかという設計が必要です。例えばキヤノンでは、費用対効果を出すために業務の絞り込みや対象となる帳票を選別するところからお手伝いすることが可能ですし、お客様の業務にはどんなシステム構成が最適かという観点でスキャナなどのハードウェアや文書管理などの保管先、データ分析ツールなどもトータルにご提案させていただくことができます。

人間のマネジメントの下、AI OCRとRPAとの連携が本格化していくことで、一歩先の顧客満足を生み出せるものと期待されています。一例を挙げると、保険業務であれば、AI OCRとRPAの連携により査定自動化を実現できれば、給付金の支払いまでのリードタイムの短縮が可能になります。これが発展すれば、近い将来、無意識のうちに必要な手続きが終わり、給付金が受け取れる、そんなこともけっして絵空事ではないのです。

夢のテクノロジーとして、あたかもあらゆる不可能を可能にする技術のように語られがちなAI。しかし、どこまでいってもAIが人間を超えることはあり得ないというのが、今の大半の識者たちの見方です。AI OCRとRPAの連携はあくまでもワークフロー効率化の一手段として捉えて、上手に有効活用していきましょう。

キヤノンマーケティングジャパンでは、AI OCRやRPAをはじめとした業務効率化のためのソリューションを数多く手がけています。お気軽にご相談ください。



こちらの記事もおすすめです

関連ソリューション・商品

ドキュメントソリューションに関するご相談・お問い合わせ

キヤノンマーケティングジャパン株式会社 デジタルドキュメントソリューション企画課