ペーパーレス化を促進するならAI-OCR導入がお勧め
いま最も注目されているIT技術がChatGPTをはじめとする自然言語処理AIですが、その技術は今に始まったものではなく、すでに長い研究開発と実用化の歴史をベースにしています。この技術を、スキャナや複合機と組み合わせたソリューションがAI-OCRと呼ばれ、紙ベースの既存業務をデジタル化する決め手として普及してきております。今回は、AI-OCRの概要とメリットを解説します。
<目次>
・AI-OCRって何?
・AI-OCRには目的に合わせてタイプがある
・AI-OCRが人気となった背景は?
・AI-OCR導入のメリットは?
AI-OCRって何?
スキャナ専用機や複合機でデジタル画像にした紙上の文字を、専用ソフトウェアでデジタル文書に変換できることはご存知のことと思います。この技術はOCR(Optical Character Recognition/光学的文字認識)と呼ばれ、これまでも紙文書のデジタル化におおいに貢献してきました。その認識精度は10年前でも90%以上になっていたのですが、実際に認識結果をシステムに直接連携させることは避けられてきました。たとえ認識精度が99%であっても、100文字中1文字は誤認識されるのですから、厳密な文字・数字の入力が必要な場面では、システム入力前に人間による何段階かの確認作業が必要になり、省力化がそれほど期待できませんでした。
ところが、現在では新しいAI技術であるディープラーニング(深層学習)を応用することで、従来よりもはるかに高い精度で自動文字認識が可能になっています。この技術を活用したOCRソフトウェアと対応するスキャナや複合機を組み合わせたソリューションがAI-OCRと呼ばれています。そのポイントは、最新AI技術を適用した自動認識エンジンをもつことと、自動認識に適した解像度やノイズ除去機能を備えた前処理機構を備えること、そしてあらかじめ用意された業界用語などの辞書との照合により読み取り結果を補正する後処理機構があることです。これらの技術・機構が目的に合わせた高精度な認識性能につながっています。
AI-OCRの文字認識精度は、数字や学習済みの限られた文字・文字列(業界用語や取引先間での共通明細項目名など)であれば、それが手書きであってもほぼ100%の認識率が実現しています。また、日本語・英語など様々な言語の文字を対象にしても、従来よりもはるかに高い認識精度をもっており、この性能と機能を利用すれば、人間が変換結果を確認する作業を大きく削減することが可能になり、省力化とシステム入力までの時間短縮を図ることができます。
さらに、AI-OCRは文字だけでなく帳票のレイアウトを学習し、定形フォーマットであれば文字や数字の位置によってもその項目を判別し、業務システムで定義された項目にその文字や数字を紐づけて出力することができます。様々な帳票フォーマットを学習させておけば、その帳票に合わせて自動的にシステム入力すべき情報を抽出して業務システムに自動連携・自動入力することが可能です。単に文字や数字の認識精度が高いだけでなく、同じ目的の帳票であれば自動的に業務システムが必要としているデータフォーマットに自動置換して連携できるため、業務システムへの人間の手入力や結果の目視確認作業を大幅に削減できることになります。
AI-OCRには目的に合わせてタイプがある
AI-OCRソリューションは、基本的には現場でスキャナや複合機で紙原稿をデジタル画像にし、読み取った画像をネットワーク経由で自動認識ソフトウェアに渡し、認識結果を業務システムや管理用PCに転送するという仕組みです。自動認識ソフトウェアを自社サーバーに置くこともでき、クラウドサービスも使えます。オンプレミス構築とするか、クラウドサービスを組み込んだソリューションを選ぶかが最初の判断となります。機密情報を外部には出さないポリシーの組織や業務にはオンプレミスタイプ、そうでなければ認識エンジンの学習による性能改善が継続して期待できるクラウドタイプがお勧めです。
もう1つの判断ポイントは、定形帳票・文書を対象にするのか、一般的な非定形文書を対象にするのかです。AI-OCR製品にはこのどちらに重心を置いて設計されているかの違いがあります。帳票レイアウトの学習やシステム連携を必要とする場合は前者のタイプ、アンケートの文章などのような非定形文書が主な対象であれば後者のタイプがお勧めです。
さらにもう1つのポイントは、「業務特化型」と「汎用型」の別があることです。汎用型は文字どおり、どのような帳票・文書にも対応しますが、比較的認識精度が低くなります。業務特化型は、業界用語をはじめとする業務に関連の深い文字などを学習済みなので、対象業務においては認識精度が著しく高くなります。ただし汎用的には利用しにくい面もあります。
AI-OCRが人気となった背景は?
ペーパーレス化はコンピュータの登場以来ずっと期待されながら半世紀以上を経た今でも残る課題です。しかし現在まで完全には解決できていません。特に日本企業の業務プロセスには伝統的に紙の伝票・帳票・文書が分かちがたく組み込まれてきた歴史があります。そのビジネススタイルを捨て去ることはそう簡単ではありません。特に取引先の多い企業の見積り・受発注、納品・検収、契約、経費などの会計システム入力などには多種多様な伝票/帳票が利用されており、紙そのものの手渡しやFAXでのやり取りがどうしてもなくせないことが多いからです。また自社内でも紙ベースの業務をデジタル化するのも現場の抵抗や新規ITツール導入予算が限られるために難しいケースも見受けられます。外部の取引先の協力も得ながら業務のデジタル化、システム化に臨むのが理想ではありますが、なかなかそうもいかないのが実情でしょう。
しかしデジタル化は時代の趨勢であり、早急に取り組まなければ競争力を失うのが目に見えています。DXの必要性が叫ばれていますが、そのベースとなるアナログ情報のデジタル変換(デジタイゼーション)ができなければますます他社に遅れをとるリスクが高くなっています。
そこで、一部には紙の帳票を残したままではあってもデジタル化を進めたいという企業が増え、そのための有力選択肢としてAI-OCRが普及しているのです。また一方では電子帳簿保存法への対応のために税務関連の書類のデジタル化して保管したうえ、同法が条件としている検索性を確保する目的でも利用されています。
AI-OCR導入のメリットは?
見積り・受発注・契約・物流などのケースのほか、マーケティング部門では顧客のアンケート調査に多用されています。これはシステム連携による自動処理というより、デジタルデータにして分析・加工を容易にする目的が主になっています。
また医療機関での問診票や診断書などのデジタル化、教育機関でのテスト答案のデジタル化、銀行や各種公共事業機関での申請・依頼などにも利用価値が高いとして普及が見込まれています。
情報の発生源として紙が主となる業務では、すべての業務の効率化が図れますが、特に比較的定形的な紙文書に最も適し、従来のOCRとは違い手書き文字でも高精度に認識できる特徴を活かした活用法がお勧めできます。
AI-OCRは帳票の種類の自動判別と、必要なデータの抽出が可能なので、様々なフォーマットの書類でもスキャンするだけで管理用システムや会計システムに必要データが自動入力でき、電子帳簿保存法に準拠した保存と検索が可能になります。帳票を仕分けして人手でデータ項目を入力するのに比べ、日々の作業量が劇的に削減されます。
このように認識性能が飛躍的に向上し、適用可能な業務も拡大しているAI-OCRですが、ほぼ100%の認識率といっても完璧にすべて認識できることは将来的にも不可能だという見方が一般的です。業務によってどのような業務フローが適切なのか、どのAI-OCRソリューションの適用が最も効果的なのかを検討するときには、専門知識豊富なエンジニアやITアーキテクトの知識やノウハウも利用されることをお勧めいたします。