AI-OCR
読み: エーアイオーシーアール
AI-OCRとは紙文書を自動認識
AI-OCRとは、ディープラーニングを活用して文字認識の精度を飛躍的に高めたOCR技術のこと。従来のルールベースOCRでは読み取れなかった手書き文字や複雑なレイアウトの帳票にも対応し、紙の業務をデジタルデータに変換する入り口として活用が広がっている。
かんたんに言うと
紙に書かれた文字を読み取ってテキストデータに変換する技術のAI強化版。従来は活字しか読めなかったが、AIの目を持つことで手書きの癖字や斜めに撮影された帳票にも対応できるようになった。
手書きや複雑レイアウトに対応するAI-OCRと従来OCRの決定的な違い
OCR自体は1950年代から存在する枯れた技術である。郵便番号の自動読み取りや、書籍のスキャンなど限定的な場面では十分に機能していた。
しかし従来型は、フォントの種類やサイズが変わると途端に認識率が下がる。手書き文字にいたっては実用に耐えないレベルだった。
AI-OCRはCNNやTransformerといったニューラルネットワークで文字パターンを学習する。人間の筆跡の揺れ、かすれ、重なりといった不規則なパターンを大量のデータから学習済みのため、実務で使える精度が出る。Google Cloud Vision APIやAzure AI Document Intelligenceが代表的なサービスとして知られている。
手書き文字認識の精度を左右する要因
AI-OCRの精度は万能ではない。
まず言語の問題がある。英語圏の手書き認識は高い精度が出るが、日本語は漢字の画数の多さと字体のバリエーションの豊富さから、認識の難易度が跳ね上がる。「機」と「械」を正しく区別するのは、AIにとっても容易ではない。
次に帳票のレイアウト。罫線が薄い、印刷とスタンプが重なっている、FAXで送られてきたために画質が劣化している。現場から上がってくる紙はきれいなものばかりではない。
前処理として画像の傾き補正やノイズ除去を挟むことで認識率は改善するが、この前処理の設計自体にノウハウが必要になる。
RPA連携による業務フロー全体の変革
AI-OCR単体では、紙の情報をデータ化するだけで終わる。価値を最大化するには、RPAと組み合わせて後工程まで自動化する設計が求められる。
典型的な流れはこうなる。請求書をスキャナーで取り込み、AI-OCRが金額、日付、取引先名を抽出する。抽出結果をRPAが会計システムに自動入力し、承認ワークフローに回す。人間が介在するのは最終確認のみ。
ただし、ここで落とし穴がある。AI-OCRの認識結果が99%正確でも、1%の誤りが会計処理に紛れ込むと実害が出る。信頼度スコアが低い項目を人間にエスカレーションする仕組みを設計段階で組み込んでおく必要がある。
導入を検討する際の現実的な判断ポイント
月に処理する紙帳票が数十枚なら、正直なところ手入力のほうが早い場合もある。AI-OCRの導入効果が出るのは、月に数百枚以上の定型帳票を処理している部署である。
もうひとつ見落としがちなのが、紙のフォーマットの統一度合い。取引先ごとに請求書のレイアウトがバラバラという状態だと、帳票ごとにテンプレートを設定する手間が発生する。非定型帳票への対応力はサービスによって大きく異なるため、自社の帳票を実際に読ませてみるPoC期間は省略しないほうがいい。
当社の見解
AIプロダクトの導入で最も時間を食うのは技術の実装ではない。自社の業務プロセスを言語化する作業だ。ここを省略すると、どんなに優秀なツールを入れても使い物にならない。当社は企画から開発・運用まで全工程を自社で完結させることで、仕様伝達のロスをゼロにしている。理想は阿吽の呼吸で仕事ができるAIパートナーだ。間違った判断をしようとしたときは、忖度なく意見をくれる。それが信頼できる仕事の相棒だ。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
