テキストデータへの変換技術に脱帽!AI-OCRはここまでキター! | AIZINE(エーアイジン)
テクノロジー

テキストデータへの変換技術に脱帽!AI-OCRはここまでキター!

AI-OCRのイメージ
Tegaki.ai | AI(人工知能)を活用した手書き日本語入力OCR の使用イメージ

AIの活用が叫ばれ続けており、続々とAIを活用したサービスや商品が登場していますよね。中でも業務効率化に役立つものは様々で、役立つ便利ツールがあるなら誰しも使いたいところ。その中の一つがAI(人工知能)を搭載したOCR、通称AI-OCRです!

そもそもOCRとは、印刷物などの文字を光を当てることで読み取り、テキストデータに変換する仕組みのこと。

僕が前職でデザイン・印刷に関わる業務をしていた際、お客様から「昔の資料を全てテキストデータ化してほしい」と要望を頂くこともありました。

時に数百ページ全てを手入力してテキスト化するなんてことも(これはなかなか大変でした!)。

当時OCRの利用も試してみたのですが、変換精度はイマイチ信用ならず、結局全て仲間と共に手入力していくことに。このような大変な経験があったからこそ、AI(人工知能)の導入が進んでいる今ならOCRも頼れる存在になっているのでは!?という期待もかねて、今回OCRについて調べてみることにしました!

それでは早速、AIとOCRの組み合わせた技術の実態ついてお伝えしていきます!

ちなみに、OCRはOptical Character Recognition/Readerの略で、日本語に訳すと「光学的文字認識」となります。

AI(人工知能)とは、人の知的な活動(話す、判断する、認識するなど)をコンピュータで実現しようとする技術や研究分野を示す概念のことです。さらに詳しく知りたい方はコチラ↓

OCRを支える技術、画像認識は人のレベルを超えた

AI(人工知能)を用いた画像認識が脅威になるイメージOCRは、印刷物などの文字を光を当てることで読み取り、テキストデータに変換する仕組みのことですが、この背景には画像認識という技術が採用されているんです。画像認識とは、コンピュータに画像を認識させてその画像には何がどんな状況で写っているのかを分析、判別させていく技術のこと。

長い間画像認識の精度はいまいちだったのですが、そんな状況を打破するように飛躍的に認識精度を向上させたのが、AI(人工知能)を実現する技術の一つディープラーニング(Deep Learning)です!現在世間を賑わしている技術なのでご存知の方もいるかもしれません。

ディープラーニングとは、深層学習とも呼ばれ、脳の神経ネットワークを単純化してコンピュータのプログラム上で再現した技術です。

従来のコンピュータが苦手としていた「ルールのわからない問題」にも対応できる非常に大きな可能性を秘めています。もっと詳しく知りたい方はこちら↓

このディープラーニングを採用することで画像認識技術が驚くほどに向上した!という出来事が2012年に起こったのですが、この出来事はAI(人工知能)の研究者や機械学習エンジニアを奮い立たせるほどの衝撃を与えました。

こうした背景もあってますます研究が進み、今では「ディープラーニングによる画像認識技術は人間の認識率を超えた」とまで言う人も現れているほどです。

ちなみに、僕の場合はディープラーニングによる囲碁AIがプロ棋士を打ち負かしたというニュースに衝撃を受け、興奮を抑えることができずAIエンジニアになろうと会社を辞めてきました!

AI-OCRと従来OCRの違い〜識字率が格段に向上、非定型書式帳票の対応が可能

業務をしているイメージこれまでものOCRももちろん手書きや印刷文字の読み取りは可能でしたが、前述したようにディープラーニング(Deep Learning)を活用することでAI-OCRは手書きの文字を含めた識字率が格段に向上しました!

また、従来のOCRは開発者が定めた指定のルールに基づいて対応していく手法だったため、指定のフォーマットを満たしていない例外的なものについては人手を頼らざるを得ず対応が困難だったんです

それに対してAI-OCRでは、様々な書式の紙帳票、つまり非定形の書類からも正確に情報を読み取って効率的にデータ化できる仕組みが実現しています!

例えばカメラで撮影した請求書や発注書をAI-OCRを利用することで請求金額や請求日などの必要項目を、自動的に抽出するサービス等が展開されています。

AI-OCR製品検討の際に確認したい2点、「機能範囲」と「得意領域」

AI-OCRサービスTegakiのサービスページ

精度も向上しどんどん魅力的になっているAI-OCR製品ですが、提供している会社によって製品にはそれぞれ特徴があるんです。

製品導入を検討する際には「機能の範囲」と「得意領域」の2つを確認しておくと良いでしょう。「読み取りだけを行うもの」、「読み取り後に業務システムへの共有までを行うもの」、「手書きと印字ではどちらが得意か」などを確認すると良いです。

また、AI-OCRを提供している会社の多くは事前検証サービスを提供しているので、実際に導入を検討する際には後悔しないためにも事前検証することが必須!!

AI-OCRを提供している代表的な企業を以下にご紹介します。

  • AI inside「DX Suite」:書類の仕分けが可能、アクセス権限の設計/設定を詳細に行うことが可能

まとめ

さて、今回はAI-OCRの精度が向上している背景や製品導入の検討時に確認したいこと、提供しているサービス会社についてお伝えしてきました。改めて内容を振り返ってみましょう。
  • OCRとは、印刷物などの文字を光を当てることで読み取り、テキストデータに変換する仕組みのこと
  • OCRを支える技術、画像認識は人のレベルを超えはじめている
  • AI-OCRと従来OCRの違いは、「識字率が格段に向上したこと」と「非定型書式帳票の対応が可能になったこと」が挙げられる
  • AI-OCR製品検討の際に確認したいのは「機能範囲」と「得意領域」の2つ

ということがわかりましたよね。

OCRを社内に導入検討する際、「数年前に試したけどダメだったから当てならないよ」という意見が出てくるかもしれません。実際、私もそのように言われたことがあります。

しかし、コンピュータの処理速度は毎年倍々に増えていきますし、いえ、それ以上のブレークスルーも近年起きているので、そうした言葉は当てにならないでしょう。いくつかの領域でAI(人工知能)が人間の能力を超え始めていることが、それをはっきりと表しています!「数年前こうだったから今もこうだろう」という意識はあまり参考にできません。

AI-OCRを始めとした便利な道具を使えば煩雑な業務を手放すことができますよね。ひょっとしたら、今目の前にある業務はコンピュータにお任せできることなのかもしれません。

日々最新技術を活用したツールについて情報収拾していくことで、本当に私たちが力を入れるべき部分へと時間を割いていきたいものです。今後もさらなるテクノロジーの発展にますます期待していきましょう!

<参考>
『AI-OCRとは何か?』~OCRとの違いと製品検討の勘所~
Tegaki.ai | AI(人工知能)を活用した手書き日本語入力OCR
AI-OCRの比較|主要なベンダー・開発会社

コメントをどうぞ

トップへ戻る
タイトルとURLをコピーしました