AI(人工知能)や機械学習について調べていると、「パターン認識」という言葉をよく目にします。なんとなく難しそうなイメージでスルーしがちですが、どういうものなのかちょっと気になりますよね。
「パターン」という言葉は、機械学習を説明する文章にもよく出てきます。パターン認識と機械学習はどのような関係性があるのでしょうか。
初心者にとっては機械学習の概念でさえ、ややもするとあやふやになってくるもの。そこに紛らわしい言葉が出現すると、混乱して弱気になってしまいます。
そこで今回はパターン認識について、その概念や機械学習との関係性について解説。パターン認識の種類や活用例もご紹介していますので、パターン認識の基本を具体的にイメージしながら理解できるようになります。
モヤモヤしていたパターン認識と機械学習について、今日こそスッキリさせましょう。
パターン認識とは何か
わかりやすいように具体例を使ってご説明しましょう。人込みで誰かを探す時、私たちは背格好や髪型など「目に見える特徴」や、聞こえてくる声など「音の特徴」を使って探しますよね。これは人間が無意識で行っているパターン認識です。
このように見た目、音、匂いなど何らかの特徴に基づいて見分ける技術をパターン認識といいます。
人間は普段当たり前に行っているパターン認識ですが、最近はコンピュータにもできるようになっており、その技術はもうすっかり私たちの生活の中に溶け込んでいます。
ではパターン認識にはどのような種類があるのでしょうか。
パターン認識の種類
コンピュータが行うパターン認識の中で、特によく使われているのは次の3種類です。
- 顔認識
- 文字認識
- 音声認識
順にご説明しましょう。
顔認識
顔認識は、主に画像で人や動物などの「顔」を認識する技術。年齢や性別、表情までも見分けることができます。また、登録したデータから個人を特定する「顔認証」もこの技術に含まれます。
文字認識
文字認識は、画像の中から文字を見つけ出して認識する技術。最近は不鮮明な読みにくい文字でも、ほぼ正しく読み取ることができます。
音声認識
音声認識は、人間の声を認識・分析し、文字に変換する技術。その仕組みは次のとおり。
- 人の声から空気の振動を波型データなどに変換。
- 不要なノイズを取り除いて文字データに変換。
- 音の並びから単語に変換。
- 単語のつながりから文として認識。
このように音声認識はいくつかあるパターン認識の中でも工程が多く、特に難しい分野です。
以上、パターン認識でよく使われている3種類について解説しました。
さて、パターン認識とよく一緒に見かけるのが機械学習。パターン認識と機械学習にはどのような関係性があるのか、次でご説明しましょう。
パターン認識と機械学習の関係
パターン認識と機械学習の関係を述べる前に、機械学習について簡単にご説明します。
これを見る限りでは、なんとなく似ているような似ていないような・・・という感じですよね。一般的にパターン認識と機械学習は、「ほぼ同じ意味」もしくは「パターン認識は機械学習の一部」と考えられています。
もう少し詳しく説明すると、この2つは起源に違いがあります。パターン認識は工学が起源となっているのに対して、機械学習は計算機科学分野から生まれた技術。
パターン認識と機械学習は、「ほぼ同じ意味」と覚えておきましょう。
次に、パターン認識の活用例をご紹介。
パターン認識の活用例
ここでは、パターン認識の活用例を顔認識、文字認識、音声認識の3種類にわけてご紹介します。
顔認識の事例:万引き防止システム
万引き防止システムLYKAONは、あらかじめ要注意人物を登録しておくことにより、対象の人物が入店するとアラームで知らせてくれるシステム。まず監視カメラで顔を認識し、登録した要注意人物と顔認証することで、対象者が入店した時点で店員に通知がいきます。
従来のシステムでは万引き発生後に通知がくるため、プロによる巧妙な手口に対処するには限界がありました。
日本全国での万引き被害年間総額は推定4,600億円!
「LYKAON」を実際に利用している店舗では、要注意人物に対して犯行前に声掛けを行うことで被害額が大幅に減少したそうです。
文字認識の事例:OCR(光学文字認識)
文字認識の代表的な技術であるOCR(光学文字認識)の事例を2つご紹介します。
郵便局
文字認識の事例で、一番身近なのは郵便局でしょう。日本では1968年、郵便番号制度の導入でOCRによる自動仕分けが始まりました。
OCRの仕組みは次のとおり。
- 画像内から文字のみ探し出し、1文字ごとに切り出す。
- あらかじめ登録されたデータをもとに、1文字ずつ文字の種類を識別する。
- 2で識別した文字の情報を、文字データとして出力。
当時認識できたのは手書きの数字のみでしたが、その後その他の手書き文字の認識も可能に。現在は自由なフォーマットの書類でも文字を認識できるようになっています。
Google翻訳
スマホアプリのGoogle翻訳も身近な文字認識のひとつ。対象物にカメラを向けると、画像内から文字を認識します。その認識した文字情報を指定した言語に変換することで、翻訳する仕組み。
2016年頃からAI(人工知能)によって翻訳の精度が飛躍的に向上し、それに伴い利用者も急増しています。
外国製食品の成分表示を見るのによく利用します。
音声認識の事例3つ
ここでは音声認識の事例を3つご紹介。
Googleドキュメント
Googleドキュメントは、ツールから「音声入力」を選択すると、マイクに話しかけるだけで文字入力をすることができます。後から手直しは必要ですが、かなり精度が高くなっています。
NEC翻訳
NEC翻訳は11言語に対応している音声翻訳アプリ。音声認識と自然言語処理によって、言語の異なる相手とも円滑にコミュニケーションを図ることができます。
Google Duplex
Google Duplexは、AI(人工知能)が人間に代わって、レストランなどに予約の電話を代行してくれるサービス。
音声アシスタントアプリのGoogleアシスタントを使って予約の電話をするように頼むと、AI(人工知能)が自動で電話をかけて店員と会話をし、予約完了したら通知がくるシステム。2021年2月現在、使えるのはアメリカのみで日本ではまだ未提供です。
予約ができなかった場合も、メールで報告してくれるから安心。
日本でのサービス開始が待ち遠しいですよね。
パターン認識の今後の可能性
パターン認識技術は、今後もますます進化していくことは間違いありません。AI(人工知能)の進化によってその精度はますます向上していくからです。
私たちの生活は、まだまだパターン認識技術によってより便利になる可能性を秘めています。今後、今まで人間が行ってきた単純労働はどんどん機械が代替し、私たちはよりクリエイティブな仕事にシフトしていくことになるでしょう。
私たちの生活を豊かにしてくれるパターン認識の将来に期待したいですね
パターン認識と機械学習についてはこちらでも詳しく解説しています。
今回はパターン認識について、基本的なところと機械学習との関係性についてお話しました。
パターン認識とは「画像や音声などを、ある特徴に注目して見分ける技術」で、よく使われているのは次の3種類。
- 顔認識
- 文字認識
- 音声認識
ご紹介した事例は、どれも便利なサービスでしたよね。
そしてずっと気になっていたパターン認識と機械学習の違い。なんとほぼ同じ意味だったとは驚きでした。
AI(人工知能)や機械学習について勉強していると、難しく感じる言葉によく遭遇しますが「ゆっくりひも解いてみると意外と簡単だった」というのはよくある話。
恐れずに着実に知識を積み重ねていけば、これからの時代必ず役に立つ時がくるはず。あなたの知的好奇心を満たすためにぜひ、AIZINEをご活用ください。
【お知らせ】
当メディア(AIZINE)を運営しているAI(人工知能)/DX(デジタルトランスフォーメーション)開発会社お多福ラボでは「福をふりまく」をミッションに、スピード、提案内容、価格、全てにおいて期待を上回り、徹底的な顧客志向で小規模から大規模ソリューションまで幅広く対応しています。
御社の悩みを強みに変える仕組みづくりのお手伝いを致しますので、ぜひご相談ください。