【機械学習入門】パターン認識って何?基本や仕組みを徹底解説 | AIZINE(エーアイジン)
AIとは何か

【機械学習入門】パターン認識って何?基本や仕組みを徹底解説

機械学習と明記

機械学習でパターン認識って出てくるけど何が何だかわからない!

機械学習について勉強しているとこの用語を見かけることがありますよね。

パターン認識は私達が普段使っている家電製品などでも利用されており、今や生活に欠かせないものとなっています。

パターンを認識するのかなとなんとなくイメージはできても正確な定義やイメージ、どういった仕組みになっているかまで聞かれてしまうとなかなか答えづらいというのも事実。

そこで今回はパターン認識とは何かといったところから解説をし、どういったものがあるかや機械学習との関係性、どのような仕組みで動いているか見た上で実際に使われている事例を紹介していきます。
中村
中村

それではまず、そもそもパターン認識とは何かというところからお伝えします。

パターン認識って何だろう

公園で人を見つけるイメージ

パターン認識とは何かを具体的に話していく上でまずは友人と待ち合わせをしているのをイメージしてみましょう。

待ち合わせ場所には友人だけでなく様々な人がいます。

その中で友人を探す時見ていくのは顔や髪型だったりその人の声ですよね。友人かそうでないかを見極めているのでポイントとなるのは論理的な情報ではなく画像や音声をそのまま用いていること。

このように何らかの特徴に基づいて欲しいものを見つけるという一連の行動をパターン認識というのです。

パターン認識の種類

モニターでチェックしてるイメージ

パターン認識がどういったものであるか触れたところでどういったものがあるか見ていきましょう。

顔認識

顔認識は文字通り顔を扱うパターン認識。顔認識が行うタスクは大きく分けて2つあります。

1つは「認証」新しく入力された画像を既に入力してある顔データと比較するというものになります。わかりやすい例がスマホのロック解除。スマホを買って新しく登録する時自分の顔を撮りますよね。その後ロックを解除する時は新しい顔の画像を既に登録したものと比較することで判別をしているのです。

もう1つは「認識」これはデータとして入力された顔を顔の画像を複数集めたデータベースと比較するというもの。セキュリティや監視システムなどで使われることが多くなります。

文字認識

文字認識は画像から文字や文章を認識するというもの。

種類はオフライン文字認識とオンライン文字認識の2つ。

オフライン文字認識は紙に書かれていたり印刷されている文字を判別するもの。その場で読み取ってキーボードで入力しなくても自動でパソコンに表示されます。

オンライン文字認識は画面に入力した手書き文字を判別するもの。パソコンやゲーム機などに専用のペンなどを使って直接書いた文字を認識しパソコンに表示してくれます。

音声認識

音声認識は音声データをテキストデータに変換する技術のこと。私達人間であれば言葉をそのまま理解することはできるもののコンピューターだとそうはいきません。音声情報と言語情報の両方を用いて音声を解析し認識するまでに至るのです。

iPhoneに搭載されているSiriやAmazonやGoogleのスマートスピーカーの広まりに合わせ近年利用が拡大しています。

機械学習におけるパターン認識とは

機械学習との関係のイメージ

「特徴を用いて欲しいものを見つける」と聞くと機械学習と似ていますよね。

機械学習は計算機科学の分野、パターン認識は工学という側面から分野を見ているという点以外は同一のものと言ってもほぼ支障はありません。

一方で両者が両輪となってAI(人工知能)の発展に貢献しています。

従来の機械学習ができたのは情報を数字や記号を通して覚え、それを基に対処方法を提案すること。ただしこれは論理的なものに限られており人の顔や建造物のような処理できない情報もあります。
そこでパターン認識の出番。機械学習と組み合わせることで論理的に処理できない情報も扱えるようになり機械学習でできることが広がっているのです。

機械学習でのパターン認識の仕組みとは

仕組みのイメージ

機械学習とパターン認識の関係について触れたので具体的にどう動いているか見ていきましょう。

ここでは文字認識で説明しますが「パターン認識の種類」で挙げたパターン認識であれば基本的な流れは変わりません。

その流れは「学習」して「認識」するというもの。

学習

パターン認識での学習は与えられたデータを元にそれがどのようなパターンになるか識別や予測をする教師あり学習によって行われる場合が一般的。

文字認識ではまず教師画像というものを用意します。

あという画像にはあ、いという画像にはい…という風にすべての画像に正解のラベルが振られています。

これらの画像をコンピューターが扱いやすいよう整えた上で学習をしていくことになるのです。

認識

学習をしたらテスト画像を用いて認識の段階に入っていきます。

しかし、画像のどこに文字があるかコンピューターにはわからないというのが課題。
そのため文字がどの領域にあるか見つけていく必要があります。

一番単純なのは適当な大きさの領域を設定し端からずらしていくというもの。異なる文字にも対応できるよう調節も行うことも。

どの領域を調べるか決めたら学習したデータを元に含まれている文字を調べるというのが一連の流れとなるのです。

パターン認識を用いた実用事例

機械学習の応用をイメージ

最後にパターン認識がどう使われているか事例を見ていきましょう。

ここでは顔認識、文字認識、音声認識から1つずつ紹介します。

監視用サングラス

BBCの報告によると中国の警察では顔認識技術を用いたサングラスの使用を始めています。

その目的は容疑者の特定をするというもの。

グラスは無線となっており容疑者のデータベースにリンクされています。

警察官は群衆の中から犯人をスキャンし特定できるようになっているのです。

警察官が自分で探すより早いのは言うまでもありません。

中国のメディアは鄭州の警察官が既にこれを活用、容疑者の数名を逮捕するのに繋がったと報告しています。

顔認証システム

画像認識の技術は顔認証システムにも応用されています。

その例として挙げられるのは観光業界。

  • アメリカン航空などでは顔認証を搭乗券の代わりとし搭乗手続きや手荷物検査を行うという試みが始められています。
  • また、不正入国を試みている旅行者を公式身分証明書のデータベースと照合し摘発できた事例も。
  • 中国のマリオネットホテルでは顔認証のおかげでチェックインの手続きを1分程度にまで短縮、宿泊費などの費用は顧客の口座へ自動で請求がかかるよう仕組みが整えられています。

感情分析

音声認識を応用し人の声から喋っている人の感情を分析することも可能となっています。

それはEmpathというもの。

従業員のメンタルヘルスケア、ユーザーの満足度といった幅広い用途が期待されています。
また、分析した感情と実際の行動がどう関係しているかを見ていくことで消費者行動の分析にも活かせるようになっているのです。

 

理解しピンときたイメージ

今回はパターン認識とは何かといったところから解説をし、どういったものがあるかや機械学習との関係性、どのような仕組みで動いているか見た上で実際に使われている事例を紹介しました。

パターン認識は何らかの特徴に基づいて欲しいものを見つけるという一連の行動のことで顔認識、文字認識、音声認識といったものがあります。

パターン認識は機械学習でできることの幅を広げる大きな役割を果たしており、学習と認識という2つのステップで目的の達成をしていくことに。

中国の監視用サングラスや顔認証、感情分析など幅広い領域での応用が進められています。

中村
中村

AI(人工知能)の発展とともにパターン認識が私達の生活をどう便利に変えていくか今後も注目していけるといいですよね。

トップへ戻る
タイトルとURLをコピーしました