AI(人工知能)に関する技術の仕組みを調べようとするとよく「CNN(シーエヌエヌ)」「Machine Learning(マシンラーニング)」という言葉が出てきますよね。当たり前の事のように書かれているので「うんうん」なんて頷きながら読んでいても、実はよく解っていなかったり、なんとなく読み飛ばしてしまっている人もきっと多い事でしょう。
でも、この「CNN」「Machine Learning」は人工知能(AI)に関する技術の仕組みを知る上においてとても大事な言葉です。
そこで今回は、「CNNって何?Machine Learningって何?」のタイトル通り、難しいけど頑張って調べてみることにしました。それぞれには関連がありそうなので、一緒にCNN」「Machine Learning」の理解を目指して頑張っていくことにしましょう。
人工知能(AI)とは人間の知的な活動をコンピュータ上で再現しようとする技術や研究分野のこと
AI(人工知能)についてもっと詳しく知りたい方は、次のページが参考になります。
Machine Learning(機械学習)とは、AI(人工知能)の中心となる技術である
機械学習(Machine Learning)は、データからパターンや傾向を掴んで、新しいデータに対して予測や判定を行っていく技術のことを言います。
機械学習(Machine Learning)についてさらに詳しく知りたい方は、次のページが参考になるでしょう。
ここで、先人の言葉を引用して、機械学習(Machine Learning)の定義を見てみましょう。機械学習(Machine Learning)のパイオニアの1人であるアーサー・リー・サミュエルは、機械学習を
明示的にプログラムしなくても学習する能力をコンピュータに与える研究分野
と言っています。「明示的にプログラムしなくても」という文は、プログラムしなくても学習するという意味ではありません。明示的にというのは、「Aの時はBを実行しなさい」とはっきり(明示的に)プログラムをしなくても、自分で判断して動くという意味です。
Machine Learning(機械学習)は「教師あり学習」と「教師なし学習」に大別される
- 教師あり学習(supervised learning)
- 教師なし学習(unsupervised learning)
①「教師あり学習」というのは、学習データに正解ラベルを付けて学習する方法です。例えば、花の名前を教えてくれる人工知能(AI)を作るのなら、学習データ(画像)に対して、これは「桜」、これは「チューリップ」というようにラベル(教師)を付けて学習させます。
②「教師なし学習」は、正解ラベルをコンピュータに与える事なしに、データから共通する特徴を持つグループを見つけたり、データを特徴づける情報を抽出したりする手法のことです。
現在の郵便局は、郵便番号を次の様に機械で取り扱うことで効率化を図っています。
- 郵便番号だけでなく、宛先も自動で認識します。
- 宛先情報は、人間に見えない特殊インクでバーコード印刷します。
- 配達の道順に郵便物を自動で並べ替えします。
※やさしい解説があります。興味ある人は見てみましょう。→郵便の仕組み(NEC)
この郵便番号の認識は「0から9」の数字を機械に学習させることによって、新たに郵便局に届いたハガキなどに掲載されている郵便番号の数字を正確に認識しています。
CNNとは、ディープラーニングの一つの手法である
CNNは、ディープラーニングと非常に関係が深い言葉です。そこでまず、ディープラーニングの仕組みから見ていくことにしましょう。
ディープラーニングは、大きく3つの層から構成されています。
入力層(INPUT):人間に例えると、五感(視力、聴力、嗅覚、味覚、触覚)から入ってくる情報に該当する部分です。
中間層:人の脳に当たる部分です。中間層はとても単純に命令を実行するだけの状態のものから、すべて自分で判断して実行するものまであります。
出力層(OUTPUT):判断結果に相当します。例えば、入力層から入って来た画像を見て「これは犬だ」という判定、結果を出力します。
機械学習(Machine Learning)で出てきた郵便番号の例①で、少し不思議に思った方はいますよね。「宛先も自動で認識します」とありました。そうです、宛先というのは明らかに郵便番号だけではなく「宛先の文字」まで読み取っています。この郵便番号のような事例には、ディープラーニングが活用されています。
ディープラーニングには構造の違いでいくつか種類があり、代表的なものとして、
などがあります。今回のメインはCNNなので、DNNとRNNの解説は割愛します。これで全体の関連が分かって来ましたよね。
つまり、人工知能(AI)の中心となる技術が機械学習(Machine Learning)で、その一手法としてディープラーニングがあり、ディープラーニングのアルゴリズムの一つとしてCNNがある、という事です。
ディープラーニングについてさらに詳しく知りたい方は、以下のページが参考になります。
CNNは画像認識の分野で広く使われている
「0」と「1」を文字として眺めてみた時、「0」は小文字のオー「o」や大文字のオー「O」、マル「○」との区別がつきにくいですね。また、同様に「1」と大文字のアイ「I」や小文字のエル「l」の識別も難しそうです。さて、あなたならこの違いをどうやって調べますか。
まず方眼紙に大きく文字を書いてみます。「マスの中の文字がない白い所」と「文字のある黒い所」があることに気づきます。これがCNNという手法の基本です。「白」と「黒」の2通りだけとなれば、デジタル処理が出来そうです。
実際のCNNではマス目を丁寧に1個ずつ調べるのではなくて、作業時間と効率を考えて、いくつかのマス目パターンを作っておき、このパターンをずらせてパターンに該当する、該当しないという判断をさせながら調べて行くという方法を取っています。この手法を工夫し、駆使する事により、単純な数字だけではなく、文字や写真の他、人間の顔などを判断していくのです。
まとめ
以上、「CNN」、「Machine Learning」 についてお伝えして来ました。
人工知能(AI)は一般に紹介されている華やかな見た目と違って、理論や手法を調べて行くとなかなか分かりにくい部分があります。それを調べる方法として分かる部分を少しずつ紐解いて行くと全体が分かりやすくなって、最後に全貌まで分かるかもしれません。
- 人工知能(AI)とは人間の知的な活動をコンピュータ上で再現しようとする技術や研究分野のこと
- Machine Learning(機械学習)とは、AI(人工知能)の中心となる技術である
- Machine Learning(機械学習)には「教師あり学習」と「教師なし学習」の二つがある
- CNNとは、ディープラーニングの一つの手法である
- CNNは画像認識の分野で広く使われている
この、少しずつ情報を拾って、それをパターン化して繋ぎ合わせていくという方法は、人工知能(AI)の仕組みと同じです。もともと人工知能(AI)は人間の思考の流れを解明して作っているのですから、当然なのかもしれません。人工知能(AI)より優れているあなたなら、きっと同じ手法で他の言葉も読み解けるでしょう。これからもあなたが人工知能(AI)について楽しく調べていけると良いですよね。