AI(人工知能)についてで様々な用語が飛び交う中、cnnとrnnという言葉を見かけるようにもなってきました。
どちらも最近話題となっているディープラーニングの中で欠かせない手法の1つで、研究開発の対象として注目されています。そして私達が普段使っているWebサービスでも使われているのです。
そこで今回はそのcnnとrnnは何かというところから説明し、cnnとrnnがそれぞれ具体的にどのように使われているか事例をご紹介し、最後にこれらが一緒に使われている事例もご紹介します。事例を見ることでAI(人工知能)に馴染みのない方にも身近に感じられるようになるでしょう。
それでは、まずはcnnとrnnがどのように使われているかからお伝えします。
画像処理で用いられるcnn、時系列データ処理で用いられるrnn
まず初めにcnnとrnnについて。
cnn(畳み込みニューラルネットワーク)は画像データの扱いで主に用いられ、ディープラーニングにおいて数値を扱う場合と画像を扱う場合では要領が変わってしまいます。というのも画像の場合数値と違いデータは数値情報として縦と横の二次元となるからです。
従来のような手法でも画像データを扱うことはできますが、一次元に当てはめてしまうことで必要な情報が損なわれ精度に響きやすいという問題点がありました。画像データを扱う際にはそのまま二次元で入力する方が合理的だということで考えられたのがcnnであり、様々な種類のモデルが存在しています。
次に、rnn(リカレントニューラルネットワーク)は主に時系列データの扱いで用いられています。
データから時系列をそのまま入力し時間がどれくらい依存しているか学習できるようにしたものなのでcnnと同様様々なモデルが考えられています。
ホットペッパービューティーのネイル類似検索でcnnが使われたいた!
それでは今度はcnnとrnnが何に使われるか触れたので具体的な事例を見ていきましょう。
代表的なのはネイルの類似検索機能。画像を基にネイルの位置を判別しカラーヒストグラムやデザインを識別するので従来よりも直感的な画像の表示につながっているのですが、大まかな段取りからどうcnnが使われているか見てみましょう。
まず初めに手の写真からどれが爪であるかわかることが大前提となります。
爪を特定したところで、次にそこにあるものが何のデザインであるかが課題になりますよね。
デザインの判別にあたり色の区別も欠かせません。
これらの流れを経て完成したのが類似検索機能のシステムで、新しい画像に対しどのタグに近いかをプログラムが自動的に判定をしてくれるのです。
rnnを使って俳句を自動で作る!
ここまではcnnの事例を見たので次はrnnの事例を見ていきましょう。
これはAI(人工知能)に関連したビジネスや企業の創生、そしてそこで活躍する人材の育成を目的に札幌市が立ち上げた「SAPPOLO AI LAB」という組織によって立ち上げられたプロジェクト。
AI(人工知能)は感性や独創性ではまだ人間にリードされておりそれらの感性の塊とも言える「俳句作り」に挑戦することで文書作成の課題に挑戦するというのがこのプロジェクトの目的の1つでした。主に小林一茶、正岡子規、高浜虚子などの古典俳句を学習する材料としています。
「すずめのこそこのけそこのけおうまがとおる」という有名な俳句を例にしましょう。
ここからがrnnの出番です。
学習が完成したら、先頭に当たる単語を入れることで次にどの形態素が出て来る確率が高いかから形態素を出力し順を追って俳句という文字列として完成させています。
Googleがcnnとrnnの二刀流で画像の説明文を作る!
以上、cnnとrnnでそれぞれの導入事例を見てきましたよね。それでは最後にこれらを一緒に使っている例もご紹介しましょう。
本来であればcnnが行うことの最終段階で写真の中にある物体がどんなものであるかを決める作業が行われるのですが、それをする前に作業をストップ。
また、直接様々な画像を認識させて説明文をつけることでより精度の高い説明文をつけられるようになります。
今回は「初心者でもわかる!cnnやrnnが使われている事例まとめました」と題し、cnnとrnnがどのような時に使われるかを説明しました。
cnnは画像認識に使われる手法でホットペッパービューティーのネイルの類似検索機能で使われています。
rnnは時系列データ処理で使われており事例として「AI俳句「一茶くん」」を紹介しました。ここでは時系列として特定の言葉の次にどのような形態素が使われるか予測して俳句として文字列の生成をしていましたよね。
そしてGoogleが開発している画像から説明文を自動生成する技術ではcnnとrnnの両方を用いています。
これらの技術は今後も開発が進んだり広く導入が進んでいきます。ですから今後も注目していき、そしてそれらの事例から新しいアイデアを生み出していきましょう。
【お知らせ】
当メディア(AIZINE)を運営しているAI(人工知能)/DX(デジタルトランスフォーメーション)開発会社お多福ラボでは「福をふりまく」をミッションに、スピード、提案内容、価格、全てにおいて期待を上回り、徹底的な顧客志向で小規模から大規模ソリューションまで幅広く対応しています。
御社の悩みを強みに変える仕組みづくりのお手伝いを致しますので、ぜひご相談ください。
コメントをどうぞ