現在AI(人工知能)やディープラーニングの発展はすさまじいので、一般社会や産業界からの注目は目覚ましいですよね。なかでも敵対的生成ネットワーク(GAN)という新進気鋭の技術にAI(人工知能)業界で大きな関心が寄せられています。敵対的生成ネットワーク(GAN)は画像生成を始めとして、さまざまな場面で使われて、私たちの知らないところでもひそかに活躍しているのだとか。
しかし、意外と身近な技術とはいえ、敵対的生成ネットワーク(GAN)なんて単語はこれまで聞いたことない、聞いたことくらいあるけどよく知らないという人も少なくないでしょう。AI(人工知能)関連で細かな技術を知る機会や知ろうとするタイミングはあまりありません。
そこで今回は、敵対的生成ネットワーク(GAN)について解説し、実際に体験できるサイトを紹介します。
最初に敵対的生成ネットワーク(GAN)とはどういうものか解説します。
敵対的生成ネットワーク(GAN)とは
ここまで敵対的生成ネットワーク(GAN)の仕組みを説明しましたが、実際なにに使われているのか気になるところ。続いて、敵対的生成ネットワーク(GAN)がどのような使われ方をしているのか紹介しましょう。
敵対的生成ネットワーク(GAN)はどう使われている?
敵対的生成ネットワーク(GAN)は主に画像生成の場面で使われるので、それに関連する活用例を3つ紹介します。
まったく新たな画像を生成する
キオクシア株式会社が漫画界の巨匠手塚治虫氏の新作を作ろう、と「TEZUKA2020」というプロジェクトを立ち上げました。実は、このプロジェクトのキャラクター作画担当AI(人工知能)に敵対的生成ネットワーク(GAN)が使われています。
AI(人工知能)にたくさんのキャラクターの絵を学習させたり、応用技術を用いたりすることでキャラクター生成に成功し、31年振りに「ぱいどん」という新作が誕生しました。
自動で画像を着色する
敵対的生成ネットワーク(GAN)を使った技術の1つにPix2Pixと呼ばれる技術があります。これは入力された画像データの特徴を残したまま、生成された画像データに新たな特徴を加えるというものです。この技術により、例えば白黒のカバンのラフスケッチに着色を施し、自動でカラーにすることができます。
低画質の画像を高画質にする
敵対的生成ネットワーク(GAN)を応用して、PULSE(Photo Upsampling via Latent Space Exploration)という技術を米国デューク大学の研究チームが開発しているとのこと。これはより自然さを持った高画質の画像に変換する技術開発です。これにより、より鮮明な画像を得ることができ、医学や天文学、衛星画像に応用可能だと説明されています。
このように、敵対的生成ネットワーク(GAN)はさまざまな場所で実用化されていたり、開発されていたりします。ここまで読んで、実際に敵対的生成ネットワーク(GAN)を実感したくなりますよね。次から敵対的生成ネットワーク(GAN)を体験できるサイトを4つ紹介します。
敵対的生成ネットワーク(GAN)を使ったサイトその1:Image-to-Image Demo(Affine Layer)
最初に紹介するのはAffine Layerというサイトにある、Image-to-Image Demoというページです。Image-to-Image Demoは先ほど紹介した敵対的生成ネットワーク(GAN)を使った技術であるPix2Pixを体験できるページになります。
Image-to-Image Demoでは、ブラウザ上の枠内にカーソルで手描きした絵を、それに近い写真へと変換できるという優れもの。枠内にはすでにお手本となる絵と、変換結果の写真が表示されており、お手本通りに描くもよし、自由で描くもよし。ネコや建物、靴、カバンを写真へと変換できさまざまな楽しみ方ができます。
ただし、必ずしもお手本通りにきれいな写真になるとは限らず、絵の具合で結果が変わるため、わけのわからない写真となることもしばしばあるので注意しましょう。しかし、どのような結果になろうと、Pix2Pixの潜在能力に驚くこと間違いありません。
敵対的生成ネットワーク(GAN)を使ったサイトその2:Comixify.ai
2番目に紹介するのはComixify.aiで、これはワルシャワ工科大学の研究者が論文で発表したComixifyというシステムをデモとして試せるサイトです。このシステムは任意の動画や画像から特徴的なシーンを取り出し、マンガ風の画像へと変換するというユニークなもの。
Comixify.aiの操作は簡単で、手元にある動画や画像をアップロードするか、YouTubeまたはTikTokのURLを入力するだけです。25分以内の動画でなければいけないという制限はあるものの、Comixifyの能力を十分に味わえるでしょう。
画像作成だけでなく、他の人が作った画像を閲覧して楽しめるので楽しみ方が広がりますよね。
敵対的生成ネットワーク(GAN)を使ったサイトその3:Petalica Paint
3番目に紹介するのは株式会社Preferred Networks提供、ピクシブ株式会社運営のPetalica Paintで、以前はPaintsChainerという名称のサービスでした。このサービスはイラスト(線画)をAI(人工知能)が自動で着色するというもので、画像をアップロード、またはサンプルの画像を使って楽しむことができます。
イラスト(線画)のクオリティが高いほどきれいに着色がおこなわれ、画力が試される部分もありますが、自動で着色されるというのは興味深いですよね。着色パターンは3つあり、「たんぽぽ」、「さつき」、「かんな」から自由に選択できます。
他にも、ラフや写真を線画にする機能もあり、こちらは「パンダ」と「しろくま」の2種類のパターンがあります。手軽に線画を描いたり、着色ができたりするので、絵を描くことを趣味にしている人は一度試しましょう。
敵対的生成ネットワーク(GAN)を使ったサイトその4:GAN Lab
最後に紹介するのは、GAN Labで、ジョージア工科大学とGoogle Brainが発表した敵対的生成ネットワーク(GAN)を体験できるサイトです。これまで紹介したサイトとは趣が異なり、敵対的生成ネットワーク(GAN)でなにか生成しよう、というものではなく、仕組みを可視的に知ろうというサイトとなっています。
すでに用意されている4種類の画像データ、またはフリーハンドで指定の枠内に描いた画像データを選択するだけで開始するため、使い方は簡単です。サイト上ではどのようにデータを生成し、どのように似せていき、どのように結果を出力するかの流れを可視的にリアルタイムで観察することができます。データの生成過程や、入力データとの比較過程が見てわかるので、敵対的生成ネットワーク(GAN)の仕組みを理解するにはもってこいでしょう。
以上、敵対的生成ネットワーク(GAN)を体験できる4つのサイトを紹介しました。サイトで実感してみると、この先進的な技術がこれからどのようになっていくか期待が高まりますよね。最後に、今後敵対的生成ネットワーク(GAN)はどのようになるのかについて解説します。
敵対的生成ネットワーク(GAN)技術の今後
これまで紹介したように、敵対的生成ネットワーク(GAN)技術は画像生成分野での活用や研究が盛んであり、今後もその流れは続くでしょう。例えば医療の画像診断や工場や防犯カメラなどに使われる異常検知への応用研究がすでに見られます。また、新しいデータを生成するという特徴から、これまでAI(人工知能)には難しいと思われていたデザイナーやアーティストの仕事を担う可能性もあるとか。
一方で、悪意のあるフェイク画像やフェイク動画で著名人の印象操作をおこなったり、人権侵害したりと、人を傷つけたり、法を犯したりする事例も増えてくるでしょう。これは敵対的生成ネットワーク(GAN)技術の精度が向上するにつれて、より巧妙になり、社会的問題となる可能性も秘めています。
さて、今回は敵対的生成ネットワーク(GAN)について解説し、実際に体験できるサイトを紹介しました。敵対的生成ネットワーク(GAN)とは、入力されたデータからデータを生成し、入力データと比較と生成を繰り返すことで、“本物のデータ”のようなデータを生成するモデルでしたよね。そして、まったく新たな画像の生成、画像の自動着色、画像の高画質化などが可能で、実用化や研究が進んでいます。
今回紹介した、敵対的生成ネットワーク(GAN)を体験できる4つのサイトとその内容は次の通りです。
- Image-to-Image Demo:手書きの絵を写真に変換
- Comixify.ai:動画からマンガ風の画像を生成
- Petalica Paint:線画を自動着色
- GAN Lab:可視的に敵対的生成ネットワーク(GAN)の仕組みを解説
敵対的生成ネットワーク(GAN)の技術は今後も主に画像分野で活躍を見せると予想されます。最新の技術は悪用の心配もありますが、十分な議論と対策を続けることで抑えられるでしょう。より良い社会にするために、前向きに新たな技術を取り入れつつ、正しい使い方をしましょう。
GAN:敵対的生成ネットワークとは何か ~「教師なし学習」による画像生成
GAN(敵対的生成ネットワーク)とは|意味・仕組み・応用例
敵対的生成ネットワーク_GAN (Vol.19)
AIで作った漫画に“手塚治虫らしさ”は宿るのか? 前代未聞のプロジェクト、ピンチ救った「転移学習」 (3/4)
画像鮮明化技術とは?敵対的ネットワーク生成による原理と活用事例
手塚治虫の新作漫画に挑んだ裏側 ーAIを活用したあらすじ&キャラクター生成
Image-to-Image Translation with Conditional Adversarial Networks
米デューク大学が、従来のAI学習と異なる方法で 画像の解像度を64倍も高める
敵対的生成ネットワークの台頭【前編】
手書きの「絵」から本物そっくりの「写真」を作るアプリがすごい―でも失敗すると…
動画から漫画を自動で生成する「Comixify」を使ってみた
動画をマンガ風に変換する技術「Comixify」、ワルシャワ工科大の研究者らが発表
Comixify: Transform video into a comics
Howto 自動着色
自動着色サービス「PaintsChainer」が名称変更 ピクシブは「Chainer開発終了とは無関係」と説明
ジョージア工科大学とGoogle Brain、GANの学習プロセスをリアルタイムに可視化するWebブラウザベースの対話型視覚化ツール「GAN Lab」を発表
敵対的生成ネットワーク(GAN)を一言でまとめると、入力されたデータをもとに、新たなデータを生成するモデルの一種です。このモデルは生成モデルと呼び、画像認識のような入力されたデータがどんなものであるのか識別する識別モデルに匹敵するほど、広く使われているAI(人工知能)のモデルの1つとなります。