SiriやGoogleアシスタント、初音ミクなどのボカロなど「ん!?この声、人間じゃないな!」と感じる機会も増えて来ましたよね。スマホやAIスピーカーだけではなく、人工音声を利用したサービスはどんどん開発され、誰でも使えるようになり、その敷居は下がりつつあります。
わたし(タルミホ)は、起きたらまずラジオをつけて1日をスタートするんですが、その日も早起きしてラジオを聞いていると・・・
おはようございます。AIアナウンサーです。
AI(人工知能)がアナウンサーしてるのね〜!さっそく人工音声との遭遇です!
おはようございます、山本学です。
ななっ!しかも人間(男性)とのコラボ!おもしろい!しっかり耳をすませて聞いてみましょう。
↓↓↓実際のAIアナウンサーの音声↓↓↓
AI(人工知能)の音声の後に、人間である山本さんの声を聞いていると・・・噛まずにスムーズに読み上げるAI(人工知能)より、山本さんの方が「間」があったりするのに聞きとりやすいことに気が付きました。
なぜ「間」がある不完全な方が聞きやすいんだろう?
ということで今回は、無駄がないAI(人工知能)音声のおしゃべりより、無駄のある山本さんの方が聞きとりやすいと感じたのはなぜか!?(ディスってるわけではありませんw)
その謎解きと、ますます発展するであろうAI(人工知能)音声の未来を、山本さんと楽しく予想してきました。
いざ!神戸をいつも盛り上げているラジオ局「Kiss FM KOBE」さんへ
今回インタビューに向かったのは、神戸のみなさまに愛されている「Kiss FM KOBE」という海の近くにあるラジオ局。もちろん神戸っ子のわたしは、いつも聞いてるのでテンション上がります!!
そして、お答えくださったのはAIアナウンサーと掛け合いながら、一緒に番組出演されているKiss FM KOBE「神戸経済ニュースウィークリー」の山本学さんです。
聞いてくださったんですね〜、ありがとうございます。
そうですね、働き方改革が目的ですね。
はい。アナウンサーと番組を作るには、関係者はスタジオに張り付いて、長時間に渡り拘束されてしまうんですが、アナウンサーがいない時間にも効率的に番組を作る方法を考えました。
はい。このニュース番組は時間も場所も選ばず、PCがあれば編集でき、アナウンスを間違えてもすぐに取り直しができます。
アナウンサーの場合だと、またアナウンサーを呼び出して、スタジオを抑えて・・・とすぐにはできないので、効率よく時間を使えていますね。
ちなみに、他のDJやスタッフからAI(人工知能)起用に反対意見はなかったんですか?
それがみんな拒否反応もなく、面白い!といってくれました。
AI(人工知能)による音声読み上げサービス「Amazon Polly」の魅力
Amazon Polly(アマゾンポリー)とは高度なディープラーニング技術を使用し、テキストを読み上げるサービスで、24言語、48の音声パターンの人間の声のような音声を、低コストでの合成を実現しています。
そうですね、やはり使いやすさです。音声の調整機能など、まだまだ未完成な部分はありますが、今後使用者が増えればどんどん改良されていくと思います。
もちろん、男性も使いたいですし、英語、中国語、韓国語など多言語で使っていきたいですね。緊急放送などで使っていくのがすごく役に立ちそうなんですよ。
地震や台風の被害が起きた時などは、観光客にも何が起きているか素早く伝えたいですよね。現代では即時性というか、すぐに答えが出ることを求められているので。
AI(人工知能)の最大のメリットは、僕と違って噛まない、疲れない、声が変わらないw 緊急時もずーーっとアナウンスを続けることができますからね。
やはり、くぎりをどこで入れるかが大変ですね。それによって読み上げ方に変化が出るんです。
日本語は英語より難しくて、なめらかさを出すのに苦労します・・・微妙な言葉の上げ下げなどがAmazon Pollyはできないので、そのまま入力すると違和感になるんですよ。
社内でも、AI(人工知能)の音声は気持ち悪い!という意見もあったんですよ。
そろそろ本題へ!AIの音声と人間の声の聞き取りやすさの違いはノイズにあった!
はい、なんでしょう?
・・・
・・・
ふむ、なるほど!そうなんですよね、僕もAIアナウンサーと共演して気づいたんですが、実は人の息を吸う瞬間の音や、リップノイズがないと、人間の頭に残りにくいんです。
ですよね。つまり、息を吸った瞬間に話題が変わることを、人は無意識に察知するので集中するんですね。
そういう人間のもつ独特の「間」に、人の耳は慣れているんですよ。
実はあえてその人間のノイズを残すように編集しているんですよ。
・・・
プロデューサーと私が話しているのを収録して、そのあとプロデューサーの部分をAI(人工知能)の音声に置き換えているんです。
それでもAI(人工知能)音声とのコラボにこだわりたかったんですよw
AI(人工知能)による音声の未来はどうなっていくか予想してみた!
せっかくAI(人工知能)を使っているのだから、名前をつけたり、年齢や性格などキャラ設定をして、DJとして全面に出しちゃうの良いのでは!?と勝手に考えていたので、その辺も聞いて見ましょう。
はい。AIにセクシー系のキャラ付けして起用する会社も多いようですが、むしろ機械は機械らしいほうが面白いと思うんですよね。
機械らしくあるメリットは、AI(人工知能)だとわかることで、人間と違うと感じた時の気持ち悪さや違和感を抑えられることですね。
ずばりそうです。
でも、これからは人間側の耳がAI(人工知能)の音声になれてくる可能性が高いと考えています。
そうですね、人工音声に違和感を感じなくなっていくんじゃないでしょうか。
そうなんですよ。AIスピーカーに今朝のニュース教えてと話しかけて、人工音声で聞く。そんな時代がもう来ていますからね。
それまでは世の中の様子をみながら送り出しますが、みなさんの耳の方が変わっていくと予想できるので、AIアナウンサーが人間らしくなる必要はないでしょう。
きっと人間か機械か判別できないレベルまでAI(人工知能)音声進化すると思います。それは人間の声が一番良いというのではなく、その方がわかりやすいからだと思います。だから人間に近づいている。
でも、もし人間が話すより「わかりやすい話し方」があるならそれになっていくでしょうね。
まとめ
今回は「無駄がないAI(人工知能)の音声」と、「無駄がある人間の声」その聞き取りやすさの違いについて、Kiss FM KOBEの山本さんと謎解きをしました!
- 人が息を吸う瞬間の音や、唇のふれる音などリップノイズがないと、話が人間の頭に残りにくい。
- 息を吸った瞬間に話題が変わることを、人は無意識に察知するので集中できる。
また、AI(人工知能)の音声の未来がどうなっていくかの予想も興味深かったですよね。
- AI(人工知能)の音声は人間と判別つかないくらいに進化する。
- 人間の耳がAI(人工知能)の音声に慣れて、違和感を感じなくなる。
何気なく耳にしたラジオ番組から、AI(人工音声)音声と人間の声の違いや、人間を超える未来を感じさせる貴重なお話を聞けました。
まさかまさか、聞き取りやすさの秘密がリップノイズにあったなんて・・・一瞬で判断を下す人間の五感って本当に面白いですよね。AI(人工知能)の進化だけではなく、自身の対応力の変化にも注目して、AI(人工知能)との日常を楽しんでいきたいですよね。
神戸密着型の市民に愛され系ラジオ局、Kiss FM KOBEさん
今回お応えくださった山本さんが、AIアナウンサーと出演されているのは、Kiss FM KOBEにて毎週土曜 AM7:00から放送中の「神戸経済ニュースウィークリー」です。
朝早くてちょっと・・・という方は、ラジオアプリ「radiko」のいつでも好きな時間に番組を聞ける「タイムフリー」機能がおすすめです!
そんな「タイムフリー」にぴったりな、10分間でちょい聞きできる「10BLOCKS」という番組が人気急上昇中。そんな斬新かつおもしろい番組にチャレンジされている、魅力的なKiss FM KOBEさんですが、リアルにスタッフ募集中とのこと。ぜひ、サイトも覗いてみてください!
わたしも応募しちゃおうかな♡