「声質変換」をご存知だろうか。声質変換とは、自分の声を誰かの声に変える最新技術のことである。
この声質変換の技術を応用して、様々な「声」に関する課題の解決を目指す会社がある。株式会社 voicewareだ。
どんな企業なのか。詳しく見ていこう。
代表取締役社長 CEO
田村一起
1986年徳島県出身。大学卒業後は、システムエンジニアとして独立系SIerに入社。その後独立し、フリーランスエンジニアとして主にスマートフォンアプリ開発に携わる。2017年7月に、電気通信大学の中鹿亘助教と共に株式会社voicewareを設立。同助教の開発した声質変換技術を核として、音声×AIを駆使したサービスを開発中。
――株式会社 voicewareの事業について教えてください。
私たちは「声質変換」という技術を扱っています。声質変換は、自分の声を誰かの声に変える技術です。イメージとしては、名探偵コナンの蝶ネクタイ型変声機を現実世界に実現すると思っていただくとわかりやすいと思います。この技術を機械学習を使って実現しています。
今までのボイスチェンジャーは、声を高くしたり、低くしたりすることで、女声や男声を作っていました。一方、声質変換は、誰かの声になることができる技術です。実在する人物の声になれることが特徴になっています。
――声質変換は今後どんな風に使われていくのですか?
声質変換が今後使われてくる領域は、スマートスピーカーやロボットの領域が考えられますね。
現在、ロボットの声には、特定の合成音を使われています。声質変換の技術を使えば、ロボットの声を好きなキャラクターや家族の声に変えることができるんです。
――ロボット分野に活用できるのですね!
最近では、Vチューバー関連の分野で需要が上がってきていますね。
今までVチューバーさんが声をつけるときには、既存のボイスチェンジャーを使って、声をうまくあわせて調整していました。音声認識・音声合成を使って、自分の言葉をテキストにしてから音声にしているVチューバーさんもいらっしゃいます。これは非常に手間がかかったり、感情がのせられなかったりするなどの課題がありました。
Vチューバーの領域は映像の技術の完成度は高いのですが、声の技術は発展途上にあるんです。その領域にも使っていただきたいと思いますね。
――他に活用できる分野はありますか?
他にも医療や福祉の領域にも活用していくこともできます。具体的には、喉頭摘出者(のどを摘出した人)の方は現在機械音でお話しされていますが、これを声質変換で自分の声を取り戻すことを目指しています。
また、亡くなった方の声の再現もできます。亡くなった方の声を聴ければ、遺族の方のセラピーにも使うことができますよね。
このように、様々な場面で使えるサービスになっています。
――ToB・ToC、どちらを想定しているのでしょうか?具体的に想定しているターゲットについても教えてください。
まずは、ToBの領域にサービスを提供していきたいと思っています。
その中でも、主にエンタメ業界をターゲットとしています。声優さんが活躍しているアニメ業界などに進出していきたいです。
――競合について教えて下さい。
声質変換の業界全体としても、技術自体のクオリティーが発展途上です。そのため、競合は少なくなっています。
研究レベルでは、大企業などが参画していることもあります。Vチューバーとの組み合わせを考えている企業さんは多いですね。
――株式会社 voicewareとしての強みはなんですか?
技術に強みがあります。というのも、話者のサンプル数が少なくて済むようになっているんです。
30秒の音源があれば、音声を再現することができます。加えて、その録音する内容も制限はありません。亡くなった方でも、30秒の音源さえあれば再現できるのが強みになっていますね。
また、そのクオリティーも着々と上がってきています。市場でも勝負できると思えるようになったので、現在では、プロダクトの開発も開始しました。
ありがたいことに、テレビでも取り上げてもらえ、話題性も出てきていますね。
――株式会社 voiceware立ち上げの経緯について教えてください。
新卒では、中小企業のSIerでSEをやっていました。4年後、独立してフリーランスとして活動。そんな状況で、今のCTOが僕に声をかけてくれたんです。
彼は、大学で助教をしており、声質変換の研究をしていました。そこで、面白いサービスができると思ったのだそうです。彼はそのサービスを社会・世界に出したいと思っていたのですが、大学の助教はCEOになれないという規則があり、経営のスキルもなかった。そこで独立して経営も詳しいだろうということで、私に声をかけてくれたんです。
自分はAIに関しては全く触ったこともありませんでしたが、面白いと思いましたね。実際に色々と調査してみると、声のニーズは結構あったんです。これはイケるぞと(笑)。そこで、CTOの彼と組んで、今の事業を始めました。
今年で3年目になります。
――プロダクトの目指す姿を教えてください。
最終的には私たちのプロダクトで、だれもが自分の好きな声を選べる世界を実現することを目指しています。
私たちが開発するデバイスを使って、気分によって声を選べるようにしていきたい。服を着るように、声も「着る」時代を作っていきたいと思っています。
現状では、リアル世界での実現は難しいですが、VR空間で声質変換の技術を使っていくことは可能ですし、必要になってきます。というのも、これからVR空間でコミュニケーションをすることが普通になってくるでしょう。そんな世界においては、声を変える必要が出てくると思うのです。声を変える技術を広めていくことで、プライバシーの保護などの課題を解決していこうと思います。
――株式会社 voicewareの展望を教えてください。
声の課題を全般的に解決していきたいと思います。
声質変換の研究もしていますが、それ以外にも音声系のAIを使うような分析の案件を受けることがあります。例えば、コールセンターで声の感情を読み取ることや、営業成績が良い人の声を分析するなどが代表例ですね。
それらを分析していく中でわかったことは、その場に適した声があるということです。
「プレゼンや営業の場面に効果的な声」があるんです。その場に適した声を分析し、それを自由に使い分けられる技術の開発を目指していきます。
声にコンプレックスを持っている人は多いですよね。そんな人たちを含め、声に関する様々な課題を解決できるような企業になっていきたいと思っています。
声の課題を解決して、声を自由に選べる時代を作る。株式会社 voicewareのこれからに期待だ。
取材担当橋本
AIアクセラレーター、募集中。メンタリングを受けた人の感想はこちらやこちら。
30分で取材
掲載無料
原稿確認OK