吉田一星
慶應義塾大学卒業後、ヤフー株式会社に入社。コンピュータビジョン、機械学習、検索、分散処理などの研究開発に関わり、コンピュータビジョン、VR/ARの技術を世界に先駆けてスマートフォンに応用したサービスを複数立ち上げた。2016年にPaneo株式会社(現在は株式会社EmbodyMeに改名)を創業し、一枚の顔写真から自分そっくりそのままの3Dモデルを自動で生成するVRコミュニケーションサービス、「EmbodyMe」をリリース。2018年には、AIで本物と区別がつかないフェイクビデオを簡単に作成できるスマホアプリ「Xpression」をリリースした。
アプリ専門の調査会社App Annieによれば、アプリストアの市場規模は2018年時点で1000億ドルに到達したという。その中でも業界をけん引するのは、AR技術取り入れたPokemon GoやSnapchat等の成長分野だ。消費者側から見ても、画像や動画に求めることは多く、バーチャルYoutuberもその一例だろう。今回スタートアップタイムズは、新技術を用いたサービス「Xpression」を開発し、アプリ動画市場に参入を狙う「EmbodyMe」に直撃する。
フェイクビデオアプリの「Xpression」
一言で言うと「AIやディープラーニングを用いて、フェイクビデオを簡単に作れる」サービスです。サービス名は「Xpression」、できることとしては、動画の中の人の表情を自分の表情で乗っ取り、リアルタイムで動かせること。絵画が喋っていたり、ニュースキャスターに自分の言葉を代弁してもらう、寝巻きでビデオチャット面接をうけることだってできます。
サービスの概要を聞いた
現在は一般のユーザーに使っていただけるように、サービス展開をしております。最近若者の間で「Snow」、「Snapchat」などが流行っていますので、我々の技術を使ってより多くの方に楽しんでいただけるようなサービスを作りたいと思っています。
次世代型の動画加工サービスとしての展望を持っているという。
まず、Youtubeで動画を検索したり、iPhoneに保存されている動画、あらかじめ用意されている動画を選んでください。どんな動画でもOKです。カメラに写った自分の顔の表情を動かすと、動画の人の表情もその場で動きます。リアルタイムです。あとは録画ボタンを押して、それを録画するだけで簡単にフェイクビデオを作成できます。
技術的な応用の幅はかなり広く、例えばビデオチャットに応用すれば、すっぴんでもトイレにいても、相手に不快感を持たれることなくコミュニケーションができます。
あらかじめ撮っておいたスーツ姿のビデオを使えば、寝巻き姿でオンライン面接に臨むことも可能です。また、既存の映画の役者に自分の好きなセリフを喋らせ、切り貼りすれば、オリジナルの映画を簡単に作成できます。
競合サービスについてきいた。
私たちの特徴はその技術的な部分にあります。どうAIを使っているのかというと、Xpressionでは常に3つのディープラーニングのネットワークが動いています。カメラ側の顔解析、ビデオ側の顔解析、GANでの画像生成です。スマートフォンや一般的なPCでリアルタイムに動かすことは従来難しかったのですが、そこを実現しました。
競合がいないというのも、技術的な優位性があるからだという。
なぜ創業したのかをきいた。
前職はヤフーにいましたが、その時から似たようなプロダクトを作っていました。モバイル上でARやVRサービスを作っていましたね。SnowやSnapchat、Facebookのフェイスエフェクトと同じようなアプリを3年前に世界で初めて実現したり、バーチャルYoutuberやAnimojiのようなアプリも3年前に世界で初めて実現しました。
ヤフーの本業である他のメディアやECなどとのシナジーがなかなか見出せず、社内では孤軍奮闘していました。しかし、40カ国以上でストアランキング1位を獲得したりと、魅力的なものは作れていたと思います。 社内だと限界を感じた私は、「自分でやるしかない」と思い会社を飛び出し起業にいたりました。
拡張現実の事業に専念したいという思いが、吉田氏を独立させたのである。
将来の展望をきいた。
新技術の部類にあたりますので、まずは社会に浸透できるように広げていきたいですね。前にも言いましたが、ビデオチャットの分野でかなり可能性がある技術だと思います。女性なんかだとお化粧をしていないとビデオチャットができない、そんな課題を解決したいですね。またバーチャルYoutuber向けにもサービス展開をしていきたいです。
Xpressionは最初の出発点で、現実と区別がつかないリアルな映像を誰でも簡単に作れ、それがリアルタイムで動くようになるという世界を実現するのがゴールです。AIを用いた次世代のコンピュータグラフィックスを実現するということです。今のXpressionは表情だけですが、次に頭や体全体を自由に動かしたり、あらゆる人や背景を作り出していくというように技術を進歩させていきます。
技術的なリーディングカンパニーになる、「EmbodyMe」は今後アプリ市場に新しい風をもたらすのか、注目していきたい。
取材担当中山
AIアクセラレーター、募集中。メンタリングを受けた人の感想はこちらやこちら。
30分で取材
掲載無料
原稿確認OK