AIの根幹技術である機械学習。機械学習では、コンピューターに学習データを読み込ませて、AIのモデルを構築する。ここで一番コストがかかるのは、その学習データの用意だ。そのため、この工程を外注する企業は多い。
しかし、納品されたデータの品質が悪かったり、発注先の作業の進捗が遅かったりと、機械学習のための学習データの外注には問題が頻発する。
株式会社バオバブには、効率的に学習データを構築できる仕組みがあり、高品質なデータを早く、リーズナブルに求める企業のニーズに応えることができる。
代表取締役社長の相良美織さんは当初、機械翻訳のための対訳を中心にサービスを立ち上げた。現在では画像認識や音声認識などの幅広い分野の学習データを構築する。将来的には、オープンソースのAIツールとの連携も視野に入れる。
どんな企業なのか。詳しく見ていこう。
株式会社バオバブ 代表取締役社長
相良美織
ーーサービスを一言でいうと?
機械学習のための学習データを構築するサービスです。具体的には機械翻訳のための対訳作成や画像認識のためのアノテーション、対話シナリオの構築などを組織的に行います。”Baopart”と呼ばれる作業員がリモートで作業しやすい仕組みが整っているので、高品質なサービスを早く、リーズナブルに提供できます。
ーーどんな仕組みが整っているのですか?
バオバブのアノテーションプラットフォームのユニークは主に4つです。1つ目は、アノテーションのツールを内製化して作っているところです。このツールを使うことで、Baopartの作業の効率化が期待できます。2つ目は、優れたBaopartを確保して、リテインし続ける仕組みです。Baopartが継続してリモート業務に取り組める環境を用意しています。
3つ目は、オペレーションです。例えば、クライアントのニーズを反映させたガイドラインを、昨日参加した初心者のBaopartにも理解できるように準備することはとても重要です。4つ目は、Baopartプラットフォーム内のコミュニケーションの仕組みです。BaoLeader(管理者)とBaoChecker(責任者)がBaopart一人ひとりの作業の進捗状況を確認するので、滞りなく作業を進められます。
このように作業者が働きやすい環境をつくることで、現在では22か国から800名以上のBaopartが集まっています。国際色が強いのも特徴です。
ーー競合サービスはありますか?それとの違いは?
国内外問わず、機械学習のための学習データを構築するサービスは他にも存在しますが、作業員のリテインがうまくいかない事例が多いようです。例えば、作業員のキャパシティを超える仕事量を企業が低賃金で強要し、職務を放棄する作業員が出ています。バオバブは、Baopart一人ひとりがこなせる仕事量を把握しているため、限界を超えた仕事量を要求しませんし、ノルマもありません。Baopartが好きな時間に好きなだけ仕事をしながら、オペレーションと仕組みで効率的に生産性を向上させています。
ーーなぜ現在のサービスを始めようとしたのですか?
2010年に創業した当時から、機械翻訳のための対訳を中心に業務を始めました。画像認識に使う画像アノテーションを始めたのは、ディープラーニングを手がけるPFN(Preferred Networks)様からの依頼がきっかけです。現在では、機械翻訳や画像認識、音声認識までの幅広い機械学習のための学習データを用意できます。
ーーこのサービスの今後は?
現在は機械学習の学習データの構築を手がけていますが、今後は学習データをもとにAIモデルを構築し、ベンチマークとしてお客様に提示するサービスも始めようと考えています。AIが完成するまでの複雑な工程に疲弊しきっているお客様を多く見てきたからです。
将来的には、この学習データをTensorFlowやOpenNNなどのオープンソースのAIツールとかけ合わせていきます。技術分野で連携を深めるために、Google for Startups Acceleratorへの参加も決めました。
ーービジョンはありますか?
誰もがどこでもAIのモデルをレゴのように構築できる世界を作ることです。最近では、障がい者就労支援施設の方々にも業務に参加していただいており、「職場が明るくなった」という声もいただいています。バオバブのサービス提供を通して、Baopartの人生にも良い変化を与えられるようになったらいいですね。
株式会社バオバブが気になった方は、以下のリンクまで。
取材担当佐野
取材させていただけるスタートアップ、募集中。詳しくはこちら。
AIアクセラレーター、募集中。メンタリングを受けた人の感想はこちらやこちら。
30分で取材
掲載無料
原稿確認OK