クリエイティブ生成AIエージェントで、表現の可能性を解き放つ

2023年度の第9回1stRound支援先の一つである株式会社Scimit(サイミット)は、技術と創造性の融合を体現するスタートアップだ。第一段、AIボイスチェンジャー「Koemake」の累計登録者数は3万8000人を突破。
いま同社が挑戦しているのは、音声変換の枠を超えた革新的な取り組みだ。「絵が描けなくても思い通りのイラストを生み出せる」「作曲の知識がなくても心に描いた音楽を形にできる」—そんな世界の実現を目指している。
専門的なスキルがなくても、誰もが創造的な表現を形にできる「クリエイティブ生成AIエージェント」のローンチを控える代表取締役CEOの石坂雄平氏に、事業の概要や優位性、起業に至った経緯、今後の展望などを聞いた。
ワンクリックで自在に音声変換できるAIボイスチェンジャー
―まず、Scimitの事業について教えてください。
石坂:当社はまず、「声」というもっとも身近なメディアに革命を起こすことから始めました。従来のボイスチェンジャーは、基本的にピッチとフォルマントの調整による信号処理で音声変換していました。ただ、この方法では機械的な音質になりがちで、使用者自身も発声時点で声を調整する必要があったんです。
生成AIの登場により、この技術的制約を打破できる可能性が生まれました。私たちが目指したのは、その技術を誰もが直感的に使えるようにすること。その日の気分やコンテキストに応じて、自由に声を変えられる世界を実現したいと考えたんです。そこで「Koemake RVC Player」というソフトウェアを開発・提供しました。RVCとは、Retrieval-based Voice Conversionの略ですが、この先端技術を誰もが簡単に扱えるようインターフェースにこだわりました。
―プロダクトの特徴や優位性は何でしょうか。
石坂:β版を2023年5月にリリースして登録者を着実に伸ばしてきました。そして2024年8月にはバージョンアップした「Koemake Live(コエメイク・ライブ)」をリリース。登録者数は3万8000人に達しています。
開発当初から使いやすさを重視して、UI/UXにこだわってきました。最大の特徴は、他のサービスと直接連携ができること。Discord(ゲーマー向けのトークアプリ)やVRChat(ソーシャルVRプラットフォーム)、Zoomとボイスチェンジャーを接続するには通常サードパーティー製のオーディオインターフェースを介する必要がありますが、それが不要で、ワンクリックで接続できます。
またターゲットボイスでは、たとえば「声優の○○さんの声質に近づけたい」といったニーズに応える場合、音声変換における音質精度と遅延はトレードオフの関係にありますが、当社では音質を重視しつつも、独自技術で遅延も最小限に抑えることができます。おそらく世界で当社だけが持っているであろう技術を取り入れて、これを実現しているのです。
―ボイスチェンジャーやその事業における課題や展望を教えてください。
石坂:ボイスチェンジャー全体の技術的課題としては、マイクの性能や声の相性などの環境に左右されず、高品質な音声変換が行える状態を目指したいですね。モバイルで使えるアプリケーションの開発も急務だと考えています。
ビジネス面では、現状のエンターテイメント用途から日常生活への浸透を図りたいと考えています。例えば、カーナビの音声カスタマイズやコールセンターでのオペレーター支援など、実用的な応用領域は無限に広がっています。このような社会実装を通じて、市場拡大と新たな価値創造を目指しています。
2度目の挑戦で1stRoundに採択。決め手はプロダクトの確立とユーザー数
―2021年7月にScimitを設立されていますが、起業に至った経緯を教えてください。
石坂:私は長く研究者としてキャリアを積み、現在も関東学院大学理工学部で准教授としてAIや半導体の研究に携わっています。ただ研究の世界では、成果が社会に還元されるまでのタイムラグに常にジレンマを感じていました。より直接的かつ迅速に社会に価値を提供したいという思いが、起業を決意する大きな原動力となりました。
アメリカでは研究成果からイノベーションが生まれ、それが起業とスケールアップを通じて産業構造を変革していく流れが確立されています。日本でもこの生態系を創出するために、研究者自らがビジネスの世界に飛び込み、新しいロールモデルを示す必要があると考えました。
社名の「Scimit」には「ScienceにCommitする」という決意を込めています。日本のアカデミアの優れた知見を社会実装につなげるエコシステムを構築すべく、当初は研究者支援サービスと、技術顧問である東京科学大学の雨宮准教授による研究成果の事業化に取り組んできました。
―2023年度の1stRoundに応募された理由は何でしたか。
石坂:ボイスチェンジャー開発に着手した2022年秋頃、ディープテック領域で日本最高峰の1stRoundプログラムに強く惹かれました。充実した支援体制とVCネットワーク構築の機会は、技術志向のスタートアップにとって理想的な環境でした。
最初の挑戦である第8回では採択に至りませんでした。分析すると、プロダクトの完成度不足と、同領域の既存採択企業との差別化不足が課題でした。
この教訓を糧に、競合が未開拓だった個人向けサービスに注力し、「Koemake」のβ版をリリース。わずか数か月で登録者1万人という具体的成果を示しました。第9回審査会では、このトラクションと独自ポジショニングが評価され、念願の採択を勝ち取ることができたと考えています。
―そのほか、1stRoundに採択されて役立ったことを教えてください。
石坂: 最も価値があったのは、ノンエクイティの事業資金と、それによって実現したプロダクト品質の向上です。スタジオ品質の音声収録やオリジナルキャラクターの制作など、ユーザー体験を高める重要な投資が可能になりました。
また、メンターの水本さんとの月例面談は、私の思考の枠組みを拡張する貴重な機会でした。技術シーズをビジネスに昇華させる方法論、市場の捉え方など、研究者としての視点だけでは気づきにくい多くの示唆をいただきました。時に厳しい指摘もありましたが、それこそが真の成長につながりました。今でも行き詰まりを感じたとき、水本さんの言葉が新たな打開策を見出す指針となっています。
加えて「1stRound BASE in 東大前 HiRAKU GATE」の利用権や、ビズリーチを通じた人材確保など、多角的なサポートが事業加速の原動力となりました。
生成AIで誰もがクリエイティブコンテンツを気軽に作れるように
―御社の今後の展望を教えてください。
石坂:実は私たちのコアビジョンは、ボイスチェンジャーの枠を超えています。本質的には、表現手段の民主化、つまり専門的なスキルがなくても誰もが創造性を発揮できる環境の構築です。この理念を体現する次世代プロダクトとして、「クリエイティブ生成AIエージェント」の開発を進めており、「Saku AI」というブランドで近々ローンチする予定です。
特に注目しているのが、YouTubeやTikTokといった動画プラットフォームの爆発的な成長です。現在、多くのクリエイターが高品質なコンテンツ制作に膨大な時間とリソースを費やしています。しかし、アイデアはあってもモーショングラフィックスの知識がない、編集技術に自信がない、BGM制作のスキルがないといった技術的障壁が、多くの人々の表現を阻んでいるのが現状です。
「Saku AI」は、大規模言語モデルや画像生成モデルの能力を持ちながら、自律的にコンテンツ創作のタスクを遂行するAIシステムです。現代の生成AIの驚異的な能力を、テキストだけでなく、視覚、聴覚など多様なモダリティで発揮させます。
また興味深いことに、現代の若い世代は複数のアカウントやペルソナを使い分ける文化を形成し、さまざまなプラットフォームで自己表現を楽しんでいます。この新しい創作文化に「Saku AI」は完璧に適合し、ユーザーの創造性を拡張するプラットフォームになるでしょう。特にバイラルコンテンツを生み出したいインフルエンサーや、効率的に企業PRを行いたいマーケターにとって、革命的なツールになると確信しています。
このコンセプトは世界的にも黎明期にあります。先行者優位を確立するため、「Saku AI」ローンチ後は迅速に資金調達フェーズに移行し、グローバル展開を加速したいと考えています。実績のある強力な開発チームを構築済みです。投資家の皆様と共に、急成長する動画コンテンツ市場と生成AI技術の融合領域で、世界市場の開拓に挑戦したいと思います。
―「ScienceにCommitする」というところから、進化していますね。
石坂:研究者支援という創業理念は今も大切にしています。雨宮准教授の研究を活用した半導体設計AIの一般化プロジェクトは、学術と産業の橋渡しの好例です。
また、研究室における生成AI活用の効率化も重要課題です。現状、研究者や学生が個別にサブスクリプションを管理する非効率を解消するため、研究・論文執筆特化型の生成AIパッケージ開発も視野に入れています。研究室単位での統合的なAI活用を促進し、日本の研究力向上に貢献したいと考えています。
―最後に、起業を考える方へアドバイスをお願いします。
石坂:起業への情熱があるなら、迷わず行動に移すことをお勧めします。私自身、研究キャリアを積んでから起業しましたが、振り返れば若い時期の挑戦にも大きな価値があったと感じます。若年期は純粋な熱量と体力があり、しがらみも少ないため、大胆な挑戦が可能です。
キャリアが進むほど様々な制約も生じてきます。思い立った時が最適なタイミングであり、行動することで初めて見えてくる景色があります。挑戦から得られる学びは、成功失敗に関わらず、かけがえのない財産になるはずです。