ゲームのボイスといえば、何を思い浮かべますか?「こんにちは、NPCです」としか言わない堅苦しい声優さんでしょうか?それとも、開発資金が足りず、ゲーム中のセリフは全て字幕に頼っている状況でしょうか?

今年の台北ゲームショウのステージ上で、VoAIの創設者であるチャオ・スークアン氏は率直にこう述べました。「今日のAI音声は、もはや過去の機械的な音声ではありません。」これは単なる技術の進歩ではなく、「生産性」と「想像力」の解放でもあります。
「ナレーション」がもはや「贅沢」ではなくなったとき
趙旭光氏は講演の冒頭で、ある興味深い現象を指摘した。情報過多の時代において、人々の目は様々な短い動画やメッセージで溢れており、「聴覚」は断片化された時間を埋めるための新たな戦場となっている。運転、家事、通勤など、耳は多くの時間、使われていないのだ。

しかし、ゲーム開発者やコンテンツクリエイターにとって、高品質な音声コンテンツの制作は、しばしば法外な費用がかかります。プロの声優を雇うだけでなく、レコーディングスタジオを借りる必要があり、ポストプロダクションの編集にはさらに費用がかかります。その結果、多くのゲーム(特にインディーゲーム)は、音声による演出を諦め、テキストのみの表現を選択せざるを得なくなっています。
「もし今、あなたの声、上司の声、あるいはネットの有名人の声を使って、まるで人間のように話せるロボットがいたら、本当に面白いでしょう」とチャオ・シューグアン氏は強調した。VoAIのコア技術は、AIによるナレーションを、単調な「ミス・グーグル」のような多様な声で話すだけのものではなく、喜び、恥ずかしさ、怒りなど幅広い感情を伝え、さらには特定のキャラクター(若い女性、若い男性、語り手など)の個性を模倣することだ。

チャオ・スークアン氏はさらに、中国語の音声データは既に世界中で利用可能であるものの、そのほとんどは依然として中国市場向けの研修コンテンツであると指摘した。台湾市場では一般的に、よりローカライズされた音声データが求められているため、現地市場のニーズを満たす研修コンテンツの価値が高まると予想される。

AI NOWCAST: あなたのLINEがAIニュースステーションに
VoAIは、ナレーションの提供だけにとどまらず、LINE上に構築された自動ニュース放送プラットフォーム「AI NOWCAST」という実用的なアプリケーションも紹介しました。
動作ロジックは非常にシンプルです。ニューステキストをキャプチャし、AIによって音声放送に適したスクリプトに書き換え、音声コンテンツを生成し、最終的にユーザーに配信して聴取します。この背後には、AIの情報処理能力、つまり「構造化、要約、再音声化」の能力が発揮されています。

ゲーム業界にとって、この技術の可能性は単なる「ニュース放送」にとどまりません。このロジックをゲーム内の「デイリークエストブリーフィング」や「ギルドバトルアップデート」に適用すれば、プレイヤーはもはやぎっしり詰まったアナウンスをじっと見つめる必要がなくなります。代わりに、AIキャラクターが生き生きとした声で「ギルドリーダー!昨夜、私たちの拠点は攻撃を受け、大きな損害を受けました!」と語りかけるのを「直接聞く」ことができるのです。これにより、没入感は飛躍的に向上するでしょう。
AI アバター: 話すだけでなく、「顔」も必要です。
さらに、チャオ・シューグアン氏はイベントでVoAIの最新技術であるAIビデオクローン技術も披露しました。写真と音声録音だけで、AIが写真に写っている人物を「動かし」、話させ、唇の動きまで再現します。
ゲーム開発者にとって、この技術は従来の手法に比べて大きなメリットをもたらします。動き、話すNPCを作成するには、これまで3Dモデリング、モーションキャプチャ(Mocap)、表情リギングが必要で、それぞれのステップにコストがかかっていました。AI技術を活用すれば、1枚の2DアートワークとAI生成の音声を組み合わせるだけで、大量の物語コンテンツを迅速に作成できます。
趙旭光氏はさらに、「動画コンテンツの大量生産」というコンセプトを提唱した。これは、AIエージェントを用いてAIを訓練し、様々な視聴者層をターゲットにすることで、数千もの異なる短編動画を自動生成するものだ。ゲームマーケティングにおいて、これは膨大な量の広告素材を極めて低コストでテストし、最も高いユーザーコンバージョン率を持つものを見つけることができることを意味する。


これは将来的にさらなる市場機会につながる可能性もあります。
チャオ・スークアン氏によると、VoAIは現在、SaaS(Software as a Service)とAPIアクセスという2つの主要なカテゴリーでサービスを提供している。VoAIは主にGoogle Cloudプラットフォーム上に構築されているが、トラフィックとシステム運用のリスクを軽減するために、AWS、Azure、そして台湾のローカルクラウドサービスプラットフォームとも連携している。
そして、ブロックチェーンとAI技術で構築されたKKカンパニーAI を活用したデジタル アバター管理プラットフォーム、TheKeeperこれに対し、チャオ・シュグアン氏は、VoAIは実際に同様の技術を保有しており、エンターテインメント市場と連携した展開も検討しているが、現段階ではYouTuberやKOLなどのクリエイティブ集団との連携が中心だと説明した。

分析: AI は創造性を増幅するものであり、代替するものではありません。
チャオ・シューグアン氏は、AI音声技術がゲーム開発において「やりたかったができなかった」ギャップを埋めていると強調した。
多くの場合、開発者はフルボイス化への欲求ではなく予算不足、ダイナミックなプレゼンテーションへの欲求ではなく人材不足に悩まされています。しかし、生成AIの出現により、こうした「贅沢」は「標準」技術へと変貌を遂げています。
もちろん、AIの音声表現はトッププロの声優の感情表現のニュアンスにはまだ及ばないかもしれません。しかし、量とスピードという点では、AIはすでに絶対的な能力を発揮しています。未来のゲーム開発プロセスは、核となるストーリーラインは実在の声優が演じ、膨大なサイドクエスト、ランダムな会話、そして動的に生成されるNPCとのインタラクションまで、すべてAIが担当するようになるかもしれません。
サウンドと画像を生成するコストがゼロに近づくと、ゲーム開発者に残るのは創造性とストーリーテリング能力を試すことだけです。


