MediaTekの先端技術研究開発部門であるMediaTek Researchは本日(7月9日)、オープンソースの新しい音声認識モデル「MR Breeze ASR 25」の正式リリースを発表しました。台湾でよく使われる表現やアクセントに最適化され、中国語と英語が混在する音声環境においても、より高い認識精度を実現しています。OpenAI Whisperをベースに開発され、Apache 2.0ライセンスの下でリリースされたこのモデルは、より多くの台湾の開発者や業界におけるAI音声アプリケーションの導入を加速させるでしょう。
MediaTekイノベーションセンターの責任者であるDa-Shan Hsu博士は、これまで主流の国際音声モデルは中国語の文脈における台湾語の理解に苦労していたと述べています。例えば、「何が起こったか」を「ピーナッツで何が起こったか」と誤認するといったよくある誤りがありました。MR Breeze ASR 25は、「AIが台湾語の音声をより良く理解できるように」するために開発されました。
公式データによると、MR Breeze ASR 25は、OpenAI Whisperと比較してローカル音声認識精度が約10%向上し、台湾でよく使われる中国語と英語の文構造であるコードスイッチングでは56%という大幅な向上を達成しました。この技術は、スマートカスタマーサービス、会議のトランスクリプト作成、字幕生成といった一般的なシナリオに適用可能であり、将来の現場展開やデバイスベースのAIへの新たな可能性を切り開きます。
MR Breezeシリーズの第25世代音声認識モデルであるMR Breeze ASR 2025は、MediaTekの「フルスタック繁体字中国語AI」戦略の一環です。同社は既に、視覚理解機能を備えたマルチモーダル言語モデル(V-LLM)、台湾語アクセント向けに特別にチューニングされたTTSモデル、外部関数呼び出しをサポートする言語モデルをXNUMX年にリリースしており、包括的なローカライズAIテクノロジーエコシステムを構築しています。
現在MR Breeze ASR 25HuggingFaceから入手可能開発者や企業は自由にダウンロードしてご利用いただけます。ご興味のある開発者の方は、MediaTek Innovation Base 公式プラットフォームにアクセスして、より詳しい技術情報やアプリケーション事例をご覧いただくか、モデルのパフォーマンスを直接お試しいただけます。
音声AIテクノロジーにおける世界的な競争が激化する中、MediaTekイノベーションベースは、現地の言語理解とオープンソース共有戦略を強化することで、「台湾の言語テクノロジーの独立」を促進するための長期的な取り組みと実践的な能力を発揮しています。



