数十億人のユーザーから毎日膨大な量のAI生成およびレコメンデーション計算が要求される状況に直面し、Metaはハードウェアの制御を強化することを決定しました。Metaは…カスタマイズされたチップメタトレーニングおよび推論アクセラレータ(MTIA)的最新發展藍圖。有別於傳統晶片廠一至兩年的產品週期,Meta宣示將在短短兩年內 (至2027年)將接續推出包含MTIA 300、400、450與500總計四代新晶片。
Meta は、独自の「モジュラー チップレット」設計と「推論ファースト」戦略を通じて、NVIDIA などの商用 GPU に大きく依存する状況において、極めて高いパフォーマンスとコスト効率を兼ね備えた自社開発の道を切り開こうとしています。
ムーアの法則のリズムを破る: 6 か月ごとに更新される「超高速反復」。
従来の半導体業界では、全く新しいAIチップの開発と発売には通常1~2年かかります。しかし、AIモデルの進化のスピードは、ハードウェアの開発サイクルをはるかに上回っています。
ハードウェアがソフトウェアに遅れを取らないよう、Metaは非常に積極的な「ハイベロシティ」戦略を採用し、新チップのリリースサイクルを約6ヶ月に1回に短縮しました。このアジャイルに近いソフトウェア開発スピードは、高度なモジュール設計哲学によるものです。MTIA 400から500まで、Metaは同じシャーシ、ラック、ネットワークインフラストラクチャを採用し(OCPオープンコンピューティング標準に準拠)、新世代チップを既存のサーバーラックに直接「ドロップイン」できるため、チップ製造からデータセンターへの導入までの時間を大幅に短縮しました。
2年間で4世代の戦闘力を分析:高周波数帯域幅メモリ(HBM)を目指す
Meta が公開したタイムラインと仕様によると、これら 4 つの MTIA チップはそれぞれ異なる段階で戦略的ミッションを担います。
• MTIA 300(量産中)高性能でコスト効率に優れた基盤として、Meta の従来の「ソートと推奨」(R&R) システム向けに主に最適化されているほか、後続の GenAI チップの基盤となるネットワークと通信アーキテクチャも構築されています。
• MTIA 400(近日公開予定):これは、Metaにとって、トップクラスの商用チップ(NVIDIAシリーズなど)と直接競合できる初の製品です。レコメンデーションシステムの計算能力を維持するだけでなく、GenAIのサポートを大幅に強化し、FP8の計算能力は前世代機と比較して400%向上し、HBMメモリ帯域幅も51%向上しています。
• MTIA 450(2027年初頭予定):「GenAI推論」向けに特別に設計されています。大規模言語モデル(LLM)の推論速度はメモリ帯域幅に大きく依存するため、MTIA 450はHBMの帯域幅を直接2倍にし、推論専用に設計された低精度データ形式(MX4など)を導入することで、市場の主要な商用製品を凌駕するパフォーマンスを実現します。
• MTIA 500(2027年予定):進一步挑戰極限,在450的基礎上再將HBM頻寬提升50%、MX4算力提升43%,並且採用更先進的2×2小型運算小晶片 (Chiplet)配置,實現以最低成本輸出最大規模的AI推論能力。
「推論優先」と痛みのない転送のソフトウェアエコシステム
現在、市場で主流となっているGPUのほとんどは、最も計算負荷の高い大規模生成AIの「事前学習」向けに設計されており、その後、推論用に「ダウングレード」されています。Meta社は、このアプローチはコスト面で極めて不経済だと考えています。
そのため、MTIA 450 と 500 では、完全に反対の「推論優先」戦略を採用しています。この戦略は、最初からデコードおよび専門家の混合 (MoE) アーキテクチャ向けに最適化されており、Meta AI アシスタントへの数十億のユーザーからの毎日の呼び出しを処理する際に、コンピューティング能力の単位あたりのコストが最小限に抑えられることを保証します。
さらに重要なのは、世界で最も人気のあるAIフレームワークであるPyTorchの発明者であるMetaが、MTIAが最初からPyTorchをネイティブサポートできるようにしたことです。開発者はコードを書き換えることなく、商用GPUとMTIA間でモデルをシームレスに移行できるため、新しいハードウェア導入に伴う苦労を完全に排除できます。
視点の分析
Meta が最近発表した今後 2 年間の MTIA 設計ロードマップは、明確なメッセージを伝えています。「モデルのトレーニングに GPU を購入するのは問題ありませんが、無料ユーザーにサービスを提供するために高価な GPU を使用するのは論外です。」
Llama 4、あるいは将来登場するLlama 5のようなスーパーモデルの学習には、確かに数万基もの最先端の商用GPUが必要です(だからこそMetaはNVIDIAの主要顧客であり続けているのです)。しかし、学習は一度きりの費用で済みます。モデルがオンラインになれば、Facebook、Instagram、WhatsAppの30億人のアクティブユーザーから毎日送られてくる膨大な数の「推論」リクエストへの対応は、運用コストの底なし沼に陥ることになります。
もしMetaが、生成するテキストや推奨するReelsデバイスごとに高額な「GPUハードウェア税と消費電力税」を支払わなければならないとしたら、同社の粗利益率は急速に低下するでしょう。MTIAファミリーの誕生と急速なイテレーションは、Metaが自社の収益モデルを守るために築き上げたハードウェアの堀と言えるでしょう。
Meta は、オープンソース ソフトウェア (PyTorch、vLLM) とオープン ハードウェア (OCP) を深く統合することで、単一のハードウェア ベンダーの制約から解放されるだけでなく、特定の大量アプリケーション シナリオでは、カスタム設計された ASIC (特定用途向け集積回路) の方が GPU よりもはるかに有用かつ効率的であることを業界に証明しています。




