生成型AIモデルにおける競争が激化するにつれ、推論の高コストと計算上のボトルネックが、AI大手企業が解決に躍起になっている大きな問題点となっている。情報最新レポートAIスタートアップ企業のAnthropicは、AIモデル推論の計算コストを削減するために、英国を拠点とするAIチップスタートアップ企業であるFractileからチップを購入する計画を立てていると指摘された。
Fractile社は、大規模言語モデル(LLM)推論の性能をNVIDIA製品の最大100倍向上させながら、コストはわずか10分の1に抑える可能性を秘めたダークホースであると主張している。同社のチップは2027年に正式に発売される予定だ。
計算機能とメモリ機能を一体化した、まさにゲームチェンジャー。
2022年に設立されたFractileは、オックスフォード大学のウォルター・グッドウィン博士によって創設されました。比較的新しい企業ではありますが、Graphcore、NVIDIA、Imagination Technologiesといった企業で経験を積んだ業界ベテランを含む、強力な開発チームを擁しています。
Tom's Hardwareによると、Fractileは2024年に1500万ドルのシードラウンドを完了し、現在、企業価値を10億ドルのユニコーン企業に押し上げることを目指して、2億ドルの新たな資金調達ラウンドを模索している。
その核心的な武器は、建築設計にある。
現在、NVIDIAの主流GPUは、演算ユニットとメモリコンポーネント(HBMやDRAMなど)を分離しています。AI推論を実行する際、両者間でデータが頻繁に移動する必要があり、これが煩わしいレイテンシの問題を引き起こすだけでなく、膨大な電力消費にもつながります。これが最大の問題点であり、業界では冗談交じりに「メモリの壁」と呼ばれています。
この「壁」を打ち破るため、FractileはRISC-V命令セットベースのチップアーキテクチャとSRAMスタティックランダムアクセスメモリを採用し、「処理ユニット」と「メモリ」を単一のダイに大胆に統合しました。同社は、データ移行のボトルネックを解消するこの「ニアメモリ」設計により、NVIDIA GPUよりも最大100倍高速に大規模な言語モデル推論を実行でき、しかもコストはわずか10%で済むと主張しています。
アントロピック社のコンピューティング能力に対する不安とリスク分散戦略
なぜAnthropicはこの初期段階の半導体スタートアップに興味を持ったのだろうか?その答えは、同社の爆発的な成長の背景にある、コンピューティング能力に対する不安にある。
2025年末までに、Anthropicの年間収益は300億ドルに急増した。自社で積極的にデータセンターを構築するOpenAIやxAIとは異なり、Anthropicの戦略は「クラウド中立性」を重視しており、NVIDIA GPU、AmazonのTrainium、Google TPUといったサードパーティのコンピューティングプラットフォームを幅広く活用している。
事業の急速な拡大に伴い、推論コストが大きな負担となっていた。アナリストらは、Anthropicの今回の動きは、より効率的で安価な推論処理能力を獲得するためだけでなく、「サプライチェーンのリスクを分散」し、将来の処理能力競争において単一のNVIDIAアーキテクチャへの過度な依存を回避するためでもあると指摘している。
視点の分析
Anthropic社によるFractileチップの購入報道は、現在のAI市場における重要なトレンドを反映している。すなわち、「トレーニング」と「推論」のためのハードウェア需要が急速に乖離しつつあるということである(例えば、Googleが今年初めてFractileチップを購入したことなど)。第8世代TPUこれは、対応するトレーニング用TPU 8tと、対応する推論用TPU 8iに分割されます。
モデルのトレーニング段階においては、NVIDIAは広範かつ成熟したCUDAソフトウェアエコシステムと優れたハードウェア統合能力のおかげで、短期的にはAI市場における地位を揺るぎないものに保っています。しかし、モデルが完成し、実用的なアプリケーション展開のための「推論」段階に入ると、業界関係者は単一の応答の「レイテンシ」と「コスト効率」により関心を寄せるようになります。
これは、NVIDIAに買収されたGroqだけでなく、SRAMメモリやニアメモリアーキテクチャの利用に注力するCerebrasや、本稿の主人公であるFractileといったスタートアップ企業にとっても、優れた参入機会となる。



