Open Source Community 2026-04-04 Source →

Meta Llama 4 Maverick：400Bパラメータ・1000万トークンコンテキストのオープンウェイト多モーダルモデル、自前インフラで無料実行可能

Metaがオープンウェイト最大クラスのモデル「Llama 4 Maverick」を公開しました。MoE（混合エキスパート、Mixture of Experts）アーキテクチャを採用した400Bパラメータの多モーダルモデルで、最大1,000万トークンというコンテキストウィンドウを持ちます。テキストと画像を扱うことができ、IBM watsonx.aiなど複数のクラウドプラットフォームでも提供が始まっています。自前のインフラで実行する場合は無料で利用できる点が、クローズドモデルとの大きな差別化要因です。

MoEアーキテクチャは、全パラメータを同時に活性化するのではなく処理ごとに適切な「エキスパート」サブネットワークを選択して使う仕組みで、同規模の密なモデルより推論コストを抑えられます。ただしr/LocalLLaMAでは「400Bを自前インフラで動かすには相当のGPUが必要」という現実的な議論が広がり、モデルの性能よりも量子化手法や展開方法に関するスレッドのほうが活発でした。フル精度での実行には数十枚規模のGPUが必要となるため、一般の開発者が試すには量子化版の登場が待たれます。

X上では「オープンソースがプロプライエタリに本格的に追いついてきた」という評価と、「土曜日公開という奇策」への驚きが入り混じりました。プロプライエタリ各社のGPT-5.4やGemini 3.1 Proが相次いでリリースされる中、オープンウェイトで同水準の性能を狙えるモデルが出てきたことはAI民主化の観点から重要な一歩です。ウェイトが公開されていることで、特定産業向けのファインチューニングや、データをクラウドに出せないプライバシー要件の強い用途での活用が今後期待されます。

Meta Llama 4 Maverick：400Bパラメータ・1000万トークンコンテキストのオープンウェイト多モーダルモデル、自前インフラで無料実行可能

関連リンク