OpenAIが、オープンウェイト(重みを公開)の大規模言語モデル「gpt-oss-20b」と「gpt-oss-120b」を発表しました。Apache 2.0ライセンスのもとHugging Face・Azure・AWSで無償公開されており、GPT-2以来7年ぶりとなるオープン大型モデルの投入は、MetaのLlamaが独占していたオープンソースLLM市場に本格参入する動きとして注目を集めています。
OpenAIの発表によると、gpt-oss-120bは総パラメータ数117B(1,170億)でトークンあたり51億パラメータが活性化するMoE(Mixture-of-Experts、専門家混合)アーキテクチャを採用しており、単一の80GB GPUで動作します。推論性能はOpenAIが社内向けに提供するo4-miniとほぼ同等に達しています。一方のgpt-oss-20bは総パラメータ21B・アクティブパラメータ3.6Bで、16GBメモリのエッジデバイスでの動作が可能とされており、o3-miniと同水準のベンチマーク結果を示しています。両モデルともMXFP4形式でネイティブ量子化済みで配布されており、デプロイの手軽さを重視した設計です。訓練にはo3など同社のフロンティアモデルから得た強化学習技術が採用されています。
コミュニティの反応は歓迎と批判が入り交じっています。X(旧Twitter)ではMetaのLlamaシリーズへの「本格的な対抗馬」として期待する声が多い一方、Hacker Newsでは「『オープンソース』という言葉の使い方に疑義がある」として、研究コミュニティから真のオープンソース(訓練コードやデータセットの開示を含む)とは異なると指摘する声が上がっています。r/MachineLearningでも、Apache 2.0ライセンスに付随する商用利用制限の細かい条項を問題視する議論が白熱しており、「オープンウェイト」と「オープンソース」の概念の違いが改めて浮き彫りになっています。
GPT-OSSのリリースは、クローズドAPIのみを提供してきたOpenAIが戦略転換を図る大きなシグナルです。Metaがオープンソース戦略で開発者コミュニティの支持を集めてきた流れに対し、OpenAIがどこまで「開放性」を担保できるかが今後の競争の焦点になります。エッジデバイスから研究用途まで幅広い利用を見込んだラインナップは、企業・個人開発者の双方に選択肢を提供するものであり、LLMのオープン化競争が新たな局面を迎えたといえるでしょう。