OpenAIは、GPT-2以来となる完全オープンウェイトモデル「gpt-oss-120b」と「gpt-oss-20b」を公開しました。2019年以来約6年ぶりのオープン化となり、AI業界に大きな転換点をもたらしています。
gpt-oss-120bは総パラメータ数117億、gpt-oss-20bは21億を持ち、いずれもMixture-of-Experts(MoE)アーキテクチャを採用しています。gpt-oss-120bはトークンあたり51億パラメータのみをアクティブ化し、80GBのGPUメモリで実行可能です。gpt-oss-20bは16GBのメモリで動作し、エッジデバイスでの利用も視野に入れています。OpenAIによると、gpt-oss-120bは推論ベンチマークでo4-miniと同等の性能を発揮し、gpt-oss-20bはo3-miniと同等の結果を示しています。
Hugging Face CEOは「オープンエコシステムへの有意義な貢献」と評価し、ローカル実行可能な点を歓迎しています。Snowflake、Orange、AI Swedenなどが早期パートナーとしてファインチューニングに参加しています。一方、Redditでは「STEMベンチマークは優秀だが、創作・一般知識・多言語推論が弱い」という批判もあり、合成データへの過度な依存が指摘されています。
Apache 2.0ライセンスで提供されるこれらのモデルは、企業や研究者が自由にカスタマイズできる選択肢を提供し、オープンソースAI市場での競争を活性化させそうです。
| - [Introducing gpt-oss | OpenAI](https://openai.com/index/introducing-gpt-oss/) |
|---|---|
| - [openai/gpt-oss-120b | Hugging Face](https://huggingface.co/openai/gpt-oss-120b) |