新闻动态

OpenAI再掀风暴,新开源模型实力如何?

6月13日深夜,OpenAI的奥特曼团队突然在网上发布了两款全新开源大模型gpt-oss-20B和gpt-oss-120B,引发了全球开发者的高度关注。两款模型不仅性能追平甚至超越了o3-mini与o4-mini,还能在普通电脑、消费级显卡,甚至手机设备上流畅运行。

这次发布的两款gpt-oss模型分别为总参数210亿、激活参数36亿的20B版本,以及总参数1170亿、激活参数51亿的120B版本。技术指标显示,gpt-oss-120B能在单张80GB显存的GPU上高效运行,gpt-oss-20B则只需16GB显存设备即可部署,极大降低了模型使用和创新的门槛。公开资料显示,gpt-oss-120B在国际权威的推理和工具测试中,表现可与旗舰o4-mini媲美,甚至在健康医疗、编程和数学等专业领域超越了同级别模型。许多开发者当天夜里就在官网、github和huggingface平台体验了模型的部署和推理,讨论异常热烈。

发布当晚,OpenAI还同步上线了playground在线体验网站、34页的详细技术报告和模型卡,开放了模型源码和分词器,许可协议为宽松的Apache2.0。模型采用混合专家设计(MoE),原生支持128k超长文本上下文,分组多查询注意力机制与旋转位置编码大幅提升了推理和内存效率。训练数据聚焦英文学术、编程与通用知识领域,总计预训练成本低于50万美元。gpt-oss支持完整流程可追溯的思维链推理、参数级微调、函数调用、网页浏览、代码自动运行等“智能体”能力。开发者只需一句系统指令即可在低、中、高三档推理投入间灵活切换,满足不同应用场景和延迟需求。

耐人寻味的是,相比以往封闭的策略,这次OpenAI自GPT-2以后终于再次大规模开源主力模型。业内普遍认为,这大大激发了生态创新,加速了前沿AI能力向全社会的普及。20B和120B这两款开源模型的实际性能,甚至在难度极高的数学竞赛、健康知识问答等核心指标上超越同档专有模型,真正做到了“用得起、调得顺、跑得快”。部分开发者评价,gpt-oss或将成为新兴市场、中小企业、科研团队降本增效的AI利器。

值得注意的是,OpenAI在后训练阶段,采用了与o4-mini同样的高算力强化学习和监督微调流程,让这两款开源模型不仅追求低算力、低门槛,还力求与企业级商用模型一致的输出质量和安全性。模型训练过程中保留了思维链过程的完整性,又防止过度“模板化”,这也得到了学术界同行的认可。

对于这次突然开源,奥特曼表示gpt-oss系列凝结了OpenAI数十亿美元的研究探索,是全球最实用的开放模型。许多AI开发者在体验后也直言,这将有力推动AI能力下沉和行业创新。此次开源落地,给想参与智能体生态和个人定制AI工具的人们带来了实实在在的机会。

随着gpt-oss两款模型的到来,AI创新正变得越来越普惠和容易。每一位开发者、创业团队,甚至普通用户,都有机会平等参与到前沿AI工具和生态构建中。未来,模型开源或许正成为人工智能普及、让技术真正惠及每一个人的重要一步。



Powered by 意昂体育 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024