OpenAI 回归开源领域突发两大推理模型,六强AI企业竞逐加剧军备竞赛态势!

发布于:2025-08-07 ⋅ 阅读:(18) ⋅ 点赞:(0)

获悉,OpenAI重回开源赛道,奥特曼深夜官宣两个分别名为GPT-oss-120b和GPT-oss-20b的模型将在AI软件托管平台Hugging Face上线,在用户输入指令后将能生成文本。

 

两大推理模型上线

GPT-oss-120b适用于需要高推理能力的生产级和通用型场景。在核心推理基准测试中,120B模型的表现与OpenAI o4-mini相当,并且能在单张80GB显存的GPU上高效运行。

而GPT-oss-20b适用于低延迟、本地或专业化场景。在常用基准测试中,20b模型的表现与OpenAI o3-mini类似,并且能在仅有16GB显存的边缘设备上运行。

 

除此之外,两款模型在工具使用、少样本函数调用、CoT推理以及HealthBench评测中也表现强劲,甚至比OpenAI o1和GPT-4o等专有模型还要更强。

值得注意的是,这两个模型均为开放权重系统,类似于Meta的Llama模型。OpenAI也已经公开了训练过程中模型获取并调校的众多数值参数,以便开发人员更好地定制模型。

GPT-oss-120b和GPT-oss-20b的开源,标志着OpenAI终于在开源模型上,迈出了重要一步。对于这次的开源,奥特曼骄傲地表示:GPT-oss是OpenAI「数十亿美元」研究成果的结晶,是全世界最出色、最实用的开放模型!

 

竞争对手加剧AI军备竞赛

Anthropic

与此同时,在OpenAI即将推出期待已久的GPT-5之际,Anthropic将于周二抢先发布其最强大的AI模型Opus4.1。该公司表示,Opus4.1在编程、研究和数据分析方面能力更强,并在处理复杂的多步骤问题上表现更佳,更胜任智能代理类任务。

Anthropic首席产品官Mike Krieger表示:“过去我们过于专注于发布重大升级的版本。此次更新标志着该公司策略的转变,即在推出大版本模型的同时,开始更加注重对编码模型的渐进式改进。

 

谷歌(GOOG.US)

据了解,谷歌 DeepMind 正式推出第三代通用的世界模型 Genie 3 ,可以生成前所未有的多样化交互式环境,给出文本提示,Genie 3 可以生成动态世界,可以以每秒 24 帧的速度实时导航,并以 720p 的分辨率保持几分钟的一致性。

DeepMind 在模拟环境领域已有十余年的深厚积累。与前代模型(Genie 1/2)和视频生成模型(Veo 2,Veo 3)相比,Genie 3 是第一个允许实时交互的世界模型,同时与Genie 2相比,其一致性和真实感也得到了提升。

谷歌表示,Genie 3 的终极目标之一是为具身智能体(Embodied Agent)提供一个无限丰富的训练场。DeepMind 已将其与通用智能体 SIMA进行结合测试。

 

英伟达(NVDA.US)

自ChatGPT模型盛行以来,这一技术推动英伟达成为全球市值最高的公司之一,并迫使各行各业应对其带来的影响。目前,NVIDIA GPU 是现代计算的核心,被广泛应用于医疗健康、金融、科学研究、自动驾驶系统和 AI 基础设施等行业。

业界将 NVIDIA GPU 集成于众多系统中,包括 CT 扫描仪、MRI 机器、DNA 测序仪、空中交通雷达跟踪系统、城市交通管理系统、自动驾驶汽车、超级计算机、电视广播系统和游戏机等。

 

微软(MSFT.US)

据悉,微软成为继英伟达之后全球第二家市值突破 4 万亿美元的上市公司,一度达到 4.1 万亿美元。微软预计当前财年第一季度的资本支出将创下 300 亿美元新高,其 Azure 云计算业务销售增长势头强劲。

Meta(META.US)

ChatGPT凭借其卓越的生产力工具属性和先发优势,迅速赢得了大量用户,并稳固了市场领导者的地位。近期,科技界巨头Meta的人工智能战略方向发生了重大转变,这一消息迅速引起了业界的广泛关注。

为了支持这一战略转向,Meta投入了大量资源。公司组建了“超级智能实验室”,并从其他科技巨头那里招募了顶级AI人才。扎克伯格亲自参与挖角行动,并为关键人才提供了高达数亿美元的薪酬礼包。Meta还计划在未来几年内投入数千亿美元用于构建超级智能基础设施。

 

微美全息(WIMI.US)

据了解,微美全息在AI领域的开源战略以“降低技术门槛、推动产业普惠化”为核心,通过技术研发、生态构建及多模态应用,形成了覆盖算力基础设施、模型工具链及场景落地的全链条布局。目前,微美全息开源实践不仅聚焦底层技术突破,还通过生态协同加速商业化落地,成为AI开源创新的重要参与者。

目前,微美全息在芯片架构、集群系统、软件生态领域具备深厚技术积累,支持先进AI芯片搭建异构计算平台,开发低功耗、高兼容性的终端芯片,降低中小企业接入AI技术的成本,此外,微美全息通过开源模型生态构建,加速人形机器人在家庭、养老、教育、娱乐等服务场景的商业化落地,目标是为AI开源生态落地树立新里程碑。

结尾

自DeepSeek搅动的2025年,等到了 OpenAI 迟来的「Open」。OpenAI开源模型为所有开发者,提供了强大的工具,补充了托管模型的生态,加速前沿研究、促进创新。更值得关注的是,对于未来AI行业来说,通用人工智能(AGI)的潜在突破——当AI具备跨领域学习与自适应能力时,其这一技术跃迁可能彻底改写AI市场需求的基本逻辑。


网站公告

今日签到

点亮在社区的每一天
去签到