2025年被普遍认为是AI Agent商业化的关键之年,而大模型正是Agent能力的核心支撑。
当开发成本大幅降低,我们很可能看到各种垂直领域的Agent应用如雨后春笋般涌现。
技术普惠的现实意义对于广大AI创业者和开发者来说,这无疑是个好消息。
之前只有大厂才能玩得起的大模型游戏,现在中小团队也有了参与的机会。
开源往往能催生出最具创新性的应用。
✏
6月30日,百度宣布其文心大模型4.5系列全面开源。
百度选择开放,实际上是在为自己争取更大的生态影响力。
2025年Agent爆发,文心4.5开源的时间点选得很巧妙。
此次百度一次性推出10款文心大模型4.5系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键维度上,均处于行业领先位置。
产品地址:https://yiyan.baidu.com
闭源模型的“镀金时代”
我们必须承认,闭源模型开启了这场革命。
以OpenAI的GPT系列和Anthropic的Claude为代表,它们用惊人的智能水平向世界证明了大型语言模型的颠覆性潜力。
它们是规则的制定者,是性能的标杆,也是商业化的先行者。
在那个阶段,开发最先进的大模型是一场资本和数据的豪赌,动辄数十亿美金的训练成本、海量的高质量数据集以及顶尖的人才储备,构筑了一道普通玩家难以逾越的护城河。
这种模式在商业上无可厚非,它确保了巨额投资的回报,并允许模型所有者完全控制其技术的发展方向和安全边界。
OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet共同定义了行业标杆,它们在通用推理、用户体验和功能完善度上达到了令人瞩目的高度 。
特别是Anthropic的Claude系列,凭借其独特的“Constitutional AI”理念,强调与人类价值观对齐,并在企业级应用上展现出独到之处 。
其Claude 3.5 Sonnet在研究生水平推理(GPQA)、编码能力(HumanEval)等多个基准测试中超越了GPT-4o,并引入了创新的“Artifacts”功能,允许用户与AI生成的图表、代码片段等内容进行交互式协作,这在复杂数据分析和内容创作场景中极具价值 。
与此同时,OpenAI的GPT-4o则凭借其成本效益和多功能性,成为一个可靠的“全能选手”,能够处理从文本生成到多模态输入的广泛任务,为广大开发者提供了稳定且易于集成的解决方案 。
闭源模型最初的护城河是其无可争议的性能优势。
GPT-4的出现,让市场愿意为其高昂的成本和封闭的特性买单。
然而随着DeepSeek-R1等开源模型的性能在多个关键基准测试上追平甚至反超 ,这条护城河正在迅速收窄。
所以,当开源大模型的一些亮点被充分验证后,一般闭源模型会火速跟进。
无论是基础模型的能力,还是模型功能层的设计思路上,整体上是互相借鉴的过程。
开源AI力量的崛起
当Llama已成开源往事,由DeepSeek-R1扛起模型开源大旗
R1的技术路径:通过算法优化和架构创新,他们证明了"堆算力"并非唯一出路。
这种效率优先的思路,恰恰击中了当前AI发展的痛点——不是每家公司都有钱烧GPU集群,但每家公司都需要AI能力。
这种"技术普惠"策略直接引爆了华尔街的恐慌:
英伟达单日蒸发近6000亿美元市值,整个AI产业链都在重新审视自己的商业模式。
国内千问一直秉持开源的路线,很多创业公司和产品底层都是基于Qwen进行强化学习,蒸馏,数据微调,百度也是看到了开源巨大的价值后决定正式开源,所以很期待这次文心“亮剑”。
开闭源模型对比:
而且,传统云厂商也可以部署开源模型以更低的价格提供给初创 AI 团体或公司。
应用层开源技术栈:看不见的引擎
基础模型无法在真空中运行。
一个丰富多样的开源工具生态系统已经涌现,为开发稳健、可扩展的AI应用提供了必要的支撑。
编排框架:像LangChain和Netflix Metaflow这样的工具,帮助开发者将大型语言模型、API和数据源像乐高积木一样组合起来,构建复杂的应用逻辑 。
向量数据库:Milvus、Weaviate等专门的向量数据库,对于实现检索增强生成(RAG)至关重要。
RAG让大型语言模型能够基于事实性的、企业专有数据进行回答的关键技术。
推理与部署:Ollama等工具使得在本地设备上部署和运行大型语言模型变得异常简单。
完整的技术栈:一个典型的现代开源AI应用,其技术栈可能包括用于前端的Streamlit,用于嵌入的JinaAI,用于后端的FastAPI,以及用于数据存储的Postgres(结合pgvector扩展)。
百度文心4.5大模型,究竟有哪些料?
🌰
根据官方发布和技术社区的解析,百度此次开源的文心大模型4.5系列,绝非“轻量版”的试水,而是诚意满满的核心能力释放。
文心大模型4.5开源系列针对MoE架构提出了一种创新性的多模态异构模型结构,适用于从大语言模型向多模态模型的持续预训练范式,增强了多模态理解能力。
文心大模型4.5开源系列均使用飞桨深度学习框架进行高效训练、推理和部署。
在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。
其系列模型在多个文本和多模态基准测试中达到SOTA水平,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出。
在文本模型方面,文心大模型4.5开源系列基础能力强、事实准确性高、指令遵循能力强、推理和编程能力出色,在多个主流基准评测中超越友商开源模型。
在多模态模型方面,在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中优于闭源的OpenAI o1。
此外,在轻量模型上,文心4.5-21B-A3B-Base文本模型效果与同量级的友商相当。
官方详细介绍地址:
https://mp.weixin.qq.com/s/BVQzYwcnpDzUAWvRzP5g_g
百度的这一步棋,精准而狠辣。
对于百度而言,很简单,我猜他们的想法是
“用AI开源换生态”
大模型开源:大厂不求速成,但求未来的“阳谋”
为什么这些不差钱的科技巨头,纷纷选择将自己耗费巨资研发的核心资产公之于众?
这并非一时冲动,而是一种深思熟虑的长期战略,一盘“阳谋”。
用社区参与构建真正的护城河
一个成功的开源模型,会迅速吸引一个庞大而忠诚的开发者社区。
这个社区会自发地为模型贡献代码、修复bug、开发教程、构建应用,甚至形成独特的文化圈层。这个由全球智慧共同构建的生态系统,其生命力和迭代速度,远非任何一家公司的闭源团队可以比拟。
这将形成一个独特的“AI恰饭硬核群体”,他们既是使用者,也是维护者和传播者,这种粘性是金钱买不来的。
B端渗透的路径
对于企业级市场,直接使用通用大模型往往不够。
最佳实践是“基于开源模型蒸馏 + 私有数据微调”。
企业可以在一个强大的开源基座模型上,用自己积累的行业数据进行精调,创造出最适合自身业务场景的专用模型。这既保证了数据安全(无需上传到第三方平台),又极大地降低了开发成本。
开源,为大厂向B端市场的“慢渗透”铺平了道路。
后发者的追赶捷径
对于在模型能力上稍稍落后的追赶者而言,开源是加速追赶第一梯队的最佳策略。
将模型开放,等于借助了全球开发者的力量来帮助自己改进技术、发现问题。
凭借大厂雄厚的资金和算力底蕴,再结合开源社区的集体智慧,可以迅速缩短与最前沿模型的差距。
股价是最终的KPI
模型本身开源可能短期内无法直接创造收入,但它所创造的行业影响力、技术领导力叙事,以及生态繁荣的预期,会直接反映在资本市场上。
投资者的信心会推高公司的股价,从而带来比直接售卖API调用远为丰厚的资本回报。
开源和闭源,各有各的道
最初马斯克在 OpenAI 时期的开放,到奥特曼时期商业化过渡,再到最近 OpenAI 再次转向不完全商业化的承诺,这家头部 AI 公司尚且在摸着石头过河,战略是根据自己公司优势和外部环境决定的。
所以,即使是强如 OpenAI,也会在巨大未知的路线面前不得不进行各种探索,最终找到适合掌舵人和公司的长期路线。
各凭本事而已。
大模型的开源与闭源并不重要,“好用”才是验证真理的唯一准则。
近期李彦宏说过这么一句话,非常赞同:
"无论开源、闭源,基础模型只有解决现实问题,才有真实价值。"
AI 长期中期的技术发展,商业形态都存在极大的不确定性,其实可以理解这种策略的。
像 Claude,Gemini,Kimi 也都贡献了非常多的优秀开源项目。
但对于用户来讲,持续享受到最新的 AI 能力才是最实惠的。
底层逻辑:AI从基建为王走向应用层生态
风险投资向AI应用层转向
资本的流向是市场价值预期的最清晰指标。
在初期为基础模型研发注入巨额资金后,风险投资(VC)的焦点正明确地转向AI的应用层和运营层,这为本报告的核心论点提供了最有力的佐证。
数据显示了这一戏剧性的转变:
惊人的增长:2024年,全球AI应用层初创公司吸引了高达510亿美元的风险投资,同比增长37%。而AI运营层(包括MLOps、数据工具等)的增长更为迅猛,融资额飙升344%,达到130亿美元。
主导投资领域:AI相关初创公司在2024年占据了全球所有风险投资总额的近三分之一,成为最受资本青睐的赛道
投资者的明确目标:VC们现在明确地将目标锁定在“生成式AI应用公司”——即那些利用第三方基础模型来构建面向消费者或企业的专业软件的公司 ()。他们尤其看好那些能够利用AI颠覆传统行业的垂直领域软件 ()。
顶级机构入场:包括红杉资本(Sequoia Capital)、安德森·霍洛维茨基金(a16z)在内的顶级VC,以及像AI Fund这样的专项基金,都在积极地扩大其在AI应用和工具层的投资组合 。
风险投资在AI技术栈中的分布(2023-2024年)
这场开源浪潮最深远的影响在于它将创新的重心从模型层下移到了应用层。
所以,无论是开源还是闭源,能够根据自身优势抓住可以抓的牌,保持在牌桌上的实力和定力。
留到最后,一起迎接 AGI 的到来。
对于百度而言,非常有希望以文心开源为基础构建下面的完整生态: