AI Agent浪潮下,昇腾与科大讯飞携手开辟AI落地“新航路”

发布于:2025-03-29 ⋅ 阅读:(29) ⋅ 点赞:(0)

过去两个月里,大模型产业出现了两个现象级热点:

一个是DeepSeek催生的大模型开源浪潮,用工程创新和技术平权的方式加速了AI普惠化的进程。

另一个是AI Agent产品的出圈,让AI从被动响应走向主动规划和执行,甚至是跨场景的复杂任务。

传递到产业端,“2025年将是AI Agent元年”的说法渐渐成为共识,业界对于大模型落地的态度从“观望”转向了行动。同时也在深度影响产业的竞争逻辑,进入到了技术摸高和落地应用的并行模式。

在不久前落幕的昇腾人工智能伙伴峰会上,一直走在AI产业最前沿的昇腾与科大讯飞强强联手,为AI在千行万业的加速落地开辟出一条“新航路”。

01 跨越落地鸿沟,首先要懂大模型
大模型的产业图景不可谓不诱人,但和业务场景之间仍存在一条鸿沟。

根据Gartner、埃森哲、波士顿咨询等权威咨询机构的报告:当前仅有25%的AI试点项目能够规模化推广、60%的企业在AI项目中技术与实际场景需求脱节、60%的中型企业因算力不足或云服务成本过高,无法支撑模型训练……这些问题不被解决,大模型的落地应用就无从谈起。

首先需要厘清的是:为什么会存在落地鸿沟?

可以找到的答案似乎有很多。对大模型认识不全面乃至有认识误区,难以挖掘出对大模型的应用需求;由于保密、隐私保护等需要,缺少高质量的行业数据;接入大模型需要对现有系统进行改造,增加了实施的复杂性;将大模型融入现有业务流程和系统架构,涉及大量的开发和测试工作……

原因不一而足,但指向了同一个症结:对许多企业来说,大模型还是一个陌生的“新物种”。这为大模型产业中的赋能者们提出了一个基本要求——想做“摆渡人”,首先要懂大模型。

而昇腾和科大讯飞恰恰是其中的佼佼者。

在昇腾人工智能伙伴峰会上,科大讯飞副总裁娄超深度解读了双方从模型训练到推理过程中攻克的一个又一个技术难题。

比如2023年10月发布的首个国产智能算力集群“飞星一号”,就解决了大规模集群训练的诸多“疑难杂症”。特别是在超大规模集群网络通信带宽利用率方面,昇腾和科大讯飞的联合攻关,让“飞星一号”的网络通信带宽利用率达到了95%,有效提升了大模型训练过程中卡间数据和模型权重传输的效率。

当长思考能力将scaling延展到推理,Tokens已经成为衡量推理系统的唯一标准,集群推理成为大模型推理系统的标配,系统既要确保用户的低时延响应,又需要提高整体吞吐,以最大化推理的经济价值。

为了实现大模型推理的极致效率,昇腾从算子到推理系统全面创新。针对MoE架构,国内首创大规模专家并行方案,通过将MoE模型的多专家权重数据分散部署到更多的卡上,降低单卡权重加载时延,让模型解码输出更快,同时解决了吞吐性能、通信开销等挑战。

2025年3月中旬,昇腾与科大讯飞率先实现了MoE模型的大规模专家并行集群推理,将深度推理类模型端到端的训练效率提升了30%,超大规模集群网络通信带宽的利用率提升至95%,单卡静态内存占用仅为双机部署的1/4,推理吞吐性能提升了3.2倍,端到端时延降低了50%。

窥一斑而知全豹。

作为国内为数不多走完了大模型训练到落地全流程的企业,昇腾和科大讯飞踩过了大模型训练到推理部署的每一个坑,积累了从数据清洗到算力调度,再到高效部署、推理加速的全流程经验,趟出了一条从技术创新到场景融合的新路线。

02 场景化一体机:让落地更加便捷
对于中小型企业而言,可能没有训练行业大模型的需求,怎么才能拉近他们和新质生产力的距离呢?

时间回到2025年2月末,科大讯飞联合昇腾发布了全新升级的训推一体机和推理一体机,可兼容讯飞星火和DeepSeek双模型,同时内置了模型微调工具链、知识蒸馏工具链、精品智能体等工具,进一步缩短了大模型的落地流程,加速了大模型能力到产业生产力的转化。

对比其他落地方式,大模型一体机提供的是“开箱即用”的选项,无需花费大量时间精力配置和优化硬件环境,无需深入了解底层的算法和框架细节,无需担忧“数据上云”带来的安全问题……在很大程度上缩短了部署周期、降低了落地门槛。

不过问题也出现了,大模型和场景的融合,不是简单部署一套大模型就可以了,而是要明确场景,把数据用好。往往因缺少模型选型、场景落地的经验,企业在大模型实际落地应用中常常会遇到“最后一公里”的障碍。

昇腾和科大讯飞深谙其中的道理,解题的思路可以归纳为一句话——围绕目标场景需求做创新、做产品。

聚焦政务办公场景,科大讯飞和昇腾创合作推出的AI政务办公一体机,内置公文写作、政策文件解读、数据分析、中英互译等4种大模型场景应用,目前已经在安徽、湖北等地落地应用;AI政务综窗一体机内置了超过4500个办事项语料、2000个办事相关政策法规,事项推荐准确率高达90%,咨询回答准确率高达95%,大幅提升了政务效率。

面向法院的庭审场景,科大讯飞和昇腾联合推出了星火法律笔录精简一体机,学习了数万书记员的笔录资料,并基于海量法律数据训练模型,打造了集智能笔录规整、语义理解、自动校对、重点提取的一站式解决方案。截至目前,星火法律笔录精简一体机已经在全国100多个法院试点,合作深化庭审场景的深度应用。

不只是对单一场景的满足,还有城市级的综合解决方案。

面向城市AI应用的讯飞星火塔式一体机,通过讯飞星火、DeepSeek和Qwen三擎模型驱动,依托行业大模型解决方案,可满足政务、警务、司法、社工等城市智能应用需求;集行业模型“资源池”、生态场景“集聚地”、大模型开发“服务站”、产业供需“链接器”于一体的城市人工智能公共服务平台,深入赋能城市产业的发展。

正如科大讯飞董事长刘庆峰多次在公开场合提及的:“无论大模型如何演进,最后一公里的产品体验和应用落地,才是真正的挑战。”

就结果来看,昇腾和科大讯飞已然找到了解决路径,从云端的大模型服务到打造行业大模型的全套工具链,再到面向不同场景的一体机,大模型正在深入解放生产力、解放每一家企业的想象力。

03 写在最后
杰弗里·摩尔在《跨越鸿沟》中将“技术采用生命周期”的客户群体分成了五类,分别是创新者、早期采用者、早期大众、后期大众和落后者。

目前的大模型正处于从早期采用者向早期多数过渡的阶段,也就是“鸿沟”所在的阶段。相较于模型层的你追我赶,一场更重要的博弈在于怎么将创新迅速“扩散”到产业中,乃至可以说比创新更重要的,是创新的扩散。

乐观的是,昇腾、科大讯飞等行业领跑者,正在各个维度开放合作,验证大模型的落地应用进程,持续向千行百业输出新质生产力,有望形成“模型越强、落地越多、用户越广、算力越大”的增长飞轮,掀起一股不可逆的产业革命。