最近跟几家做AI落地的企业聊,发现个特别扎心的共性问题:聊起 AI Agent(智能体)都两眼放光,说要做“企业专属的智能助手”,真动手建了才发现 ——要么跑不起来,要么跑起来了没法用,最后全卡在 “看似简单的细节” 上。
后来翻到 Rakesh Gohel 那篇刷屏的 AI Agent 冰山模型,瞬间懂了:想做一个真正能用的智能体,90% 的工作是软件工程,只有 10% 才是 AI。这话说出来,不少盯着 “大模型能力” 的团队可能会懵,但只要落地过就知道 —— 这才是真话。
先放张图,大家先直观感受下这 “冰山” 到底长啥样(来源:Rakesh Gohel 的 LinkedIn,建议存图对照看):
一、别被 “智能” 骗了:AI Agent 的核心是 “能干活”,不是 “会聊天”
很多人一提到 AI Agent,第一反应是 “像 ChatGPT 那样能对话、会生成内容”—— 但这只是 “表面功夫”。
咱们把智能体拆成两部分看就懂了:
1.那 10% 的 AI:只负责 “想明白”
比如理解你说的 “把上周的销售报表整理成 PPT”,规划出 “先调数据、再算同比、最后排版” 的步骤,或者生成PPT里的文字内容。这部分靠大模型(LLM)就能搞定,也是大家最容易看到的 “智能”。
2.那 90% 的软件工程:负责 “干成事”
你想让智能体调销售数据,得先打通企业的 CRM 系统吧?(工具调用)
不同岗位的人能看的数据不一样,得做权限控制吧?(身份认证)
万一中间数据加载失败了,得有日志能查问题在哪吧?(可观测性)
甚至你在钉钉上发指令,智能体得能在钉钉里回复,这还要做前端交互……
这些看不见的 “基建”,才是让智能体从 “会聊天” 变成 “能干活” 的关键。
一句话总结:AI 决定智能体 “懂不懂你说的话”,软件工程决定它 “能不能把事干成、干稳”。光懂不干活,那不是智能体,是 “聊天机器人”。
二、拆解 AI Agent 冰山模型:水面上 10% 是体验,水下 90% 是生存根本
很多团队做智能体失败,就是只盯着 “水面上的 10%”,忽略了水下的 “生存基础”。咱们具体拆拆这两部分:
(1)水面上的 10%:用户能直接摸到的 “AI 体验”
这部分是最直观的,也是 C 端产品能快速跑通 MVP 的关键:
①比如你用 ChatGPT 写文案、用 Cursor 写代码、用文心一言做 PPT,甚至企业里的 “智能工单助手” 自动回客户问题 —— 这些都是 “水面上的体验”。
②核心能力就两样:大模型的语义理解(能懂你要啥)、基础任务规划(知道第一步干啥、第二步干啥)。
③但要注意:这部分只是 “冰山一角”,撑不起企业级的落地。
(2)水面下的 90%:企业落地的 “硬骨头”,也是成败关键
这部分没人会主动展示,但少了任何一块,智能体都没法在企业里 “活下来”。我按落地优先级拆了 6 块,都是踩过坑才懂的重点:
① 前端与交互层:智能体的 “入口”
不是所有人都愿意打开新软件用智能体 —— 得嵌在钉钉、飞书里,或者企业自己的 Web 端、APP 里。还要有任务面板,让用户能看到 “智能体现在干到哪了”,比如 “报表已生成 30%”。
② 记忆与上下文管理:智能体的 “记性”
你跟智能体说 “把刚才那份报表再加个环比数据”,它得记得 “刚才那份报表” 是哪份吧?这就要靠向量数据库(比如 Milvus)存对话上下文,用 Redis 存实时状态 —— 不然每次对话都是 “重新认识”,根本没法连续干活。
③ 身份认证与权限控制:企业的 “安全锁”
这是 B 端和 C 端最大的区别之一。比如财务岗的智能体,只能调财务数据;销售岗的,只能看自己客户的信息。得对接企业的 SSO、AD/LDAP 系统,确保 “谁能用、能看啥、能改啥” 都可控 —— 不然数据泄露就是大问题。
④ 工具与执行层:智能体的 “手脚”
智能体自己不会 “调数据”“做 PPT”—— 得靠 RPA 机器人爬数据、OCR 识别发票、调用企业系统 API 生成文件。这部分是 “干活的核心”,也是工程工作量最大的地方之一。
⑤ 智能体编排与调度:复杂任务的 “指挥官”
如果要做“季度总结自动化”,得拆成“调销售数据→算利润→写总结→生成 PPT” 几步,可能还需要 “数据智能体”“写作智能体”“PPT 智能体” 协作。这里面大部分是工程逻辑(比如 “数据调完再通知写作智能体开工”),只有少部分是 AI 推理。
⑥ 可观测与日志追溯:智能体的 “监控器”
企业用智能体,最怕 “黑箱操作”—— 不知道它干没干活、干错了在哪改。所以必须有监控面板,能看任务状态;有操作日志,能查 “哪步调用失败了”“数据从哪来的”。我见过有团队因为没做这个,智能体出了错查不到原因,最后只能弃用。
最后补一句:水下这90%,不负责“展示聪明”,只负责让智能体“落地、稳定、可控、能追溯”—— 但没有这些,再聪明的 AI 也没用。
三、搞懂 “90/10” 比例,企业落地能少走 80% 的弯路
很多团队一开始就错了,把 AI Agent 当成 “大模型应用”,而不是 “软件系统”。搞懂这个比例,至少能解决 4 个核心问题:
1.别高估 AI 的能力:别盯着模型 “死磕”
我见过有团队花几十万调大模型,结果智能体连“对接 OA 系统” 都没搞定 —— 最后模型调得再厉害,也没法干活。正确的思路是:先确定 “要干哪些活”,再看 “需要哪些工程能力”,最后选匹配的模型。
2.架构设计要 “从下往上”:先搭基建,再装 AI
别一上来就想 “怎么让智能体更聪明”,先画工程架构图:数据存在哪?工具怎么接?权限怎么控?日志怎么存?把这些 “水下的部分” 规划好,再把 AI 模型嵌进去 —— 不然就是 “空中楼阁”。
3.团队配置要 “重工程”:别全招 AI 算法岗
90% 的工作是软件工程,意味着团队里需要前端、后端、运维、架构师,AI 算法岗(做Prompt、微调)1-2 个就够了。我见过有公司招了一堆算法工程师,结果没人会对接企业 API,项目拖了半年没落地。
4.理解 “C 端快、B 端慢” 的本质:落地要求不一样
C 端产品比如 ChatGPT,只要把 “水面上的 10%” 做好,就能跑 MVP;但 B 端要的是 “能稳定干活”,必须把水下 90% 的工程基建做完整 —— 这就是为什么 B 端 AI Agent 落地难,但一旦落地,价值也大得多。
现在行业里聊 AI Agent,总爱强调 “大模型多厉害”“多智能”,但真正落地过的人都知道:能让智能体在企业里 “稳定干活” 的,不是那 10% 的 AI,而是那 90% 的软件工程。
如果你们公司正准备做 AI Agent,别先急着选模型、聊 “智能程度”,先找工程师把 “水下的 90%” 捋清楚:要对接哪些系统?权限怎么设?日志怎么存?把这些基础打牢,再谈 AI—— 这才是落地的正确姿势。