智能体架构的真相:90%是软件工程,10%是AI

      过去两年,AI智能体(AI Agent)成为AI落地的热门方向。从 ChatGPT 的对话助手,到自动化办公、代码助手,再到多智能体协作平台,智能体被视为未来人机交互的核心形态。

然而在实际落地中,很多企业会发现一个残酷现实:

构建一个真正可用的智能体,90% 的工作是软件工程,只有 10% 才是 AI。

这一观点最早由 Rakesh Gohel 在其著名的AI Agent冰山模型中提出,并在业内引发了广泛共鸣。本文将深入解析这背后的逻辑。

 

图来源:Rakesh Gohel(linkedin)Rakesh Gohe

一、为什么智能体是 90% 软件工程、10% AI?

表面上,智能体看起来只是一个能理解自然语言、会自动生成结果的“大模型应用”。但真正的企业级智能体落地,远不止一个 LLM:

  1. AI 模型只解决“脑子”的问题

    • 理解任务、规划步骤、生成内容或结果

    • 这一部分就是“10% AI”

  2. 软件工程支撑智能体的整个“身体和神经系统”

    • 用户交互、权限控制、任务编排、数据流转、工具调用、日志监控、异常回滚

    • 这些工作是“90% 软件工程”,没有它们,智能体无法稳定运行

用一句话概括:

AI 决定智能体“懂不懂”,软件工程决定它“能不能干活”。

二、AI智能体的冰山模型

为了直观说明这 90/10 的关系,我们可以用冰山模型来理解智能体架构:

1. 水面上的 10%:用户可见的 AI

  • 内容:自然语言交互、意图理解、文本/代码/报表生成

  • 典型体验

    • C端:ChatGPT、文心一言、通义千问、Cursor

    • B端:智能工单助手、报销自动审核、代码自动补全

  • 核心能力

    • 大模型(LLM)语义理解与生成

    • 基础任务规划与工具选择

用户看到的“智能”部分,其实只是冰山一角。

2. 水面下的 90%:支撑智能体运行的软件工程

这部分是企业真正的建设难点,主要包括:

  1. 前端与交互层

    • Web端、移动端、企业IM(钉钉/飞书)入口

    • 对话UI、任务面板、状态可视化

  2. 记忆与上下文管理

    • 长短期对话记忆、任务链状态、文档缓存

    • 典型实现:向量数据库(Milvus)、Redis/ES

  3. 身份认证与权限控制

    • 企业级 SSO、AD/LDAP、API网关鉴权

    • 确保智能体任务执行可控、可审计

  4. 工具与执行层

    • RPA、OCR、知识库、企业系统API

    • 智能体的“手脚”,完成具体任务

  5. 智能体编排与调度(Orchestration)

    • 多智能体协作、任务拆解、工具路由

    • 只有少部分是AI推理,大部分是工程逻辑和任务管理

  6. 可观测与日志追溯

    • 任务状态监控、错误处理、操作日志

    • B端智能体必须“看得见它在干活”,否则无法信任

  7. 数据与基础设施

    • ETL、数据库、向量库、云原生容器、GPU/CPU集群

    • 保障性能、可扩展性和低成本运行

 

总结:水面下的 90% 负责让智能体“落地、稳定、可控、可追溯”,而非展示“聪明”。

三、为什么这个比例对企业落地很重要

  1. 防止高估AI能力

    • 只关注模型而忽视工程建设,智能体很快失效或不可控

  2. 指导架构设计

    • 把智能体当作软件系统,而不是单个模型

    • 先规划好 Workflow、权限、数据、日志、工具集成

  3. 明确团队建设方向

    • 90% 的工作需要软件工程、架构、运维人才

    • 只有 10% 是 Prompt、模型微调或推理优化

  4. 解释为什么B端落地难、C端快

    • C端重体验,轻工程,冰山顶部就能跑 MVP

    • B端重交付,必须把冰山底部的 90% 建完整

 
首页    行业洞察    智能体架构的真相:90%是软件工程,10%是AI