编辑推荐:
目 录
技术原理篇
第1章 快速认识AI Agent 2
1.1 为什么需要AI Agent 2
1.1.1 AI Agent的应用价值 3
1.1.2 AI Agent的本质 5
1.1.3 AI Agent、RAG与Workflow的区别和联系 9
1.2 AI Agent的历史与发展 10
1.2.1 从传统智能体到生成式AI Agent 10
1.2.2 LLM-Agent的兴起 11
1.3 AI Agent的类别与特点 15
1.3.1 AI Agent主流分类 15
1.3.2 AI Agent的特点 17
第2章 AI Agent基础原理与关键技术 18
2.1 AI Agent基础原理 18
2.1.1 AI Agent的定义与三大能力 19
2.1.2 AI Agent的行为决策运行机制 22
2.2 LLM-Agent的主要模块 25
2.2.1 LLM模块 26
2.2.2 角色模块 26
2.2.3 记忆模块 27
2.2.4 规划模块 28
2.2.5 行动模块 29
2.3 LLM常见技术或应用范式 32
2.3.1 提示工程 32
2.3.2 函数调用 33
2.3.3 检索增强生成 36
2.3.4 微调 38
2.3.5 训练优化与推理优化 41
2.4 LLM-Agent能力评估 42
2.4.1 LLM-Agent评估概述 42
2.4.2 LLM-Agent评估体系与方法 43
第3章 AI Agent开发框架与一般步骤 47
3.1 AI Agent的主要开发框架 47
3.1.1 LangGraph 49
3.1.2 CrewAI 57
3.1.3 Swarm 65
3.1.4 AutoGen 72
3.1.5 OpenAI Agents SDK 74
3.1.6 Google Agent Development Kit(ADK) 79
3.2 从零开始构建通用AI Agent 81
3.2.1 选择合适的LLM 82
3.2.2 定义AI Agent的控制逻辑 82
3.2.3 定义AI Agent的核心指令 83
3.2.4 定义并优化AI Agent的核心工具 83
3.2.5 制定可靠的记忆处理策略 84
3.2.6 解析AI Agent的原始输出 84
3.2.7 安排AI Agent的下一步行动 84
3.2.8 多智能体的设计 86
第4章 AI Agent的MCP与通信协同 87
4.1 AI Agent的MCP 87
4.1.1 MCP与AI Agent 88
4.1.2 基于MCP的AI Agent问答知识库构建 93
4.2 AI Agent通信协同 103
4.2.1 什么是A2A 103
4.2.2 A2A与MCP之间的关系 104
4.2.3 A2A架构设计实现剖析 105
落地实战篇
第5章 AI Agent构建工程实战1——基于Coze、Dify平台构建AI Agent 110
5.1 ReAct框架核心原理深度剖析 110
5.1.1 ReAct框架的核心原理剖析 111
5.1.2 ReAct框架的核心代码实现 114
5.2 AI Agent三大能力深度剖析 123
5.2.1 AI Agent规划能力剖析与代码实现 124
5.2.2 AI Agent行动能力剖析与代码实现 129
5.2.3 AI Agent记忆能力剖析与代码实现 131
5.3 基于Coze平台构建AI Agent 132
5.4 基于Dify平台构建AI Agent 137
第6章 AI Agent构建工程实战2——基于LangGraph框架构建AI Agent 147
6.1 AI Agent落地架构选型 147
6.1.1 AI Agent落地架构选型的必要性 147
6.1.2 AI Agent落地的主流架构选型 148
6.1.3 AI Agent落地架构选型依据 149
6.2 LangGraph对AI Agent的支持 150
6.2.1 LangChain与LangGraph的本质区别 151
6.2.2 LangGraph中支持构建AI Agent的主要模块 153
6.2.3 LangGraph的State组件 156
6.3 提示工程应用 157
6.3.1 提示工程概述及提示词的典型构成 157
6.3.2 提示词在LangGraph中的作用 158
6.3.3 提示工程在基于LangGraph构建AI Agent过程中的应用 158
6.4 工具调用AI Agent 160
6.4.1 工具调用AI Agent的核心原理 161
6.4.2 使用工具调用构建AI Agent的过程 168
6.5 AI Agent长短期记忆能力实现 172
6.5.1 基于SqliteSaver实现短期记忆 173
6.5.2 基于Store实现长期记忆 178
6.6 基于LangGraph开发企业级AI Agent 181
6.6.1 基于LangGraph开发单智能体 182
6.6.2 基于LangGraph开发多智能体 188
6.7 本地化部署多智能体实战 192
6.7.1 基于Supervisor架构实现多智能体 192
6.7.2 本地化部署多智能体 207
第7章 数据分析AI Agent的企业应用案例——基于DeepSeek模型 208
7.1 企业数据分析的范式革命 208
7.1.1 传统BI与ChatBI Agent的本质差异 209
7.1.2 企业级ChatBI Agent需求分析 210
7.2 企业级ChatBI Agent架构设计 211
7.2.1 企业级ChatBI Agent总体架构 212
7.2.2 企业级ChatBI Agent架构设计的难点 214
7.3 企业级ChatBI Agent技术选型与资源评估 215
7.3.1 企业级ChatBI Agent技术选型 215
7.3.2 企业级ChatBI Agent资源评估 215
7.4 基于DeepSeek模型构建与部署企业级ChatBI Agent 216
7.4.1 DeepSeek模型的架构与核心优势 216
7.4.2 基于DeepSeek模型构建企业级ChatBI Agent 220
7.4.3 基于DeepSeek本地化部署企业级ChatBI Agent 261
7.5 企业级ChatBI Agent在电商行业的应用 261
7.5.1 某电商集团ChatBI Agent的建设场景 261
7.5.2 某电商集团ChatBI Agent在物流领域的实践 262
7.5.3 某电商集团更多AI实践在物流领域落地 267
第8章 基于AI Agent构建智能客服系统 269
8.1 AI Agent改变智能客服系统 269
8.1.1 快速认识智能客服系统 269
8.1.2 LLM在智能客服系统中的作用 270
8.2 基于AI Agent的智能客服系统的关键技术 272
8.2.1 向量检索与知识图谱 272
8.2.2 意图识别与工具调用 272
8.2.3 多轮对话与上下文管理 272
8.3 基于AI Agent的智能客服系统的设计与实现 273
8.3.1 基于AI Agent智能客服系统的需求分析 273
8.3.2 基于AI Agent智能客服系统的架构设计与技术选型 274
8.3.3 智能客服系统的核心实现 277
8.4 基于AI Agent的智能客服系统在金融行业的应用 296
8.4.1 金融行业AI Agent智能客服的构建 296
8.4.2 金融行业AI Agent智能客服的实现 297
前沿探索篇
第9章 AI Agent前沿应用探索 310
9.1 电信开发平台综合应用探索 310
9.1.1 AI原生应用电信开发平台整体架构 310
9.1.2 AI原生应用电信开发平台使用操作 312
9.1.3 AI原生应用电信开发平台的典型应用场景 319
9.2 多模态AI Agent的构建与应用探索 325
9.2.1 多模态AI Agent的概念 325
9.2.2 多模态AI Agent的构建与应用 326
第10章 AI Agent未来发展与挑战 335
10.1 AI Agent的高级形态与AGI发展 335
10.1.1 AI Agent的高级形态1——具身智能 336
10.1.2 AI Agent的高级形态2——智能驾驶 339
10.1.3 AI Agent是AGI发展的重要技术路径 342
10.2 AI Agent伦理与安全 343
10.2.1 数据质量与隐私保护 343
10.2.2 技术成熟度与局限性 346
10.2.3 法律框架与合规性 348
展开
推荐序1
作为经历过大数据技术发展完整历程的科技从业者,我有幸赶上了新一代人工智能技术快速从理论走向实践、从科研走向产业的发展浪潮。近年来,随着大模型(LLM)和多模态模型技术的演进,我们正站在一个全新的技术拐点上——人工智能不再仅仅是“玩具”,而是逐步演变为具备感知、思考、决策与行动能力的AI Agent生产力工具。这不仅是技术的跃迁,更是人机协作范式的一场深刻变革。
在此背景下,《AI Agent开发全书:原理、框架与企业落地》一书的出版恰逢其时。本书不仅系统地梳理了AI Agent的基础原理与技术架构,更可贵的是,它侧重开发实战与行业应用,突出了企业级应用落地。全书整体内容结构清晰,重点突出,详略得当:技术原理篇为全书的基础,详细阐述了AI Agent的关键技术与主要模块,以及主要开发框架与MCP等;落地实战篇是全书的重点,不仅基于Coze、Dify等平台和LangGraph等框架构建AI Agent,还结合ChatBI、智能客服等企业级应用场景,提供了具有参考价值的实战案例;前沿探索篇探讨了AI Agent的未来发展趋势,包括多模态Agent、具身智能与AGI发展等。每一章都围绕当前主流技术,循序渐进,不断深入。
我特别欣赏本书对架构设计与实战落地的强调。在当前LLM仍然存在“幻觉”的背景下,如何让AI Agent真正理解环境、响应上下文、执行任务并持续学习,已成为决定其能否在电信、金融、工业制造等关键行业落地的核心挑战。或许,我们能在本书提到的提示工程、ReAct框架、Tool Calling机制、记忆能力、多智能体构建、MCP与通信协同等关键技术中找到答案。
作为一家以软件开发为主营业务的上市公司CTO,我深知技术创新必须与商业闭环并重。AI Agent的真正价值在于它能否自主完成数据分析、客户服务、流程自动化、风险预警等复杂任务,从而释放人力、提升效率、创造增量价值。本书中的多个实战章节,都是围绕这些高价值场景展开的,极具启发性和实践指导意义。
我相信,AI Agent将成为未来人工智能应用的核心形态,而本书将是每一位AI工程师、产品经理和技术管理者不可或缺的案头指南。
查礼
北京东方国信科技股份有限公司副总裁兼CTO
2025年8月18日
推荐序2
当第一次看到AI Agent这个概念时,我脑海中浮现的不仅是技术的演进,更是一场即将席卷全球的生产力革命。我们正站在一个新时代的门槛上——从“人适应机器”走向“机器服务于人”的智能跃迁。摆在各位面前的本书,正是这场变革中不可或缺的导航图与实践手册。
《AI Agent开发全书:原理、框架与企业落地》一书,以系统化、工程化、前沿化的视角,全面剖析了AI Agent的技术本质与发展脉络。它不止于理论,而是打通架构设计、开发框架、行业场景与未来趋势,形成了从认知到实践的完整闭环。全书结构清晰,层层递进:第1章对AI Agent的本质与历史进行溯源,第2章拆解关键技术模块,第3章是主流开发框架的横向对比,第4章介绍AI Agent的MCP与通信协同,第5、6章是基于Coze、Dify等平台和LangGraph等框架的工程实战,最终延伸至第7、8章,介绍AI Agent在数据分析、智能客服等企业级场景中的深度应用,以及第9、10章对多模态Agent与AGI未来的前瞻思考——每一步都紧扣时代脉搏,既有思想高度,又有落地温度。
尤为难得的是,本书并未陷入“炫技式”的技术堆砌,而是始终围绕“如何构建真正可用、可落地、可扩展的AI Agent系统”这一核心命题展开。无论是对ReAct框架的深度剖析、讲解Tool Calling实现机制,还是介绍记忆管理、多智能体协同、MCP等关键设计,作者都以极强的工程思维给出了清晰的路径指引。这在当前AI技术浮躁、概念泛滥的背景下,显得尤为珍贵。
作为北京数致未来科技的创始人,以及持续深耕AGI领域的探索者,我深知:未来的智能世界,不是单一模型的胜利,而是由无数具备感知、决策、行动与协作能力的AI Agent所构成的生态。本书,正是帮助开发者、企业架构师、技术决策者、AI产品经理迈入这一生态的“第一把钥匙”。
我乐于为这样一本兼具深度与广度、思想性与实操性的著作撰写推荐序。它不仅适合AI初学者建立系统认知,也值得资深从业者反复研读。相信每一位认真读完本书的读者,都将获得构建未来智能系统的底层能力。
孙玄
北京数致未来科技创始人&CEO
视频号“玄姐谈AGI”主理人
2025年8月14日
前言
在人工智能技术迅猛发展的今天,AI Agent(智能体)已成为推动行业变革的核心力量。从简单的任务自动化到复杂的自主决策系统,AI Agent正在重塑人机交互的边界,并在企业服务、数据分析、智能客服、多模态交互等领域展现出巨大的潜力。
为什么写这本书
本书的创作源于我在AI领域多年的行业观察与技术实践。随着大模型(LLM)和智能体技术的快速发展,许多开发者与企业虽对AI Agent充满兴趣,却面临如下挑战。
? 技术门槛高:AI Agent开发涉及LLM、记忆、规划、工具调用等多模块协同,缺乏系统化的指导。
? 落地经验少:如何将实验室中的智能体技术转化为实际业务场景的解决方案,需要方法论与案例的支撑。
? 生态碎片化:LangGraph、CrewAI、Google ADK等框架层出不穷,开发者难以快速选型并高效应用。
本书通过“原理+实战+前沿”三位一体的内容设计,帮助读者从零构建AI Agent,并掌握其落地应用的核心能力。
本书核心内容
本书分为3篇,内容层层递进。
1. 技术原理篇(第1~4章)
? 系统解析AI Agent的本质、技术框架与核心模块(如LLM、规划、记忆、工具调用)。
? 深入探讨AI Agent开发的关键技术,如提示工程、RAG、函数调用等。
2. 落地实战篇(第5~8章)
? 基于Coze、Dify等平台和LangGraph等框架,手把手地教授读者AI Agent的开发与部署。
? 结合企业级案例(如数据分析AI Agent、智能客服),剖析架构设计、技术选型与行业适配。
3. 前沿探索篇(第9、10章)
展望多模态Agent、具身智能等前沿方向,并探讨安全、伦理与AGI发展的未来挑战。
本书特色
? 注重实操:包含大量代码示例、架构图与调试技巧,覆盖从开发到部署的全流程。
? 行业导向:聚焦金融、电商、电信等场景,提供可复用的解决方案。
? 前瞻视角:不仅讲解现有技术,更分析AI Agent与AGI的演进路径。
致谢
感谢我的团队与朋友在成书过程中提供的宝贵建议,尤其感谢参与案例实践的企业伙伴,他们的真实需求让本书的实战内容更具参考价值。此外,感谢编辑团队的细致工作,使复杂的技术内容得以清晰呈现。
读者对象
? 开发者:希望掌握AI Agent开发全流程的技术人员。
? 企业决策者:寻求AI Agent落地场景与架构设计的管理者。
? 研究者:关注智能体技术前沿与AGI发展的学者。
阅读建议
? 建议初学者按章节顺序阅读,逐步构建知识体系。
? 有经验的读者可直接跳转至落地实战篇,结合自身需求参考案例进行学习。
? 对于代码与工具部分,建议动手实践,书中附有相关资源链接。
AI Agent的时代已至,它不仅是技术的革新,更是人机协作范式的跃迁。希望本书能成为读者探索这个领域的可靠指南,让我们共同推动智能体的发展与落地。
李希沅
2025年8月8日于北京
展开