图书简介:
目 录
第1章 初识大模型 1
1.1 从ChatGPT到Manus AI:技术革命正在悄然发生 1
1.1.1 什么是大模型:从“人工智障”到全能选手 1
1.1.2 智能体,一场跨时代的技术革命 5
1.1.3 未来的智能体时代 11
1.1.4 时代的革命与中国力量的崛起 12
1.2 大模型争霸战:谁才是AI时代的王者 14
1.2.1 基础大模型全景图:从“王者”到“黑马” 14
1.2.2 大模型的不同场景测评 24
1.2.3 如何选择和使用:AI选型指南 41
1.3 Token:大模型的语言密码与成本密钥 43
1.3.1 揭开Token的神秘面纱 43
1.3.2 Token技术的演进历程 44
1.3.3 Token与字节的本质区别 45
1.3.4 中文Token的成本真相 45
1.3.5 Token优化的实用策略 47
1.3.6 Token的未来 48
1.4 开源精神:推动大模型普及的关键力量 49
1.4.1 开源的本质:从厨师的食谱说起 49
1.4.2 开源的历史传奇:从打印机故障到改变世界 50
1.4.3 开源的运行机制:人类历史上最大的协作实验 51
1.4.4 开源的商业奇迹:免费却价值连城的经济学悖论 52
1.4.5 选择开源的战略智慧:改变游戏规则的思维革命 54
1.5 算力:支撑大模型世界的隐形基石 56
1.5.1 算力的本质:数字世界的“动力源泉” 57
1.5.2 算力的分类体系:从通用到专用的精准匹配 57
1.5.3 算力衡量指标:科学量化计算能力 58
1.5.4 算力硬件生态:多元化计算架构的协同发展 60
1.5.5 全球算力产业格局:竞争与合作并存的生态体系 61
1.5.6 英伟达GPU产品解读:算力领域的标杆案例 62
1.5.7 未来发展趋势:算力技术的演进方向 63
第2章 大模型进阶指南 65
2.1 提示词工程:像“翻译官”一样,教AI说人话 65
2.1.1 提示词存在的必然性:从认知科学到技术实现 65
2.1.2 提示词工程的最佳实践与核心策略 67
2.1.3 提示词工程案例集 69
2.1.4 提示词工程的进阶策略与未来展望 73
2.2 为大模型装上外挂:用RAG和微调驯服大模型 75
2.2.1 深入理解RAG:为AI安装知识库 76
2.2.2 深入理解微调:重塑AI的思维模式 78
2.2.3 RAG 与微调:选择的智慧 80
2.3 大模型的三大协议革命:函数调用、MCP与A2A 82
2.3.1 函数调用:OpenAI提出的大模型的“手脚” 82
2.3.2 MCP:大模型领域的Type-C接口 84
2.3.3 A2A协议:智能体之间的翻译官 87
2.3.4 从“独狼”到“群狼”:三种协议的选择之道 90
2.4 更高级的文本语法:Markdown格式 92
2.4.1 理解Markdown:大模型时代的通用语言 92
2.4.2 Typora:Markdown编辑的最佳伴侣 93
2.4.3 掌握Markdown核心语法 94
2.4.4 文本格式化:让内容更加生动 95
2.4.5 列表结构:组织信息的利器 95
2.4.6 进阶功能:释放Markdown的全部潜力 98
2.4.7 高级样式定制:打造个性化的视觉体验 102
2.4.8 特殊排版技巧 106
2.4.9 表情符号与特殊字符 109
第3章 大模型实操指南 111
3.1 大模型本地化部署与API操作指南 111
3.1.1 本地化部署的必要性与价值 111
3.1.2 如何获取本地模型的API 112
3.1.3 本地化AI客户端解决方案 116
3.2 大模型RAG:IMA、FastGPT、RagFlow 124
3.2.1 本地知识库的价值 124
3.2.2 RAG最佳实践与策略 124
3.2.3 主流RAG平台详解 125
3.2.4 案例:用IMA知识库搭建一个党建神器 132
3.3 文生图:Gemini、即梦AI、GPT-4o 134
3.3.1 文生图的起源与演进 134
3.3.2 主流文生图模型和工具 134
3.4 文生视频:Veo3、混元视频、Seedance、数字人 143
3.4.1 文生视频简介 143
3.4.2 主流文生视频模型与工具对比 143
3.4.3 延伸案例:儿童绘本视频制作 149
3.4.4 延伸案例:“回答我”爆款短视频制作 152
3.5 文生音乐:Suno、海绵音乐、Stable Audio 154
3.5.1 AI音乐的演进与现状 154
3.5.2 主流AI音乐创作工具详解 155
3.6 AI编程(代码辅助):Cursor、CodeSouler 159
3.6.1 AI编程时代的全新范式 159
3.6.2 主流AI编程工具详解 160
3.6.3 各类代码辅助工具对比 165
3.6.4 延伸案例:用代码生成小红书配图+文案 166
3.6.5 延伸案例:无代码完成一个以太坊智能合约的部署 169
3.7 AI编程(零代码):豆包AI编程、V0 176
3.7.1 什么是零代码编程 176
3.7.2 零代码编程工具推荐 176
3.7.3 V0 179
3.7.4 工具对比与分析 181
3.8 智能体:Manus AI、Flowith、天工Skywork 182
3.8.1 智能体的崛起与核心特征 182
3.8.2 主流智能体工具详解 183
3.8.3 智能体工具对比 188
3.9 AI浏览器:Fellou、AutoHub、豆包 188
3.9.1 什么是AI浏览器 188
3.9.2 主流AI浏览器深度解析 189
3.9.3 到底该选择哪款AI浏览器 198
3.10 AI工作流平台:Dify、Coze、n8n 198
3.10.1 工作流自动化的时代意义 198
3.10.2 主流工作流平台深度解析 199
3.10.3 平台选择的策略与应用场景 203
3.11 能转化成播客和视频的大模型笔记本计算机——NotebookLM 203
3.11.1 NotebookLM 是什么 203
3.11.2 NotebookLM 的使用方法 204
3.11.3 案例:用NotebookLM构建学习与讨论平台 206
3.12 企业级大模型资产管理工具:CSGHub 207
3.12.1 从DevOps到AgenticOps:大模型时代的运维新范式 207
3.12.2 CSGHub:企业级大模型资产管理的全能平台 209
3.12.3 大模型平台生态格局:从HuggingFace到CSGHub 212
3.13 Web3.0领域的多智能体协作开源框架:ai16z 214
3.13.1 从草根逆袭到技术明星:ai16z与Eliza的起源故事 214
3.13.2 ElizaOS的技术架构深度解析 215
3.13.3 ElizaOS的安装与快速上手 216
3.14 多智能体协作开源框架典范——MetaGPT 221
3.14.1 为什么需要MetaGPT 221
3.14.2 部署和使用指南 222
3.14.3 典型应用案例解析 224
3.14.4 MetaGPT(MGX)云端平台简介与实践 235
第4章 商业落地和思考 239
4.1 如何打造一个优秀的大模型产品:从技术思维到商业落地的
完整指南 239
4.1.1 AI产品设计的底层逻辑 239
4.1.2 现有大模型产品的市场分析 244
4.1.3 打造一个完美的AI产品 247
4.1.4 AI硬件产品构思案例:重新定义智能硬件的商业逻辑 250
4.2 大模型时代的生产力与生产关系的变革:Think Different,
Dream Bigger 254
4.2.1 技术革命必然带动社会和生产关系的变革 254
4.2.2 大模型解决生产力问题,区块链重塑生产关系 255
4.2.3 短期内最具变革潜力的行业:电影、设计、AR和VR 257
4.3 当智能体遇上价值互联网:A2A协议+AP2开启全自主
智能体新纪元 257
4.3.1 从工具到伙伴:AI的进化之路 258
4.3.2 价值互联网:智能体的数字土壤与协作语言 258
4.3.3 协同进化:A2A协议+AP2+区块链网络的化学反应 260
4.3.4 引领未来,创造可能的案例场景 262
4.3.5 结语:数字文明的新起点 263
4.4 新时代的AI公司都在做什么 263
第5章 结束语:现在开始,和AI聊起来 266
展开
序 一
青年科技工作者陈放给我送来一本书稿《会聊天就会用AI:零基础玩转大模型》,请我为这本书写一篇序,我是有些忐忑不安的。因为AI在全中国乃至全世界都太热门,相关的议论太多,我虽一直关注、跟踪研究、夙夜学习,但自感远远不够。但同时,我也是愿意写几句的,因为陈放这本书基于他对AI的长期研究与实践,既是心路历程,也是实操感悟,对像他这样的千千万万的AI爱好者和实践者,是有帮助和启发作用的。
诚如陈放在本书的前言中所说,这本书不是关于AI的宏论或专著,也不是写给那些已经熟知AI,精通AI编程、熟悉深度学习的AI专业人士的。它写给你我这样的普通人:对AI感兴趣,但不知道从哪里开始;想尝试用AI提高效率,却怕太难学不会;或者只是好奇:AI到底能帮我干点儿啥?所以在这本书里,你会看到:通俗易懂的语言,没有复杂的术语,只有生活化的比喻;生动有趣的案例,让你边看边笑,边笑边学;一步步的操作指南,带你从零开始体验AI的魅力;实用的技巧和资源,告诉你哪些工具好用、怎么用、为什么用……书中的每一章,都会用轻松易懂的方式,带你探索AI世界。你会发现,原来AI并非都是高深莫测、遥不可及的,它就在你的指尖,在你的日常工作、生活、学习、社交之中。因此,不妨看一看、学一学、做一做,让你与AI时代、与AI潮流拉近距离,提高实用技能。
人类社会犹如巨大的车轮,滚滚向前。科技创新,日新月异,百舸争流。信息科技,是人类科技创新变革的突出领域。一方面,人类社会从信息技术(Information Technology,IT)走向数据技术(Data Technology,DT),曾经作为人类20世纪最主要创新标志的互联网,已然进入成熟时期,迈向“互联网+”时代的新高峰;另一方面,萌芽于20世纪50年代的AI越过低谷期、复苏期,进入了全面爆发期,自然语言处理渗透、深度学习崛起、算力和数据量激增、百模大战愈演愈烈,AI在越来越多的领域生根发芽,不断带给世界新的惊喜。DeepSeek的横空出世和爆火全球,既是全球人类的福音,也是国人的骄傲。
AI变得越来越热门,世界各国都在关注和热议AI,各种会议、论坛、演讲、培训接连不断,各种著作、论文、评说层出不穷,大厂大院全面比拼大战,资本在寻找各种机会,各路AI大咖忙于宣讲布道。人们或追捧或诟病,或感慨或质疑,或沉思或焦虑。基于不同的理解和认知,站在不同的视角和立场,人们对AI的当下与未来有着不同甚至大相径庭的看法和说法:究竟何为AI?AI与互联网、元宇宙之间的关系是什么?如何开发和应用AI?AI的价值取向是什么?AI的伦理如何贯穿?如何推动AI向善,规避风险?有了大模型,人们还需要学习知识吗?AI会超越人类甚至最终取代人类吗?……问题远远不止这些,它们既简单又复杂,既浅显又深刻,既个别又普遍,既业余又专业,对这些问题的探讨和辩论,已经不仅出现在私密空间,而且出现在了大庭广众、大众传媒和社交媒体之中。也许已有答案,也许还没有被普遍认同和接受的答案,因为我们对AI的理解和认识还只是初步的,我们已知的远不如未知的多。AI更大的发展在未来,在不断探索创新之中……
AI是引领新一轮科技革命和产业变革的战略性技术。加快发展新一代AI,是我们赢得全球科技竞争主动权的重要战略抓手。我国政府高度重视AI,做出了一系列重大决策部署。推动互联网、大数据、AI和实体经济深度融合;坚持科技自立自强,突出应用导向,推动我国AI朝着有益、安全、公平的方向健康有序发展,是我国AI发展的既定方向。
顺应潮流、得时无怠、只争朝夕,乃理性务实之举。企业如此,行业产业如此,大厂大院如此,个人亦是如此。AI海阔天空,浩瀚无穷,博大精深,作为普通的个体,需要保持对AI的关注与学习,但也要因人而异,以需求为导向,从选准切入角度开始,边学边做,避免陷入个人无法掌控的宏大精深与专业深海。
但愿陈放这本书,能成为你在AI前行之路上的有益搭档。
周锡生
新华网首任董事长、总裁、总编辑,资深互联网、AI研究员
前 言
还记得第一次在计算机前敲击键盘时的好奇吗?现在,只要将事情说清楚,就能让智能助手帮忙写文章、做表格、改图片、做数据分析,甚至自动处理一些重复的事情。这本书只做一件事:教你通过“聊天”将AI变成真正能辅助你的工具。
为什么强调“聊天”呢?因为大多数时候,把话说清楚就能取得好结果。只有先告诉AI你想达到的目标,再补充背景和例子,说明你要什么样的答案,它才能按照你的要求执行任务。你不需要懂技术,只需要把需求说明白。
至于背后的技巧,你无须担心也不必硬记专业名词。简单记住:现在的AI很好用了,很多工具能够接收你的资料,把你常做的事形成小流程,像一位可靠的帮手。我们会用生活化的例子,带你一步步上手。
本书提供的价值
(1)如何向AI说清楚你的想法,让它听得懂。
(2)如何把事情拆成小步骤,请AI一步步帮你做。
(3)如何让结果展示得明白,比如以表格、清单、范例等形式。
(4)如何输入自己的资料,让AI更懂你的需求。
(5)如何把常用任务做成小流程,重复使用不费力。
(6)如何保护隐私、检查结果是否“靠谱”。
读者收获
(1)一个会聊天、能干活的AI搭档。
(2)一套好用的提问模板,随取随用。
(3)从“不会”到“能做”的信心和能力。
(4)把AI用于工作、学习、生活中的快捷方法。
这本书是写给普通人看的
(1)对AI好奇但不知道从哪里开始学习的人。
(2)想提高效率又怕太难的人。
(3)只想搞清楚“AI到底能帮我干啥”的人。
你不会看到一堆难懂的专业名词,也不用看复杂的图表。我们就用生活中的例子、对话式的教学,带你一步一步来掌握AI。每个知识点都有操作步骤和好用的提问模板,让你边看边用、越用越熟。
更重要的是,我们不只讲“AI是什么”,更讲“怎么聊、怎么用、为什么用”。会告诉你哪些工具好用、怎么提问更有效、哪些地方要小心,帮你少走弯路。
接下来,让我们一起轻松上路,不用费劲背概念,也能把AI用起来。
陈放
展开