第 9 步 · AI 智能体 简单 · 12 分钟
🧠什么是 AI 智能体(agent)?
智能体不是聊天机器人。它是一个被放出盒子、被赋予了工具和目标的模型。下面讲清楚它到底是怎么运作的, 真实、没有魔法。
您已经安装了 Claude Code 或 OpenCode,看着它写文件、运行命令、修正自己的错误。这很震撼, 也有点像魔法。但其实没有任何魔法,只有一个简单而强大的想法。花五分钟来把它拆解开:一旦您理解了智能体是什么,您就知道该对它抱什么期待,更重要的是知道不该抱什么期待。
模型、聊天机器人、智能体:三样不同的东西
人们常常把这三者混为一谈。但区别其实很清晰:
- 语言模型(LLM) 是纯粹的引擎。您给它文本,它还您文本。它不做别的任何事。它不知道现在几点,读不了您的文件,记不住任何东西。
- 聊天机器人 是装进了对话界面里的模型。用来思考、撰写、解释都很方便。但它仍然被困在自己的文字泡泡里:它建议您执行某条命令,但它不会去执行。
- 智能体 是被赋予了三样东西的模型:一个目标、一批能作用于现实世界的工具,以及一个让它不断重来直到目标达成的循环。这时它不再是建议:它在动手。
循环,一切的核心
每一个智能体,无论是 Claude Code、OpenCode 还是别的,都运转在同一个循环上。正是这个循环,把一个话痨模型变成了一个自主的工作者:
我们来展开一个具体的例子。您问:「测试通过了吗?」。智能体不靠猜, 它在循环:
- 思考,「要知道答案,我得运行测试命令。」
- 行动(工具) : 它在您的终端里执行
npm test。 - 观察 : 它读取输出:三个测试失败,在某个文件里。
- 思考,「报错说函数返回了
null。我去读那个文件。」 - 行动 : 它打开文件,定位 bug,写出修正。
- 行动 : 它重新运行
npm test。 - 观察 : 全绿了。目标达成,它停下。
没有人把这些步骤一一口述给它。是它自己选的,一步接一步,根据它所观察到的情况。这就是智能体:一个在循环中决定自己下一步行动的模型,每一步都依据上一步的结果。
工具:给大脑装上双手
一个智能体的价值,全在于您给它的工具。一个工具,就是一种行动能力:读一个文件、写一个文件、运行一条 shell 命令、调用一个 API、上网搜索。工具的清单越丰富,智能体能完成的事就越多。
Claude Code 和 OpenCode 出厂就为开发配齐了工具:文件系统、终端、搜索、git。而您还可以扩展这份清单, 这正是下一篇的主题,搭建您的智能体。
自主程度:一个滑块,不是一个开关
「自主智能体」让人害怕,或让人向往,看心情。现实更微妙:自主程度是一个由您来调的滑块。
- 每个行动您都确认。 智能体提议,您逐一批准。慢,但完全掌控, 刚上手时、或处理敏感操作时最合适。
- 只确认有风险的动作。 智能体可以自由地连续读取和测试,但在删除、推送或碰网络之前会先问您。这是日常的最佳设定。
- 放手让它跑。 在一个边界清晰、可回退的任务上(一次有测试覆盖的重构),您放开手,最后复审结果。
为什么这对爱折腾的人是一场革命
因为它改变了您的角色。您从「敲命令的人」变成「拍板和复审的人」。您用中文描述一个意图,智能体把它翻译成一连串具体行动,您来确认。这正是为什么一台迷你机器在一个并非系统管理员的人手里也能如此强大:智能体做技术性的动作,您来把握方向。