AI Agent 运行手册:把数字员工从一次性任务变成可交接岗位
这篇文章记录万象片场如何为 AI Agent 设计运行手册:把任务入口、执行步骤、验收证据、异常处理和复盘更新写清楚,让数字员工不只是能跑一次,而是能长期稳定值班。
在万象片场的内容自动化里,我越来越觉得:真正有用的 AI Agent,不应该只靠一条很长的提示词临场发挥。它需要一份像真实岗位一样的运行手册。
运行手册不是写给人看的漂亮制度,而是写给数字员工执行的工作说明。它要回答一个朴素问题:如果明天换一个 Agent、换一次会话、换一个定时任务入口,它还能不能接住同一份工作,并交出稳定结果?
很多 AI 自动化项目失败,不是因为模型不会写、不懂代码、不能调用浏览器,而是因为每次任务都像从零开始:今天记得预览,明天忘了检查图片;今天部署后看了线上链接,明天只看 build;今天知道不能提交无关文件,下一次又把别的改动混进去。单次执行看起来只是小失误,长期运行就会变成信任成本。
所以,万象片场现在把数字员工的日常任务拆成运行手册:入口是什么,步骤怎么走,验收看什么,异常怎么停,复盘写到哪里。目标很明确:让 AI Agent 从“一次性聪明”变成“可交接岗位”。
一、为什么只写提示词不够
很多人搭 Agent 的第一反应,是继续加提示词:更详细的要求、更长的禁止事项、更复杂的输出格式。这当然有用,但它解决不了所有问题。
提示词更像“临时交代”,运行手册更像“岗位制度”。两者的区别在于:
| 项目 | 长提示词 | 运行手册 |
|---|---|---|
| 作用 | 告诉 Agent 这次要做什么 | 告诉 Agent 这类工作长期怎么做 |
| 重点 | 当前任务要求 | 标准流程、边界、验收和复盘 |
| 风险 | 容易越来越长、互相覆盖 | 可以模块化更新、复用和审计 |
| 产出 | 一次交付 | 可重复运营能力 |
如果一个任务只做一次,提示词足够。但如果一个任务要每天跑,比如写博客、检查增长数据、更新内容计划、部署网站,就必须有运行手册。否则每一次执行都在重新赌 Agent 是否理解完整上下文。
对万象片场来说,博客自动发布就是最好的训练场。它既有内容判断,也有文件写入;既有本地构建,也有线上部署;既有品牌表达,也有 Git 同步。只靠“写一篇文章并发布”这句话,远远不够。
二、运行手册的五个核心模块
我目前把 AI Agent 运行手册拆成五个模块:任务入口、执行流程、验收证据、异常处理、复盘更新。
1. 任务入口:先说明这是谁的工作
任务入口要写清楚:这个 Agent 在什么时间、什么触发条件下、为了什么目标开工。
比如早间博客发布任务,入口可以写成:
角色:万象片场博客自动发布代理
触发:每天早间槽
方向:AI 自动化 / 数字员工 / Agent 实战
目标:选择未发布主题,写成长期资产文章,并完成预览、构建、部署、Git 同步
禁止:不重复标题,不写泛泛 AI 新闻,不操作无关项目
这一步看似简单,但非常关键。没有入口定义,Agent 很容易把任务理解成“写一篇文章”,而不是“维护一个品牌资产库里的固定栏目”。
2. 执行流程:把隐性经验写成步骤
执行流程要尽量减少“凭感觉”。例如博客发布可以拆成:
- 读取内容计划和内容体系文件;
- 读取已有文章标题,排除已发布主题;
- 选择最适合当前栏目推进的选题;
- 按现有 frontmatter 格式写 Markdown;
- 本地预览首页、归档页、文章页;
- 检查图片是否加载;
- 运行 build;
- 部署到 Cloudflare Pages;
- 验证线上首页和具体文章;
- 只提交本次相关文件并 push。
这不是为了把 Agent 管死,而是为了把“老员工经验”变成新会话也能执行的步骤。真正可靠的自动化,往往不是更神奇,而是更不跳步。
3. 验收证据:不要只听它说完成
运行手册必须规定验收证据。否则 Agent 很容易在语言层面完成任务,却没有证明结果真的可用。
我会要求每次交付至少留下这些证据:
- 新文件路径和标题;
- 本地文章页标题可见;
- 图片
complete、naturalWidth、naturalHeight正常; npm run build通过;npm run deploy成功;- 线上文章 URL 可打开,标题和正文关键句可见;
- Git commit 和 push 完成,工作区干净。
这套证据链会把“我认为完成了”变成“结果可以被复查”。对一个长期值班的数字员工来说,这是信任的基础。
4. 异常处理:知道什么时候停下来
很多自动化事故,不是失败本身造成的,而是失败后还继续往下跑。
运行手册里必须写清楚哪些情况要停止:
- 内容主题与栏目不匹配;
- 发现标题重复但没有新主题可选;
- build 失败;
- deploy 需要登录或权限不足;
- 线上验证显示具体文章无法访问;
- Git 状态里出现本次任务之外的修改;
- 涉及账号资料、付费投放、私信、删除内容等高风险动作。
数字员工不是越自动越好。真正成熟的 Agent,要知道哪些事可以自己做,哪些事必须停下来等人确认。运行手册的作用,就是把这些边界提前写成规则,而不是等出事后再解释。
5. 复盘更新:让手册每天变得更准
运行手册不是一次写完就不动。每次执行后,都应该问三个问题:
- 今天有没有出现新的失败点?
- 有没有某个检查被证明不够可靠?
- 有没有值得下次继承的增长线索?
比如发现计划队列里的早间主题已经全部发布,就应该把规则更新成:优先从同栏目延伸新的实战主题,而不是重复旧标题。比如发现 raw HTTP 检查可能被 Cloudflare 影响,就要补充浏览器验证或缓存破坏参数。比如发现某个系列已经形成,就要把它放进资源页或专题页待办。
这一步让运行手册不只是流程文档,而是数字员工的训练材料。
三、一份最小运行手册模板
如果现在要给一个 AI Agent 建运行手册,我会从下面这个最小模板开始:
# 任务名称
## 角色与目标
- 你是谁
- 你服务哪个资产/项目
- 这次任务的成功标准
## 输入材料
- 必读文件
- 必查目录
- 必须参考的历史记录
## 标准流程
1. 检查前置条件
2. 选择任务对象
3. 创建或修改产物
4. 本地验证
5. 构建/测试
6. 部署/同步
7. 线上验证
8. 提交记录
## 验收证据
- 文件路径
- 测试/构建结果
- 线上链接
- 截图或 DOM 检查
- Git 状态
## 停止条件
- 权限不足
- 构建失败
- 发现无关修改
- 触及高风险动作
## 复盘更新
- 新规则
- 新坑点
- 下次待办
这个模板不复杂,但它能把一个模糊任务变成可交接任务。哪怕未来换模型、换工具、换执行环境,只要运行手册还在,数字员工就不必每天重新摸索。
四、运行手册会改变内容系统的质量
万象片场做博客,不只是为了多发几篇文章。更重要的是,把 AI 自动化、内容生产、部署、复盘这一整套流程沉淀成可复制资产。
当每个 Agent 任务都有运行手册,内容系统会出现几个变化:
- 文章不会只靠灵感,而是沿着栏目和计划推进;
- 发布不会只看“生成成功”,而是完整检查预览、构建、部署和线上;
- 错误不会散在聊天记录里,而会进入手册和台账;
- 系列内容会自然长成专题、清单、模板和服务入口;
- 数字员工的能力会从“会做事”升级为“会按岗位稳定交付”。
这也是我理解的 AI 自动化价值:不是让一个模型偶尔惊艳一次,而是让它在一个真实系统里持续交付、持续留下证据、持续改进。
下一步
下一步,万象片场会继续把数字员工的工作拆成更具体的岗位手册:博客发布代理、增长数据分析代理、旧文深改代理、内容产品化代理。每一份手册都不追求复杂,而是追求可执行、可验证、可复盘。
当运行手册、记忆台账、证据链和权限边界连起来,AI Agent 才真正从工具变成一个可以长期值班的数字同事。