2026年6月5日

AI Agent 运行手册：把数字员工从一次性任务变成可交接岗位

这篇文章记录万象片场如何为 AI Agent 设计运行手册：把任务入口、执行步骤、验收证据、异常处理和复盘更新写清楚，让数字员工不只是能跑一次，而是能长期稳定值班。

AI自动化数字员工Agent实战运行手册

桌面上的计划本、键盘和任务清单，象征 AI Agent 运行手册把数字员工的工作流程标准化

在万象片场的内容自动化里，我越来越觉得：真正有用的 AI Agent，不应该只靠一条很长的提示词临场发挥。它需要一份像真实岗位一样的运行手册。

运行手册不是写给人看的漂亮制度，而是写给数字员工执行的工作说明。它要回答一个朴素问题：如果明天换一个 Agent、换一次会话、换一个定时任务入口，它还能不能接住同一份工作，并交出稳定结果？

很多 AI 自动化项目失败，不是因为模型不会写、不懂代码、不能调用浏览器，而是因为每次任务都像从零开始：今天记得预览，明天忘了检查图片；今天部署后看了线上链接，明天只看 build；今天知道不能提交无关文件，下一次又把别的改动混进去。单次执行看起来只是小失误，长期运行就会变成信任成本。

所以，万象片场现在把数字员工的日常任务拆成运行手册：入口是什么，步骤怎么走，验收看什么，异常怎么停，复盘写到哪里。目标很明确：让 AI Agent 从“一次性聪明”变成“可交接岗位”。

一、为什么只写提示词不够

很多人搭 Agent 的第一反应，是继续加提示词：更详细的要求、更长的禁止事项、更复杂的输出格式。这当然有用，但它解决不了所有问题。

提示词更像“临时交代”，运行手册更像“岗位制度”。两者的区别在于：

项目	长提示词	运行手册
作用	告诉 Agent 这次要做什么	告诉 Agent 这类工作长期怎么做
重点	当前任务要求	标准流程、边界、验收和复盘
风险	容易越来越长、互相覆盖	可以模块化更新、复用和审计
产出	一次交付	可重复运营能力

如果一个任务只做一次，提示词足够。但如果一个任务要每天跑，比如写博客、检查增长数据、更新内容计划、部署网站，就必须有运行手册。否则每一次执行都在重新赌 Agent 是否理解完整上下文。

对万象片场来说，博客自动发布就是最好的训练场。它既有内容判断，也有文件写入；既有本地构建，也有线上部署；既有品牌表达，也有 Git 同步。只靠“写一篇文章并发布”这句话，远远不够。

二、运行手册的五个核心模块

我目前把 AI Agent 运行手册拆成五个模块：任务入口、执行流程、验收证据、异常处理、复盘更新。

1. 任务入口：先说明这是谁的工作

任务入口要写清楚：这个 Agent 在什么时间、什么触发条件下、为了什么目标开工。

比如早间博客发布任务，入口可以写成：

角色：万象片场博客自动发布代理
触发：每天早间槽
方向：AI 自动化 / 数字员工 / Agent 实战
目标：选择未发布主题，写成长期资产文章，并完成预览、构建、部署、Git 同步
禁止：不重复标题，不写泛泛 AI 新闻，不操作无关项目

这一步看似简单，但非常关键。没有入口定义，Agent 很容易把任务理解成“写一篇文章”，而不是“维护一个品牌资产库里的固定栏目”。

2. 执行流程：把隐性经验写成步骤

执行流程要尽量减少“凭感觉”。例如博客发布可以拆成：

读取内容计划和内容体系文件；
读取已有文章标题，排除已发布主题；
选择最适合当前栏目推进的选题；
按现有 frontmatter 格式写 Markdown；
本地预览首页、归档页、文章页；
检查图片是否加载；
运行 build；
部署到 Cloudflare Pages；
验证线上首页和具体文章；
只提交本次相关文件并 push。

这不是为了把 Agent 管死，而是为了把“老员工经验”变成新会话也能执行的步骤。真正可靠的自动化，往往不是更神奇，而是更不跳步。

3. 验收证据：不要只听它说完成

运行手册必须规定验收证据。否则 Agent 很容易在语言层面完成任务，却没有证明结果真的可用。

我会要求每次交付至少留下这些证据：

新文件路径和标题；
本地文章页标题可见；
图片 complete、naturalWidth、naturalHeight 正常；
npm run build 通过；
npm run deploy 成功；
线上文章 URL 可打开，标题和正文关键句可见；
Git commit 和 push 完成，工作区干净。

这套证据链会把“我认为完成了”变成“结果可以被复查”。对一个长期值班的数字员工来说，这是信任的基础。

4. 异常处理：知道什么时候停下来

很多自动化事故，不是失败本身造成的，而是失败后还继续往下跑。

运行手册里必须写清楚哪些情况要停止：

内容主题与栏目不匹配；
发现标题重复但没有新主题可选；
build 失败；
deploy 需要登录或权限不足；
线上验证显示具体文章无法访问；
Git 状态里出现本次任务之外的修改；
涉及账号资料、付费投放、私信、删除内容等高风险动作。

数字员工不是越自动越好。真正成熟的 Agent，要知道哪些事可以自己做，哪些事必须停下来等人确认。运行手册的作用，就是把这些边界提前写成规则，而不是等出事后再解释。

5. 复盘更新：让手册每天变得更准

运行手册不是一次写完就不动。每次执行后，都应该问三个问题：

今天有没有出现新的失败点？
有没有某个检查被证明不够可靠？
有没有值得下次继承的增长线索？

比如发现计划队列里的早间主题已经全部发布，就应该把规则更新成：优先从同栏目延伸新的实战主题，而不是重复旧标题。比如发现 raw HTTP 检查可能被 Cloudflare 影响，就要补充浏览器验证或缓存破坏参数。比如发现某个系列已经形成，就要把它放进资源页或专题页待办。

这一步让运行手册不只是流程文档，而是数字员工的训练材料。

三、一份最小运行手册模板

如果现在要给一个 AI Agent 建运行手册，我会从下面这个最小模板开始：

# 任务名称

## 角色与目标
- 你是谁
- 你服务哪个资产/项目
- 这次任务的成功标准

## 输入材料
- 必读文件
- 必查目录
- 必须参考的历史记录

## 标准流程
1. 检查前置条件
2. 选择任务对象
3. 创建或修改产物
4. 本地验证
5. 构建/测试
6. 部署/同步
7. 线上验证
8. 提交记录

## 验收证据
- 文件路径
- 测试/构建结果
- 线上链接
- 截图或 DOM 检查
- Git 状态

## 停止条件
- 权限不足
- 构建失败
- 发现无关修改
- 触及高风险动作

## 复盘更新
- 新规则
- 新坑点
- 下次待办

这个模板不复杂，但它能把一个模糊任务变成可交接任务。哪怕未来换模型、换工具、换执行环境，只要运行手册还在，数字员工就不必每天重新摸索。

四、运行手册会改变内容系统的质量

万象片场做博客，不只是为了多发几篇文章。更重要的是，把 AI 自动化、内容生产、部署、复盘这一整套流程沉淀成可复制资产。

当每个 Agent 任务都有运行手册，内容系统会出现几个变化：

文章不会只靠灵感，而是沿着栏目和计划推进；
发布不会只看“生成成功”，而是完整检查预览、构建、部署和线上；
错误不会散在聊天记录里，而会进入手册和台账；
系列内容会自然长成专题、清单、模板和服务入口；
数字员工的能力会从“会做事”升级为“会按岗位稳定交付”。

这也是我理解的 AI 自动化价值：不是让一个模型偶尔惊艳一次，而是让它在一个真实系统里持续交付、持续留下证据、持续改进。

下一步

下一步，万象片场会继续把数字员工的工作拆成更具体的岗位手册：博客发布代理、增长数据分析代理、旧文深改代理、内容产品化代理。每一份手册都不追求复杂，而是追求可执行、可验证、可复盘。

当运行手册、记忆台账、证据链和权限边界连起来，AI Agent 才真正从工具变成一个可以长期值班的数字同事。