2026年5月19日

把 AI Agent 当实习生训练：从人工审阅到半自动值班的三阶段

这篇文章记录万象片场训练数字员工的一套三阶段方法：先人工审阅，再半自动执行，最后让 AI Agent 在明确边界内值班，用真实验证而不是幻想全自动。

AI自动化数字员工Agent实战工作流

会议桌上的团队白板和笔记本电脑，象征把 AI Agent 像实习生一样分阶段训练成数字员工

很多人第一次接触 AI Agent，会直接问一个问题：它能不能全自动帮我干活？

我现在更愿意把问题换成：如果它是一个刚入职的实习生，我应该怎么训练它，才能让它逐步变成可靠的数字员工？

在万象片场的博客自动发布、内容系统维护和本机工作流实验里，我越来越少追求“一步到位的全自动”，而是把 Agent 训练成一个有岗位、有权限、有检查清单、有复盘记录的协作对象。这样做看起来慢一点，但长期更稳，也更适合个人内容生意系统。

这篇文章记录我目前使用的三阶段训练方法：人工审阅期、半自动执行期、边界内值班期。

一、为什么不要一上来追求全自动？

全自动听起来很诱人：早上定时启动，自动选题、写文章、预览、部署、提交代码，最后发一条报告。问题是，只要某一环出错，它就可能把错误放大。

我在实际任务里见过几类风险：

选题没有读历史文章，导致标题和观点重复；
Markdown 看似完整，但 frontmatter 日期或图片字段不符合站点规范；
构建通过了，但线上缓存还没刷新，Agent 却直接汇报成功；
浏览器登录状态失效，Agent 误以为网站不可用；
Git 仓库里有其他任务留下的改动，被一起提交。

这些问题不是 AI 不够聪明，而是岗位训练不够清楚。一个真人实习生刚来，也不能第一天就拿到所有账号、所有权限、所有发布按钮。AI Agent 也是一样。

所以我给万象片场数字员工定的原则是：先让它可解释，再让它可放权；先让它能交付一次，再让它长期值班。

二、第一阶段：人工审阅期，只允许它产出草稿

第一阶段的目标不是效率，而是校准。此时 Agent 可以做大量准备工作，但关键动作要有人审阅。

适合交给它的任务包括：

读取内容计划和已有文章；
提出 3 个未重复选题；
写出文章草稿和摘要；
生成小红书或公众号切片建议；
列出发布前检查项。

不适合交给它的任务包括：

直接修改账号资料；
直接删除旧内容；
直接群发公众号；
在没有验证的情况下发布生产站点；
把不确定的指标写成确定结论。

这个阶段最重要的不是“写得像不像人”，而是看它是否会主动读取上下文、是否知道哪些地方要停下来、是否能把不确定性讲清楚。

我会重点观察 4 个信号：

它有没有先看计划文件和历史内容；
它有没有避免重复标题；
它有没有自然带出万象片场的品牌主线；
它有没有把下一步说成可执行清单，而不是空泛建议。

只要这 4 点稳定，才进入第二阶段。

三、第二阶段：半自动执行期，让它做但必须自检

第二阶段开始，Agent 可以执行真实动作，但每个动作后必须自检。它不再只是写草稿，而是可以创建文件、启动本地预览、运行构建、部署站点、提交 Git。

但这里有一个关键：半自动不等于随便自动。

我会把任务拆成一条固定链路：

读取计划
  ↓
检查已有文章
  ↓
创建 Markdown
  ↓
本地预览
  ↓
检查首页 / 归档 / 文章页
  ↓
检查图片加载
  ↓
构建
  ↓
部署
  ↓
线上验证
  ↓
只提交相关文件

这条链路的意义，是让 Agent 每做一步都有证据。比如“文章写好了”不够，必须看到本地页面能打开；“部署成功”不够，必须看到线上文章页可访问；“Git 已同步”不够，必须确认工作区干净。

在万象片场的博客任务里，我尤其看重三类验证：

1. 内容验证

文章是否有清晰导语、小标题、步骤、清单和结尾？是否围绕 AI 自动化、数字员工、Agent 实战，而不是变成泛泛 AI 新闻？是否有长期资产价值？

2. 页面验证

首页是否出现新文章？文章页标题是否正确？图片是否加载完成？排版有没有明显断裂？如果只是命令行返回 200，但浏览器里看不到正确内容，也不能算完成。

3. 资产验证

本次改动是否只包含目标文章？有没有把无关文件一起提交？这一步很容易被忽略，但它决定了长期仓库是否干净。

第二阶段训练的是 Agent 的“自检能力”。它要学会的不是更多命令，而是每条命令之后如何判断结果。

四、第三阶段：边界内值班期，给它明确岗位和权限

当一个流程连续多次通过验证，就可以进入第三阶段：让 Agent 在固定边界内值班。

所谓边界，至少包括 5 件事：

主题边界：比如早间槽只写 AI 自动化 / 数字员工 / Agent 实战；
目录边界：只能操作 /Users/william/projects/cloudflare-blog，不能碰无关项目；
权限边界：博客可自动发布，公众号群发和账号资料修改需要确认；
质量边界：必须有摘要、heroImage、可执行步骤和下一步；
验证边界：预览、构建、部署、线上检查、Git 状态缺一不可。

这时的 Agent 才像一个真正的数字员工：它不是“想干什么就干什么”，而是在岗位说明书里稳定完成一组工作。

对个人创作者来说，这个阶段很有价值。因为你不再只是用 AI 写一篇文章，而是在搭建一套每天能产出、能验证、能积累资产的工作系统。

五、我的数字员工训练清单

如果你也想训练一个 AI Agent，不妨先用这份清单：

给它一个明确岗位，而不是一句模糊指令；
给它可读取的计划文件和历史记录；
先让它写草稿，不急着发布；
每个生产动作后都加验证步骤；
把失败分层记录：输入、生成、执行、验证、资产；
不给它不必要的高权限；
让它每次只提交相关改动；
定期复盘哪些任务可以放权，哪些任务必须保留人工确认。

这套方法的核心很朴素：把 AI Agent 当成一个会成长的协作者，而不是一次性魔法按钮。

六、下一步：从“会做事”到“会交接”

接下来，万象片场的数字员工还需要继续升级：不仅要能完成任务，还要能把任务交接清楚。比如每次发布后留下简短记录：选题来自哪里、改了哪个文件、验证了哪些页面、是否有后续可拆成小红书或公众号内容。

当这些记录越来越完整，博客就不只是文章集合，而会变成一套可复用的 AI 内容生产操作手册。

下一篇早间自动化文章，我会继续拆解一个更具体的问题：数字员工怎样把“今天做了什么”变成可追踪的增长线索，而不是只发一条空泛的成功报告。