把 AI Agent 当实习生训练:从人工审阅到半自动值班的三阶段

这篇文章记录万象片场训练数字员工的一套三阶段方法:先人工审阅,再半自动执行,最后让 AI Agent 在明确边界内值班,用真实验证而不是幻想全自动。

AI自动化数字员工Agent实战工作流
会议桌上的团队白板和笔记本电脑,象征把 AI Agent 像实习生一样分阶段训练成数字员工

很多人第一次接触 AI Agent,会直接问一个问题:它能不能全自动帮我干活?

我现在更愿意把问题换成:如果它是一个刚入职的实习生,我应该怎么训练它,才能让它逐步变成可靠的数字员工?

在万象片场的博客自动发布、内容系统维护和本机工作流实验里,我越来越少追求“一步到位的全自动”,而是把 Agent 训练成一个有岗位、有权限、有检查清单、有复盘记录的协作对象。这样做看起来慢一点,但长期更稳,也更适合个人内容生意系统。

这篇文章记录我目前使用的三阶段训练方法:人工审阅期、半自动执行期、边界内值班期。

一、为什么不要一上来追求全自动?

全自动听起来很诱人:早上定时启动,自动选题、写文章、预览、部署、提交代码,最后发一条报告。问题是,只要某一环出错,它就可能把错误放大。

我在实际任务里见过几类风险:

  • 选题没有读历史文章,导致标题和观点重复;
  • Markdown 看似完整,但 frontmatter 日期或图片字段不符合站点规范;
  • 构建通过了,但线上缓存还没刷新,Agent 却直接汇报成功;
  • 浏览器登录状态失效,Agent 误以为网站不可用;
  • Git 仓库里有其他任务留下的改动,被一起提交。

这些问题不是 AI 不够聪明,而是岗位训练不够清楚。一个真人实习生刚来,也不能第一天就拿到所有账号、所有权限、所有发布按钮。AI Agent 也是一样。

所以我给万象片场数字员工定的原则是:先让它可解释,再让它可放权;先让它能交付一次,再让它长期值班。

二、第一阶段:人工审阅期,只允许它产出草稿

第一阶段的目标不是效率,而是校准。此时 Agent 可以做大量准备工作,但关键动作要有人审阅。

适合交给它的任务包括:

  1. 读取内容计划和已有文章;
  2. 提出 3 个未重复选题;
  3. 写出文章草稿和摘要;
  4. 生成小红书或公众号切片建议;
  5. 列出发布前检查项。

不适合交给它的任务包括:

  • 直接修改账号资料;
  • 直接删除旧内容;
  • 直接群发公众号;
  • 在没有验证的情况下发布生产站点;
  • 把不确定的指标写成确定结论。

这个阶段最重要的不是“写得像不像人”,而是看它是否会主动读取上下文、是否知道哪些地方要停下来、是否能把不确定性讲清楚。

我会重点观察 4 个信号:

  • 它有没有先看计划文件和历史内容;
  • 它有没有避免重复标题;
  • 它有没有自然带出万象片场的品牌主线;
  • 它有没有把下一步说成可执行清单,而不是空泛建议。

只要这 4 点稳定,才进入第二阶段。

三、第二阶段:半自动执行期,让它做但必须自检

第二阶段开始,Agent 可以执行真实动作,但每个动作后必须自检。它不再只是写草稿,而是可以创建文件、启动本地预览、运行构建、部署站点、提交 Git。

但这里有一个关键:半自动不等于随便自动。

我会把任务拆成一条固定链路:

读取计划

检查已有文章

创建 Markdown

本地预览

检查首页 / 归档 / 文章页

检查图片加载

构建

部署

线上验证

只提交相关文件

这条链路的意义,是让 Agent 每做一步都有证据。比如“文章写好了”不够,必须看到本地页面能打开;“部署成功”不够,必须看到线上文章页可访问;“Git 已同步”不够,必须确认工作区干净。

在万象片场的博客任务里,我尤其看重三类验证:

1. 内容验证

文章是否有清晰导语、小标题、步骤、清单和结尾?是否围绕 AI 自动化、数字员工、Agent 实战,而不是变成泛泛 AI 新闻?是否有长期资产价值?

2. 页面验证

首页是否出现新文章?文章页标题是否正确?图片是否加载完成?排版有没有明显断裂?如果只是命令行返回 200,但浏览器里看不到正确内容,也不能算完成。

3. 资产验证

本次改动是否只包含目标文章?有没有把无关文件一起提交?这一步很容易被忽略,但它决定了长期仓库是否干净。

第二阶段训练的是 Agent 的“自检能力”。它要学会的不是更多命令,而是每条命令之后如何判断结果。

四、第三阶段:边界内值班期,给它明确岗位和权限

当一个流程连续多次通过验证,就可以进入第三阶段:让 Agent 在固定边界内值班。

所谓边界,至少包括 5 件事:

  1. 主题边界:比如早间槽只写 AI 自动化 / 数字员工 / Agent 实战;
  2. 目录边界:只能操作 /Users/william/projects/cloudflare-blog,不能碰无关项目;
  3. 权限边界:博客可自动发布,公众号群发和账号资料修改需要确认;
  4. 质量边界:必须有摘要、heroImage、可执行步骤和下一步;
  5. 验证边界:预览、构建、部署、线上检查、Git 状态缺一不可。

这时的 Agent 才像一个真正的数字员工:它不是“想干什么就干什么”,而是在岗位说明书里稳定完成一组工作。

对个人创作者来说,这个阶段很有价值。因为你不再只是用 AI 写一篇文章,而是在搭建一套每天能产出、能验证、能积累资产的工作系统。

五、我的数字员工训练清单

如果你也想训练一个 AI Agent,不妨先用这份清单:

  • 给它一个明确岗位,而不是一句模糊指令;
  • 给它可读取的计划文件和历史记录;
  • 先让它写草稿,不急着发布;
  • 每个生产动作后都加验证步骤;
  • 把失败分层记录:输入、生成、执行、验证、资产;
  • 不给它不必要的高权限;
  • 让它每次只提交相关改动;
  • 定期复盘哪些任务可以放权,哪些任务必须保留人工确认。

这套方法的核心很朴素:把 AI Agent 当成一个会成长的协作者,而不是一次性魔法按钮。

六、下一步:从“会做事”到“会交接”

接下来,万象片场的数字员工还需要继续升级:不仅要能完成任务,还要能把任务交接清楚。比如每次发布后留下简短记录:选题来自哪里、改了哪个文件、验证了哪些页面、是否有后续可拆成小红书或公众号内容。

当这些记录越来越完整,博客就不只是文章集合,而会变成一套可复用的 AI 内容生产操作手册。

下一篇早间自动化文章,我会继续拆解一个更具体的问题:数字员工怎样把“今天做了什么”变成可追踪的增长线索,而不是只发一条空泛的成功报告。