把 AI Agent 当实习生训练:从人工审阅到半自动值班的三阶段
这篇文章记录万象片场训练数字员工的一套三阶段方法:先人工审阅,再半自动执行,最后让 AI Agent 在明确边界内值班,用真实验证而不是幻想全自动。
很多人第一次接触 AI Agent,会直接问一个问题:它能不能全自动帮我干活?
我现在更愿意把问题换成:如果它是一个刚入职的实习生,我应该怎么训练它,才能让它逐步变成可靠的数字员工?
在万象片场的博客自动发布、内容系统维护和本机工作流实验里,我越来越少追求“一步到位的全自动”,而是把 Agent 训练成一个有岗位、有权限、有检查清单、有复盘记录的协作对象。这样做看起来慢一点,但长期更稳,也更适合个人内容生意系统。
这篇文章记录我目前使用的三阶段训练方法:人工审阅期、半自动执行期、边界内值班期。
一、为什么不要一上来追求全自动?
全自动听起来很诱人:早上定时启动,自动选题、写文章、预览、部署、提交代码,最后发一条报告。问题是,只要某一环出错,它就可能把错误放大。
我在实际任务里见过几类风险:
- 选题没有读历史文章,导致标题和观点重复;
- Markdown 看似完整,但 frontmatter 日期或图片字段不符合站点规范;
- 构建通过了,但线上缓存还没刷新,Agent 却直接汇报成功;
- 浏览器登录状态失效,Agent 误以为网站不可用;
- Git 仓库里有其他任务留下的改动,被一起提交。
这些问题不是 AI 不够聪明,而是岗位训练不够清楚。一个真人实习生刚来,也不能第一天就拿到所有账号、所有权限、所有发布按钮。AI Agent 也是一样。
所以我给万象片场数字员工定的原则是:先让它可解释,再让它可放权;先让它能交付一次,再让它长期值班。
二、第一阶段:人工审阅期,只允许它产出草稿
第一阶段的目标不是效率,而是校准。此时 Agent 可以做大量准备工作,但关键动作要有人审阅。
适合交给它的任务包括:
- 读取内容计划和已有文章;
- 提出 3 个未重复选题;
- 写出文章草稿和摘要;
- 生成小红书或公众号切片建议;
- 列出发布前检查项。
不适合交给它的任务包括:
- 直接修改账号资料;
- 直接删除旧内容;
- 直接群发公众号;
- 在没有验证的情况下发布生产站点;
- 把不确定的指标写成确定结论。
这个阶段最重要的不是“写得像不像人”,而是看它是否会主动读取上下文、是否知道哪些地方要停下来、是否能把不确定性讲清楚。
我会重点观察 4 个信号:
- 它有没有先看计划文件和历史内容;
- 它有没有避免重复标题;
- 它有没有自然带出万象片场的品牌主线;
- 它有没有把下一步说成可执行清单,而不是空泛建议。
只要这 4 点稳定,才进入第二阶段。
三、第二阶段:半自动执行期,让它做但必须自检
第二阶段开始,Agent 可以执行真实动作,但每个动作后必须自检。它不再只是写草稿,而是可以创建文件、启动本地预览、运行构建、部署站点、提交 Git。
但这里有一个关键:半自动不等于随便自动。
我会把任务拆成一条固定链路:
读取计划
↓
检查已有文章
↓
创建 Markdown
↓
本地预览
↓
检查首页 / 归档 / 文章页
↓
检查图片加载
↓
构建
↓
部署
↓
线上验证
↓
只提交相关文件
这条链路的意义,是让 Agent 每做一步都有证据。比如“文章写好了”不够,必须看到本地页面能打开;“部署成功”不够,必须看到线上文章页可访问;“Git 已同步”不够,必须确认工作区干净。
在万象片场的博客任务里,我尤其看重三类验证:
1. 内容验证
文章是否有清晰导语、小标题、步骤、清单和结尾?是否围绕 AI 自动化、数字员工、Agent 实战,而不是变成泛泛 AI 新闻?是否有长期资产价值?
2. 页面验证
首页是否出现新文章?文章页标题是否正确?图片是否加载完成?排版有没有明显断裂?如果只是命令行返回 200,但浏览器里看不到正确内容,也不能算完成。
3. 资产验证
本次改动是否只包含目标文章?有没有把无关文件一起提交?这一步很容易被忽略,但它决定了长期仓库是否干净。
第二阶段训练的是 Agent 的“自检能力”。它要学会的不是更多命令,而是每条命令之后如何判断结果。
四、第三阶段:边界内值班期,给它明确岗位和权限
当一个流程连续多次通过验证,就可以进入第三阶段:让 Agent 在固定边界内值班。
所谓边界,至少包括 5 件事:
- 主题边界:比如早间槽只写 AI 自动化 / 数字员工 / Agent 实战;
- 目录边界:只能操作
/Users/william/projects/cloudflare-blog,不能碰无关项目; - 权限边界:博客可自动发布,公众号群发和账号资料修改需要确认;
- 质量边界:必须有摘要、heroImage、可执行步骤和下一步;
- 验证边界:预览、构建、部署、线上检查、Git 状态缺一不可。
这时的 Agent 才像一个真正的数字员工:它不是“想干什么就干什么”,而是在岗位说明书里稳定完成一组工作。
对个人创作者来说,这个阶段很有价值。因为你不再只是用 AI 写一篇文章,而是在搭建一套每天能产出、能验证、能积累资产的工作系统。
五、我的数字员工训练清单
如果你也想训练一个 AI Agent,不妨先用这份清单:
- 给它一个明确岗位,而不是一句模糊指令;
- 给它可读取的计划文件和历史记录;
- 先让它写草稿,不急着发布;
- 每个生产动作后都加验证步骤;
- 把失败分层记录:输入、生成、执行、验证、资产;
- 不给它不必要的高权限;
- 让它每次只提交相关改动;
- 定期复盘哪些任务可以放权,哪些任务必须保留人工确认。
这套方法的核心很朴素:把 AI Agent 当成一个会成长的协作者,而不是一次性魔法按钮。
六、下一步:从“会做事”到“会交接”
接下来,万象片场的数字员工还需要继续升级:不仅要能完成任务,还要能把任务交接清楚。比如每次发布后留下简短记录:选题来自哪里、改了哪个文件、验证了哪些页面、是否有后续可拆成小红书或公众号内容。
当这些记录越来越完整,博客就不只是文章集合,而会变成一套可复用的 AI 内容生产操作手册。
下一篇早间自动化文章,我会继续拆解一个更具体的问题:数字员工怎样把“今天做了什么”变成可追踪的增长线索,而不是只发一条空泛的成功报告。