AI Agent 每日风险预检:数字员工执行前先检查哪些事

这篇文章记录万象片场如何给 AI Agent 增加每日风险预检:从任务边界、文件状态、权限动作到验收证据,让数字员工在执行前先排雷。

AI自动化数字员工Agent实战风险控制
电脑屏幕上的检查清单和工作台,象征 AI Agent 执行任务前的风险预检

在万象片场的自动发布系统里,我越来越把 AI Agent 当成一名真正会“上岗”的数字员工,而不是一个只负责回答问题的聊天窗口。

既然是员工,就不能只看它能不能完成任务,还要看它在动手之前会不会先排查风险。尤其是博客发布、Cloudflare 部署、Git 提交、跨平台内容分发这类动作,一旦执行错对象、提交错文件、重复发布标题,后面都需要人工返工。

所以我给数字员工加了一道很朴素的流程:每日风险预检。它不追求复杂,也不试图把所有事情自动化,而是在 Agent 真正写文件、构建、部署之前,先确认今天的任务是不是安全、明确、可验收。

这篇文章就是万象片场当前使用的预检思路,适合任何正在把 AI Agent 接入真实工作流的人参考。

一、先确认今天只做一件主任务

AI Agent 最容易失控的地方,不是不会做,而是太愿意“顺手多做一点”。

比如早间槽的任务本来只是发布一篇 AI 自动化方向博客,但它可能顺手想优化导航、修改其他站点、补一份社媒文案,甚至尝试检查一堆无关服务。对个人项目来说,这种热心反而会制造风险。

所以预检第一条是:

今天的主任务是什么?
哪些动作属于任务内?
哪些动作明确不做?

以万象片场博客为例,早间槽的主任务就是:读取计划、选择未发布主题、写 Markdown、本地预览、构建、部署、线上验证、Git 同步。除此之外,不碰无关项目,不改账号资料,不替用户对外群发消息。

任务边界越清楚,数字员工越像一个可靠助理,而不是一个到处乱跑的实习生。

二、检查计划文件和已发布文章

长期内容系统最怕重复。

如果 Agent 不先读取计划文件和已有文章,很容易写出看似新鲜、其实已经发布过的选题。尤其当一个博客进入几十篇文章之后,很多主题会高度接近:数字员工、定时任务、验收清单、权限边界、日志、复盘,看起来都在同一个领域里。

我的做法是让预检固定读取两类现场:

  1. 内容计划文件:确认今天属于哪个槽位,优先主题队列是什么;
  2. 已有文章标题:确认标题和角度没有重复,必要时选择同一主线下更细的切口。

这一步不是为了“管理感”,而是为了让 AI 自动化站在真实内容资产上继续生长。万象片场的博客不是一次性生成一堆文章,而是每天给同一个内容系统增加一块可复用的积木。

三、检查 Git 工作区是否干净

任何会写文件的 Agent,都必须学会尊重 Git 工作区。

如果开始任务前工作区已经有未提交改动,Agent 就要判断:这是上一轮未完成的内容,还是用户手动修改的文件?能不能覆盖?能不能一起提交?如果不检查,最后很容易把无关改动混进一次博客提交里。

一个简单的预检动作是:

git status --short

如果结果为空,说明可以从干净状态开始。如果结果不为空,就要只改本次任务需要的文件,并在提交前再次确认差异。

我现在把这条当成数字员工的“进片场前检查设备”:不是高级技巧,但能避免很多低级事故。

四、把高权限动作放到后面

AI Agent 的动作可以粗略分成三层:

  • 低风险动作:读取文件、检索文章、生成草稿;
  • 中风险动作:写入 Markdown、修改页面、调整配置;
  • 高风险动作:部署线上、提交推送、调用外部平台发布。

每日风险预检的意义,就是让 Agent 不要一上来就做高权限动作。

正确顺序应该是:先读现场,再写草稿,再本地预览,再构建,最后才部署和 Git 同步。每一层都通过,才进入下一层。

这也解释了为什么我不喜欢“直接生成并发布”的黑箱自动化。真正可长期运行的数字员工,应该像片场流程一样:开机前有通告单,拍摄中有场记,收工前有验收。

五、预检还要定义验收证据

很多自动化任务会停在一句“已完成”。但对真实项目来说,“已完成”必须有证据。

对于一篇博客文章,至少要有这些验收证据:

  1. Markdown 文件存在,frontmatter 合法;
  2. 本地首页、归档页、文章页能看到新标题;
  3. hero 图片加载正常;
  4. npm run build 通过;
  5. npm run deploy 成功;
  6. 线上文章 URL 可以打开;
  7. Git 提交和推送完成。

数字员工如果不能提供这些证据,就不能只说“完成了”。它最多只能说“草稿已生成”或“构建已通过”。

这也是万象片场做内容自动化时很看重的一点:自动化不是减少责任,而是把责任拆成可检查的步骤。

六、我的每日风险预检模板

目前我会把预检压缩成一份很短的清单:

1. 今天的唯一主任务是什么?
2. 计划文件是否已读取?
3. 已有文章标题是否已检查?
4. 是否会触碰无关项目或账号?
5. Git 工作区是否干净?
6. 本次要写入哪些文件?
7. 哪些动作必须在 build 通过后才能做?
8. 最终用哪些证据证明任务完成?

这份清单不复杂,但它能把“AI 很聪明”转成“AI 很可靠”。

对一个人运营的内容系统来说,可靠比炫技更重要。因为真正的目标不是让 Agent 偶尔完成一次漂亮操作,而是让它每天都能稳定地为内容资产添砖加瓦。

结尾:先预检,再自动化

如果你也在搭建自己的数字员工,我建议不要一开始追求全自动,而是先让它学会做风险预检。

先确认任务,先读取现场,先检查权限,先定义验收,再让它执行。这样 AI Agent 才不会只是一个会输出内容的工具,而会逐渐变成一个能参与真实运营的工作伙伴。

万象片场后续会继续把这些流程沉淀成可复用的 SOP:从每日预检、执行日志、异常分级,到周报复盘和内容产品化,让一个人的 AI 内容系统真正跑起来。