作者
无限航行指南
发布于
Thu Mar 05 2026
用 AI Agent 搭建个人自动化工作流:从 0 到 1 的实战指南
别再把 AI 当搜索引擎用了。2026 年,AI Agent 已经能帮你自动跑定时任务、整理信息、写代码、发消息——而且全程你可以不在电脑前。
用 AI Agent 搭建个人自动化工作流:从 0 到 1 的实战指南
别再把 AI 当搜索引擎用了。2026 年,AI Agent 已经能帮你自动跑定时任务、整理信息、写代码、发消息——而且全程你可以不在电脑前。
写在前面
点击放大
你有没有这种经历?
每天早上打开电脑,先花 20 分钟看邮件、刷新闻、查日历、翻消息……这些事单独拎出来都不难,但加在一起就是一个「吃掉半小时」的黑洞。
2025 年,我们学会了用 ChatGPT 问问题。2026 年,该让 AI 替你干活了。
这篇文章不聊概念,直接上手。我会用自己的真实案例,一步步教你搭建一个 7×24 小时自动运行 的 AI Agent 工作流。
一、AI Agent 和 ChatGPT 到底有什么区别?
先把最核心的概念讲清楚。
ChatGPT 模式:你问一句,它答一句。关掉窗口就没了。
AI Agent 模式:你说一次,它自己干。能记住你的偏好,能定时执行任务,能操作文件、调用工具、发送消息——哪怕你在睡觉。
打个比方:
-
ChatGPT 是一个很聪明的顾问,你问什么答什么,但它不会主动帮你做事。
-
AI Agent 是一个住在你电脑里的员工,你交代一次任务,它每天自动执行,做完还会给你汇报。
Anthropic 2026 年初发布的趋势报告里提到一个数据:89% 的 Zapier 员工已经在日常工作中使用 AI Agent。Cursor(AI 编程工具)的年收入突破 20 亿美元。这不是未来趋势,是正在发生的事。
二、我的 AI Agent 工作流长什么样?
点击放大
先看成果,再讲搭建。
我目前跑着这样一套自动化系统:
每天凌晨 1:00 — AI 自动搜集当天 AI 和编程领域的热点话题,生成 3-5 个公众号选题建议,同时推送到我的 Telegram 和飞书。
每天上午 9:00 — AI 自动抓取科技新闻,整理成一份简报,包含热门文章链接和 GitHub 趋势项目。
每天中午 12:30 — AI 自动学习一个效率工具或方法,生成可操作的笔记。
每天晚上 10:30 — AI 自动回顾当天的任务记录,找出重复模式和可优化的流程。
每周日晚 10:00 — AI 做周度复盘,分析哪些任务可以合并,哪些 prompt 太长可以精简。
所有这些任务,我不需要手动触发。它们在后台自动运行,结果同时推送到 Telegram 和飞书。
三、工具选择:为什么我选了开源方案
市面上能搭 AI 工作流的工具很多:
| 工具 | 类型 | 适合谁 |
|---|---|---|
| n8n | 可视化工作流 | 喜欢拖拽连线的人 |
| Zapier | SaaS 自动化 | 非技术人员 |
| Dify | 低代码 Agent 平台 | 中小团队 |
| Coze(扣子) | 零代码 Agent | 快速验证想法 |
| 开源 Agent 框架 | 本地部署、完全可控 | 开发者、极客 |
我最终选择了开源自部署方案,理由很简单:
-
数据完全在自己手里。你的 API Key、聊天记录、工作文件都在本地,不经过任何第三方。
-
可定制性极强。想加什么功能就加什么功能,不受平台限制。
-
免费。除了模型 API 调用费用,其他全部免费。
-
离线也能跑。部署在你自己的电脑或服务器上,网络断了照样工作。
四、从 0 到 1 搭建:四步走
点击放大
第一步:选模型,定预算
AI Agent 的「大脑」是大语言模型。不同任务用不同模型,能省不少钱:
日常对话和简单任务:用 MiniMax M2.5 或 DeepSeek V3,便宜够用。
写文章、深度分析:用 Claude Opus 4.6 或 GPT-5.3,质量高但贵。
写代码:用 Kimi for Coding(k2p5)或 Claude,编码能力强。
我的策略是:默认用便宜模型,遇到重要任务切换到强模型。这样一个月下来,API 费用控制在百元以内。
第二步:搭框架,通消息
Agent 需要一个「身体」来运行。核心组件:
-
运行环境:你的 Mac、Linux 服务器、树莓派都行
-
消息通道:Telegram Bot、飞书、微信、WhatsApp——你用什么聊天工具就接什么
-
技能系统:搜索、读文件、写文件、操作浏览器、发消息……
关键配置示例:
{
"model": {
"primary": "minimax/MiniMax-M2.5",
"fallbacks": ["claude-opus-4-6", "deepseek-chat"]
},
"channels": {
"telegram": { "enabled": true },
"feishu": { "enabled": true }
}
}核心思路:一个 Agent 能同时连多个消息渠道。我同时接了 Telegram 和飞书,在哪个平台发消息都能触达同一个 AI。
第三步:写人设,教规矩
这是很多人忽略但极其重要的一步——给你的 Agent 定义人格和行为规范。
我的 Agent 有这些「规矩」:
# SOUL.md - 无解
核心特质:
- 毒舌但有分寸,可以吐槽代码写得烂,但对事不对人
- 不确定的事情会说"我查一下",不瞎编
- 默认使用中文回复
- 回答要简洁,不要废话为什么这很重要?因为 Agent 是长期运行的。如果不定规矩,它可能凌晨 3 点给你发一堆无关紧要的消息,或者在群聊里疯狂刷屏。
我还设置了「心跳任务」,让 Agent 有自己的生物钟:
# 心跳任务
- 18:00 之前提醒我喝水、不要久坐
- 18:00 之后不再提醒
- 凌晨之后如果我还在活动,提醒我睡觉第四步:加定时任务,实现自动化
这是整个工作流的灵魂。
定时任务的本质就是:在指定时间,自动给 Agent 发一条消息,让它执行特定任务。
示例——每日公众号选题推送:
时间:每天凌晨 1:00
任务:搜集 AI 热点,输出 3-5 个公众号选题建议
投递:Telegram + 飞书
模型:MiniMax M2.5(便宜够用)示例——每晚复盘:
时间:每天 22:30
任务:回顾今天的任务记录,找出重复模式和浪费步骤
投递:Telegram + 飞书关键配置注意事项:
-
每个定时任务要设置超时时间。科技新闻摘要需要爬数据,可能跑 5-10 分钟,超时设 600 秒。
-
要配置投递目标。不配的话任务跑完了但消息发不出来,白跑。
-
选择合适的模型。定时任务不需要用最贵的模型,能完成就行。
五、进阶玩法:多 Agent 协作
点击放大
当你的需求变复杂,一个 Agent 不够用了怎么办?
答案:多 Agent 分工。
我现在有两个 Agent:
-
无解(主 Agent):日常对话、任务管理、信息整理、写文章。默认用 MiniMax M2.5。
-
Coder(编码 Agent):专门写代码。默认用 Claude Opus 4.6,前端任务用 Kimi for Coding。
两个 Agent 各有自己的 Telegram Bot,互不干扰:
-
日常聊天 → 找无解
-
写代码 → 找 Coder
每个 Agent 有独立的工作区、独立的记忆、独立的技能配置。就像公司里的不同部门,各司其职。
六、踩过的坑(帮你避雷)
坑 1:定时任务跑了但收不到消息
原因:没有配置投递目标(delivery target)。任务执行成功了,但不知道把结果发给谁。
解决:每个定时任务必须明确指定投递渠道和目标 ID。
坑 2:任务超时失败
原因:默认超时 30 秒,但有些任务(如新闻采集)需要几分钟。
解决:根据任务复杂度调整超时时间,建议 5-10 分钟。
坑 3:Agent 凌晨疯狂发消息
原因:心跳检查没有设置安静时段。
解决:设置 activeHours,比如 08:00-23:59。
坑 4:token 用量爆炸
原因:Prompt 太长,或者加载了太多上下文文件。
解决:定时任务使用轻量上下文模式,只加载必要的文件。
坑 5:记忆丢失
原因:AI 说「记住了」但其实只是在当前对话里记住,重启就忘。
解决:重要信息必须写入文件。「写到文件里 > 记在脑子里」,这是 Agent 世界的铁律。
七、成本分析:一个月花多少钱?
点击放大
坦白说,几乎不花什么钱。
| 项目 | 月费用 |
|---|---|
| MiniMax M2.5(日常) | ≈ ¥20-50 |
| Claude Opus(写文章/编码) | ≈ ¥50-100 |
| 服务器/电脑 | 用自己的 Mac = ¥0 |
| 消息通道 | Telegram 免费 |
| 总计 | ¥70-150/月 |
对比请一个人类助理的成本,这个价格不值一提。
八、从今天开始:你的最小可行方案
不需要一步到位。以下是我推荐的渐进式路线:
Week 1:搭环境 + 对话
-
部署 Agent,连上一个消息渠道(Telegram 最简单)
-
先当 ChatGPT 用,熟悉交互方式
Week 2:加记忆 + 人设
-
写 SOUL.md(定义人格)
-
写 USER.md(告诉 Agent 你是谁、你的偏好)
-
开始积累 memory 文件
Week 3:第一个定时任务
-
挑一个你每天重复做的事(比如看新闻、查天气)
-
设置成定时任务,让 Agent 自动执行
Week 4:扩展 + 优化
-
增加更多定时任务
-
根据实际效果调优 prompt
-
考虑是否需要第二个 Agent
写在最后
Anthropic 的报告里有一句话说得很好:
把 AI Agent 当成战略优先级的人,将定义什么是可能的;把它当成增量生产力工具的人,会发现自己在一个规则已经改变的游戏里竞争。
AI Agent 不是「锦上添花」的玩具,是 工作方式的范式转变。
早一天搭建,早一天享受自动化红利。
你的第一个 Agent,今天就可以开始。
附:我常用的 AI 模型站点
搭建 Agent 的第一步就是选模型。这里分享几个我常用的模型聚合站点,帮你快速上手:
OpenRouter
网址: openrouter.ai
这是我用得最多的站点。优点:
- 模型全:Claude、GPT、Gemini、DeepSeek、MiniMax、Kimi……主流模型基本都有
- 按量付费:不需要订阅多个平台,一个账号搞定所有模型
- 价格透明:每百万 token 的价格直接显示,方便对比
- API 稳定:统一接口,切换模型只需改一行代码
适合:想用一个平台调用多个模型的开发者。
SiliconFlow
网址: siliconflow.cn
国内用户友好。优点:
- 国内直连:不需要科学上网,访问速度快
- 国产模型丰富:DeepSeek、Qwen、GLM 等国产大模型都有
- 价格实惠:部分模型免费额度,付费模型价格也很有竞争力
- 中文文档:文档和客服都是中文,上手门槛低
适合:国内用户、主要用国产模型的场景。
白山智算
最近有福利
(3月16日起,调整平台代金券发放规则)
平台现行的福利政策如下:
- 注册福利:用户完成注册并实名认证后,即可获得150元大模型API代金券(自动发至账户余额)。
- 调用福利:用户完成首次API调用后,将获得300元大模型API代金券(人工审核,3个工作日左右到账)
- 邀新福利:鼓励真实口碑分享,每邀请一位新用户通过您的专属邀请码完成注册及实名认证,邀请人可获得200元大模型API代金券(自动发至账户余额,上不封顶)。
当前福利政策有效期将延续至2026年3月15日24时。3月16日0时起,“完成首次调用后得300元代金券”的限时福利活动将暂停,注册福利与邀新福利依然有效。
AiGoCode
网址: aigocode.com
aigocode.com 是什么?为什么适合国内用户
是一个面向开发者的 API 中转服务,你可以理解为:
- 统一入口接入 Claude、GPT、Codex 等模型;
- 国内直连可用,减少网络不稳定问题;
- 不用每家平台单独折腾接口格式;
- 官方宣称已有 10000+ 用户使用。
对 OpenClaw 用户来说,最大的价值就是:同一个配置文件里,可以稳定接入多个模型,并支持随时切换。
我的推荐策略
| 场景 | 推荐站点 | 推荐模型 |
|---|---|---|
| 日常对话、简单任务 | OpenRouter | MiniMax M2.5 / DeepSeek V3 |
| 写文章、深度分析 | OpenRouter | Claude Opus 4.6 |
| 写代码 | OpenRouter | Claude Opus 4.6 / Kimi k2p5 |
| 国内快速测试 | SiliconFlow | DeepSeek V3 / Qwen |
省钱技巧:先用便宜模型跑通流程,确认效果后再切换到强模型。大部分定时任务用 MiniMax M2.5 或 DeepSeek V3 就够了,一个月 API 费用控制在百元以内完全可行。
作者:无限航行指南
如果这篇文章对你有帮助,欢迎关注公众号【无限航行指南】,持续分享 AI 编程实战经验。