用 AI Agent 搭建个人自动化工作流：从 0 到 1 的实战指南

别再把 AI 当搜索引擎用了。2026 年，AI Agent 已经能帮你自动跑定时任务、整理信息、写代码、发消息——而且全程你可以不在电脑前。

别再把 AI 当搜索引擎用了。2026 年，AI Agent 已经能帮你自动跑定时任务、整理信息、写代码、发消息——而且全程你可以不在电脑前。

写在前面

点击放大

你有没有这种经历？

每天早上打开电脑，先花 20 分钟看邮件、刷新闻、查日历、翻消息……这些事单独拎出来都不难，但加在一起就是一个「吃掉半小时」的黑洞。

2025 年，我们学会了用 ChatGPT 问问题。2026 年，该让 AI 替你干活了。

这篇文章不聊概念，直接上手。我会用自己的真实案例，一步步教你搭建一个 7×24 小时自动运行 的 AI Agent 工作流。

一、AI Agent 和 ChatGPT 到底有什么区别？

先把最核心的概念讲清楚。

ChatGPT 模式：你问一句，它答一句。关掉窗口就没了。

AI Agent 模式：你说一次，它自己干。能记住你的偏好，能定时执行任务，能操作文件、调用工具、发送消息——哪怕你在睡觉。

打个比方：

ChatGPT 是一个很聪明的顾问，你问什么答什么，但它不会主动帮你做事。
AI Agent 是一个住在你电脑里的员工，你交代一次任务，它每天自动执行，做完还会给你汇报。

Anthropic 2026 年初发布的趋势报告里提到一个数据：89% 的 Zapier 员工已经在日常工作中使用 AI Agent。Cursor（AI 编程工具）的年收入突破 20 亿美元。这不是未来趋势，是正在发生的事。

二、我的 AI Agent 工作流长什么样？

点击放大

先看成果，再讲搭建。

我目前跑着这样一套自动化系统：

每天凌晨 1:00 — AI 自动搜集当天 AI 和编程领域的热点话题，生成 3-5 个公众号选题建议，同时推送到我的 Telegram 和飞书。

每天上午 9:00 — AI 自动抓取科技新闻，整理成一份简报，包含热门文章链接和 GitHub 趋势项目。

每天中午 12:30 — AI 自动学习一个效率工具或方法，生成可操作的笔记。

每天晚上 10:30 — AI 自动回顾当天的任务记录，找出重复模式和可优化的流程。

每周日晚 10:00 — AI 做周度复盘，分析哪些任务可以合并，哪些 prompt 太长可以精简。

所有这些任务，我不需要手动触发。它们在后台自动运行，结果同时推送到 Telegram 和飞书。

三、工具选择：为什么我选了开源方案

市面上能搭 AI 工作流的工具很多：

工具	类型	适合谁
n8n	可视化工作流	喜欢拖拽连线的人
Zapier	SaaS 自动化	非技术人员
Dify	低代码 Agent 平台	中小团队
Coze（扣子）	零代码 Agent	快速验证想法
开源 Agent 框架	本地部署、完全可控	开发者、极客

我最终选择了开源自部署方案，理由很简单：

数据完全在自己手里。你的 API Key、聊天记录、工作文件都在本地，不经过任何第三方。
可定制性极强。想加什么功能就加什么功能，不受平台限制。
免费。除了模型 API 调用费用，其他全部免费。
离线也能跑。部署在你自己的电脑或服务器上，网络断了照样工作。

四、从 0 到 1 搭建：四步走

点击放大

第一步：选模型，定预算

AI Agent 的「大脑」是大语言模型。不同任务用不同模型，能省不少钱：

日常对话和简单任务：用 MiniMax M2.5 或 DeepSeek V3，便宜够用。

写文章、深度分析：用 Claude Opus 4.6 或 GPT-5.3，质量高但贵。

写代码：用 Kimi for Coding（k2p5）或 Claude，编码能力强。

我的策略是：默认用便宜模型，遇到重要任务切换到强模型。这样一个月下来，API 费用控制在百元以内。

第二步：搭框架，通消息

Agent 需要一个「身体」来运行。核心组件：

运行环境：你的 Mac、Linux 服务器、树莓派都行
消息通道：Telegram Bot、飞书、微信、WhatsApp——你用什么聊天工具就接什么
技能系统：搜索、读文件、写文件、操作浏览器、发消息……

关键配置示例：

{
  "model": {
    "primary": "minimax/MiniMax-M2.5",
    "fallbacks": ["claude-opus-4-6", "deepseek-chat"]
  },
  "channels": {
    "telegram": { "enabled": true },
    "feishu": { "enabled": true }
  }
}

核心思路：一个 Agent 能同时连多个消息渠道。我同时接了 Telegram 和飞书，在哪个平台发消息都能触达同一个 AI。

第三步：写人设，教规矩

这是很多人忽略但极其重要的一步——给你的 Agent 定义人格和行为规范。

我的 Agent 有这些「规矩」：

# SOUL.md - 无解

核心特质：
- 毒舌但有分寸，可以吐槽代码写得烂，但对事不对人
- 不确定的事情会说"我查一下"，不瞎编
- 默认使用中文回复
- 回答要简洁，不要废话

为什么这很重要？因为 Agent 是长期运行的。如果不定规矩，它可能凌晨 3 点给你发一堆无关紧要的消息，或者在群聊里疯狂刷屏。

我还设置了「心跳任务」，让 Agent 有自己的生物钟：

# 心跳任务

- 18:00 之前提醒我喝水、不要久坐
- 18:00 之后不再提醒
- 凌晨之后如果我还在活动，提醒我睡觉

第四步：加定时任务，实现自动化

这是整个工作流的灵魂。

定时任务的本质就是：在指定时间，自动给 Agent 发一条消息，让它执行特定任务。

示例——每日公众号选题推送：

时间：每天凌晨 1:00
任务：搜集 AI 热点，输出 3-5 个公众号选题建议
投递：Telegram + 飞书
模型：MiniMax M2.5（便宜够用）

示例——每晚复盘：

时间：每天 22:30
任务：回顾今天的任务记录，找出重复模式和浪费步骤
投递：Telegram + 飞书

关键配置注意事项：

每个定时任务要设置超时时间。科技新闻摘要需要爬数据，可能跑 5-10 分钟，超时设 600 秒。
要配置投递目标。不配的话任务跑完了但消息发不出来，白跑。
选择合适的模型。定时任务不需要用最贵的模型，能完成就行。

五、进阶玩法：多 Agent 协作

点击放大

当你的需求变复杂，一个 Agent 不够用了怎么办？

答案：多 Agent 分工。

我现在有两个 Agent：

无解（主 Agent）：日常对话、任务管理、信息整理、写文章。默认用 MiniMax M2.5。
Coder（编码 Agent）：专门写代码。默认用 Claude Opus 4.6，前端任务用 Kimi for Coding。

两个 Agent 各有自己的 Telegram Bot，互不干扰：

日常聊天 → 找无解
写代码 → 找 Coder

每个 Agent 有独立的工作区、独立的记忆、独立的技能配置。就像公司里的不同部门，各司其职。

六、踩过的坑（帮你避雷）

坑 1：定时任务跑了但收不到消息

原因：没有配置投递目标（delivery target）。任务执行成功了，但不知道把结果发给谁。

解决：每个定时任务必须明确指定投递渠道和目标 ID。

坑 2：任务超时失败

原因：默认超时 30 秒，但有些任务（如新闻采集）需要几分钟。

解决：根据任务复杂度调整超时时间，建议 5-10 分钟。

坑 3：Agent 凌晨疯狂发消息

原因：心跳检查没有设置安静时段。

解决：设置 activeHours，比如 08:00-23:59。

坑 4：token 用量爆炸

原因：Prompt 太长，或者加载了太多上下文文件。

解决：定时任务使用轻量上下文模式，只加载必要的文件。

坑 5：记忆丢失

原因：AI 说「记住了」但其实只是在当前对话里记住，重启就忘。

解决：重要信息必须写入文件。「写到文件里 > 记在脑子里」，这是 Agent 世界的铁律。

七、成本分析：一个月花多少钱？

点击放大

坦白说，几乎不花什么钱。

项目	月费用
MiniMax M2.5（日常）	≈ ¥20-50
Claude Opus（写文章/编码）	≈ ¥50-100
服务器/电脑	用自己的 Mac = ¥0
消息通道	Telegram 免费
总计	¥70-150/月

对比请一个人类助理的成本，这个价格不值一提。

八、从今天开始：你的最小可行方案

不需要一步到位。以下是我推荐的渐进式路线：

Week 1：搭环境 + 对话

部署 Agent，连上一个消息渠道（Telegram 最简单）
先当 ChatGPT 用，熟悉交互方式

Week 2：加记忆 + 人设

写 SOUL.md（定义人格）
写 USER.md（告诉 Agent 你是谁、你的偏好）
开始积累 memory 文件

Week 3：第一个定时任务

挑一个你每天重复做的事（比如看新闻、查天气）
设置成定时任务，让 Agent 自动执行

Week 4：扩展 + 优化

增加更多定时任务
根据实际效果调优 prompt
考虑是否需要第二个 Agent

写在最后

Anthropic 的报告里有一句话说得很好：

把 AI Agent 当成战略优先级的人，将定义什么是可能的；把它当成增量生产力工具的人，会发现自己在一个规则已经改变的游戏里竞争。

AI Agent 不是「锦上添花」的玩具，是 工作方式的范式转变。

早一天搭建，早一天享受自动化红利。

你的第一个 Agent，今天就可以开始。

附：我常用的 AI 模型站点

搭建 Agent 的第一步就是选模型。这里分享几个我常用的模型聚合站点，帮你快速上手：

OpenRouter

网址: openrouter.ai

这是我用得最多的站点。优点：

模型全：Claude、GPT、Gemini、DeepSeek、MiniMax、Kimi……主流模型基本都有
按量付费：不需要订阅多个平台，一个账号搞定所有模型
价格透明：每百万 token 的价格直接显示，方便对比
API 稳定：统一接口，切换模型只需改一行代码

适合：想用一个平台调用多个模型的开发者。

SiliconFlow

网址: siliconflow.cn

国内用户友好。优点：

国内直连：不需要科学上网，访问速度快
国产模型丰富：DeepSeek、Qwen、GLM 等国产大模型都有
价格实惠：部分模型免费额度，付费模型价格也很有竞争力
中文文档：文档和客服都是中文，上手门槛低

适合：国内用户、主要用国产模型的场景。

白山智算

网址: https://ai.baishan.com

AiGoCode

网址: aigocode.com

aigocode.com 是什么？为什么适合国内用户

是一个面向开发者的 API 中转服务，你可以理解为：

统一入口接入 Claude、GPT、Codex 等模型；
国内直连可用，减少网络不稳定问题；
不用每家平台单独折腾接口格式；
官方宣称已有 10000+ 用户使用。

对 OpenClaw 用户来说，最大的价值就是：同一个配置文件里，可以稳定接入多个模型，并支持随时切换。

我的推荐策略

场景	推荐站点	推荐模型
日常对话、简单任务	OpenRouter	MiniMax M2.5 / DeepSeek V3
写文章、深度分析	OpenRouter	Claude Opus 4.6
写代码	OpenRouter	Claude Opus 4.6 / Kimi k2p5
国内快速测试	SiliconFlow	DeepSeek V3 / Qwen

省钱技巧：先用便宜模型跑通流程，确认效果后再切换到强模型。大部分定时任务用 MiniMax M2.5 或 DeepSeek V3 就够了，一个月 API 费用控制在百元以内完全可行。

作者：无限航行指南

如果这篇文章对你有帮助，欢迎关注公众号【无限航行指南】，持续分享 AI 编程实战经验。