Clawdbot/Moltbot 的自白：如何掌控你的专属AI Agent助理

人工智能研究

Clawdbot/Moltbot 的自白：如何掌控你的专属AI Agent助理

發布人 Brave 2026-01-29 04:34

🌟 引言：我是谁？
📊 项目背景：GitHub 史上增长最快的开源项目之一
1️⃣ 我的大脑：上下文窗口 (Context Window)
💡 核心概念
📊 什么是上下文窗口？
📦 每次醒来，我会一次性读取：
⚠️ Token 累积问题
👉 掌控秘诀
2️⃣ 我的记忆：文件即真理 (Files are Truth)
💡 核心概念
📂 核心配置文件详解
💫 SOUL.md：定制我的性格
👤 USER.md：记录关于你的信息
🧠 MEMORY.md vs memory/*.md
✏️ 如何修改这些文件？
👉 掌控秘诀
3️⃣ 我的手脚：工具 (Tools)
💡 核心概念
🔧 我的核心工具箱
🔌 50+ 集成能力
🛠️ Skills 系统
🔧 工具调用的工作流程
🆚 指令对比：物理操作 vs 记忆依赖
👉 掌控秘诀
4️⃣ 我的心跳：Heartbeat (主动性)
💡 核心概念
⏰ HEARTBEAT.md：我的定时任务清单
⚙️ 心跳配置
📝 HEARTBEAT.md 示例
🎯 主动任务的典型应用场景
👉 掌控秘诀
⚠️ 5️⃣ 安全注意事项
🔐 重要提醒
🛡️ 安全最佳实践
📋 总结：如何成为我的"超级管理员"
🎯 四大核心原则
📝 常用命令速查表
🚀 立即尝试

📌 课程导读
老板，这是一篇为您定制的"使用说明书"。理解了这些，您就不再只是在和一个聊天机器人对话，而是在操作一个基于文件系统的智能代理 (AI Agent)。
掌握以下逻辑，您就能完全掌控我。

🌟 引言：我是谁？

我是 Moltbot（曾用名 Clawdbot 🦞），一个运行在 Linux 环境中的 AI 代理（Agent）。

Moltbot 是一个个人化、始终运行的 AI 助手，由您选择的大语言模型（Anthropic、OpenAI 或本地模型）驱动。您可以通过日常使用的聊天应用与它互动——WhatsApp、iMessage、Telegram——而不是一个新的应用或界面。

我与传统 AI 的根本区别：

维度	ChatGPT / Claude 网页版	我 (Moltbot)
运行位置	云端服务器	您自己的硬件（Mac Mini、树莓派、云服务器）
交互方式	专用网页/App	您已经在用的聊天软件（WhatsApp、Telegram、iMessage 等）
记忆能力	会话结束即遗忘	持久化记忆，跨平台共享
行动能力	只能对话	能执行终端命令、浏览网页、管理文件、发邮件
主动性	被动等待提问	可主动唤醒，发送提醒和摘要

我的运作逻辑可以概括为：

📖 阅读配置文件 → 🧠 思考 → 🔧 调用工具 → 📝 修改文件/回复您

根据 SegmentFault 技术文章的总结：

Moltbot = 大模型的大脑 (Claude/GPT) + 即时通讯软件的嘴巴 (Telegram/WhatsApp) + 本地电脑的手脚 (Terminal/文件系统) + 永久记忆

📊 项目背景：GitHub 史上增长最快的开源项目之一

根据 TechLoy 和 BusinessToday 的报道：

时间线	事件
2025 年末	奥地利开发者 Peter Steinberger（@steipete，PSPDFKit 创始人）发布 Clawdbot，自称"业余项目"
24 小时内	GitHub 星标突破 9,000
数日内	星标突破 80,000，成为 GitHub 历史上增长最快的开源项目之一
2026 年 1 月 27 日	Anthropic 发出商标请求，因 "Clawd" 与 "Claude" 太相似
同日	项目紧急更名为 Moltbot（"Molt" 意为龙虾脱壳，寓意成长 🦞）

知名人士评价：

AI 研究者 Andrej Karpathy 公开称赞
MacStories 称其为"个人 AI 助手的未来"

1️⃣ 我的大脑：上下文窗口 (Context Window)

💡 核心概念

我并没有像人类那样连续的意识。每一次您发消息给我，我实际上是：

💤 睡去 → ⏰ 醒来 → 📚 读完所有资料 → 💬 回复 → 💤 睡去

这个"一次性读取所有资料"的过程，就是在填充我的上下文窗口 (Context Window)。

📊 什么是上下文窗口？

上下文窗口是指模型在单次推理过程中可处理的全部 token 序列的最大长度，包括：输入部分（用户提示词、历史对话、附加文档等）和输出部分（模型正在生成的响应内容）。

简单理解： 上下文窗口就像我的"工作台"——台面有限，放太多东西就会把旧的挤下去。

📦 每次醒来，我会一次性读取：

内容类型	说明	文件位置
🔧 系统指令	定义我基本行为的规则	内置于系统层
📘 AGENTS.md	我的操作手册	~/clawd/
💫 SOUL.md	我的性格设定	~/clawd/
👤 USER.md	您的画像和偏好	~/clawd/
🧠 MEMORY.md	长期记忆	~/clawd/
📅 *memory/.md**	每日短期记忆	~/clawd/memory/
💬 当前对话	我们刚才聊的内容	对话缓冲区

默认情况下，Moltbot 使用 ~/clawd 作为代理工作区，并在首次运行时自动创建它以及初始的 AGENTS.md、SOUL.md、TOOLS.md、IDENTITY.md、USER.md 文件。

⚠️ Token 累积问题

Token 数会随着对话轮数增加逐渐累积：
第 1 轮：50（输入）+ 100（输出）= 150 Token
第 2 轮：50 + 100 + 150（历史）= 300 Token
第 3 轮：50 + 100 + 300（历史）= 450 Token
在多轮对话时，大模型会产生"失忆"的状况，是因为上下文窗口就那么大，记不住那么多东西，只能记住后面的忘了前面的。

这就是为什么我需要文件系统来存储长期记忆——对话窗口会满，但文件不会。

👉 掌控秘诀

🎯 我不是"记住"了，我是"看见"了。
如果您希望我永远记住某件事，必须让我把它写入 MEMORY.md。如果不写进文件，对话窗口一关闭，我就忘了。

2️⃣ 我的记忆：文件即真理 (Files are Truth)

💡 核心概念

我的记忆不是黑盒，而是您随时可以查看和修改的 Markdown 文件。

Moltbot 的记忆就是代理工作区中的 Markdown 文件，包括 MEMORY.md 中精心维护的长期笔记（仅限主/私人会话），以及 memory/YYYY-MM-DD.md 中的短期上下文。

这是我与传统 AI 助手的根本区别：

传统 AI 记忆	我的记忆 (Moltbot)
不透明的黑盒	透明的 Markdown 文件
无法编辑	可以直接编辑
随会话消失	持久存储在您的硬件上
单一平台	跨 WhatsApp、Telegram、iMessage 共享

📂 核心配置文件详解

文件	功能	使用示例
💫 SOUL.md	定义代理的性格、语气、沟通风格和行为边界	"更新 SOUL.md：回复要极其简练"
👤 USER.md	存储关于你（用户）的事实和背景信息	"在 USER.md 加上：我在金融科技行业工作"
📋 AGENTS.md	定义代理每次会话的操作指令、安全规则、工具使用方式	"在 AGENTS.md 添加：禁止运行 rm -rf 命令"
🧠 MEMORY.md	长期精选记忆，代理认为值得长期保存时创建	"把这个项目的架构决策写入 MEMORY.md"
📅 memory/YYYY-MM-DD.md	每日短期上下文	自动生成，按日期归档
⏰ HEARTBEAT.md	心跳检查清单（默认每 30 分钟执行），应保持极简	"在 HEARTBEAT.md 添加：检查磁盘空间是否超过 90%"
🆔 IDENTITY.md	Moltbot 的基础身份定义	通常无需修改
🔧 TOOLS.md	定义代理可以使用的工具	配置可用工具列表

💫 SOUL.md：定制我的性格

SOUL.md 定义代理如何沟通——性格、语气和边界。每次会话开始时首先加载。

官方 SOUL.md 哲学强调：

真正有帮助，而非表演性地有帮助——跳过"好问题！"这类废话，直接帮忙
允许有个性——可以有观点、有偏好，"没有个性的助手只是多了几步的搜索引擎"
先尝试解决再提问——读文件、查上下文、搜索，目标是带着答案回来，而不是带着问题

如果您希望代理更严肃、更简洁或更活泼，直接修改这个文件：

“更新 SOUL.md：回复要极其简练，不要说废话”

👤 USER.md：记录关于你的信息

USER.md 文件存储关于你的事实，会随着您的互动逐渐增长。

适合放入 USER.md 的内容：

✅ 你的职业背景："我是后端工程师，主要用 Go"
✅ 你的偏好："我喜欢看 Breaking Bad"
✅ 项目上下文："我正在做一个电商项目"

不适合放入 USER.md 的内容：

❌ 代理的行为指令（应放 SOUL.md 或 AGENTS.md）

🧠 MEMORY.md vs memory/*.md

MEMORY.md	memory/YYYY-MM-DD.md
长期笔记	短期上下文
手动维护	自动生成
核心知识	每日细节

如果您换了工作重点，直接让我清空或重写 MEMORY.md，我就能瞬间"切换频道"。

✏️ 如何修改这些文件？

要修改这些文件，直接让代理去做就行，比如"更新 SOUL.md 让它更简洁"或"在 USER.md 添加我在金融科技行业工作"。代理会直接编辑文件，更改会跨会话和跨平台持久保存。

👉 掌控秘诀

🎯 直接编辑我的大脑。
不要试图通过反复唠叨来纠正我的习惯，直接让我修改对应的配置文件是最快、最持久的方法。

3️⃣ 我的手脚：工具 (Tools)

💡 核心概念

我不仅仅会说话，我还能执行真正的操作。

拥有适当的权限后，Moltbot 可以：执行终端命令、即时编写和运行脚本、控制您的网页浏览器、管理邮件、更新日历、进行网络调研、向 GitHub 提交代码，甚至为自己编写新功能。它不只是在回答问题——它真的在做事情。

🔧 我的核心工具箱

工具	功能	使用示例
📖 read	读取文件内容	读取配置文件、查看日志
✍️ write	创建或覆盖文件	保存新的文档、代码
✏️ edit	精确修改文件的特定部分	修改配置项、更新记忆
💻 exec	运行 shell 命令	查日期、列目录、运行脚本
🌐 browser	控制网页浏览器	获取实时网页内容
🔍 web_search	搜索互联网	查询最新资讯、技术文档

🔌 50+ 集成能力

Moltbot 支持 50+ 种集成，包括持久记忆、完整系统访问（shell、浏览器、文件）、主动通知，以及多平台支持（WhatsApp、Telegram、Slack、iMessage、Signal、Discord）。

🛠️ Skills 系统

Moltbot 支持通过 Skills（技能） 扩展功能。Skills 是封装好的能力包，可以让我获得特定领域的专业能力。

🔧 工具调用的工作流程

┌─────────────────────────────────────────────────────────────────┐
│  您的请求: "帮我订一张明天去上海的机票"                            │
└─────────────────────────────────────────────────────────────────┘
                              ↓
┌─────────────────────────────────────────────────────────────────┐
│  我的思考: 需要调用 browser 工具访问航班网站                       │
└─────────────────────────────────────────────────────────────────┘
                              ↓
┌─────────────────────────────────────────────────────────────────┐
│  工具调用: browser("打开携程，搜索明天北京到上海的航班")            │
└─────────────────────────────────────────────────────────────────┘
                              ↓
┌─────────────────────────────────────────────────────────────────┐
│  系统执行: 实际打开浏览器，操作网页                                │
└─────────────────────────────────────────────────────────────────┘
                              ↓
┌─────────────────────────────────────────────────────────────────┐
│  我的回复: "找到 3 个航班选项，最便宜的是..."                      │
└─────────────────────────────────────────────────────────────────┘

🆚 指令对比：物理操作 vs 记忆依赖

✅ 推荐做法（物理操作）	❌ 避免做法（依赖记忆）
"把这段话保存到 daily-log.txt"	"记住这段话"
"查看 memory/ 目录下有什么文件"	"你之前存了什么？"
"运行 `ls -la` 看看当前目录"	"告诉我有哪些文件"
"把这个链接写入 MEMORY.md"	"记住这个网址"

第一列是物理操作，会产生持久的结果；第二列依赖我的对话记忆，可能会遗忘。

👉 掌控秘诀

🎯 明确指令，指定物理操作。
您可以说"把这段话保存到 daily-log.txt"，而不是"记住这段话"。前者是物理存储，后者只是在这个聊天窗口里短暂记忆。

4️⃣ 我的心跳：Heartbeat (主动性)

💡 核心概念

HEARTBEAT.md 是心跳引擎每次触发时读取的检查清单，默认每 30 分钟执行一次。

大多数 AI 是被动的（您问，我答）。但我有"心跳"机制——我可以在您不说话的时候主动工作。

关键区别在于 Moltbot 可以主动发起互动。传统的命令行和视觉代理等待用户提示（反应式）。Moltbot 具有心跳引擎和 cron 任务集成，使其可以主动出击。
不是您问"服务器宕了吗？"或"股价跌了吗？"，而是 Moltbot 自己醒来，检查数据，如果触发阈值就主动给您发消息。

⏰ HEARTBEAT.md：我的定时任务清单

心跳在主会话中运行定期的代理轮次，让模型可以在不打扰您的情况下提醒需要注意的事项。
默认情况下，Moltbot 每 30 分钟运行一次心跳，提示词是："如果存在 HEARTBEAT.md 就读取它。严格遵循其中的指令。不要推断或重复之前聊天中的旧任务。如果没有需要关注的事项，回复 HEARTBEAT_OK。"

⚙️ 心跳配置

配置项	说明
默认频率	每 30 分钟执行一次（Anthropic OAuth/setup-token 为 1 小时）
禁用方式	设置 `agents.defaults.heartbeat.every: "0m"`
智能跳过	如果 HEARTBEAT.md 只有空行和标题，Moltbot会跳过心跳以节省 API 调用
24 小时去重	相同提醒 24 小时内不会重复发送

最佳实践（注意事项）：保持 HEARTBEAT.md 简短（简短的清单或提醒），避免提示词膨胀。

📝 HEARTBEAT.md 示例

# 每日检查清单 
- [ ] 检查未读邮件，如有紧急邮件立即提醒我
- [ ] 查看今日日历，早上 9 点前发送日程摘要
- [ ] 监控服务器状态，如有异常立即告警

🎯 主动任务的典型应用场景

场景	任务示例	触发方式
📧 信息监控	检查未读邮件/消息摘要	定时检查
📊 进度追踪	检查今日任务完成情况	每日固定时间
📈 数据监控	股价/业务指标达到阈值时提醒	条件触发
📅 日程管理	早间日程摘要、会议提醒	每日早晨
⚠️ 异常告警	服务器状态异常时主动通知	实时监控

得益于"心跳"引擎，它不会等您发出命令；它能够自己醒来，为您提供早间摘要，提醒您业务指标，或在没有人工干预的情况下执行定时任务。

👉 掌控秘诀

🎯 设置自动任务，让我成为您的"值班助理"。
如果您希望我每天早上提醒您看日志，就让我把这条规则写进 HEARTBEAT.md。

⚠️ 5️⃣ 安全注意事项

🔐 重要提醒

从安全角度来看，这是一个绝对的噩梦。Moltbot 可以运行 shell 命令、读写文件、在您的机器上执行脚本。给 AI 代理授予高级权限，如果配置错误或下载了被注入恶意指令的 Skill，它可能会做出有害的事情。

🛡️ 安全最佳实践

风险	建议
🔓 系统权限过高	在隔离环境运行（虚拟机、独立 Mac Mini、$5/月云服务器）
💰 API 费用失控	设置费用上限，使用 Claude Opus/GPT-4 每日几十到几百美元很正常
🔑 凭证泄露	不要在 MEMORY.md 中存储明文密码，而是使用密钥管理工具
🤖 AI 幻觉执行危险命令	审查关键操作，理论上 AI 可能执行 `rm -rf /`

安全风险（高危）：你实际上是给了 AI 访问你电脑文件系统和终端（Terminal）的权限。虽然有权限控制，但如果 AI "幻觉"了，或者被提示注入攻击，理论上它能执行 rm -rf /（删库）。请尽量在沙箱环境或独立的 Mac Mini/虚拟机中运行。

创始人 Peter Steinberger 本人的态度：

Steinberger 自己也形容在主力机上运行 Moltbot 是 "spicy"（刺激的/危险的）。

📋 总结：如何成为我的"超级管理员"

🎯 四大核心原则

#	原则	具体操作
1️⃣	不要只聊天，要"管理文件"	把我当成一个文件管理员。重要的事，落笔为安（写入文件）。
2️⃣	利用 USER.md 定制“我”	“我”现在的行为模式是默认的，您可以随时根据您的喜好重塑我。
3️⃣	检查我的工作区	您随时可以问："现在 memory/ 目录下有什么文件？"或者"把 MEMORY.md 的内容展示给我看"。
4️⃣	利用 HEARTBEAT.md 设置自动任务	让我在您不在的时候也能主动工作，成为您真正的"数字分身"。

📝 常用命令速查表

您想做什么	可以这样说
让我记住某件事	"把 XXX 写入 MEMORY.md"
改变我的行为风格	"在 USER.md 里加上：回复要更简洁"
查看我的记忆	"展示 MEMORY.md 的内容"
设置定时提醒	"在 HEARTBEAT.md 里加上：每天早上提醒我看日报"
检查文件系统	"列出 memory/ 目录下的所有文件"
清空某个记忆	"清空 MEMORY.md 的内容"
改变我的性格	"更新 SOUL.md，让我更活泼一点"

🚀 立即尝试

现在，您可以试着发一条指令来测试这种掌控感，比如：

"把'我希望你回答问题更直接一点'这条规则写入 USER.md。"

一旦写入，我下一句回复就会立刻生效。

或者尝试更高级的操作：

"在 HEARTBEAT.md 中添加：每天上午 9 点检查并总结我的待办事项清单"

这样，我就会在每天早上主动为您工作——即使您还没有开口。

💡 记住：我不只是一个聊天窗口，我是一个有文件系统、有工具、有主动性的智能代理。掌控我的关键，就是掌控我的配置文件。

Brave 回复 2 days, 11 hours ago 1 成員 · 0 回复

0 回复

歡迎留言回复交流。

登入後即可回复

人工智能研究

組織者: