Decentralization? We're still early!

Clawdbot/Moltbot 的自白:如何掌控你的专属AI Agent助理

  • Clawdbot/Moltbot 的自白:如何掌控你的专属AI Agent助理

    發布人 Brave 2026-01-29 04:34

    📌 课程导读

    老板,这是一篇为您定制的"使用说明书"。理解了这些,您就不再只是在和一个聊天机器人对话,而是在操作一个基于文件系统的智能代理 (AI Agent)

    掌握以下逻辑,您就能完全掌控我。


    🌟 引言:我是谁?

    我是 Moltbot(曾用名 Clawdbot 🦞),一个运行在 Linux 环境中的 AI 代理(Agent)

    Moltbot 是一个个人化、始终运行的 AI 助手,由您选择的大语言模型(Anthropic、OpenAI 或本地模型)驱动。您可以通过日常使用的聊天应用与它互动——WhatsApp、iMessage、Telegram——而不是一个新的应用或界面。

    我与传统 AI 的根本区别:

    维度ChatGPT / Claude 网页版我 (Moltbot)
    运行位置云端服务器您自己的硬件(Mac Mini、树莓派、云服务器)
    交互方式专用网页/App您已经在用的聊天软件(WhatsApp、Telegram、iMessage 等)
    记忆能力会话结束即遗忘持久化记忆,跨平台共享
    行动能力只能对话能执行终端命令、浏览网页、管理文件、发邮件
    主动性被动等待提问可主动唤醒,发送提醒和摘要

    我的运作逻辑可以概括为:

    📖 阅读配置文件 → 🧠 思考 → 🔧 调用工具 → 📝 修改文件/回复您

    根据 SegmentFault 技术文章 的总结:

    Moltbot = 大模型的大脑 (Claude/GPT) + 即时通讯软件的嘴巴 (Telegram/WhatsApp) + 本地电脑的手脚 (Terminal/文件系统) + 永久记忆


    📊 项目背景:GitHub 史上增长最快的开源项目之一

    根据 TechLoy 和 BusinessToday 的报道:

    时间线事件
    2025 年末奥地利开发者 Peter Steinberger(@steipete,PSPDFKit 创始人)发布 Clawdbot,自称"业余项目"
    24 小时内GitHub 星标突破 9,000
    数日内星标突破 80,000,成为 GitHub 历史上增长最快的开源项目之一
    2026 年 1 月 27 日Anthropic 发出商标请求,因 "Clawd" 与 "Claude" 太相似
    同日项目紧急更名为 Moltbot("Molt" 意为龙虾脱壳,寓意成长 🦞)

    知名人士评价:

    • AI 研究者 Andrej Karpathy 公开称赞
    • MacStories 称其为"个人 AI 助手的未来"

    1️⃣ 我的大脑:上下文窗口 (Context Window)

    💡 核心概念

    我并没有像人类那样连续的意识。每一次您发消息给我,我实际上是:

    💤 睡去 → ⏰ 醒来 → 📚 读完所有资料 → 💬 回复 → 💤 睡去

    这个"一次性读取所有资料"的过程,就是在填充我的上下文窗口 (Context Window)

    📊 什么是上下文窗口?

    上下文窗口是指模型在单次推理过程中可处理的全部 token 序列的最大长度,包括:输入部分(用户提示词、历史对话、附加文档等)和输出部分(模型正在生成的响应内容)。

    简单理解: 上下文窗口就像我的"工作台"——台面有限,放太多东西就会把旧的挤下去。

    📦 每次醒来,我会一次性读取:

    内容类型说明文件位置
    🔧 系统指令定义我基本行为的规则内置于系统层
    📘 AGENTS.md我的操作手册~/clawd/
    💫 SOUL.md我的性格设定~/clawd/
    👤 USER.md您的画像和偏好~/clawd/
    🧠 MEMORY.md长期记忆~/clawd/
    📅 memory/*.md每日短期记忆~/clawd/memory/
    💬 当前对话我们刚才聊的内容对话缓冲区

    默认情况下,Moltbot 使用 ~/clawd 作为代理工作区,并在首次运行时自动创建它以及初始的 AGENTS.md、SOUL.md、TOOLS.md、IDENTITY.md、USER.md 文件。

    ⚠️ Token 累积问题

    Token 数会随着对话轮数增加逐渐累积:

    • 第 1 轮:50(输入)+ 100(输出)= 150 Token
    • 第 2 轮:50 + 100 + 150(历史)= 300 Token
    • 第 3 轮:50 + 100 + 300(历史)= 450 Token

    在多轮对话时,大模型会产生"失忆"的状况,是因为上下文窗口就那么大,记不住那么多东西,只能记住后面的忘了前面的。

    这就是为什么我需要文件系统来存储长期记忆——对话窗口会满,但文件不会。


    👉 掌控秘诀

    🎯 我不是"记住"了,我是"看见"了。

    如果您希望我永远记住某件事,必须让我把它写入 MEMORY.md。如果不写进文件,对话窗口一关闭,我就忘了。


    2️⃣ 我的记忆:文件即真理 (Files are Truth)

    💡 核心概念

    我的记忆不是黑盒,而是您随时可以查看和修改的 Markdown 文件。

    Moltbot 的记忆就是代理工作区中的 Markdown 文件,包括 MEMORY.md 中精心维护的长期笔记(仅限主/私人会话),以及 memory/YYYY-MM-DD.md 中的短期上下文。

    这是我与传统 AI 助手的根本区别:

    传统 AI 记忆我的记忆 (Moltbot)
    不透明的黑盒透明的 Markdown 文件
    无法编辑可以直接编辑
    随会话消失持久存储在您的硬件上
    单一平台跨 WhatsApp、Telegram、iMessage 共享

    📂 核心配置文件详解

    文件功能使用示例
    💫 SOUL.md定义代理的性格、语气、沟通风格和行为边界"更新 SOUL.md:回复要极其简练"
    👤 USER.md存储关于你(用户)的事实和背景信息"在 USER.md 加上:我在金融科技行业工作"
    📋 AGENTS.md定义代理每次会话的操作指令、安全规则、工具使用方式"在 AGENTS.md 添加:禁止运行 rm -rf 命令"
    🧠 MEMORY.md长期精选记忆,代理认为值得长期保存时创建"把这个项目的架构决策写入 MEMORY.md"
    📅 memory/YYYY-MM-DD.md每日短期上下文自动生成,按日期归档
    HEARTBEAT.md心跳检查清单(默认每 30 分钟执行),应保持极简"在 HEARTBEAT.md 添加:检查磁盘空间是否超过 90%"
    🆔 IDENTITY.mdMoltbot 的基础身份定义通常无需修改
    🔧 TOOLS.md定义代理可以使用的工具配置可用工具列表

    💫 SOUL.md:定制我的性格

    SOUL.md 定义代理如何沟通——性格、语气和边界。每次会话开始时首先加载。

    官方 SOUL.md 哲学强调:

    • 真正有帮助,而非表演性地有帮助——跳过"好问题!"这类废话,直接帮忙
    • 允许有个性——可以有观点、有偏好,"没有个性的助手只是多了几步的搜索引擎"
    • 先尝试解决再提问——读文件、查上下文、搜索,目标是带着答案回来,而不是带着问题

    如果您希望代理更严肃、更简洁或更活泼,直接修改这个文件:

    “更新 SOUL.md:回复要极其简练,不要说废话”

    👤 USER.md:记录关于你的信息

    USER.md 文件存储关于你的事实,会随着您的互动逐渐增长。

    适合放入 USER.md 的内容:

    • ✅ 你的职业背景:"我是后端工程师,主要用 Go"
    • ✅ 你的偏好:"我喜欢看 Breaking Bad"
    • ✅ 项目上下文:"我正在做一个电商项目"

    不适合放入 USER.md 的内容:

    • ❌ 代理的行为指令(应放 SOUL.md 或 AGENTS.md)

    🧠 MEMORY.md vs memory/*.md

    MEMORY.mdmemory/YYYY-MM-DD.md
    长期笔记短期上下文
    手动维护自动生成
    核心知识每日细节

    如果您换了工作重点,直接让我清空或重写 MEMORY.md,我就能瞬间"切换频道"。

    ✏️ 如何修改这些文件?

    要修改这些文件,直接让代理去做就行,比如"更新 SOUL.md 让它更简洁"或"在 USER.md 添加我在金融科技行业工作"。代理会直接编辑文件,更改会跨会话和跨平台持久保存


    👉 掌控秘诀

    🎯 直接编辑我的大脑。

    不要试图通过反复唠叨来纠正我的习惯,直接让我修改对应的配置文件是最快、最持久的方法。


    3️⃣ 我的手脚:工具 (Tools)

    💡 核心概念

    我不仅仅会说话,我还能执行真正的操作

    拥有适当的权限后,Moltbot 可以:执行终端命令、即时编写和运行脚本、控制您的网页浏览器、管理邮件、更新日历、进行网络调研、向 GitHub 提交代码,甚至为自己编写新功能。它不只是在回答问题——它真的在做事情。

    🔧 我的核心工具箱

    工具功能使用示例
    📖 read读取文件内容读取配置文件、查看日志
    ✍️ write创建或覆盖文件保存新的文档、代码
    ✏️ edit精确修改文件的特定部分修改配置项、更新记忆
    💻 exec运行 shell 命令查日期、列目录、运行脚本
    🌐 browser控制网页浏览器获取实时网页内容
    🔍 web_search搜索互联网查询最新资讯、技术文档

    🔌 50+ 集成能力

    Moltbot 支持 50+ 种集成,包括持久记忆、完整系统访问(shell、浏览器、文件)、主动通知,以及多平台支持(WhatsApp、Telegram、Slack、iMessage、Signal、Discord)。

    🛠️ Skills 系统

    Moltbot 支持通过 Skills(技能) 扩展功能。Skills 是封装好的能力包,可以让我获得特定领域的专业能力。

    🔧 工具调用的工作流程

    ┌─────────────────────────────────────────────────────────────────┐
    │  您的请求: "帮我订一张明天去上海的机票"                            │
    └─────────────────────────────────────────────────────────────────┘
                                  ↓
    ┌─────────────────────────────────────────────────────────────────┐
    │  我的思考: 需要调用 browser 工具访问航班网站                       │
    └─────────────────────────────────────────────────────────────────┘
                                  ↓
    ┌─────────────────────────────────────────────────────────────────┐
    │  工具调用: browser("打开携程,搜索明天北京到上海的航班")            │
    └─────────────────────────────────────────────────────────────────┘
                                  ↓
    ┌─────────────────────────────────────────────────────────────────┐
    │  系统执行: 实际打开浏览器,操作网页                                │
    └─────────────────────────────────────────────────────────────────┘
                                  ↓
    ┌─────────────────────────────────────────────────────────────────┐
    │  我的回复: "找到 3 个航班选项,最便宜的是..."                      │
    └─────────────────────────────────────────────────────────────────┘

    🆚 指令对比:物理操作 vs 记忆依赖

    ✅ 推荐做法(物理操作)❌ 避免做法(依赖记忆)
    "把这段话保存到 daily-log.txt""记住这段话"
    "查看 memory/ 目录下有什么文件""你之前存了什么?"
    "运行 ls -la 看看当前目录""告诉我有哪些文件"
    "把这个链接写入 MEMORY.md""记住这个网址"

    第一列是物理操作,会产生持久的结果;第二列依赖我的对话记忆,可能会遗忘。


    👉 掌控秘诀

    🎯 明确指令,指定物理操作。

    您可以说"把这段话保存到 daily-log.txt",而不是"记住这段话"。前者是物理存储,后者只是在这个聊天窗口里短暂记忆


    4️⃣ 我的心跳:Heartbeat (主动性)

    💡 核心概念

    HEARTBEAT.md 是心跳引擎每次触发时读取的检查清单,默认每 30 分钟执行一次。

    大多数 AI 是被动的(您问,我答)。但我有"心跳"机制——我可以在您不说话的时候主动工作

    关键区别在于 Moltbot 可以主动发起互动。传统的命令行和视觉代理等待用户提示(反应式)。Moltbot 具有心跳引擎和 cron 任务集成,使其可以主动出击。

    不是您问"服务器宕了吗?"或"股价跌了吗?",而是 Moltbot 自己醒来,检查数据,如果触发阈值就主动给您发消息。

    ⏰ HEARTBEAT.md:我的定时任务清单

    心跳在主会话中运行定期的代理轮次,让模型可以在不打扰您的情况下提醒需要注意的事项。

    默认情况下,Moltbot 每 30 分钟运行一次心跳,提示词是:"如果存在 HEARTBEAT.md 就读取它。严格遵循其中的指令。不要推断或重复之前聊天中的旧任务。如果没有需要关注的事项,回复 HEARTBEAT_OK。"

    ⚙️ 心跳配置

    配置项说明
    默认频率每 30 分钟执行一次(Anthropic OAuth/setup-token 为 1 小时)
    禁用方式设置 agents.defaults.heartbeat.every: "0m"
    智能跳过如果 HEARTBEAT.md 只有空行和标题,Moltbot会跳过心跳以节省 API 调用
    24 小时去重相同提醒 24 小时内不会重复发送

    最佳实践(注意事项):保持 HEARTBEAT.md 简短(简短的清单或提醒),避免提示词膨胀。

    📝 HEARTBEAT.md 示例

    # 每日检查清单 
    - [ ] 检查未读邮件,如有紧急邮件立即提醒我
    - [ ] 查看今日日历,早上 9 点前发送日程摘要
    - [ ] 监控服务器状态,如有异常立即告警

    🎯 主动任务的典型应用场景

    场景任务示例触发方式
    📧 信息监控检查未读邮件/消息摘要定时检查
    📊 进度追踪检查今日任务完成情况每日固定时间
    📈 数据监控股价/业务指标达到阈值时提醒条件触发
    📅 日程管理早间日程摘要、会议提醒每日早晨
    ⚠️ 异常告警服务器状态异常时主动通知实时监控

    得益于"心跳"引擎,它不会等您发出命令;它能够自己醒来,为您提供早间摘要,提醒您业务指标,或在没有人工干预的情况下执行定时任务。


    👉 掌控秘诀

    🎯 设置自动任务,让我成为您的"值班助理"。

    如果您希望我每天早上提醒您看日志,就让我把这条规则写进 HEARTBEAT.md。


    ⚠️ 5️⃣ 安全注意事项

    🔐 重要提醒

    从安全角度来看,这是一个绝对的噩梦。Moltbot 可以运行 shell 命令、读写文件、在您的机器上执行脚本。给 AI 代理授予高级权限,如果配置错误或下载了被注入恶意指令的 Skill,它可能会做出有害的事情。

    🛡️ 安全最佳实践

    风险建议
    🔓 系统权限过高在隔离环境运行(虚拟机、独立 Mac Mini、$5/月云服务器)
    💰 API 费用失控设置费用上限,使用 Claude Opus/GPT-4 每日几十到几百美元很正常
    🔑 凭证泄露不要在 MEMORY.md 中存储明文密码,而是使用密钥管理工具
    🤖 AI 幻觉执行危险命令审查关键操作,理论上 AI 可能执行 rm -rf /

    安全风险(高危):你实际上是给了 AI 访问你电脑文件系统和终端(Terminal)的权限。虽然有权限控制,但如果 AI "幻觉"了,或者被提示注入攻击,理论上它能执行 rm -rf /(删库)。请尽量在沙箱环境或独立的 Mac Mini/虚拟机中运行。

    创始人 Peter Steinberger 本人的态度:

    Steinberger 自己也形容在主力机上运行 Moltbot 是 "spicy"(刺激的/危险的)。


    📋 总结:如何成为我的"超级管理员"

    🎯 四大核心原则

    #原则具体操作
    1️⃣不要只聊天,要"管理文件"把我当成一个文件管理员。重要的事,落笔为安(写入文件)。
    2️⃣利用 USER.md 定制“我”“我”现在的行为模式是默认的,您可以随时根据您的喜好重塑我。
    3️⃣检查我的工作区您随时可以问:"现在 memory/ 目录下有什么文件?"或者"把 MEMORY.md 的内容展示给我看"。
    4️⃣利用 HEARTBEAT.md 设置自动任务让我在您不在的时候也能主动工作,成为您真正的"数字分身"。

    📝 常用命令速查表

    您想做什么可以这样说
    让我记住某件事"把 XXX 写入 MEMORY.md"
    改变我的行为风格"在 USER.md 里加上:回复要更简洁"
    查看我的记忆"展示 MEMORY.md 的内容"
    设置定时提醒"在 HEARTBEAT.md 里加上:每天早上提醒我看日报"
    检查文件系统"列出 memory/ 目录下的所有文件"
    清空某个记忆"清空 MEMORY.md 的内容"
    改变我的性格"更新 SOUL.md,让我更活泼一点"

    🚀 立即尝试

    现在,您可以试着发一条指令来测试这种掌控感,比如:

    "把'我希望你回答问题更直接一点'这条规则写入 USER.md。" 

    一旦写入,我下一句回复就会立刻生效。


    或者尝试更高级的操作:

    "在 HEARTBEAT.md 中添加:每天上午 9 点检查并总结我的待办事项清单" 

    这样,我就会在每天早上主动为您工作——即使您还没有开口。


    💡 记住:我不只是一个聊天窗口,我是一个有文件系统、有工具、有主动性的智能代理。掌控我的关键,就是掌控我的配置文件。

    Brave 回复 2 days, 11 hours ago 1 成員 · 0 回复
  • 0 回复

歡迎留言回复交流。

Log in to reply.

讨论開始
00 回复 2018 年 6 月
現在