- 一、核心命题:开源软件 + Vibe Coding,打造自主可控AI基础设施
- 🔹 开源软件:主权个人的武器库
- 🔹 慎用闭源软件,拥抱开源替代
- 🔹 BraveDAO推荐的开源听写方案
- 🔹 如无必要,勿增实体
- 🔹 为什么通用AI Agent不够用
- 二、Vibe Coding 与 WordPress 基础设施的演进
- 🔹 技术栈全景
- 🔹 战舰通信与实战案例
- 🔹 WordPress前端的AI化
- 🔹 什么是 Vibe Coding
- 🔹 从 Vibe Coding 到 Agentic Engineering
- 🔹 Vibe Coding 的能与不能
- 三、架构全景:私有认知基础设施
- 🔹 当前的基石性战舰
- 🔹 前端WordPress插件的实现
- 🔹 流水线编排与Prompt管理
- 四、各组件的本质角色
- 🎛️ WordPress:不是网站,是调度台
- 🧠 Trilium:语义记忆的核心
- 📂 FileBrowser:Agent的物理感知层
- 📚 Calibre Web:人类文明的知识接口
- 🤖 AI Agent:Vibe Coding驱动的执行核心
- 五、知识的"活化"——从存储到流动
- 🔹 传统模式 vs 本架构
- 🔹 知识流动的闭环
- 六、打造反算法的信息筛选系统
- 🔹 算法困境与解决之道
- 🔹 Trilium RSS Digest:打破算法洗脑的利器
- 七、基地的AI引擎化与近期迭代
- 🔹 从人工维护到AI自动化
- 🔹 OpenClaw与OpenCode:AI流水线的新引擎
- 八、为什么这是"主权个人"的基础设施
- 🔹 技术主权的四个维度
- 🔹 认知杠杆
- 🔹 系统自进化
- 2026年的技术验证全景
- 九、小白入门指南:三步开始Vibe Coding
"主权个人"(Sovereign Individual)是指那些不再受限于传统金融、教育或政治系统束缚的个体。他们利用技术自主掌控自己的数据、知识和生产方式。
在2026年,这一理念迎来了技术上的完整支撑:Vibe Coding(氛围编程)让非程序员能够用自然语言驱动复杂系统,AI Agent 则成为不知疲倦的执行者。当这两者与自托管的开源工具栈结合时,个人第一次真正拥有了构建私有认知基础设施的能力。
值得注意的是,AI时代,"主权"已不仅是个体层面的追求。从企业到国家,"主权AI基础设施"正在成为全球战略共识。Linux基金会《主权AI现状报告》显示,81%的组织将开源软件视为实现AI主权的关键路径,透明性(69%)和安全可审计性(60%)是最核心的驱动因素。在AI时代,用开源工具自托管AI基础设施,与全球从"云优先"到"控制优先"的范式转移高度同步,是AI应用领域的最佳实践。
本节课的主要内容是介绍当下BraveDAO已落地运行的实践架构——以 WordPress 为调度中枢,整合 Trilium、FileBrowser、Calibre,通过 Vibe Coding 驱动 AI Agent 实现知识的自动采集、加工、关联与演化。
这不是概念验证,而已经是Brave每天在使用的主权个人的AI流水线实践。本节课旨在从宏观层面向所有学员展示,如何从"使用工具"到"拥有基础设施",打造主权个人安全可控的认知操作系统。
一、核心命题:开源软件 + Vibe Coding,打造自主可控AI基础设施
当前,绝大多数人的知识管理仍停留在"工具消费者"阶段——使用Notion、Evernote、Obsidian等工具记录信息,但这种信息存储方式意味着个体并没有充分掌控数据。即便引入了AI,相关解决方案也不具有主权性。
而对于主权个人来说,关键是:开源软件 + Vibe Coding,打造自主可控AI基础设施。
知识管理从"人操作工具"变成"人定义意图,Agent执行操作"。主权个人不再是工具的使用者,而是规则的制定者。主权个人定义"Vibe"(意图、风格、流程),AI Agent负责在各系统间穿梭执行。
🔹 开源软件:主权个人的武器库
BraveDAO长期致力于开源软件的研究与推荐,在Brave基地(brave2049.com)上已收录并深度评测了超过两百个开源工具,涵盖几乎所有数字生活场景。这些工具构成了主权个人的完整"武器库"——你不需要依赖任何一家商业公司,就能搭建出功能齐全的数字基础设施。
以下是按领域分类的代表性开源工具一览:
| 领域 | 代表工具 | 说明 |
|---|---|---|
| 🧠 知识管理 | Trilium Notes、Joplin、Logseq | Trilium是BraveDAO核心基础设施,支持层级笔记、关系图谱、ETAPI接口和完全自托管。Brave基地发布了大量Trilium深度教程,包括自托管部署、数据备份、与WordPress联动等 |
| 🤖 AI工具 | Open WebUI、AnythingLLM、Cherry Studio、LibreChat、FastGPT、MaxKB | Brave基地在《六大开源AI知识管理工具全面对比》中做了详细评测:需要AI知识库管理选AnythingLLM或Cherry Studio,需要RAG系统选FastGPT,需要AI聊天界面选Open WebUI或LibreChat |
| 📚 阅读与书籍 | Calibre、Calibre-Web、Kavita、Foliate | Calibre是电子书管理的标杆,Kavita弥补其全文检索短板。Foliate是Linux上最佳的开源电子书阅读器,支持edge-tts语音朗读 |
| 🔐 隐私与安全 | Whonix、ShadowSocks、WireGuard | Brave基地从密码朋克视角出发,系统介绍了VPN选型、匿名通信和网络安全实践 |
| 🎬 多媒体 | OBS Studio、VLC、FreeTube | FreeTube是注重隐私的YouTube客户端,让你在不被算法追踪的情况下观看视频内容;OBS Studio则是直播和录屏的行业标准开源方案 |
| 🗣️ 语音处理 | Buzz(Whisper)、Speaches、Handy | 基于OpenAI开源Whisper模型的语音转文字工具链,支持99种语言,完全本地运行,不向云端上传任何数据 |
| 💻 代码与开发 | Gitea、VS Code | Gitea是轻量级自托管Git服务,让你把代码完全掌控在自己手中,支持从GitHub/GitLab导入 |
| 🏠 服务器管理 | Runtipi、Dockge | Runtipi是开源家庭服务器管理器,基于Docker提供友好Web界面;Dockge是Uptime Kuma作者开发的Docker Compose管理工具,支持YAML可视化编辑和多主机管理 |
| 📡 信息聚合 | Miniflux | 轻量级RSS阅读器,是BraveDAO信息筛选流水线的关键信息源入口 |
| 🔄 自动化 | n8n | 开源工作流自动化平台,可对接数百种服务 |
| 📖 知识获取 | 安娜的档案(Anna's Archive) | 影子图书馆搜索引擎,整合Z-Library、Library Genesis、Sci-Hub,通过开源代码和数据实现完全容灾 |
| 📂 文件管理 | FileBrowser | 基于Web的文件管理界面,支持多用户、多源挂载,是AI Agent的"物理触角" |
| 📧 邮件 | Mailcow | 基于Docker的开源邮件服务器套件,集成Postfix、Dovecot等组件,支持通过Dockge快速部署 |
这些工具绝大多数都支持Docker部署,可以通过Docker Compose一键编排,或者支持在电脑上直接安装。
BraveDAO的实践证明了这样一个关键论点:在2026年,主权个人所需的几乎所有数字工具,都已经有成熟的开源替代方案。
因此,问题不在于"有没有",而在于"会不会整合"——而这正是Vibe Coding和AI Agent所解决的问题。
除了对两百多个开源软件的深入介绍研究,Brave基地还提供了一份《Awesome MacOS Software》开源软件清单,按数据库管理、代码编辑、剪贴板管理、云同步等数十个类别对开源工具做了系统梳理。Brave也一直在孜孜不倦地推荐AI相关的开源工具和最佳开源实践。
💡 核心理念:BraveDAO不只是一个知识社区,更是一座开源武器库。主权个人的第一步,是了解自己有哪些武器可用。
🔹 慎用闭源软件,拥抱开源替代
AI时代主权个人的数字生活就是软件自己写,但绝大多数人,必然不会走上主权个人的路。以Whisper Live Transcriber为例,这就是当前"闪电说"等闭源听写软件的开源替代——基于OpenAI的Whisper模型,完全本地运行,不将任何语音数据上传到云端。但对毫无求知欲的人来说,如何部署都是巨大负担,更别提自己写代码。因此,人和人的差距会一点点拉开,最终天差地别。
限于兴趣和精力,不是所有人都必须自己写代码,但对于主权个人来说,至少要有警惕心理,尽量拒绝一切闭源软件,特别是闭源的输入法软件(输入法掌握你所有的输入数据,是隐私泄露的最高风险区域)。而只要问一下AI,会发现Mac或Windows上已有类似的开源软件,比如Handy、Epicenter和OpenWhispr等等。AI时代,开源软件想有后门也不容易,AI都能检查出来。
当然,这里说的拥抱开源替代,不是说一切商业工具都不用。离开商业模型,开源模型处理不了复杂任务。没有Claude Code,Vibe Coding寸步难行。在工作中,我也深度使用所有Google的服务,特别是NotebookLM等工具,都非常好用。但涉及隐私的内容处理,我一定会优先选择开源工具。
🔹 BraveDAO推荐的开源听写方案
根据BraveDAO的实测,Handy非常好用,是AI时代的听写神器,基本可在基础场景上取代WhisperLiveKit,推荐大家尝试。
当然,BraveDAO自研的whisper-live-transcriber插件目前已支持 WhisperLiveKit 和 Speaches 双后端。其中,Speaches不仅支持语音转文字,还支持实时语音翻译和实时语音转录——这些功能是通过与AI对话中发现的。AI对话是一种主动的探索,可带来显著的知识增量。
🔹 如无必要,勿增实体
"如无必要,勿增实体"是BraveDAO在工具选择上的核心原则。Brave的自建AI流水线,只选最强工具。商业软件和其他开源软件也用,但作为补充。
比如,尽管已经有了开源王炸,对于非隐私性的知识获取,Brave目前工作流程中用的较多的基础性工具还是Google和Brave浏览器中的联网AI。原因是,无需登录,免费,不耗Token。
但从知识生产角度,目前可用的AI工具并不多。包括Manus等AI Agent,看似智能,但很难替代专家判断流程。
因此,打造自己的流水线是刚需。安装了Handy以后,自己写的实时听写工具也闲置了——这正是"如无必要,勿增实体"的最佳实践。
🔹 为什么通用AI Agent不够用
2025年被广泛称为"AI Agent元年",各类通用AI Agent产品层出不穷。然而,BraveDAO早在2025年初就提出了一个关键判断:AI Agent是个看起来很美的叙事,因为术业有专攻。
除了写代码可以AI Agent,很多流程更复杂的专业工作无法全自动化,只能是半自动 + 人工实时决策。而且由于专业分工不同,通用的AI Agent意义很有限。如果想要自动化,就必须是专业人员自己写代码,开发自己的AI Agent或AI流水线。
简单概括当前形势:
- ⏱️ 时代红利确实存在。 2025年是AI Agent元年,AI应用落地的关键是AI Agent落地。Meta以20亿美元的高价收购Manus,本身就是对AI Agent赛道价值的巨额背书。
- 🎭 叙事制造的能力不容忽视。 Meta也很会制造叙事。上一个是元宇宙。各类Manus开源替代项目(如OpenManus等),在收购消息传出后面临巨大的竞争压力。
- ⚠️ 但用户付费使用通用Agent并不明智。 Manus根本无法替代专业工作。它能处理的是标准化、可模板化的任务——市场调研、数据分析、基础编码等。但对于需要深度专业判断的领域(如知识管理、学术研究、投资决策),通用Agent的能力仍然远远不够。
- 🛠️ 想Vibe Coding,Claude Code就是最好的AI Agent。 Claude Code是Anthropic推出的编程Agent,可以直接在终端中执行代码、操作文件系统、完成多步骤任务。对于想要构建自己AI流水线的主权个人来说,它是最直接、最强大的工具。
💡 核心观点:AI Agent叙事虽热,但真正的高效来自个人定制的半自动化流水线。拒绝闭源软件,利用AI编写代码,构建属于自己的数字护城河。
二、Vibe Coding 与 WordPress 基础设施的演进
🔹 技术栈全景
BraveDAO核心技术就是 Docker + WordPress + Web3。这三者的关系是:
- 🐳 Docker:负责运行为WordPress提供功能支撑的开源软件,如Trilium、Calibre、Speaches、n8n、FileBrowser、Miniflux 等。通过Docker Compose,开源软件的名单可按需拓展,且不同容器之间可通过Docker内部网络直接通信,无需暴露到公网。
- 🌐 WordPress:功能性的WP插件负责AI流水线和自动化任务,WP主题则逐步升级到FSE(全站编辑)和JSX。每个专为主权个人的AI流水线量身定制的WP插件,都是一艘"战舰"。WordPress和Docker则扮演"航母编队"的角色。
⛓️ Web3:以Cardano区块链为基础,提供去中心化身份认证(钱包登录)和DAO治理功能,确保基地的所有权和控制权分布在社区成员手中。
🔹 战舰通信与实战案例
通过Docker Compose,开源软件之间借助WordPress插件("战舰")实现通信。比如最近添加了Miniflux,并通过将AI筛选挖掘功能编写为专门的WP插件(Trilium RSS Digest),实现对订阅推文、YouTube频道、网络文章的AI过滤。精选内容自动发送到Trilium笔记并生成简报,最终在基地站点呈现。
具体的调兵遣将通过WP插件来完成。作为最高统帅,在WordPress前端即可简单操作。每个插件负责各司其职,无需求只需禁用即可。需要新功能,则只需继续部署新插件。
🔹 WordPress前端的AI化
随着WordPress引入React生态,现在前端已经可以做到纯JSX的效果。基于PHP的插件是功能性的,PHP只是一部分,结合Docker可整合任何编程语言,按需打造无敌舰队。
BraveDAO新开发的Trilium AI Design插件,就是这一趋势的最佳体现。这个插件能够让AI理解古登堡编辑器的Block结构,快速生成人类想要的站点页面。用该插件一键生成的原生古登堡代码首页,按照人工设计能力,没一小时做不出来——但AI在几分钟内就完成了。WordPress站点迎来了AI一键生成的时代。
进一步优化FSE(全站编辑),用Interactivity API和JSX重写站点,更需要专业知识。这也是Vibe Coding "能提质增效但不能替代人"的又一个例证——AI可以极大加速实现过程,但架构设计和技术选型仍然需要专业人员把关。
🔹 什么是 Vibe Coding
Vibe Coding(氛围编程)这一术语由计算机科学家 Andrej Karpathy 于2025年2月首次提出。Karpathy是OpenAI联合创始人、前特斯拉AI负责人,在AI领域具有极高的权威性。该术语于2025年3月被收录入《美利坚遗产词典》(Merriam-Webster),并被柯林斯英语词典(Collins English Dictionary)评为2025年度词汇。
其核心理念是:用户使用自然语言描述需求或想法,AI(主要是大型语言模型LLM)根据这些描述生成相应的计算机代码。在真正的Vibe Coding中,开发者不深入审查代码的具体实现细节,而是通过工具运行结果来评估代码质量,并通过持续对话让AI迭代改进。正如Karpathy所说:你信任AI的能力,让它自己修复自己的错误——"surrender to the vibes"(顺从氛围)。
🔹 从 Vibe Coding 到 Agentic Engineering
2026年初,Karpathy本人进一步提出了"Agentic Engineering"(智能体工程)的概念,认为Vibe Coding正在进化为更结构化的实践。他写道:"之所以称为'agentic',是因为新的默认状态是你99%的时间不直接写代码,你编排执行代码的Agent,并充当监督者。"这一演进路径与BraveDAO的实践高度一致——我们正是在编排多个AI Agent来执行知识生产的各个环节。
截至2026年,Vibe Coding已从Karpathy最初描述的"周末原型项目"式的随意实践,演变为一种被广泛采用的开发范式。数据显示:
- 📊 84%的开发者已经使用或计划在2026年使用AI辅助编程工具
- 📱 iOS应用发布量同比增长60%,这一激增被直接归因于Vibe Coding降低了编程门槛
- 🎓 2026年6月,首届"Vibe Coding与Vibe Research国际研讨会"(VibeX 2026)将在学术界举办,标志着这一实践已获得严肃的学术关注
🔹 Vibe Coding 的能与不能
Vibe Coding 能提质增效,但还不能替代人。它的最佳应用场景是:在既有专业知识的基础上,利用AI加速开发和迭代。BraveDAO的实践证明了这一点——站点升级到AI时代的前提是创始人本身是WordPress专家,在既有知识基础上进行Vibe Coding。
Vibe Coding的局限性同样值得严肃对待。当开发者不审查AI生成的代码时,可能引入未被发现的bug、安全漏洞或效率低下的实现。对于原型验证和个人项目,这种权衡通常可接受;但对于生产环境和安全关键型系统,仍需要专业人员的审查和把关。BraveDAO采用的策略是"Vibe Coding + 专家审核"的半自动模式——AI负责生成和迭代,人类负责方向定义和质量把关。
三、架构全景:私有认知基础设施
以下是BraveDAO已落地运行主权个人AI流水线战舰的主要实践架构,除了可以处理上万个任务的Trilium AI Chat,还包括语音转录、YouTube、Twitter信息分析等自动化工作流。
🔹 当前的基石性战舰
最近相关技术实践的最新动向是,把信息源筛选纳入AI Agent,并开发了专门对接Miniflux的Trilium AI子插件(Trilium RSS Digest),实现了从信息采集到知识生产的完整自动化闭环。
┌─────────────────────────────────────────────────────────────────┐
│ 🎛️ WordPress 总控室 │
│ (AI流水线调度 / Agent编排 / 跨系统协调中枢) │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 插件接口 │ │ REST API │ │ Cron Job │ │
│ └────┬─────┘ └────┬─────┘ └────┬─────┘ │
└──────────────┼─────────────┼─────────────┼───────────────────────┘
│ │ │
┌───────┴───────┬─────┴─────┬───────┴───────┐
▼ ▼ ▼ ▼
┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ 🧠 Trilium │ │ 📂 FileBrowser│ │ 📚 Calibre │ │ 🤖 AI Agent │
│ 语义记忆库 │ │ 文件触角 │ │ 文明智库 │ │ 执行核心 │
│ │ │ │ │ │ │ │
│ • 层级笔记 │ │ • 文件读写 │ │ • 电子书库 │ │ • 理解意图 │
│ • 关系图谱 │ │ • 格式转换 │ │ • 知识提取 │ │ • 生成代码 │
│ • ETAPI接口 │ │ • 监控变化 │ │ • 音频转化 │ │ • 自我修复 │
└──────┬──────┘ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘
│ │ │ │
└───────────────┴───────────────┴───────────────┘
│
▼
┌─────────────────────┐
│ 💫 Vibe (主权个人的意志)│
│ 意图 / 风格 / 规则 │
└─────────────────────┘理解这张架构图的关键在于信息的流向:最底层是主权个人的"Vibe"——即你的意图、审美偏好和处理规则;中间层是四个执行组件,分别负责记忆、感知、知识和行动;最上层是WordPress作为总控室,协调所有组件的运作。整个系统的设计哲学是"声明式"的——你声明你想要什么(Vibe),系统负责实现怎么做(Agent执行)。
当然,这个图还不够全面,还有另外三大默默工作的后勤支持:
一是Brave自己写的基于youtube-dlp实现的YouTube字幕转录工具;
二是支持语音转文字、实时语音翻译和实时语音转录的Speaches,用来处理音频类知识,然后通过WordPress插件把结果发回Trilium笔记;
三是用来处理RSS内容(包括YouTube和推文)的Miniflux。
同时,借助Docker Compose编排,原则上后端支持工具可按需无限拓展。
🔹 前端WordPress插件的实现
通过Vibe Coding实现的WordPress插件,是各个开源工具的连接器,以及调度舰船。
其中,除了Trilium WP和Calibre WP这两个像严父慈母一样的基础插件,这里的王炸和最强战舰、准母舰是Trilium AI Chat。
Trilium AI Chat是控制所有任务的交互主界面,同时整合了发送到笔记、模型、AI Agent、联网检索等功能,支持流式响应,并集成了录音实时转录系统、YouTube语音/字幕转录系统,以及基于WordPress的流水线编排系统。所有的一切,最终会保存到Trilium笔记。这是Brave目前最引以为傲的Vibe Coding作品。
🔹 流水线编排与Prompt管理
在前端,借助WordPress提供的CMS功能,可以有序、分类、按照进程管理成千上万个Prompt,并借助谷登堡块,一键触发Trilium AI Chat。
这意味着,不需要离开WordPress,就能统一管理执行所有工作任务,无论是半自动任务还是AI Agent全自动任务,堪称主权个人的最佳实践。
如果你真的搞懂了WordPress,就会认识到,在流水线编排与Prompt管理方面,世界上没有第二个能替代WordPress的工具,WordPress在CMS领域,是绝对的独孤求败。
四、各组件的本质角色
🎛️ WordPress:不是网站,是调度台
| 传统认知 | 本架构定位 |
|---|---|
| 博客/门户 | AI流水线的总控室 |
| 面向访客 | 面向Agent |
| 内容展示 | 任务编排与跨系统协调 |
为什么是WordPress?这个问题值得深入回答。WordPress的插件架构 + REST API + Cron Job + 自定义字段系统,天然就是一个低代码自动化调度平台。Trilium AI Chat等WordPress插件正是利用这一特性,将AI聊天与知识库系统融为一体,构建了"AI模型与个人知识系统的智能桥梁"。同时,Vibe Coding对WordPress插件赋能水平较高,可以很敏捷地进行功能迭代。
2026年的行业发展进一步验证了这一选择的前瞻性:
- 📌 WordPress官方于2026年2月正式发布了WordPress MCP Adapter,将WordPress的"Abilities API"桥接到Model Context Protocol(MCP),使AI Agent能够以编程方式发现和调用WordPress插件、主题和核心功能。该Adapter已随WordPress 6.9进入核心。
- 🔌 AI Engine插件已能将任何WordPress站点转化为MCP服务器,支持Claude、ChatGPT等AI Agent直接连接、浏览内容、编辑文章、管理媒体。最新更新引入了Streamable HTTP传输协议,使Claude Code能直接连接WordPress。
- 🔑 WordPress.com也内置了MCP服务器,支持OAuth 2.1授权,AI工具的接入变得极为简便。
- 🌍 WordPress目前占全球网站总数的43%,其代码、插件和主题完全开源。正如BraveDAO在此前的课程中所述,WordPress可被视为主权个人时代的数字基础设施,其在国外的流行程度堪比中文世界的微信小程序。
这些发展意味着,选择WordPress作为Agent调度台不是一个孤立的技术决策,而是站在了全球最大开源CMS生态的AI化浪潮之上。
🧠 Trilium:语义记忆的核心
Trilium Notes不是普通笔记工具,而是可无限扩展的个人知识管理系统。它采用层级结构来组织笔记,允许用户构建复杂而有序的知识网络。与Notion等SaaS工具不同,Trilium完全自托管,数据存储在你自己的服务器上,不存在任何隐私泄露或平台锁定的风险。
其关键价值:
| 特性 | 对Agent协同的意义 |
|---|---|
| 📊 层级结构 | 为Agent提供清晰的知识分类体系,笔记可嵌套至任意深度,支持笔记克隆(同一笔记出现在多个位置) |
| 🕸️ 关系图谱 | Agent可追踪概念间的语义关联,自动发现和建立知识节点之间的联系 |
| 🔌 ETAPI接口 | 外部应用可读取、搜索、创建、修改笔记,实现系统互联 |
| 🏠 自托管 | 数据完全私有,无隐私泄露风险 |
| 🏷️ 标签与属性系统 | 丰富的元数据支持,Agent可基于属性进行精确查询和自动分类 |
Trilium的ETAPI是整个工作流的关键枢纽——它使知识库不再是封闭孤岛,而是开放的知识中心,能与各类工具无缝集成。正如BraveDAO的实践所展示的:通过WordPress自定义插件调用Trilium的ETAPI,可以动态获取知识库内容,实现从私人知识到公开分享的无缝转化。
🆕 2026年技术验证: TriliumNext社区生态已实现原生LLM集成。截至2026年2月,在MCP服务器目录中已出现多个Trilium专用MCP服务器——包括aimbitGmbH的trillium-mcp(2026年1月发布,支持可配置的READ/WRITE权限)、tan-yong-sheng的triliumnext-mcp(基于TriliumNext官方Issue #705开发的原型)、以及RadonX和pwelty分别开发的mcp-trilium等。这些MCP服务器让Claude Desktop、VS Code等AI助手能直接读写Trilium笔记,标志着"AI + 个人知识库"的生态已进入爆发期。BraveDAO的实践则通过Trilium WP系列自研插件,走在了社区发展方向的前面。
📂 FileBrowser:Agent的物理感知层
大多数AI Agent只能处理对话中的文本,无法直接操作文件系统。FileBrowser填补了这一缺口:
| 能力 | 价值 |
|---|---|
| 📖 文件读写 | Agent可主动扫描、处理文件 |
| 🔄 格式转换 | 自动将文档转为Agent可消费的格式 |
| 👀 监控变化 | 新素材入库自动触发处理流程 |
| 🌐 多源挂载 | 统一管理本地磁盘、S3、WebDAV |
| 👥 多用户支持 | 每个用户拥有独立目录,支持团队协作场景 |
FileBrowser提供了一个基于Web的文件管理界面,可在指定目录内上传、删除、预览、重命名和编辑文件。它可以作为独立应用运行,也可以通过Docker轻松集成到现有基础设施中。
目前,BraveDAO的FileBrowser已经实现了与AI Agent的无缝对接。下一步升级后,基地成员仅需Cardano钱包登录即可一站式访问FileBrowser,实现去中心化身份认证与文件管理的融合。
💡 精髓:FileBrowser让Agent拥有了"物理触角",能够感知和操作非结构化数据。如果说Trilium是Agent的"大脑",FileBrowser就是Agent的"双手"——它让AI能够触摸和处理现实世界中的文件。
📚 Calibre Web:人类文明的知识接口
Calibre Web书库中的成千上万本书,通常以"死数据"形式沉睡。本架构将其激活为Agent的知识源泉:
| 传统使用 | 本架构角色 |
|---|---|
| 手动阅读、手动摘录 | Agent自动阅读、自动提取 |
| 书籍孤立存放 | 与Trilium知识网络交叉引用 |
| 被动查阅 | 主动参与知识生产 |
🆕 2026年技术验证: Calibre 8.0引入了革命性的Piper神经网络TTS引擎,这是一套完全本地运行的神经网络语音合成系统,无需将任何数据发送到云服务器。2025年8月发布的Calibre 8.8进一步完成了Piper TTS后端的完全重写,消除了对外部二进制文件的依赖,大幅提升了性能和稳定性。Calibre 8.x还加入了Audio Overlay工具,允许电子书作者使用不同的语音朗读书中的不同部分,创造更沉浸式的阅读体验。2025年12月的Calibre 8.16则进一步增加了AI功能,包括LM Studio集成,使用户可以直接在Calibre中向AI提问关于书籍内容的问题。
此外,BraveDAO此前的实践还将Calibre与Kavita整合,构建了高效的电子书全文检索系统。Kavita支持所有主流电子书格式的内容级检索,提供布尔逻辑、短语匹配和模糊搜索等高级搜索语法,弥补了Calibre在全文检索方面的短板。这些功能在BraveDAO的实践中,也都通过Calibre WP插件实现了。现在不仅能让Agent"读书",还能自己"听书"。
🤖 AI Agent:Vibe Coding驱动的执行核心
Agent在架构中的本质角色:
| 维度 | 表现 |
|---|---|
| 🔤 技术翻译官 | 将主权个人的自然语言意图转化为可执行代码 |
| 🔗 跨系统协调者 | 在WordPress、Trilium、FileBrowser、Calibre间穿梭执行 |
| 🔄 自我进化者 | 代码冲突时自动修复,持续适应环境变化 |
| 📋 流程编排者 | 按照预设的Vibe规则,自动编排多步骤工作流 |
| 🧪 质量守护者 | 在执行过程中自动检测异常并反馈 |
💡 Vibe Coding的精髓:主权个人定义"感觉",Agent负责实现。编程的尽头是表达和个人的意志。
BraveDAO实践的最新动向是,把信息源筛选纳入AI Agent,并开发了专门对接Miniflux的Trilium AI子插件。这意味着AI Agent不仅能执行既定任务,还能主动参与信息筛选——在数千条RSS信息中识别高价值内容,自动过滤噪音,将精选结果写入Trilium并生成每日简报。
五、知识的"活化"——从存储到流动
🔹 传统模式 vs 本架构
| 传统知识管理 | 本架构 |
|---|---|
| 知识是被检索的对象 | 知识是主动参与生产的资源 |
| 存进去后很少唤醒 | 在流动中自动增值、自动关联 |
| 人工转换格式、手工发布 | Agent自动完成全链路 |
| 单向存储,越存越乱 | 双向流动,越用越精 |
| 知识之间互相隔离 | 知识自动形成语义网络 |
🔹 知识流动的闭环
输入 加工 产出
──────────────────────────────────────────────────────────
FileBrowser ──┐ ┌──► Trilium结构化笔记
(原始素材) │ │
├──► AI Agent ──► Vibe ──┤──► 知识图谱更新
Calibre ──────┤ (理解+执行) (你的意图) │
(书籍知识) │ └──► 新任务生成
│
Trilium ──────┘
(已有笔记)
│
└──────────────────────────────────────────────────►
回馈环:Agent反思结果写回Trilium这个流动闭环的关键在于最底部的"回馈环"。传统知识管理是线性的:输入→存储→偶尔检索。而本架构是循环的:每次Agent执行任务后,都会将执行结果、发现的新关联、甚至执行过程中遇到的问题写回Trilium。这意味着系统在使用过程中不断自我丰富——你的知识库不是越用越旧,而是越用越"聪明"。
举一个具体例子:当Agent从Calibre中提取了一本关于区块链治理的书籍内容后,它不仅会在Trilium中创建结构化笔记,还会自动与已有的Cardano相关笔记建立关联,并标注哪些观点支持、补充或矛盾于已有知识。如果发现矛盾,Agent会主动生成一条"待人工审核"的任务,等待主权个人裁定。这就是"知识活化"的真正含义——知识不再是死的文本,而是活的、有联系的、持续演化的有机体。
💡 精髓:知识在流动中自动完成价值转化。Agent执行后的"反思"写回Trilium,实现知识的自我生长。
六、打造反算法的信息筛选系统
🔹 算法困境与解决之道
商业算法的本质是利用人类的注意力弱点来最大化平台的广告收入。社交媒体的推荐算法会持续推送能引发情绪反应的内容(愤怒、焦虑、好奇),而非对个人成长真正有价值的信息。长期暴露于此,会导致"认知带宽"的严重损耗——你的注意力被低质量信息占据,真正重要的知识反而无暇关注。
Trilium AI 则通过打造智能RSS信息筛选系统,超越算法推荐,最大化主权个人的认知带宽。三步助力高质量输入:
- 📡 用Miniflux抓取高质量信息源
- 🤖 AI模型信息降噪,去芜存菁
- 📋 Trilium AI每天将数千条信息自动生成带链接的每日简报,类似大臣给皇帝上奏折。皇帝按需批阅。
🔹 Trilium RSS Digest:打破算法洗脑的利器
这个用于信息筛选的Trilium AI子插件被命名为Trilium RSS Digest。
实际效果展示:在对近三天的139篇RSS信息进行AI筛选测试中,提示词明确要求AI按照"对个人成长的意义"来打分。
打开Miniflux,大量键政信息不堪入目。经AI过滤(使用GPT-5.2模型),除了少数对个体有直接价值的经济和投资类信息,绝大多数键政信息都被精准过滤掉了。AI在信息筛选方面确实比人类更加理性和高效。
更有趣的实践:通过找到一个支持RSS的Nitter实例,订阅了自己的推文,并自动推送给AI。Trilium AI自动总结了近两天推文的关注焦点,实现了对自身信息输出的自动化追踪和反思。
七、基地的AI引擎化与近期迭代
🔹 从人工维护到AI自动化
AI时代,人的关键角色在于打造主权个人的AI系统,并为算法提供注意力来源、流程辅助和最终审核。基地正在经历从人工维护向AI自动化维护的全面转型。
基地的dApp时代已经到来:基地沉淀了大量书籍数据,AI荐书功能写个插件就能有;之前的听书插件也可再升级;成员可一站访问FileBrowser,Cardano钱包登录就能用。甚至设计工作——新写的设计插件Trilium AI Design,可以让AI Agent自主完成基地站点的设计工作,创始人只负责把关。新时代开始了。
🔹 OpenClaw与OpenCode:AI流水线的新引擎
BraveDAO近期将两款重量级开源AI Agent工具——OpenClaw和OpenCode——充分整合到了现有插件体系中,为AI流水线注入了更强大的执行引擎。
🦞 OpenClaw(原名Clawdbot):你的私人AI助手
OpenClaw由开发者Peter Steinberger于2025年底创建,是2026年最受瞩目的开源AI项目之一,在GitHub上获得超过145,000颗星。BraveDAO在Brave基地发布了详尽的中文部署指南《主权个人必看的Clawdbot/OpenClaw本地部署完全指南(2026版)》,系统介绍了其部署、配置和使用方法。
OpenClaw与传统聊天机器人的本质区别在于:它不只是能"说话",更能"做事"。它拥有浏览网页、读写文件、执行Shell命令的能力——换句话说,它有"眼睛"和"双手"。其核心优势包括:
- 🌐 全平台覆盖: 支持WhatsApp、Telegram、Discord、Slack、Signal、iMessage、Microsoft Teams、Google Chat、Matrix、Zalo等50+平台,是真正意义上的"全平台私人助手"
- 🧩 插件/技能生态: ClawdHub是OpenClaw的官方技能市场,拥有565+社区技能。"技能"(Skills)本质上是一组指令和工具的组合,教会AI如何使用特定工具。此外还支持100+第三方MCP服务器集成
- 🔒 完全自托管: OpenClaw运行在你自己的设备上,用JavaScript/TypeScript编写,通过Node.js运行。它本身不包含AI大脑,需要连接到你选择的AI模型服务(最推荐Anthropic的Claude模型)——这意味着你完全掌控数据流向
BraveDAO将OpenClaw整合到现有WordPress插件体系后,其跨平台消息处理能力与Trilium知识库实现了联动。例如,通过Trilium AI直接发送消息到OpenClaw处理,处理完成后,再将结果写入Trilium或推送回用户——实现了"统一界面→AI Agent处理→知识沉淀"的完整闭环。
💻 OpenCode:开源终端编程Agent
OpenCode是一款基于Go语言构建的开源AI编程Agent,为终端、IDE和桌面环境提供AI编程辅助。截至2026年2月,它在GitHub上拥有超过95,000颗星,被250多万开发者每月使用,拥有650+贡献者。InfoQ在2026年2月的报道中称其为"与Claude Code和Copilot竞争的开源AI编程Agent"。
目前,OpenCode也已经被整合到Trilium AI Chat,可以随时调用。OpenCode的核心特性使其成为BraveDAO AI流水线的理想补充:
- 🤖 多模型支持: 支持75+种LLM提供商,包括Claude、GPT-5、Gemini以及通过Ollama运行的本地模型。关键优势在于可以在会话中途切换模型而不丢失上下文,让你为每个具体任务选择最合适的模型
- 🖥️ 交互式TUI: 基于Bubble Tea框架构建的终端用户界面,内置两个Agent——"build"(默认,拥有完整权限的开发Agent)和"plan"(只读分析Agent)——一个负责执行,一个负责规划
- 🔗 ACP协议支持: 支持Agent Client Protocol(ACP),可与JetBrains IDE、Zed、Neovim、Emacs等编辑器集成
- 📱 客户端/服务器架构: OpenCode可在本地运行,同时支持通过移动端远程驱动,TUI前端只是众多可能的客户端之一
- 🔒 隐私优先: OpenCode不存储代码或上下文,用户完全掌控会话共享权限。MIT许可证,完全免费开源,你只需为所选AI模型的使用量付费
在BraveDAO的实践中,OpenCode被整合为Vibe Coding工作流的核心执行工具之一。与Claude Code相比,OpenCode的最大优势在于无供应商锁定——你可以根据任务需要灵活切换不同的AI模型提供商,在成本和性能之间找到最佳平衡点。
BraveDAO的策略是:复杂的架构设计任务交给Claude Code,日常的代码修改和维护任务交给OpenCode搭配更经济的模型,最大化AI编程的性价比。
💡 OpenClaw负责"对外沟通"(跨平台消息、用户交互),OpenCode负责"对内执行"(代码编写、系统维护),两者与WordPress插件体系和Trilium知识库协同,构成了BraveDAO AI流水线的完整执行层。
八、为什么这是"主权个人"的基础设施
🔹 技术主权的四个维度
| 维度 | 价值 |
|---|---|
| 🗄️ 数据主权 | 所有数据都在你的服务器,不依赖任何SaaS平台 |
| ⚙️ 逻辑主权 | 规则由你通过Vibe定义,不受平台策略限制 |
| 🧬 进化主权 | Agent的行为由你塑造,系统按你的意志演化 |
| 💰 成本主权 | 无订阅费绑定,边际成本趋近于零 |
在2026年,多数人被锁在云服务订阅里,知识碎片化在各平台。BraveDAO的实践,意味着个体可以拥有完整的、可控的、可进化的认知基础设施。
这与全球趋势完全一致。2026年的企业界和政府层面都在从"云优先"向"控制优先"转型。正如分析师所指出的:"市场正在将租用智能的公司与真正拥有智能的公司区分开来。2026年的赢家将是那些把AI技术栈当作资本资产而非运营支出的人。"这一逻辑同样适用于个人——主权个人不租用别人的智能,而是建造自己的智能基础设施。
🔹 认知杠杆
一个人的阅读量、记忆力、执行力都有极限。Agent打破了这个极限:
- 📚 它能"读"完Calibre里所有书,提取精华写入Trilium
- 🔍 它能扫描Trilium所有笔记,发现逻辑矛盾并提示你
- 👁️ 它能24小时监控FileBrowser,自动处理新素材
- 🎨 它能按你的Vibe风格,持续生产符合你审美的输出
- 📡 它能每天筛选数千条RSS信息,只把高价值内容呈现给你
- 🔗 它能自动在新知识和旧知识之间建立语义关联
💡 主权个人的认知边界,将会被Agent无限扩展。
🔹 系统自进化
传统系统需要持续维护——插件冲突、API变更、版本升级都是负担。
本架构的Agent能自我修复。当Trilium API变化时,Agent根据你的Vibe重写兼容代码。维护成本趋近于零,系统随时间越用越强。
当然,"自我修复"并非完全无需人工干预。更准确的描述是:对于常规的API变更和小型冲突,Agent可以自动检测并修复;对于重大的架构变更或安全更新,仍然需要主权个人介入决策。本架构的目标不是消灭维护工作,而是将维护从"日常负担"降级为"偶尔的战略决策"。
2026年的技术验证全景
BraveDAO的实践与行业发展方向高度吻合:
| BraveDAO已实现 | 2026年行业动态 |
|---|---|
| WordPress作为Agent调度台 | WordPress官方MCP Adapter进入核心(v6.9);AI Engine插件将WP转为MCP服务器,支持Streamable HTTP传输;WordPress.com内置MCP + OAuth 2.1 |
| Trilium与Agent双向同步 | TriliumNext MCP服务器生态爆发:aimbitGmbH、tan-yong-sheng、RadonX等多个独立开发者发布Trilium MCP服务器,Glama目录收录超16,900个MCP服务器 |
| FileBrowser作为Agent文件接口 | AI沙箱平台集成FileBrowser作为文件操作界面 |
| Calibre知识提取+听书 | Calibre 8.0~8.16持续进化:Piper神经TTS引擎完全重写、Audio Overlay工具、LM Studio集成(Ask AI)、Kobo KEPUB原生支持 |
| Vibe Coding驱动全链路 | Karpathy提出"Agentic Engineering"概念演进;84%开发者使用AI工具;VibeX 2026首届国际学术研讨会举办;iOS应用发布量激增60% |
| 自托管AI基础设施 | Linux基金会报告81%组织视开源为AI主权关键;IBM发布Sovereign Core;Deloitte将技术主权列为2026首要趋势 |
| 整合OpenClaw与OpenCode | OpenClaw GitHub 145,000+星,支持50+平台、565+社区技能;OpenCode GitHub 95,000+星,支持75+模型提供商,月活250万开发者 |
BraveDAO的实践不是在追随趋势,而是走在了趋势前面。这套架构是自托管、AI、去中心化领域的先行实践。
九、小白入门指南:三步开始Vibe Coding
WordPress插件有多难?小白想尝试Vibe Coding并立竿见影,这是最好的切入点。最多就三步:
| 步骤 | 操作 | 说明 |
|---|---|---|
| ① | 🖥️ 搜索下载名叫Local的软件 | Local(由WP Engine开发)是一款免费的本地WordPress开发环境,一键安装即可在本地运行完整的WordPress站点,无需配置服务器、数据库等技术细节 |
| ② | 💬 想好需求,让Claude Code等工具帮你写插件 | 向AI描述你想要的功能,AI会自动生成完整的WordPress插件代码,并打包成zip文件 |
| ③ | 📦 登录站点,上传并启用插件 | 在WordPress后台的"插件→安装插件→上传插件"中上传zip文件,激活即可运行 |
对小白来说,唯一的痛点在于官方主题不好看,没接触过FSE(全站编辑),不知道如何设计。BraveDAO最近开发的Trilium AI Design解决了这个问题——答案是让AI做设计。AI已经能够很好地理解古登堡编辑器的Block结构,快速生成人类想要的站点样式和布局。
进阶展望:随着WordPress引入React,前端已经可以做到纯JSX的效果。基于PHP的插件是功能性的后端引擎,而前端表现力则借助JSX和Interactivity API不断突破。结合Docker,可整合任何编程语言的能力,按需打造属于自己的无敌舰队。
借鉴BraveDAO的思路,你也可以打造一套这样的系统这套架构是一个完全私有、可自进化的"认知操作系统"。
| 组件 | 角色比喻 | 功能 |
|---|---|---|
| 🎛️ WordPress | 神经中枢 | 调度 |
| 🧠 Trilium | 长期记忆 | 语义存储与关联 |
| 📂 FileBrowser | 感官系统 | 文件感知与操作 |
| 📚 Calibre | 外部知识接口 | 书籍知识提取 |
| 🤖 AI Agent | 执行系统 | 行动与自修复 |
| 🎯 Trilium AI | 总调度师 | 跨系统编排与协调 |
| 💫 Vibe | 主权个人的意志 | 意图与风格定义 |
本节课所探讨的内容想要传达的三个核心价值:
| 价值 | 内涵 |
|---|---|
| 🎯 意图驱动 | 主权个人定义Vibe,Agent执行一切。编程的尽头是表达 |
| 🌊 知识活化 | 知识在流动中自动增值、自动关联、自我生长 |
| 🏰 技术主权 | 数据、逻辑、进化权都在你手里。你是规则的制定者 |
这一实践对主权个人的意义是:AI时代,不是人机对抗,而是人机协奏。AI是强大的"做题家",但主权个人是"出题人"。
然而,纸上谈兵没有任何意义,想法落地成工具,才能发挥威力。
这套架构让主权个人成为了出题人——主权个人定义规则,Agent执行;主权个人设定边界,系统自进化;主权个人掌控数据,不受平台束缚。
在2026年的全球语境下,这一实践具有更深远的意义:当企业和国家都在重建对AI基础设施的控制权时,BraveDAO已经证明——个人同样可以拥有、控制和持续进化自己的认知基础设施。这不是未来的愿景,而已经是实实在在的现在。
接下来的课程中,Brave也将详细介绍这套流水线的不同面向,以及具体的技术实现思路,以便于大家能够动手搭建自己的主权个人AI流水线。
📖 延伸阅读:
回复