Decentralization? We're still early!
課 3 的 8
In Progress

第三课 Vibe Coding 与人工智能流水线入门

Brave 2025-04-23

"主权个人"(Sovereign Individual)是指那些不再受限于传统金融、教育或政治系统束缚的个体。他们利用技术自主掌控自己的数据、知识和生产方式。

在2026年,这一理念迎来了技术上的完整支撑:Vibe Coding(氛围编程)让非程序员能够用自然语言驱动复杂系统,AI Agent 则成为不知疲倦的执行者。当这两者与自托管的开源工具栈结合时,个人第一次真正拥有了构建私有认知基础设施的能力。

值得注意的是,AI时代,"主权"已不仅是个体层面的追求。从企业到国家,"主权AI基础设施"正在成为全球战略共识。Linux基金会《主权AI现状报告》显示,81%的组织将开源软件视为实现AI主权的关键路径,透明性(69%)和安全可审计性(60%)是最核心的驱动因素。在AI时代,用开源工具自托管AI基础设施,与全球从"云优先"到"控制优先"的范式转移高度同步,是AI应用领域的最佳实践。

本节课的主要内容是介绍当下BraveDAO已落地运行的实践架构——以 WordPress 为调度中枢,整合 Trilium、FileBrowser、Calibre,通过 Vibe Coding 驱动 AI Agent 实现知识的自动采集、加工、关联与演化。

这不是概念验证,而已经是Brave每天在使用的主权个人的AI流水线实践。本节课旨在从宏观层面向所有学员展示,如何从"使用工具"到"拥有基础设施",打造主权个人安全可控的认知操作系统。


一、核心命题:开源软件 + Vibe Coding,打造自主可控AI基础设施

当前,绝大多数人的知识管理仍停留在"工具消费者"阶段——使用Notion、Evernote、Obsidian等工具记录信息,但这种信息存储方式意味着个体并没有充分掌控数据。即便引入了AI,相关解决方案也不具有主权性。

而对于主权个人来说,关键是:开源软件 + Vibe Coding,打造自主可控AI基础设施。

知识管理从"人操作工具"变成"人定义意图,Agent执行操作"。主权个人不再是工具的使用者,而是规则的制定者。主权个人定义"Vibe"(意图、风格、流程),AI Agent负责在各系统间穿梭执行。

🔹 开源软件:主权个人的武器库

BraveDAO长期致力于开源软件的研究与推荐,在Brave基地(brave2049.com)上已收录并深度评测了超过两百个开源工具,涵盖几乎所有数字生活场景。这些工具构成了主权个人的完整"武器库"——你不需要依赖任何一家商业公司,就能搭建出功能齐全的数字基础设施。

以下是按领域分类的代表性开源工具一览:

领域代表工具说明
🧠 知识管理Trilium Notes、Joplin、LogseqTrilium是BraveDAO核心基础设施,支持层级笔记、关系图谱、ETAPI接口和完全自托管。Brave基地发布了大量Trilium深度教程,包括自托管部署、数据备份、与WordPress联动等
🤖 AI工具Open WebUI、AnythingLLM、Cherry Studio、LibreChat、FastGPT、MaxKBBrave基地在《六大开源AI知识管理工具全面对比》中做了详细评测:需要AI知识库管理选AnythingLLM或Cherry Studio,需要RAG系统选FastGPT,需要AI聊天界面选Open WebUI或LibreChat
📚 阅读与书籍Calibre、Calibre-Web、Kavita、FoliateCalibre是电子书管理的标杆,Kavita弥补其全文检索短板。Foliate是Linux上最佳的开源电子书阅读器,支持edge-tts语音朗读
🔐 隐私与安全Whonix、ShadowSocks、WireGuardBrave基地从密码朋克视角出发,系统介绍了VPN选型、匿名通信和网络安全实践
🎬 多媒体OBS Studio、VLC、FreeTubeFreeTube是注重隐私的YouTube客户端,让你在不被算法追踪的情况下观看视频内容;OBS Studio则是直播和录屏的行业标准开源方案
🗣️ 语音处理Buzz(Whisper)、Speaches、Handy基于OpenAI开源Whisper模型的语音转文字工具链,支持99种语言,完全本地运行,不向云端上传任何数据
💻 代码与开发Gitea、VS CodeGitea是轻量级自托管Git服务,让你把代码完全掌控在自己手中,支持从GitHub/GitLab导入
🏠 服务器管理Runtipi、DockgeRuntipi是开源家庭服务器管理器,基于Docker提供友好Web界面;Dockge是Uptime Kuma作者开发的Docker Compose管理工具,支持YAML可视化编辑和多主机管理
📡 信息聚合Miniflux轻量级RSS阅读器,是BraveDAO信息筛选流水线的关键信息源入口
🔄 自动化n8n开源工作流自动化平台,可对接数百种服务
📖 知识获取安娜的档案(Anna's Archive)影子图书馆搜索引擎,整合Z-Library、Library Genesis、Sci-Hub,通过开源代码和数据实现完全容灾
📂 文件管理FileBrowser基于Web的文件管理界面,支持多用户、多源挂载,是AI Agent的"物理触角"
📧 邮件Mailcow基于Docker的开源邮件服务器套件,集成Postfix、Dovecot等组件,支持通过Dockge快速部署

这些工具绝大多数都支持Docker部署,可以通过Docker Compose一键编排,或者支持在电脑上直接安装。

BraveDAO的实践证明了这样一个关键论点:在2026年,主权个人所需的几乎所有数字工具,都已经有成熟的开源替代方案。

因此,问题不在于"有没有",而在于"会不会整合"——而这正是Vibe Coding和AI Agent所解决的问题。

除了对两百多个开源软件的深入介绍研究,Brave基地还提供了一份《Awesome MacOS Software》开源软件清单,按数据库管理、代码编辑、剪贴板管理、云同步等数十个类别对开源工具做了系统梳理。Brave也一直在孜孜不倦地推荐AI相关的开源工具和最佳开源实践。

💡 核心理念:BraveDAO不只是一个知识社区,更是一座开源武器库。主权个人的第一步,是了解自己有哪些武器可用。

🔹 慎用闭源软件,拥抱开源替代

AI时代主权个人的数字生活就是软件自己写,但绝大多数人,必然不会走上主权个人的路。以Whisper Live Transcriber为例,这就是当前"闪电说"等闭源听写软件的开源替代——基于OpenAI的Whisper模型,完全本地运行,不将任何语音数据上传到云端。但对毫无求知欲的人来说,如何部署都是巨大负担,更别提自己写代码。因此,人和人的差距会一点点拉开,最终天差地别。

限于兴趣和精力,不是所有人都必须自己写代码,但对于主权个人来说,至少要有警惕心理,尽量拒绝一切闭源软件,特别是闭源的输入法软件(输入法掌握你所有的输入数据,是隐私泄露的最高风险区域)。而只要问一下AI,会发现Mac或Windows上已有类似的开源软件,比如Handy、Epicenter和OpenWhispr等等。AI时代,开源软件想有后门也不容易,AI都能检查出来。

当然,这里说的拥抱开源替代,不是说一切商业工具都不用。离开商业模型,开源模型处理不了复杂任务。没有Claude Code,Vibe Coding寸步难行。在工作中,我也深度使用所有Google的服务,特别是NotebookLM等工具,都非常好用。但涉及隐私的内容处理,我一定会优先选择开源工具。

🔹 BraveDAO推荐的开源听写方案

根据BraveDAO的实测,Handy非常好用,是AI时代的听写神器,基本可在基础场景上取代WhisperLiveKit,推荐大家尝试。

当然,BraveDAO自研的whisper-live-transcriber插件目前已支持 WhisperLiveKit 和 Speaches 双后端。其中,Speaches不仅支持语音转文字,还支持实时语音翻译和实时语音转录——这些功能是通过与AI对话中发现的。AI对话是一种主动的探索,可带来显著的知识增量。

🔹 如无必要,勿增实体

"如无必要,勿增实体"是BraveDAO在工具选择上的核心原则。Brave的自建AI流水线,只选最强工具。商业软件和其他开源软件也用,但作为补充。

比如,尽管已经有了开源王炸,对于非隐私性的知识获取,Brave目前工作流程中用的较多的基础性工具还是Google和Brave浏览器中的联网AI。原因是,无需登录,免费,不耗Token。

但从知识生产角度,目前可用的AI工具并不多。包括Manus等AI Agent,看似智能,但很难替代专家判断流程。

因此,打造自己的流水线是刚需。安装了Handy以后,自己写的实时听写工具也闲置了——这正是"如无必要,勿增实体"的最佳实践。

🔹 为什么通用AI Agent不够用

2025年被广泛称为"AI Agent元年",各类通用AI Agent产品层出不穷。然而,BraveDAO早在2025年初就提出了一个关键判断:AI Agent是个看起来很美的叙事,因为术业有专攻。

除了写代码可以AI Agent,很多流程更复杂的专业工作无法全自动化,只能是半自动 + 人工实时决策。而且由于专业分工不同,通用的AI Agent意义很有限。如果想要自动化,就必须是专业人员自己写代码,开发自己的AI Agent或AI流水线。

简单概括当前形势:

  • ⏱️ 时代红利确实存在。 2025年是AI Agent元年,AI应用落地的关键是AI Agent落地。Meta以20亿美元的高价收购Manus,本身就是对AI Agent赛道价值的巨额背书。
  • 🎭 叙事制造的能力不容忽视。 Meta也很会制造叙事。上一个是元宇宙。各类Manus开源替代项目(如OpenManus等),在收购消息传出后面临巨大的竞争压力。
  • ⚠️ 但用户付费使用通用Agent并不明智。 Manus根本无法替代专业工作。它能处理的是标准化、可模板化的任务——市场调研、数据分析、基础编码等。但对于需要深度专业判断的领域(如知识管理、学术研究、投资决策),通用Agent的能力仍然远远不够。
  • 🛠️ 想Vibe Coding,Claude Code就是最好的AI Agent。 Claude Code是Anthropic推出的编程Agent,可以直接在终端中执行代码、操作文件系统、完成多步骤任务。对于想要构建自己AI流水线的主权个人来说,它是最直接、最强大的工具。

💡 核心观点:AI Agent叙事虽热,但真正的高效来自个人定制的半自动化流水线。拒绝闭源软件,利用AI编写代码,构建属于自己的数字护城河。


二、Vibe Coding 与 WordPress 基础设施的演进

🔹 技术栈全景

BraveDAO核心技术就是 Docker + WordPress + Web3。这三者的关系是:

  • 🐳 Docker:负责运行为WordPress提供功能支撑的开源软件,如Trilium、Calibre、Speaches、n8n、FileBrowser、Miniflux 等。通过Docker Compose,开源软件的名单可按需拓展,且不同容器之间可通过Docker内部网络直接通信,无需暴露到公网。
  • 🌐 WordPress:功能性的WP插件负责AI流水线和自动化任务,WP主题则逐步升级到FSE(全站编辑)和JSX。每个专为主权个人的AI流水线量身定制的WP插件,都是一艘"战舰"。WordPress和Docker则扮演"航母编队"的角色。

⛓️ Web3:以Cardano区块链为基础,提供去中心化身份认证(钱包登录)和DAO治理功能,确保基地的所有权和控制权分布在社区成员手中。

🔹 战舰通信与实战案例

通过Docker Compose,开源软件之间借助WordPress插件("战舰")实现通信。比如最近添加了Miniflux,并通过将AI筛选挖掘功能编写为专门的WP插件(Trilium RSS Digest),实现对订阅推文、YouTube频道、网络文章的AI过滤。精选内容自动发送到Trilium笔记并生成简报,最终在基地站点呈现。

具体的调兵遣将通过WP插件来完成。作为最高统帅,在WordPress前端即可简单操作。每个插件负责各司其职,无需求只需禁用即可。需要新功能,则只需继续部署新插件。

🔹 WordPress前端的AI化

随着WordPress引入React生态,现在前端已经可以做到纯JSX的效果。基于PHP的插件是功能性的,PHP只是一部分,结合Docker可整合任何编程语言,按需打造无敌舰队。

BraveDAO新开发的Trilium AI Design插件,就是这一趋势的最佳体现。这个插件能够让AI理解古登堡编辑器的Block结构,快速生成人类想要的站点页面。用该插件一键生成的原生古登堡代码首页,按照人工设计能力,没一小时做不出来——但AI在几分钟内就完成了。WordPress站点迎来了AI一键生成的时代。

进一步优化FSE(全站编辑),用Interactivity API和JSX重写站点,更需要专业知识。这也是Vibe Coding "能提质增效但不能替代人"的又一个例证——AI可以极大加速实现过程,但架构设计和技术选型仍然需要专业人员把关。

🔹 什么是 Vibe Coding

Vibe Coding(氛围编程)这一术语由计算机科学家 Andrej Karpathy 于2025年2月首次提出。Karpathy是OpenAI联合创始人、前特斯拉AI负责人,在AI领域具有极高的权威性。该术语于2025年3月被收录入《美利坚遗产词典》(Merriam-Webster),并被柯林斯英语词典(Collins English Dictionary)评为2025年度词汇。

其核心理念是:用户使用自然语言描述需求或想法,AI(主要是大型语言模型LLM)根据这些描述生成相应的计算机代码。在真正的Vibe Coding中,开发者不深入审查代码的具体实现细节,而是通过工具运行结果来评估代码质量,并通过持续对话让AI迭代改进。正如Karpathy所说:你信任AI的能力,让它自己修复自己的错误——"surrender to the vibes"(顺从氛围)。

🔹 从 Vibe Coding 到 Agentic Engineering

2026年初,Karpathy本人进一步提出了"Agentic Engineering"(智能体工程)的概念,认为Vibe Coding正在进化为更结构化的实践。他写道:"之所以称为'agentic',是因为新的默认状态是你99%的时间不直接写代码,你编排执行代码的Agent,并充当监督者。"这一演进路径与BraveDAO的实践高度一致——我们正是在编排多个AI Agent来执行知识生产的各个环节。

截至2026年,Vibe Coding已从Karpathy最初描述的"周末原型项目"式的随意实践,演变为一种被广泛采用的开发范式。数据显示:

  • 📊 84%的开发者已经使用或计划在2026年使用AI辅助编程工具
  • 📱 iOS应用发布量同比增长60%,这一激增被直接归因于Vibe Coding降低了编程门槛
  • 🎓 2026年6月,首届"Vibe Coding与Vibe Research国际研讨会"(VibeX 2026)将在学术界举办,标志着这一实践已获得严肃的学术关注

🔹 Vibe Coding 的能与不能

Vibe Coding 能提质增效,但还不能替代人。它的最佳应用场景是:在既有专业知识的基础上,利用AI加速开发和迭代。BraveDAO的实践证明了这一点——站点升级到AI时代的前提是创始人本身是WordPress专家,在既有知识基础上进行Vibe Coding。

Vibe Coding的局限性同样值得严肃对待。当开发者不审查AI生成的代码时,可能引入未被发现的bug、安全漏洞或效率低下的实现。对于原型验证和个人项目,这种权衡通常可接受;但对于生产环境和安全关键型系统,仍需要专业人员的审查和把关。BraveDAO采用的策略是"Vibe Coding + 专家审核"的半自动模式——AI负责生成和迭代,人类负责方向定义和质量把关。


三、架构全景:私有认知基础设施

以下是BraveDAO已落地运行主权个人AI流水线战舰的主要实践架构,除了可以处理上万个任务的Trilium AI Chat,还包括语音转录、YouTube、Twitter信息分析等自动化工作流。

🔹 当前的基石性战舰

最近相关技术实践的最新动向是,把信息源筛选纳入AI Agent,并开发了专门对接Miniflux的Trilium AI子插件(Trilium RSS Digest),实现了从信息采集到知识生产的完整自动化闭环。

┌─────────────────────────────────────────────────────────────────┐
│                   🎛️ WordPress 总控室                           │
│          (AI流水线调度 / Agent编排 / 跨系统协调中枢)             │
│                                                                  │
│         ┌──────────┐  ┌──────────┐  ┌──────────┐                │
│         │ 插件接口  │  │ REST API │  │ Cron Job │                │
│         └────┬─────┘  └────┬─────┘  └────┬─────┘                │
└──────────────┼─────────────┼─────────────┼───────────────────────┘
               │             │             │
       ┌───────┴───────┬─────┴─────┬───────┴───────┐
       ▼               ▼           ▼               ▼
┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐
│ 🧠 Trilium  │ │ 📂 FileBrowser│ │ 📚 Calibre  │ │ 🤖 AI Agent │
│  语义记忆库  │ │   文件触角    │ │  文明智库   │ │  执行核心    │
│             │ │              │ │             │ │              │
│ • 层级笔记   │ │ • 文件读写   │ │ • 电子书库  │ │ • 理解意图   │
│ • 关系图谱   │ │ • 格式转换   │ │ • 知识提取  │ │ • 生成代码   │
│ • ETAPI接口 │ │ • 监控变化   │ │ • 音频转化  │ │ • 自我修复   │
└──────┬──────┘ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘
       │               │               │               │
       └───────────────┴───────────────┴───────────────┘
                               │
                               ▼
                    ┌─────────────────────┐
                    │  💫 Vibe (主权个人的意志)│
                    │  意图 / 风格 / 规则   │
                    └─────────────────────┘

理解这张架构图的关键在于信息的流向:最底层是主权个人的"Vibe"——即你的意图、审美偏好和处理规则;中间层是四个执行组件,分别负责记忆、感知、知识和行动;最上层是WordPress作为总控室,协调所有组件的运作。整个系统的设计哲学是"声明式"的——你声明你想要什么(Vibe),系统负责实现怎么做(Agent执行)。

当然,这个图还不够全面,还有另外三大默默工作的后勤支持

一是Brave自己写的基于youtube-dlp实现的YouTube字幕转录工具;

二是支持语音转文字、实时语音翻译和实时语音转录的Speaches,用来处理音频类知识,然后通过WordPress插件把结果发回Trilium笔记;

三是用来处理RSS内容(包括YouTube和推文)的Miniflux。

同时,借助Docker Compose编排,原则上后端支持工具可按需无限拓展。

🔹 前端WordPress插件的实现

通过Vibe Coding实现的WordPress插件,是各个开源工具的连接器,以及调度舰船。

其中,除了Trilium WP和Calibre WP这两个像严父慈母一样的基础插件,这里的王炸和最强战舰、准母舰是Trilium AI Chat。

Trilium AI Chat是控制所有任务的交互主界面,同时整合了发送到笔记、模型、AI Agent、联网检索等功能,支持流式响应,并集成了录音实时转录系统、YouTube语音/字幕转录系统,以及基于WordPress的流水线编排系统。所有的一切,最终会保存到Trilium笔记。这是Brave目前最引以为傲的Vibe Coding作品。

🔹 流水线编排与Prompt管理

在前端,借助WordPress提供的CMS功能,可以有序、分类、按照进程管理成千上万个Prompt,并借助谷登堡块,一键触发Trilium AI Chat。

这意味着,不需要离开WordPress,就能统一管理执行所有工作任务,无论是半自动任务还是AI Agent全自动任务,堪称主权个人的最佳实践。

如果你真的搞懂了WordPress,就会认识到,在流水线编排与Prompt管理方面,世界上没有第二个能替代WordPress的工具,WordPress在CMS领域,是绝对的独孤求败。


四、各组件的本质角色

🎛️ WordPress:不是网站,是调度台

传统认知本架构定位
博客/门户AI流水线的总控室
面向访客面向Agent
内容展示任务编排与跨系统协调

为什么是WordPress?这个问题值得深入回答。WordPress的插件架构 + REST API + Cron Job + 自定义字段系统,天然就是一个低代码自动化调度平台。Trilium AI Chat等WordPress插件正是利用这一特性,将AI聊天与知识库系统融为一体,构建了"AI模型与个人知识系统的智能桥梁"。同时,Vibe Coding对WordPress插件赋能水平较高,可以很敏捷地进行功能迭代。

2026年的行业发展进一步验证了这一选择的前瞻性:

  • 📌 WordPress官方于2026年2月正式发布了WordPress MCP Adapter,将WordPress的"Abilities API"桥接到Model Context Protocol(MCP),使AI Agent能够以编程方式发现和调用WordPress插件、主题和核心功能。该Adapter已随WordPress 6.9进入核心。
  • 🔌 AI Engine插件已能将任何WordPress站点转化为MCP服务器,支持Claude、ChatGPT等AI Agent直接连接、浏览内容、编辑文章、管理媒体。最新更新引入了Streamable HTTP传输协议,使Claude Code能直接连接WordPress。
  • 🔑 WordPress.com也内置了MCP服务器,支持OAuth 2.1授权,AI工具的接入变得极为简便。
  • 🌍 WordPress目前占全球网站总数的43%,其代码、插件和主题完全开源。正如BraveDAO在此前的课程中所述,WordPress可被视为主权个人时代的数字基础设施,其在国外的流行程度堪比中文世界的微信小程序。

这些发展意味着,选择WordPress作为Agent调度台不是一个孤立的技术决策,而是站在了全球最大开源CMS生态的AI化浪潮之上。


🧠 Trilium:语义记忆的核心

Trilium Notes不是普通笔记工具,而是可无限扩展的个人知识管理系统。它采用层级结构来组织笔记,允许用户构建复杂而有序的知识网络。与Notion等SaaS工具不同,Trilium完全自托管,数据存储在你自己的服务器上,不存在任何隐私泄露或平台锁定的风险。

其关键价值:

特性对Agent协同的意义
📊 层级结构为Agent提供清晰的知识分类体系,笔记可嵌套至任意深度,支持笔记克隆(同一笔记出现在多个位置)
🕸️ 关系图谱Agent可追踪概念间的语义关联,自动发现和建立知识节点之间的联系
🔌 ETAPI接口外部应用可读取、搜索、创建、修改笔记,实现系统互联
🏠 自托管数据完全私有,无隐私泄露风险
🏷️ 标签与属性系统丰富的元数据支持,Agent可基于属性进行精确查询和自动分类

Trilium的ETAPI是整个工作流的关键枢纽——它使知识库不再是封闭孤岛,而是开放的知识中心,能与各类工具无缝集成。正如BraveDAO的实践所展示的:通过WordPress自定义插件调用Trilium的ETAPI,可以动态获取知识库内容,实现从私人知识到公开分享的无缝转化。

🆕 2026年技术验证: TriliumNext社区生态已实现原生LLM集成。截至2026年2月,在MCP服务器目录中已出现多个Trilium专用MCP服务器——包括aimbitGmbH的trillium-mcp(2026年1月发布,支持可配置的READ/WRITE权限)、tan-yong-sheng的triliumnext-mcp(基于TriliumNext官方Issue #705开发的原型)、以及RadonX和pwelty分别开发的mcp-trilium等。这些MCP服务器让Claude Desktop、VS Code等AI助手能直接读写Trilium笔记,标志着"AI + 个人知识库"的生态已进入爆发期。BraveDAO的实践则通过Trilium WP系列自研插件,走在了社区发展方向的前面。


📂 FileBrowser:Agent的物理感知层

大多数AI Agent只能处理对话中的文本,无法直接操作文件系统。FileBrowser填补了这一缺口:

能力价值
📖 文件读写Agent可主动扫描、处理文件
🔄 格式转换自动将文档转为Agent可消费的格式
👀 监控变化新素材入库自动触发处理流程
🌐 多源挂载统一管理本地磁盘、S3、WebDAV
👥 多用户支持每个用户拥有独立目录,支持团队协作场景

FileBrowser提供了一个基于Web的文件管理界面,可在指定目录内上传、删除、预览、重命名和编辑文件。它可以作为独立应用运行,也可以通过Docker轻松集成到现有基础设施中。

目前,BraveDAO的FileBrowser已经实现了与AI Agent的无缝对接。下一步升级后,基地成员仅需Cardano钱包登录即可一站式访问FileBrowser,实现去中心化身份认证与文件管理的融合。

💡 精髓:FileBrowser让Agent拥有了"物理触角",能够感知和操作非结构化数据。如果说Trilium是Agent的"大脑",FileBrowser就是Agent的"双手"——它让AI能够触摸和处理现实世界中的文件。


📚 Calibre Web:人类文明的知识接口

Calibre Web书库中的成千上万本书,通常以"死数据"形式沉睡。本架构将其激活为Agent的知识源泉:

传统使用本架构角色
手动阅读、手动摘录Agent自动阅读、自动提取
书籍孤立存放与Trilium知识网络交叉引用
被动查阅主动参与知识生产

🆕 2026年技术验证: Calibre 8.0引入了革命性的Piper神经网络TTS引擎,这是一套完全本地运行的神经网络语音合成系统,无需将任何数据发送到云服务器。2025年8月发布的Calibre 8.8进一步完成了Piper TTS后端的完全重写,消除了对外部二进制文件的依赖,大幅提升了性能和稳定性。Calibre 8.x还加入了Audio Overlay工具,允许电子书作者使用不同的语音朗读书中的不同部分,创造更沉浸式的阅读体验。2025年12月的Calibre 8.16则进一步增加了AI功能,包括LM Studio集成,使用户可以直接在Calibre中向AI提问关于书籍内容的问题。

此外,BraveDAO此前的实践还将Calibre与Kavita整合,构建了高效的电子书全文检索系统。Kavita支持所有主流电子书格式的内容级检索,提供布尔逻辑、短语匹配和模糊搜索等高级搜索语法,弥补了Calibre在全文检索方面的短板。这些功能在BraveDAO的实践中,也都通过Calibre WP插件实现了。现在不仅能让Agent"读书",还能自己"听书"。


🤖 AI Agent:Vibe Coding驱动的执行核心

Agent在架构中的本质角色:

维度表现
🔤 技术翻译官将主权个人的自然语言意图转化为可执行代码
🔗 跨系统协调者在WordPress、Trilium、FileBrowser、Calibre间穿梭执行
🔄 自我进化者代码冲突时自动修复,持续适应环境变化
📋 流程编排者按照预设的Vibe规则,自动编排多步骤工作流
🧪 质量守护者在执行过程中自动检测异常并反馈

💡 Vibe Coding的精髓:主权个人定义"感觉",Agent负责实现。编程的尽头是表达和个人的意志。

BraveDAO实践的最新动向是,把信息源筛选纳入AI Agent,并开发了专门对接Miniflux的Trilium AI子插件。这意味着AI Agent不仅能执行既定任务,还能主动参与信息筛选——在数千条RSS信息中识别高价值内容,自动过滤噪音,将精选结果写入Trilium并生成每日简报。


五、知识的"活化"——从存储到流动

🔹 传统模式 vs 本架构

传统知识管理本架构
知识是被检索的对象知识是主动参与生产的资源
存进去后很少唤醒在流动中自动增值、自动关联
人工转换格式、手工发布Agent自动完成全链路
单向存储,越存越乱双向流动,越用越精
知识之间互相隔离知识自动形成语义网络

🔹 知识流动的闭环

输入                     加工                     产出
──────────────────────────────────────────────────────────
FileBrowser ──┐                           ┌──► Trilium结构化笔记
(原始素材)     │                           │
               ├──► AI Agent ──► Vibe ──┤──► 知识图谱更新
Calibre ──────┤    (理解+执行)   (你的意图) │
(书籍知识)     │                           └──► 新任务生成
               │
Trilium ──────┘
(已有笔记)
         │
         └──────────────────────────────────────────────────►
                        回馈环:Agent反思结果写回Trilium

这个流动闭环的关键在于最底部的"回馈环"。传统知识管理是线性的:输入→存储→偶尔检索。而本架构是循环的:每次Agent执行任务后,都会将执行结果、发现的新关联、甚至执行过程中遇到的问题写回Trilium。这意味着系统在使用过程中不断自我丰富——你的知识库不是越用越旧,而是越用越"聪明"。

举一个具体例子:当Agent从Calibre中提取了一本关于区块链治理的书籍内容后,它不仅会在Trilium中创建结构化笔记,还会自动与已有的Cardano相关笔记建立关联,并标注哪些观点支持、补充或矛盾于已有知识。如果发现矛盾,Agent会主动生成一条"待人工审核"的任务,等待主权个人裁定。这就是"知识活化"的真正含义——知识不再是死的文本,而是活的、有联系的、持续演化的有机体。

💡 精髓:知识在流动中自动完成价值转化。Agent执行后的"反思"写回Trilium,实现知识的自我生长。


六、打造反算法的信息筛选系统

🔹 算法困境与解决之道

商业算法的本质是利用人类的注意力弱点来最大化平台的广告收入。社交媒体的推荐算法会持续推送能引发情绪反应的内容(愤怒、焦虑、好奇),而非对个人成长真正有价值的信息。长期暴露于此,会导致"认知带宽"的严重损耗——你的注意力被低质量信息占据,真正重要的知识反而无暇关注。

Trilium AI 则通过打造智能RSS信息筛选系统,超越算法推荐,最大化主权个人的认知带宽。三步助力高质量输入:

  1. 📡 用Miniflux抓取高质量信息源
  2. 🤖 AI模型信息降噪,去芜存菁
  3. 📋 Trilium AI每天将数千条信息自动生成带链接的每日简报,类似大臣给皇帝上奏折。皇帝按需批阅。

🔹 Trilium RSS Digest:打破算法洗脑的利器

这个用于信息筛选的Trilium AI子插件被命名为Trilium RSS Digest。

实际效果展示:在对近三天的139篇RSS信息进行AI筛选测试中,提示词明确要求AI按照"对个人成长的意义"来打分。

打开Miniflux,大量键政信息不堪入目。经AI过滤(使用GPT-5.2模型),除了少数对个体有直接价值的经济和投资类信息,绝大多数键政信息都被精准过滤掉了。AI在信息筛选方面确实比人类更加理性和高效。

更有趣的实践:通过找到一个支持RSS的Nitter实例,订阅了自己的推文,并自动推送给AI。Trilium AI自动总结了近两天推文的关注焦点,实现了对自身信息输出的自动化追踪和反思。


七、基地的AI引擎化与近期迭代

🔹 从人工维护到AI自动化

AI时代,人的关键角色在于打造主权个人的AI系统,并为算法提供注意力来源、流程辅助和最终审核。基地正在经历从人工维护向AI自动化维护的全面转型。

基地的dApp时代已经到来:基地沉淀了大量书籍数据,AI荐书功能写个插件就能有;之前的听书插件也可再升级;成员可一站访问FileBrowser,Cardano钱包登录就能用。甚至设计工作——新写的设计插件Trilium AI Design,可以让AI Agent自主完成基地站点的设计工作,创始人只负责把关。新时代开始了。

🔹 OpenClaw与OpenCode:AI流水线的新引擎

BraveDAO近期将两款重量级开源AI Agent工具——OpenClaw和OpenCode——充分整合到了现有插件体系中,为AI流水线注入了更强大的执行引擎。

🦞 OpenClaw(原名Clawdbot):你的私人AI助手

OpenClaw由开发者Peter Steinberger于2025年底创建,是2026年最受瞩目的开源AI项目之一,在GitHub上获得超过145,000颗星。BraveDAO在Brave基地发布了详尽的中文部署指南《主权个人必看的Clawdbot/OpenClaw本地部署完全指南(2026版)》,系统介绍了其部署、配置和使用方法。

OpenClaw与传统聊天机器人的本质区别在于:它不只是能"说话",更能"做事"。它拥有浏览网页、读写文件、执行Shell命令的能力——换句话说,它有"眼睛"和"双手"。其核心优势包括:

  • 🌐 全平台覆盖: 支持WhatsApp、Telegram、Discord、Slack、Signal、iMessage、Microsoft Teams、Google Chat、Matrix、Zalo等50+平台,是真正意义上的"全平台私人助手"
  • 🧩 插件/技能生态: ClawdHub是OpenClaw的官方技能市场,拥有565+社区技能。"技能"(Skills)本质上是一组指令和工具的组合,教会AI如何使用特定工具。此外还支持100+第三方MCP服务器集成
  • 🔒 完全自托管: OpenClaw运行在你自己的设备上,用JavaScript/TypeScript编写,通过Node.js运行。它本身不包含AI大脑,需要连接到你选择的AI模型服务(最推荐Anthropic的Claude模型)——这意味着你完全掌控数据流向

BraveDAO将OpenClaw整合到现有WordPress插件体系后,其跨平台消息处理能力与Trilium知识库实现了联动。例如,通过Trilium AI直接发送消息到OpenClaw处理,处理完成后,再将结果写入Trilium或推送回用户——实现了"统一界面→AI Agent处理→知识沉淀"的完整闭环。

💻 OpenCode:开源终端编程Agent

OpenCode是一款基于Go语言构建的开源AI编程Agent,为终端、IDE和桌面环境提供AI编程辅助。截至2026年2月,它在GitHub上拥有超过95,000颗星,被250多万开发者每月使用,拥有650+贡献者。InfoQ在2026年2月的报道中称其为"与Claude Code和Copilot竞争的开源AI编程Agent"。

目前,OpenCode也已经被整合到Trilium AI Chat,可以随时调用。OpenCode的核心特性使其成为BraveDAO AI流水线的理想补充:

  • 🤖 多模型支持: 支持75+种LLM提供商,包括Claude、GPT-5、Gemini以及通过Ollama运行的本地模型。关键优势在于可以在会话中途切换模型而不丢失上下文,让你为每个具体任务选择最合适的模型
  • 🖥️ 交互式TUI: 基于Bubble Tea框架构建的终端用户界面,内置两个Agent——"build"(默认,拥有完整权限的开发Agent)和"plan"(只读分析Agent)——一个负责执行,一个负责规划
  • 🔗 ACP协议支持: 支持Agent Client Protocol(ACP),可与JetBrains IDE、Zed、Neovim、Emacs等编辑器集成
  • 📱 客户端/服务器架构: OpenCode可在本地运行,同时支持通过移动端远程驱动,TUI前端只是众多可能的客户端之一
  • 🔒 隐私优先: OpenCode不存储代码或上下文,用户完全掌控会话共享权限。MIT许可证,完全免费开源,你只需为所选AI模型的使用量付费

在BraveDAO的实践中,OpenCode被整合为Vibe Coding工作流的核心执行工具之一。与Claude Code相比,OpenCode的最大优势在于无供应商锁定——你可以根据任务需要灵活切换不同的AI模型提供商,在成本和性能之间找到最佳平衡点。

BraveDAO的策略是:复杂的架构设计任务交给Claude Code,日常的代码修改和维护任务交给OpenCode搭配更经济的模型,最大化AI编程的性价比。

💡 OpenClaw负责"对外沟通"(跨平台消息、用户交互),OpenCode负责"对内执行"(代码编写、系统维护),两者与WordPress插件体系和Trilium知识库协同,构成了BraveDAO AI流水线的完整执行层。


八、为什么这是"主权个人"的基础设施

🔹 技术主权的四个维度

维度价值
🗄️ 数据主权所有数据都在你的服务器,不依赖任何SaaS平台
⚙️ 逻辑主权规则由你通过Vibe定义,不受平台策略限制
🧬 进化主权Agent的行为由你塑造,系统按你的意志演化
💰 成本主权无订阅费绑定,边际成本趋近于零

在2026年,多数人被锁在云服务订阅里,知识碎片化在各平台。BraveDAO的实践,意味着个体可以拥有完整的、可控的、可进化的认知基础设施。

这与全球趋势完全一致。2026年的企业界和政府层面都在从"云优先"向"控制优先"转型。正如分析师所指出的:"市场正在将租用智能的公司与真正拥有智能的公司区分开来。2026年的赢家将是那些把AI技术栈当作资本资产而非运营支出的人。"这一逻辑同样适用于个人——主权个人不租用别人的智能,而是建造自己的智能基础设施。

🔹 认知杠杆

一个人的阅读量、记忆力、执行力都有极限。Agent打破了这个极限:

  • 📚 它能"读"完Calibre里所有书,提取精华写入Trilium
  • 🔍 它能扫描Trilium所有笔记,发现逻辑矛盾并提示你
  • 👁️ 它能24小时监控FileBrowser,自动处理新素材
  • 🎨 它能按你的Vibe风格,持续生产符合你审美的输出
  • 📡 它能每天筛选数千条RSS信息,只把高价值内容呈现给你
  • 🔗 它能自动在新知识和旧知识之间建立语义关联

💡 主权个人的认知边界,将会被Agent无限扩展。

🔹 系统自进化

传统系统需要持续维护——插件冲突、API变更、版本升级都是负担。

本架构的Agent能自我修复。当Trilium API变化时,Agent根据你的Vibe重写兼容代码。维护成本趋近于零,系统随时间越用越强。

当然,"自我修复"并非完全无需人工干预。更准确的描述是:对于常规的API变更和小型冲突,Agent可以自动检测并修复;对于重大的架构变更或安全更新,仍然需要主权个人介入决策。本架构的目标不是消灭维护工作,而是将维护从"日常负担"降级为"偶尔的战略决策"。


2026年的技术验证全景

BraveDAO的实践与行业发展方向高度吻合:

BraveDAO已实现2026年行业动态
WordPress作为Agent调度台WordPress官方MCP Adapter进入核心(v6.9);AI Engine插件将WP转为MCP服务器,支持Streamable HTTP传输;WordPress.com内置MCP + OAuth 2.1
Trilium与Agent双向同步TriliumNext MCP服务器生态爆发:aimbitGmbH、tan-yong-sheng、RadonX等多个独立开发者发布Trilium MCP服务器,Glama目录收录超16,900个MCP服务器
FileBrowser作为Agent文件接口AI沙箱平台集成FileBrowser作为文件操作界面
Calibre知识提取+听书Calibre 8.0~8.16持续进化:Piper神经TTS引擎完全重写、Audio Overlay工具、LM Studio集成(Ask AI)、Kobo KEPUB原生支持
Vibe Coding驱动全链路Karpathy提出"Agentic Engineering"概念演进;84%开发者使用AI工具;VibeX 2026首届国际学术研讨会举办;iOS应用发布量激增60%
自托管AI基础设施Linux基金会报告81%组织视开源为AI主权关键;IBM发布Sovereign Core;Deloitte将技术主权列为2026首要趋势
整合OpenClaw与OpenCodeOpenClaw GitHub 145,000+星,支持50+平台、565+社区技能;OpenCode GitHub 95,000+星,支持75+模型提供商,月活250万开发者

BraveDAO的实践不是在追随趋势,而是走在了趋势前面。这套架构是自托管、AI、去中心化领域的先行实践。


九、小白入门指南:三步开始Vibe Coding

WordPress插件有多难?小白想尝试Vibe Coding并立竿见影,这是最好的切入点。最多就三步:

步骤操作说明
🖥️ 搜索下载名叫Local的软件Local(由WP Engine开发)是一款免费的本地WordPress开发环境,一键安装即可在本地运行完整的WordPress站点,无需配置服务器、数据库等技术细节
💬 想好需求,让Claude Code等工具帮你写插件向AI描述你想要的功能,AI会自动生成完整的WordPress插件代码,并打包成zip文件
📦 登录站点,上传并启用插件在WordPress后台的"插件→安装插件→上传插件"中上传zip文件,激活即可运行

对小白来说,唯一的痛点在于官方主题不好看,没接触过FSE(全站编辑),不知道如何设计。BraveDAO最近开发的Trilium AI Design解决了这个问题——答案是让AI做设计。AI已经能够很好地理解古登堡编辑器的Block结构,快速生成人类想要的站点样式和布局。

进阶展望:随着WordPress引入React,前端已经可以做到纯JSX的效果。基于PHP的插件是功能性的后端引擎,而前端表现力则借助JSX和Interactivity API不断突破。结合Docker,可整合任何编程语言的能力,按需打造属于自己的无敌舰队。


借鉴BraveDAO的思路,你也可以打造一套这样的系统这套架构是一个完全私有、可自进化的"认知操作系统"。

组件角色比喻功能
🎛️ WordPress神经中枢调度
🧠 Trilium长期记忆语义存储与关联
📂 FileBrowser感官系统文件感知与操作
📚 Calibre外部知识接口书籍知识提取
🤖 AI Agent执行系统行动与自修复
🎯 Trilium AI总调度师跨系统编排与协调
💫 Vibe主权个人的意志意图与风格定义

本节课所探讨的内容想要传达的三个核心价值:

价值内涵
🎯 意图驱动主权个人定义Vibe,Agent执行一切。编程的尽头是表达
🌊 知识活化知识在流动中自动增值、自动关联、自我生长
🏰 技术主权数据、逻辑、进化权都在你手里。你是规则的制定者

这一实践对主权个人的意义是:AI时代,不是人机对抗,而是人机协奏。AI是强大的"做题家",但主权个人是"出题人"。

然而,纸上谈兵没有任何意义,想法落地成工具,才能发挥威力。

这套架构让主权个人成为了出题人——主权个人定义规则,Agent执行;主权个人设定边界,系统自进化;主权个人掌控数据,不受平台束缚。

在2026年的全球语境下,这一实践具有更深远的意义:当企业和国家都在重建对AI基础设施的控制权时,BraveDAO已经证明——个人同样可以拥有、控制和持续进化自己的认知基础设施。这不是未来的愿景,而已经是实实在在的现在。

接下来的课程中,Brave也将详细介绍这套流水线的不同面向,以及具体的技术实现思路,以便于大家能够动手搭建自己的主权个人AI流水线。


📖 延伸阅读:

回复