Homestack:如何建构主权个人的数字生活基础设施
本文系BraveDAO开发的主权个人本地基础设施HomeStack的开发笔记。
一、问题
1993 年,埃里克·休斯在《密码朋克宣言》中写下:"密码朋克写代码。"这句话背后是一个判断:隐私不是靠法律争取的,而是靠技术实现的。如果你不能控制自己的数据,法律不会替你做这件事。
三十年后,这个判断的紧迫性远超休斯的想象。商业软件行业完成了从"卖软件"到"卖订阅"再到"卖你的数据"的三级跳。每一个你需要的功能——记笔记、读 RSS、听音乐、看电影、管财务、语音转文字、AI 对话——都对应一个 SaaS 产品,每个产品有自己的订阅费、隐私条款和数据锁定。你从未真正拥有这些软件,你只是在租用它们。
更深层的问题是所有权结构的改变。在桌面软件时代,你购买一份 Office 拷贝,数据存在本地硬盘,软件和数据的物理控制权在你自己手中。SaaS 模式将控制权从用户转移到了服务商——数据存在他们的服务器上,运行在他们的基础设施中,受他们的条款约束。这不是技术升级,这是产权关系的逆转。
SaaS 对商业公司是合理的(外包 IT 成本),对个人是灾难性的(放弃数据控制权)。但自托管的替代方案长期被局限在"把 Docker 跑起来"的层面——CasaOS、Umbrel、Dockge 等面板解决了部署问题,但没有回答一个更根本的问题:这些服务之间如何协作?
一个家庭的数字生活不是一组独立的应用。音频录制后需要转录,转录后需要 AI 整理,整理后需要存储,存储后需要检索和展示。这是一个管道,不是一个应用清单。
Homestack 是这个问题的技术答案。但它的前提是一个认知答案:AI 时代,一个人可以用开源工具和自己写的代码,构建一个完整的数字生活基础设施,替代大部分商业 SaaS,且数据完全由自己控制。
这本质上是密码朋克传统的一个新实践。早期密码朋克关注通信层的加密(PGP、Tor、Signal),后来的运动关注货币层的去中心化(Bitcoin、以太坊)。Homestack 关注的是基础设施层——如果一个人不能控制自己的计算基础设施,加密通信和去中心化货币都无法真正保障他的主权。数据需要运行在属于自己的硬件上,否则"拥有"只是一个法律虚构。
这也是主权个人概念在数字领域的必然延伸。大卫·戴维森和威廉·里斯-莫格在《主权个人》中预言了民族国家的衰退和个人能力的上升。在数字领域,主权个人的定义更具体:他能否在不依赖任何商业服务商的情况下,运行自己需要的全部数字服务?答案曾经是不能——运行邮件服务器、文件同步、AI 管道需要专业团队。2026 年的答案开始变为可以——因为 AI 缩小了个人与团队之间的能力差距,因为开源生态成熟了,因为像 Homestack 这样的工具将分散的组件编排成了一个系统。
这个系统的建立过程不是一次性的工程项目,而是一条持续四年的生长弧线。2022 年从一个需求(替代 Notion)开始,每一次扩展都对应一个真实痛点——商业产品涨价了、改条款了、关停了、或者仅仅是"我不想再为这个功能付费了"。每一个替换决定都是主权的一次微小恢复。
二、架构
这个系统由四层构成,Homestack 是入口。
2.1 基础设施层 — Homestack
Homestack 是一个基础设施编译器。输入是 Docker Compose 文件(加三个 homelab.* labels),输出是 Nginx 配置、SSL 证书、mDNS 注册、系统 watcher。支持 macOS(Apple Silicon)和 Ubuntu(NVIDIA)双平台。
设计原则:
- Compose 是第一公民。不加 DSL,不改用户 Compose,
{{DOMAIN}}是最小侵入。 - 透明。
nginx -t验证后才 reload,registry.json 明文可读。 - 可拆卸。
--purge删干净,不留 agent 和残留配置。 - 无面板。不需要运行一个 Web UI 来管理基础设施。
2.2 服务层
以下服务构成系统运行时。每个服务的选择标准一致:替代一个商业产品,且数据完全自控。
| 服务 | 用途 | 替代了什么 |
|---|---|---|
| Trilium | 树形笔记,知识湖 | Evernote / Notion |
| Miniflux | RSS 阅读器 | Feedly / Inoreader |
| Nextcloud | 文件同步 | Dropbox / iCloud |
| Calibre-Web | 电子书库 | Audible / 微信读书 |
| Speaches | Whisper 语音识别 | Otter.ai |
| yt-dlp-api | YouTube 媒体提取 | — |
| WhisperLiveKit | 实时语音识别 | — |
| Stremio | 电影/Torrent 流媒体 | Netflix |
| MeTube | YouTube 视频下载 | — |
| Transmission | BT 下载 | 迅雷 / uTorrent |
| Actual Budget | 家庭财务管理 | YNAB / Mint |
| BentoPDF | PDF 处理 | — |
| Navidrome | 音乐流媒体 | Spotify / Apple Music |
| WordPress | 交互外壳 | — |
覆盖笔记、阅读、文件、书籍、语音、电影、视频下载、BT 下载、财务、PDF、音乐十余类需求。每类都是曾经使用、后来放弃的商业产品。
2.3 交互层 — WordPress 插件集群
每个服务有自己独特的交互方式——RSS 需要摘要列表,电子书需要内嵌阅读器,语音需要上传表单,笔记需要树形浏览器,电影需要下载监控,财务需要账户视图。插件作为交互单元,每个 300-1600 行,注册 Gutenberg block 或 shortcode,独立运行。
三十余个插件(持续增长中)构成的集群是系统的交互层。它们共享 WordPress 的用户系统、路由管理和权限模型。
trilium 系列 → Trilium 笔记搜索、编辑、AI 对话、Agent 桥接
音频管道 → 音频/YouTube → 转录 → AI 整理 → Trilium
RSS 管道 → Miniflux → AI 摘要 → Trilium
电子书 → OPDS 客户端 + Foliate.js 阅读器 + TTS 朗读
AI 生成 → 图片生成、视频生成、语音合成
服务桥接 → Docker 状态、文件管理、WebDAV、音乐播放
系统增强 → 暗色模式、自定义展示
(持续增长中)2.4 知识层 — Trilium
所有处理产出的归宿是 Trilium,而非 WordPress。Trilium 是树形笔记数据库,提供 ETAPI 接口、脚本引擎、单目录备份。WordPress 通过只读桥接消费 Trilium 数据。
这是系统的关键决策:交互界面可以换,知识不能丢。
| 数据 | 存储位置 |
|---|---|
| 音频转录稿 | Trilium |
| RSS AI 摘要 | Trilium |
| YouTube 字幕提取 | Trilium |
| AI 对话记录 | Trilium |
| AI 图片 | WordPress 媒体库 |
| 视频 | 文件系统 |
| 财务数据 | Actual Budget 数据库 |
| WordPress 文章 | WordPress wp_posts |
三、范式转移
Homestack 不只是技术架构的堆叠,它体现的是三个层面的范式转移:所有权、交互和规模。
3.1 从租户到业主
SaaS 模式将用户变成了数字租户。你付费使用别人的基础设施,数据存放在别人的硬盘上,功能路线图由别人的产品经理决定。这是土地-佃农关系在数字世界的复制。
自托管将用户从租户变成了业主。你拥有硬件、拥有数据、拥有代码。没有人可以单方面修改条款、关闭服务、审查内容。这不是一个关于便利性的选择——如果便利是唯一标准,SaaS 显然更便利——这是一个关于控制权的选择。
Homestack 在中间提供了一个关键的桥梁:它让"成为业主"的门槛降低到了一个人可以操作的程度。十年前,运行一个邮件服务器需要 Unix 系统管理知识、DNS 配置、反垃圾邮件策略、安全加固。今天,运行一个包含邮件、文件、笔记、AI 管道的完整家庭基础设施,仍然需要一定技术能力,但这个能力门槛已经下降到了"愿意阅读文档"的水平。AI 将进一步降低这个门槛——未来你只需要描述需求,Homestack 就可以生成对应的配置。
3.2 从消费者到运营商
大多数人把自己定位为软件的消费者:安装、使用、付费。但当你运行自己的基础设施时,你变成了运营商——你需要监控、备份、升级、迁移、扩容。这不是所有人都想要的,但这是主权个人的必然要求。
运营者心态是对消费心态的超越。消费者问"哪个产品最好用",运营者问"这个服务的数据存在哪里,备份策略是什么,故障恢复流程是什么"。Homestack 通过 watcher 和 registry.json 提供了运营者需要的基础设施可见性,但更深层的认知转变在于:接受维护是自由的代价。
3.3 从小规模到网络效应
单个自托管系统是孤岛。一百个自托管系统形成一个网络。如果 Homestack 能够标准化插件和服务之间的通信协议(通过 registry.json 暴露状态、通过 ETAPI 互操作、通过 AI Agent 编排),那么一个去中心化的、个人所有的基础设施网络就开始具备超越商业 SaaS 的集体智能。
这不是虚构。telegram 群的十分钟回复速度,在社区层面就已经超过了任何商业客服。当越来越多的人运行兼容的基础设施,共享配置模板、插件和安全补丁,这个网络就产生了正反馈——人越多,系统越可靠,加入门槛越低。
四、人类在回路中:Agent、人与基础设施的三方关系
4.1 问题
AI Agent 进入 Homestack 生态后,出现了一个需要回答的底层问题:Agent 应该以什么身份与基础设施互动?是观察者、助手,还是操作者?
不同的选择通向不同的系统架构。让 Agent 全自动——自己决策、自己执行、自己部署——技术上完全可以实现,但它引出的问题比解决的问题更多:谁决定方向?当 Agent 和人的直觉冲突时听谁的?系统是为谁运转的?
4.2 答案:人提供意志,Agent 执行
观察这个系统中 Agent 实际做的事:
- 写 PHP 插件(calibre-wp 整了个遍)
- 写 JavaScript(Foliate.js 阅读器、foliate-tts.js)
- 写 Bash 模块(Homestack 检测模块)
- 写 Compose 配置
- 写文档(这篇文章本身就是 Agent 写的)
- 审查现有代码,找 bug,提改进方案
- 改配置、调参数、设计架构
- 运行命令——查文件、grep 代码、git diff、检测系统状态
Agent 既写代码也执行命令。这是对的。但有一个东西 Agent 不做:提供意志。
意志是:方向、价值观、决策、确认。"我们要支持 EPUB 阅读"是意志。"这个插件的架构应该这样设计"也是意志。"现在可以 deploy"还是意志。Agent 提供方案和代码,人给出意志——然后 Agent 在意志的框架内执行。
人(提供意志:方向、价值观、决策、确认)
→ AI Agent(在意志框架内执行:分析、设计、写代码、运行命令)
→ 系统(基础设施响应变更)
→ 人(评估结果,修正意志)
→ 循环这就是"人在回路中"的真实含义:人不是操作员,是指南针。
4.3 意志和执行的界限在哪里
界限不按层划分(不是"Agent 写代码,人运行命令"),也不按工具划分(不是"Agent 提议,人操作")。界限是按决策类型划分的。
| 决策类型 | 谁决定 | 例子 |
|---|---|---|
| 方向性决策 | 人 | "我们要做一个电子书阅读器","这个服务该不该加" |
| 实现方案 | Agent + 人确认 | "用 OPDS 协议对接 Calibre",架构设计 |
| 执行细节 | Agent | 具体代码怎么写、文件名、变量命名 |
| 部署时机 | 人确认 | "可以 deploy 了","这个改完就上线" |
| 异常处理 | 人 | "出错了,怎么办","这个行为不对" |
Agent 可以做任何事——写代码、改配置、运行命令、检查状态——只要在人的意志框架内。框架由方向性决策和确认动作定义。
4.4 为什么这个分工成立
1. 主权在意志,不在执行。
主权不是你动手做了多少事,是你的决定决定了系统的方向。你告诉 Agent"做一个电子书阅读器",这是一个决策。Agent 写了一天代码,这是执行。决策是你的,执行是 Agent 的。你可以做很少的操作,但仍然拥有完整的控制权——因为操作是在你的意志框架内发生的。
类比:CEO 不需要写代码,甚至不需要知道代码怎么写的。他做决策,团队执行。主权来自决策权,不是来自劳动量。
2. 意志不可委托。
Agent 可以代理执行,但不可以代理意愿。这是"主权个人"的底线:你不需要自己动手配置服务器,但你需要知道自己为什么要配、配成什么样、是否接受了这个结果。
如果 Agent 替你做决策——"我觉得你需要加一个音乐流媒体服务,我已经部署好了"——那主权就从你转移给了 Agent,无论这个决策对不对。问题的关键不是 Agent 做了什么,是谁决定的做什么。
3. 人做方向性决策,Agent 做实现性决策,二者需要对话来对齐。
这就解释了为什么当前对话模式是合理的:人给出方向("我需要能阅读 EPUB"),AI Agent在方向上执行(设计方案、写代码、运行命令),然后人把关结果("这里不对,改成这样")。AI Agent把结果反馈回理解,调整后继续。
这不是"效率低下的手动流程"。这是意志和执行之间的结构化对话。
4.5 授权演化:意志框架的扩缩
人在回路中的具体位置可以变化——不是二元(人在 / 人不在),而是授权范围的调整。
当前模式是紧耦合:每个方向性决策和每个确认动作都经过人。
演化方向是松耦合:人定义更大的意志框架,Agent 在框架内自主行动,只在关键决策点时同步。
| 授权模式 | 人的角色 | Agent 的角色 | 适用场景 |
|---|---|---|---|
| 紧耦合 | 给出方向 + 确认每步 | 在明确指令下执行 | 新功能开发、架构变更、不熟悉的领域 |
| 按领域授权 | 设定领域目标和边界 | 在边界内自主执行,边界外请示 | 熟悉的运维任务、定期维护 |
| 按规则授权 | 制定规则和异常处理策略 | 按规则自主运行,异常时上报 | 证书续期、日志清理、备份 |
| 战略模式 | 设定长期方向,审查阶段成果 | 将战略分解为任务并依次执行 | 系统演进、长期规划 |
每种模式的共同特征:人仍然掌握意志——方向性决策和最终确认——但操作频率不同。
授权范围可以因领域而异:Agent 在"证书续期"领域拥有高度自主权,在"架构设计"领域停留在紧耦合模式。授权也可以收放——如果 Agent 在一个领域的判断力下降,人随时收紧授权。
4.6 结论
人提供意志,Agent 在所有层执行。
这不是技术分工(哪层 Agent 碰、哪层人不让碰),是决策分工(什么决策人做、什么决策 Agent 做)。Agent 可以写代码、运行命令、改配置——只要在人的意志框架内。
主权来自"谁决定系统为什么运转",不是"谁动手让系统运转"。
五、范式(技术篇)
5.1 旧模型:App-Centric
商业软件时代的默认模式是用户适配多个互不联通的应用。每个应用独立部署、独立收费、独立存储数据、独立设计交互。用户在应用之间手动搬运数据。
5.2 新模型:Pipe-Centric
AI 时代的可能模式是一个人拥有一个可编程的数据管道。应用成为管道中的处理节点,而非终点。
这个系统中已经跑通的四条管道:
管道 1:语音 → 文字 → 知识库
上传音频 / YouTube 链接
→ Whisper 转录
→ AI 整理
→ Trilium 存储
→ WordPress 展示管道 2:RSS → 摘要 → 知识库
Miniflux 抓取 RSS
→ AI 摘要
→ Trilium 存储
→ WordPress 每日摘要管道 3:文本 → 图片 → 媒体库
用户输入 prompt
→ Draw Things 本地推理
→ WordPress 媒体库
→ 文章内嵌管道 4:新书 → AI 文章 → 知识库
Calibre 缓存刷新
→ OPDS 获取新书元数据
→ AI 生成书籍介绍
→ Trilium 存储
→ WordPress 展示5.3 集成范式:OPDS 代理模式
插件不总是直接消费 HTTP API。当服务之间需要认证、缓存、格式转换时,一个合理的模式是让 WordPress 同时充当客户端和代理。
calibre-wp 是这个模式的典型案例。Calibre-Web 通过 OPDS 协议(Atom+XML)暴露书库,calibre-wp 实现了完整的 OPDS 客户端:
WordPress (calibre-wp)
OPDS 客户端 → 解析 Atom Feed → 书籍元数据
封面代理 → 缓存 30 天 → 渐进式渲染
EPUB 代理 → 内嵌 Foliate.js 阅读器 → 书签/进度
下载代理 → 验证 → 流式传输 → 自动清理
TTS 朗读 → Edge TTS → 段落高亮/跨章节连续朗读用户从不直接访问 Calibre-Web。WordPress 将 OPDS 数据转为原生 WordPress 体验——搜索、分页、封面、描述、在线阅读、多格式下载,全部在 WordPress 用户系统和权限模型下完成。这是系统的通用模式:后端服务只负责数据,交互层负责一切用户可见的事情。
内嵌的 Foliate.js 阅读器还集成了完整的 TTS 朗读模块。点击段落即可从该位置开始朗读,支持 Edge TTS 高质量语音、语速调节(1.0×—2.5×)、段落级高亮跟踪、跨章节连续朗读(章节读完后自动翻页继续),朗读位置通过 Cookie 持久化。一条 EPUB 书籍→Edge TTS 的完整管道,全部在阅读器 UI 中完成,不打开任何外部页面。
5.4 交互范式:Gutenberg 块作为编排界面
trilium-ai-chat/prompt-block 是提示词编排系统的核心机制。内容作者在编辑器中拖入一个块,设置带变量的 prompt 模板({variable_name} 语法),保存发布。读者在前端填入变量值,触发 AI 对话,结果存入 Trilium。
这条链路——作者定义 prompt → 读者提供变量 → AI 生成 → Trilium 存储 → WordPress 展示——全部在 Gutenberg 编辑器中完成,不写代码。
配合多 Agent 配置系统,可为不同场景创建专用 Agent(文献助手、系统运维、内容整理),每个 Agent 有独立的 AI provider、FileBrowser 工作区、OpenCode 会话,配置通过全局继承减少重复。
5.5 缓存的层次
服务之间不总是实时通信。calibre-wp 的五层缓存结构是系统的通用缓存策略:
- 运行时缓存(静态变量)——同一次请求内复用
- 对象缓存(wp_cache)——同页面内复用
- 瞬态缓存(Transient)——12 小时,跨请求
- 文件缓存(PHP 文件)——持久化,Transient 的后备
- 图片缓存(30 天,500MB 上限)——封面/图片免重复请求
图片缓存超过上限时自动清理最旧文件。每层有 TTL,每层有回退,不依赖反向代理,纯应用层解决性能问题。
六、规划
以下是从当前状态推导的必然方向。
6.1 Homestack 扩展为状态注册中心
当前断裂:Homestack 的 registry.json 包含完整的服务状态,但插件无法读取它,每个插件需手动配置 API 地址。修复方向是 Homestack 暴露轻量接口供插件消费。
6.2 Gutenberg 块覆盖全部服务
每个服务最终对应一个 Gutenberg block,用户在编辑器中直接操作服务(嵌入 RSS 摘要卡片、财务图表、音乐播放器)。三十余个插件已在路上。
6.3 AI 管道持续扩展
目前在音频、RSS、图片、书籍四条管道跑通。接下来是财务数据的 AI 分析、PDF 的自动处理、音乐推荐。管道数量增长不是目标——数据进入系统后自动流向正确的处理节点才是。
6.4 服务模板持续入仓
Stremio、MeTube、Transmission、Actual Budget、BentoPDF、Navidrome 等服务的 Compose 模板将陆续入仓,达到 wizard 一键部署。每个服务部署后自动注册到 WordPress 插件和 Docker Nav。
6.5 AI 管理基础设施
目前的 AI 管道处理的是外部数据(音频、RSS、书籍)。下一步是 AI 管理基础设施本身——一个运维 Agent 接收 Homestack 的 registry.json 状态,在检测到异常时自动执行恢复操作。
这不是一个遥远的愿景。当前系统中已有 FileBrowser Agent 和 OpenCode Agent,它们可以被扩展为基础设施 Agent:监控磁盘使用率、检测容器异常、测试证书过期、生成备份报告。每个 Agent 的输出直接存入 Trilium,形成基础设施的运行日志。
进一步,AI 可以从被动响应变为主动优化:分析日志发现非高峰时段、建议调整资源分配、检测异常流量模式。当 AI 消费了 Homestack 的全部可观测数据后,基础设施开始具备自我认知。
6.6 离线优先架构
当前 Homestack 假设服务始终在线。现实世界中,网络中断、硬件故障、断电都会发生。离线优先架构让基础设施在网络恢复后自动同步,而不是在网络中断时完全不可用。
具体方向包括:本地邮件队列在连接恢复后发送、RSS 阅读器的离线缓存、Trilium 的本地副本同步、AI 管道的本地推理降级(在线时用远程模型,离线时用本地模型)。
家庭基础设施与数据中心的一个根本区别在于:家庭网络不可靠。因此系统必须假设离线是常态,在线是临时状态。这不是一个优化问题,而是一个架构假设的切换。
6.7 Homestack 协议化
最终,Homestack 可以不是一组 Bash 脚本,而是一个轻量协议:定义 Docker Compose 如何被标记、如何注册、如何被插件发现。任何实现这个协议的工具都可以参与生态。
这个协议的三个核心接口:
registry.json格式标准化——服务状态、端口、域名、证书状态- 插件自动发现——插件从 registry 读取可用服务,而不是手动配置
- 跨节点交换——一个节点的 registry 可以安全地被另一个节点查询
如果这些接口稳定下来,Homestack 就从"我写的脚本"变成了"别人也可以实现的规范"。
七、展望
7.1 密码朋克遗产
1993 年的密码朋克宣言说:"密码朋克写代码。"这句话的核心不是加密技术本身,而是一个更底层的信念:系统应该让个体有能力保护自己的利益,而不必依赖第三方。
三十年前的实现是 PGP 加密邮件。二十年前的实现是 Bitcoin 的去中心化账本。2026 年,实现是一个人可以运行自己的全部数字基础设施。加密保护了通信,区块链保护了资产,Homestack 保护了计算——这三者合在一起,构成了主权个人的完整技术栈。
密码朋克传统从来不排斥使用商业产品。它排斥的是别无选择的状态——当所有的笔记、阅读、语音、财务、AI 都绑定在一个 SaaS 上时,你失去了退出的权利。Homestack 提供的不是"拒绝商业软件",而是有退出的自由——当你对某个商业产品不满时,你有一个本地的、自控的替代方案可以直接切换。
7.2 AI 作为放大器
这个系统在 2022 年开始搭建时,AI 还只是一个辅助工具。2024 年之后的变化是决定性的——本地 AI 推理(Whisper、Draw Things、Ollama)让一个人可以完成过去需要团队的工作。
这是主权个人愿景最关键的转折点:AI 缩小了个人与组织之间的能力差距。
过去,运行一个语音转录管道需要:前端工程师(录音界面)→ 后端工程师(音频处理)→ ML 工程师(模型部署)→ 运维工程师(服务器管理)。这是一个四人团队的工作。今天,一个人用一个 WordPress shortcode + Speaches API + Trilium ETAPI + Ollama 完成了全部,每层都是现成的开源组件,Homestack 负责把它们连起来。
AI 不仅加速了管道的构建,它本身就是管道中的处理节点。prompt-block 机制让非技术用户也能定义 AI 工作流——作者定义模板,读者提供变量,AI 生成内容,系统自动存储。这是一个人机协作的编排界面,完全在 Gutenberg 编辑器内完成。
随着本地模型的进步(Apple Silicon 的统一内存架构让 70B 参数模型可以在个人电脑上运行),AI 能力的边界将不再取决于 API 价格,而取决于个人愿意投入的硬件。这意味着主权个人的 AI 能力上限正在快速接近组织级别的水平。
一个更大的图景正在浮现:AI 是历史上第一个边际成本递减的生产力工具。 蒸汽机降低了体力劳动的成本,但需要工厂(规模经济);计算机降低了信息处理的成本,但需要数据中心(资本密集)。AI 降低了认知劳动的成本,而个人级别的硬件已经足以运行有用的模型。这意味着个人第一次可以在生产力上与组织处于同一竞争平面——不是通过模仿组织的结构,而是通过跳过组织这个中间层直接使用工具。
7.3 基础设施的继承
一个运行中的家庭基础设施有一个商业 SaaS 永远无法提供的特性:它可以被继承。
你在 Google Drive 中积累的二十年文件,在法律上不属于你——它们受 Google 的服务条款约束,你的继承人需要经过复杂的流程才能访问。你在 Homestack 中积累的数据,存在你自己的硬盘上,备份在你的冷存储中,可以被完整地传给下一代。
这不是一个遥远的问题。数字遗产正在成为一个真实的社会议题——当一个人去世后,他的 Gmail、iCloud、Notion、Spotify 账户里存储的人生记录如何被家人获取?目前的答案是"通过法律程序向每个服务商单独申请"。Homestack 的答案是"给继承人一个硬盘和一个密码"。
你的 Trilium 知识库、Calibre 藏书、财务数据、AI 对话记录——这些东西的累积价值随时间增长,到十年、二十年尺度上,它们构成了一个家庭的数字记忆。这个记忆不应该随着 SaaS 公司的倒闭或条款变更而消失。
7.4 网络的可能性
一百个 Homestack 用户形成的是一个什么样的网络?
Homestack A (GPU 节点) ←→ Homestack B (存储节点) ←→ Homestack C (网络节点)
↔ ↔ ↔
AI 推理 数据备份 mDNS 发现目前,每个 Homestack 独立运行,共享的是配置模板和插件代码。下一步是共享处理能力——如果你有一个 GPU 节点,我有一个存储节点,他有一个高带宽网络节点,我们可以通过安全的点对点连接交换能力。这不是云计算的回归——这是个人基础设施的互联,没有中央协调,没有服务条款,只有协议。
具体来说:Homestack 的 registry.json 定义了每个节点的服务清单。如果这些 registry 可以被安全地发现和查询(通过 DHT 或 mDNS 的扩展),你就可以在本地网络上消费邻居的服务,或者在互联网上通过加密隧道共享特定服务。一个人的语音转文字管道可以在三个家庭的 GPU 上分布式运行。
这会带来一种新的基础设施模式:社区网格计算。不是 SETI@Home 那种中心调度的志愿计算,而是对等的、私有的、基于信任的服务交换。你信任你的邻居吗?你们可以互相备份。你的朋友有一个 GPU 节点?你可以把他加入你的 AI 管道作为推理后端。
这听起来遥远,但技术构件已经存在——Docker 的跨主机网络、WireGuard 的加密隧道、mDNS 的服务发现、Registry 的数据格式。缺少的只是一个将这些构件编排进 Homestack 的模块。这个模块的雏形可能在未来一两年内出现。
7.5 生长的哲学
这个系统没有完成状态。
它不是那种"开发两年,发布 1.0,然后进入维护模式"的项目。它是一个随着生活需求同步生长的有机体——2022 年你需要替代 Notion,所以有了 Trilium;2023 年你需要替代 Feedly,所以有了 Miniflux;2024 年你需要 AI 处理音频,所以有了 Speaches 管道;2025 年你需要替代 Netflix,所以有了 Stremio;2026 年你需要替代 YNAB,所以 Actual Budget 正在入仓。
每一个组件的加入都不是因为"这个技术很酷",而是因为外部商业环境发生了变化——涨价、改条款、关停、隐私丑闻——或者仅仅是意识到"我不需要为这个功能付月费"。
Homestack 是这个生长过程的最新产物。它是 2026 年出现在系统中的组件,但不是最后一个。只要还有商业产品在提供你不满意的服务,就还有新的组件需要加入。这个系统没有完成状态,只有生长方向。
7.6 主权个人不是一种身份,是一种实践
最后,回到主权个人这个核心概念。它不是一个可以花钱购买的身份(比如"我是一个主权个人"),而是一种需要通过持续实践来维持的状态。
每一次你选择自托管而不是订阅 SaaS,都是一次主权实践。每一次你把自己的数据从商业平台迁移到自己的硬件,都是一次主权实践。每一次你写一个新的 WordPress 插件来桥接两个服务,都是一次主权实践。
这些实践本身构成了一种生活方式:你知道你的数据存在哪块硬盘上,你知道你的服务依赖什么软件,你知道如果你的房子断电了会发生什么。你不是把数字生活的运营外包给别人——你亲手运行着它。
这比 SaaS 更费力。但它也更自由。
7.7 后 SaaS 时代的软件形态
如果越来越多人选择自托管,软件行业的商业模型会发生什么?
一个合理的推测是:SaaS 不会消失,但会退回到它真正创造价值的领域。 对于团队协作、高频更新、强网络效应的产品(如 Figma、Slack、Notion),SaaS 的效率优势不可替代。但对于个人使用的工具(笔记、阅读、音乐、财务、文件管理),SaaS 模式是一种过度抽取——个人用户为企业级基础设施付费,换来了自己不需要的可用性和弹性。
后 SaaS 时代的个人软件可能回归到一种更古老的模式:你购买软件(一次付费或免费),数据存在你自己的设备上,如果需要云同步,那是你选择的服务商而不是默认配置。
这已经在发生:Obsidian 替代了 Notion,ProtonMail 替代了 Gmail,Synology 替代了 Dropbox。Homestack 把这些替代方案统一在一个框架下,让它们的建立和维护成本降到一个人可以接受的水平。
更深层的变化是软件的原子化。在 SaaS 模式下,一个产品是一个不可分割的整体——你订阅 Notion,得到全部功能,无论你是否需要。在 Homestack 模式下,软件以插件/容器的粒度存在——你需要 RSS,跑一个 Miniflux;你需要阅读器,装一个 calibre-wp 插件。每个组件可以独立升级、独立替换、独立废弃。这恢复了软件开发中"模块化"的原始理想,而 SaaS 由于商业原因放弃了它。
7.8 2036 年的 Homestack
十年后的 Homestack 会是什么样子?以下不是幻想,而是从当前已经成立的趋势向外推导两层:
基础设施自我演化。 今天 AI 可以帮你写代码(OpenCode 已经可以保存到 Trilium、生成 Compose 配置)。十年后,Homestack 和 AI Agent 不是两个系统,而是一个协同进化的整体——Agent 观测基础设施状态,自主生成改进方案,Homestack 执行变更,Agent 验证效果。不是"告诉你证书快过期了",而是"已评估三种续期方案,选最优的执行,这是变更报告"。不是"磁盘快满了",而是"已分析存储增长趋势,识别出三个可清理的数据集和一个可迁移的冷存储,执行或取消?"
持久化 AI 身份。 今天的 AI Agent 在每次对话中重新建立上下文。十年后,你的个人 AI Agent 持续运行,积累对你数十年行为模式的理解——它知道你如何组织知识、偏好哪些信息来源、在什么时间段需要专注。这个 Agent 是你的数字管家,它跨设备、跨服务、跨时间存在。当你换硬件时,Agent 配置随 Homestack 迁移;当你创建新服务时,Agent 自动学习它的 API。不是"一个聊天机器人",而是"一个了解你二十年的数字伙伴"。
硬件即消耗品。 今天迁移 Homestack 到新机器需要手动操作。十年后,硬件是纯粹的算力提供者,Homestack 是硬件之上的抽象层。任何运行 Homestack 代理的设备——笔记本电脑、树莓派、手机、云服务器——都是同等的计算节点。旧机器坏了?插上新机器,Homestack 自动还原所有服务。性能不够?再加一个节点,负载自动均衡。你不再"拥有一台服务器",你拥有一个逻辑上统一、物理上分布的计算集群。
信任网络。 Homestack 实例之间建立自动信任关系——你的 Homestack 默认信任你配偶的、父母的、子女的 Homestack。信任可以传递:你的 Homestack 信任你兄弟的,你兄弟的信任他好友的,你在有限范围内可以访问好友的服务。这不是社交网络——这是基础设施层的信任路由。基于这个信任网络:自动异地备份、紧急数据访问、GPU 资源共享。不需要配置 VPN、不需要交换公钥、不需要管理证书——信任关系由物理接近和社交图谱自动推导。
主权经济参与。 今天 Homestack 是纯消费型支出(买硬件、付电费)。十年后,Homestack 可以自动参与去中心化经济——空闲 GPU 周期出租给分布式 AI 训练网络、闲置存储用于去中心化文件系统、带宽用于 P2P 内容分发。你的基础设施从"每月支出"变成了"偶尔有收入"。这不是挖矿——这是闲置资源的市场化,由 AI Agent 自动谈判最优价格,Homestack 执行计算任务。
数据的时间旅行。 今天的数据备份是"恢复到最后一次完整备份"。十年后,Homestack 维护完整的数据演化历史——Trilium 的每个版本、Calibre 的每次变更、财务记录的每次交易——全部可回溯。你问"2027 年我读完那本书后写的笔记是什么",系统在几秒内构建出当时的上下文视图。这不是 Git,而是面向个人知识的时间序列数据库,查询接口是自然语言。
计算的民主化。 今天,自托管仍然是一个小众爱好。十年后,随着 AI 将运维门槛降到"用自然语言描述需求",自托管从小众走向日常。Homestack 不是这个趋势的唯一推动者,但它是最早将基础设施编译器、AI Agent、个人知识库三者整合在一起的尝试之一。当一个人说"我要一台属于我的服务器"时,它应该像说"我要一台属于我的车"一样平常。
最后,一个具体的场景作为收尾:
2036 年,你十二岁的孩子在自己的笔记本电脑上运行着 Homestack 实例——不是因为你给他配置的,而是因为在课堂上他需要运行一个 AI 模型来完成科学项目,学校教的是"装个 Homestack,跑在自己的笔记本上,数据不要上传到商业 API"。他通过语音告诉 Agent:"帮我搭一个实验数据记录器,每天自动生成图表,存到我的知识库。"Agent 在五秒内开始工作。
这不需要是 Homestack 的功劳。但 Homestack 是朝着这个方向迈出的第一步。
7.9 为什么是现在
Homestack 不是一个技术创新。它的每个组件——Docker、WordPress、Trilium、Whisper、Edge TTS、Foliate.js——在各自领域都不是新东西。真正的新东西是这些组件被组装在一起的方式,以及它们在一个人的操作能力范围内协作的可能性。
这个组装的可行性窗口在 2024-2026 年打开,由三个独立趋势的汇合驱动:
硬件成熟。 Apple Silicon 的统一内存架构让个人电脑可以运行 70B 参数的本地模型。树莓派 5 和 Intel N100 Mini PC 提供了一百美元级别的可靠计算节点。NVMe SSD 让本地存储速度超过了大多数云存储。家用带宽到了 1Gbps。这些硬件条件在五年前都不成立。
开源生态成熟。 Trilium、Miniflux、Calibre-Web、Nextcloud——每一个都是经过多年打磨的成熟项目,在功能上已经可以替代对应的商业产品。WordPress 的插件 API 二十年没有断裂性变化,这让插件可以长期维护。Docker Compose 作为部署格式已经事实标准化。
AI 跨越了可用性阈值。 Whisper 的转录质量在 2023 年超过了人类速记员。Ollama 让本地模型运行简化为一行命令。Edge TTS 的中文语音质量超过了大多数商业 TTS 服务。这些 AI 能力在 2020 年都不存在。
这三个趋势的交汇创造了一个历史性的机会:一个人可以在技术上拥有自己的数字基础设施。这不是一个政治宣示,而是一个工程事实。
前几代的自托管者需要 Unix 系统管理员级别的技能。Homestack 试图把这个门槛再降低一层——不是到"无需技术"的水平(那会牺牲灵活性),而是到"愿意阅读文档"的水平。在 AI 辅助下,这个门槛还会继续下降。
7.10 如果想开始
这篇文章不是一个产品说明书,而是一个方向描述。如果你认同这个方向并想开始,以下是可操作的路径:
- 从一个需求开始。 不要试图一次性搭建全部。找一个你当前正在付费、且不满意的商业服务,找一个开源替代品,把它跑起来。一台旧电脑 + Docker Compose 就够了。
- 先跑起来,再优化。 不需要配置 SSL、不需要域名、不需要备份策略。服务能在局域网内访问就可以了。安全、可观测性、备份——这些可以在服务稳定后再加。
- 理解管道思维。 不要孤立的看待每个服务。当你运行 Trilium 后问自己:我的 RSS 阅读器能和它对话吗?我的语音转录结果能存进去吗?管道是 Homestack 的核心概念——数据从入口到出口的路径比单个服务更重要。
- 接受不完美。 自托管的服务不会像商业 SaaS 一样完美。偶尔的宕机、需要手动维护的更新、不那么流畅的 UI——这些是自由的代价。随着时间推移,你的系统会越来越好,而商业 SaaS 的条款只会越来越差。
- 加入社区。 你不是第一个做这件事的人。在 Reddit 的 r/selfhosted、r/homelab、Docker 的 Discord 上,有成千上万人做着类似的事。Homestack 的配置模板和插件也可以被分享和复用。
最后,记住密码朋克的口头禅——不,不是"代码即法律",那是一个误解。原始宣言的最后一句话是:
"我们期待这一天。"
这一天就是现在。
构成:
- Homestack:编译型基础设施 CLI
- Docker 服务:十余个(已部署 / 规划中)
- WordPress 插件:三十余个(持续增长)
- Trilium 扩展:数个
设计原则:数据自控、管道优先、Gutenberg 即 UI、无 Vendor Lock-in
时间线:2022—2026,持续开发中
网络:纯局域网
回复