基于 Orbstack + WordPress + WhisperLiveKit 打造个人语音创作中心
-
基于 Orbstack + WordPress + WhisperLiveKit 打造个人语音创作中心
目录你是否想拥有一套私人的内容创作系统,既能通过强大的语音转文字工具快速记录灵感,又能通过专业的发布平台管理你的内容?本文专为 Mac 用户(尤其是技术小白)打造,介绍如何利用 Orbstack 搭建一套包含 本地语音识别 和 专业内容管理 的全能创作中心,并利用 BraveDAO 的前端插件 实现二者的无缝整合。
这套系统能为你做什么
这套系统由三个核心部分组成,精简而高效:
- WordPress:🌐 世界上最流行的内容管理系统。用于发布、整理和归档你的图文内容。
- WhisperLiveKit:🎙️ 基于 OpenAI Whisper 模型的高性能实时语音转文字服务。运行在本地,保护隐私,提供后端 API 支持。
- Whisper Live Transcriber (WordPress插件):🔌 由 BraveDAO 开发的前端适配器,它像一座桥梁,让你直接在 WordPress 文章编辑器中通过语音输入文字,无需在不同软件间切换。
安装方法一:简单直接版(推荐小白用户)
第一步:安装 Orbstack
你可以直接访问 orbstack.dev 下载 Orbstack 的安装包。如果你使用的是 M1/M2/M3 等苹果芯片,请选择 Apple Silicon 版本。安装完成后,双击运行并启动。
第二步:创建服务配置文件
这一步我们创建一个文本文件,告诉系统如何启动 WordPress 和 Whisper 服务。
- 打开 Mac 的终端(Terminal),创建一个新文件夹:
mkdir -p ~/我的创作系统 cd ~/我的创作系统- 创建配置文件:
nano docker-compose.yml- 复制并粘贴以下内容:
name: my-content-stack services: # WhisperLiveKit: 语音转文字后端服务 whisperlivekit: build: context: . dockerfile_inline: | FROM python:3.11-slim RUN apt-get update && apt-get install -y --no-install-recommends \ ffmpeg \ git \ build-essential \ && rm -rf /var/lib/apt/lists/* RUN pip install --no-cache-dir torch --index-url https://download.pytorch.org/whl/cpu RUN pip install --no-cache-dir whisper-live-kit WORKDIR /app EXPOSE 8000 ENTRYPOINT ["wlk"] CMD ["--host", "0.0.0.0", "--port", "8000", "--model", "small", "--language", "auto"] container_name: whisperlivekit ports: - "8000:8000" volumes: - whisper-cache:/root/.cache environment: - HF_HOME=/root/.cache/huggingface restart: unless-stopped networks: - app_network # MariaDB 数据库 db: image: mariadb:10.6.4-focal container_name: wordpress-db command: --default-authentication-plugin=mysql_native_password volumes: - db_data:/var/lib/mysql restart: always environment: MYSQL_ROOT_PASSWORD: somewordpress MYSQL_DATABASE: wordpress MYSQL_USER: wordpress MYSQL_PASSWORD: wordpress healthcheck: test: ["CMD", "mysqladmin", "ping", "-h", "localhost", "-u", "root", "-p$MYSQL_ROOT_PASSWORD"] interval: 30s timeout: 10s retries: 3 start_period: 60s networks: - app_network # WordPress 网站 wordpress: image: wordpress:latest container_name: wordpress depends_on: db: condition: service_healthy volumes: - wp_data:/var/www/html ports: - "80:80" restart: always environment: WORDPRESS_DB_HOST: db WORDPRESS_DB_USER: wordpress WORDPRESS_DB_PASSWORD: wordpress WORDPRESS_DB_NAME: wordpress networks: - app_network # 卷定义 volumes: whisper-cache: db_data: wp_data: # 网络定义 networks: app_network: name: app_network driver: bridge- 保存并退出:按
Ctrl+X,然后按Y确认,最后按Enter。
第三步:一键启动所有服务
在终端中执行:
docker compose up -d> 注意:首次运行需要下载和构建镜像,可能需要几分钟。待 Orbstack 面板中所有服务变绿(Running)即表示成功。
安装方法二:进阶版(使用 Ubuntu 虚拟机 + Dockge)
此部分适合喜欢使用 Dockge 面板管理的高级用户,配置代码与上方 YAML 相同,只需将代码粘贴至 Dockge 的编辑窗口即可。
可参考基地文章:《最佳macOS版Docker方案:Orbstack+Linux+Docker》
安装后的关键步骤:配置前端适配插件 (BraveDAO Edition)
服务启动后,我们虽然有了 WordPress (前端) 和 Whisper (后端),但它们还没连通。现在我们需要使用 BraveDAO 开发的专用插件来实现“无缝整合”。
准备工作:确保你拥有 whisper-live-transcriber.zip 插件包。
1. 安装插件
- 浏览器访问
http://localhost进入你的 WordPress 站点。 - 完成 WordPress 初始化设置(设置语言、账号密码等)。
- 进入后台仪表盘,点击左侧菜单 插件 (Plugins) -> 安装插件 (Add New)。
- 点击顶部的 上传插件 (Upload Plugin),选择
whisper-live-transcriber.zip文件并安装。 - 点击 启用 (Activate)。
2. 配置 WebSocket 连接
- 在 WordPress 后台左侧菜单找到 Whisper Live 或 设置 -> Whisper Live Transcriber。
- 在设置页面中找到 WebSocket URL 字段。
- 保存设置。
3. 在文章中调用
该插件通过短代码(Shortcode)工作。你可以在任何页面或文章中插入录音按钮。
- 新建一篇文章。
- 在编辑器中输入短代码:
[whisper_live] - 或者将其添加到侧边栏的小工具中,方便随时调用。
终极工作流:如何使用你的新系统
配置完成后,你的“语音写作”流程将变得行云流水:
- 开启灵感:打开 WordPress 的“新建文章”页面。
- 点击录音:在页面中看到
[whisper_live]生成的录音/连接按钮,点击开始。 - 口述内容:对着麦克风直接把你的想法、草稿说出来。得益于 Whisper 模型,无需刻意放慢语速,系统会自动识别并添加标点。
- 实时上屏:你会看到文字实时出现在屏幕上,你可以编辑这些文字,并通过Vibe Coding修改插件,获得更多进阶的拓展功能。
常见问题 (FAQ)
- Q: 插件显示连接失败?
- A: 请检查 Orbstack 中
whisperlivekit容器是否正在运行(绿色状态)。同时确认你在浏览器中访问http://localhost:8000是否有响应(通常显示 404 或 API 文档即代表连通)。
- A: 请检查 Orbstack 中
- Q: 识别速度慢?
- A: 在
docker-compose.yml中,我们将模型设置为了--model small。如果你觉得慢,可以改为--model tiny(速度快但精度略低)。如果你是 M1/M2 Max/Ultra 芯片,可以尝试改为--model medium获得更高的识别精度。
- A: 在
- Q: 只能在本地用吗?
- A: 默认配置下是的。如果你需要在公网访问(例如用手机对着电脑说话),你需要配置内网穿透(如 Cloudflare Tunnel)并将 WebSocket URL 改为你的公网地址。
🎉 恭喜! 你现在拥有了一套完全私有、数据自控且支持高效语音输入的现代化内容创作系统!
歡迎留言回复交流。
Log in to reply.