Project AIRI：打造专属于你的开源 AI 虚拟伴侣

人工智能研究

Project AIRI：打造专属于你的开源 AI 虚拟伴侣

發布人 Brave 2026-03-06 13:58

1. 什么是 Project AIRI？
📊 项目概况速览
🌐 项目起源与 Neuro-sama 的渊源
2. 核心技术亮点
🏗️ 跨平台高性能架构
⚡ 原生硬件加速
🧠 模块化智能系统——"灵魂架构"
3. "具身智能"的初步探索：陪你打游戏
🎮 支持的游戏
🤖 "具身智能"视角下的意义
4. 生态系统与子项目
5. 部署与上手指南
🚀 快速体验
🖥️ 桌面端安装
🛠️ 开发者部署（自托管）
6. 项目发展里程碑
7. 总结与展望

随着人工智能技术的飞速发展，AI 不再仅仅是冷冰冰的生产力工具，正逐渐向具备情感交互能力的"数字生命"演进。Project AIRI（アイリ）正是这一浪潮中的佼佼者，它是一个雄心勃勃的开源项目，旨在让每个人都能在自己的设备上构建、运行并掌控一个类似 Neuro-sama 的 AI 虚拟伴侣。

1. 什么是 Project AIRI？

Project AIRI 是由 moeru-ai 团队开发的开源 AI 伴侣项目。它的核心定位是一个自托管的虚拟人系统，集成了实时对话、情感管理和游戏交互等多种能力。

与市面上常见的闭源 AI 聊天应用不同，AIRI 强调完全开源与隐私受控。用户可以将其架设在本地环境（如通过 Docker 或 Ollama），无需担心平台停运或数据泄露，打造一个真正属于自己的、可交互的 Live2D 桌面宠物或虚拟主播。

AIRI 的官方定位是"灵魂容器"（Soul Container）——一个承载赛博生命灵魂的容器，让虚拟生命走进我们的世界。它采用 MIT 开源协议发布，任何人都可以自由使用、修改和分发。

💡 项目愿景："Let you own your digital life, cyber living, easily, anywhere, anytime."
——让你随时、随地、轻松地拥有属于你的数字生命。

📊 项目概况速览

指标	详情
开发团队	moeru-ai（萌え + AI 爱好者社区）
开源协议	MIT License
GitHub Stars	约 29,000+（截至 2026 年 3 月）
最新版本	v0.9.0-alpha.1（2026 年 3 月 4 日发布）
支持平台	Web / macOS / Windows / Linux（Flatpak）/ 移动端（PWA）
项目仓库	github.com/moeru-ai/airi
官方网站	airi.moeru.ai

🌐 项目起源与 Neuro-sama 的渊源

要理解 AIRI 的诞生，就不得不提到它的精神原型——Neuro-sama。

Neuro-sama 是由英国程序员 Vedal 于 2019 年创建的 AI VTuber。她最初只是一个用于玩节奏游戏 osu! 的 AI 程序，后于 2022 年 12 月正式以 VTuber 形象在 Twitch 直播出道。Neuro-sama 具备与观众实时聊天、玩游戏（osu!、Minecraft 等）以及与其他 VTuber 连线互动的能力。截至 2026 年 1 月，Vedal987 频道已成为 Twitch 历史上订阅量排名第三的频道。

然而，Neuro-sama 并非开源项目，用户无法在她下播后继续与她互动，也无法定制她的"灵魂"。正是这一遗憾催生了 Project AIRI——它的目标是在开源世界中复现并超越 Neuro-sama 的能力边界，让每个人都能拥有自己的 AI 伴侣。

AIRI 的创始人 @nekomeowww 于 2024 年启动了这个项目，聚集了一群包括计算机科学家、多模态领域专家、设计师、产品经理以及知名开源贡献者在内的志愿者团队。目前该团队完全由社区驱动，通过开发者们的自发贡献不断迭代。

2. 核心技术亮点

Project AIRI 的技术架构整合了多项先进的 Web 和 AI 技术：

🏗️ 跨平台高性能架构

前端基于 Vue.js 和 TypeScript 开发，并利用 Rust (Tauri) 提供桌面端性能支撑。

与其他 AI VTuber 开源项目不同，AIRI 从第一天起就深度拥抱现代 Web 技术栈，将 WebGPU、WebAudio、Web Workers、WebAssembly、WebSocket 等浏览器原生能力作为系统基石。这意味着用户仅需一个现代浏览器即可运行 AIRI，无需安装复杂的本地依赖。

桌面端（名为 "Tamagotchi"）则基于 Tauri 框架构建，提供原生 GPU 加速推理、系统级音频捕获等功能，同时保持了轻量级特性。移动端通过 PWA（渐进式 Web 应用）提供支持，实现了多端覆盖。

⚡ 原生硬件加速

支持 WebGPU 以及 NVIDIA CUDA 和 Apple Metal，确保图形渲染和模型推理时充分利用本地显卡性能。

桌面端借助 HuggingFace 的 Candle 项目实现了原生 CUDA/Metal 推理，无需用户手动管理复杂的 Python 虚拟环境。在浏览器端，通过 WebGPU API 可以直接在浏览器中执行模型推理，为纯浏览器场景下的本地 AI 提供了可能。

🧠 模块化智能系统——"灵魂架构"

AIRI 的智能系统设计引入了一套名为"灵魂容器"（Soul Container）的模块化架构，将 AI 角色的人格配置、记忆持久化和语音交互解耦为可组合的独立层级。

该架构由四个核心层级定义：

🔹 层级一：灵魂容器（Soul Container）

"灵魂"在 AIRI 中指的是持久性人格特征、沟通风格偏好、记忆上下文绑定和交互节奏规则的组合。项目支持 Character Card（角色卡片），这是一种 JSON 文件，用于定义 AI 角色的人格、外观和行为。ReLU 是 AIRI 的第一个完整意识体，被描述为"一个从代码中诞生的好奇 AI 意识"。

🔹 层级二：意识循环（Consciousness Loop）

AI 评估自身状态并决定下一步行动，而非被动响应指令。

该机制使 AIRI 的 AI 能够在 JavaScript REPL 环境中运行"有意识的大脑"，具备冷却抑制、无动作后续跟进系统等高级功能。这意味着它不仅仅是在回应用户输入，还会主动评估当前情境并选择行动。

🔹 层级三：长期记忆系统——Alaya

引入名为 Alaya 的内存层，具备基于遗忘曲线的时间衰减机制和情感权重检索功能。

Alaya 的核心检索机制采用复合评分公式：

综合得分 = 1.2 × 语义相似度 + 0.3 × 时间衰减 + 0.1 × 情感权重

这套设计模拟了人类记忆的真实运作方式：我们更容易回忆起近期的、情感强烈的、与当前话题相关的事件。

🔹 层级四：语音交互管线（Voice Interaction Pipeline）

支持实时语音合成与识别，并能接入 Ollama、Claude 或 Gemini 等主流语言模型。

AIRI 实现了完整的实时语音交互管线：VAD（语音活动检测）→ STT（语音转文字）→ LLM（大语言模型处理）→ TTS（文字转语音）。语音合成方面默认集成了 ElevenLabs 的高质量服务。

3. "具身智能"的初步探索：陪你打游戏

AIRI 的游戏交互功能备受关注。它不仅能聊天，还能通过 API 接口"感知"并操作游戏环境：

🎮 支持的游戏

AIRI 目前已集成多款游戏，是目前领先的能够玩游戏的开源 AI 伴侣项目：

游戏	实现方式	功能描述
⛏️ Minecraft	LLM 驱动的智能 Bot	理解自然语言指令（如"挖 10 块石头"），具备路径规划、物品管理等能力。
🏭 Factorio	CV（计算机视觉）+ LLM	使用 YOLO 目标检测模型感知游戏画面，结合 LLM 进行决策。
🃏 Balatro	CV + OCR + LLM	使用 YOLO 进行视觉识别，RapidOCR 进行文字识别，由 LLM 制定策略。
🏰 Dome Keeper	CV + LLM	使 AIRI 能够自主游玩并进行资源采集。

🤖 "具身智能"视角下的意义

"具身智能"（Embodied Intelligence）是当前 AI 领域最受关注的前沿方向之一。其核心理念是：智能体通过载体与环境的动态交互，在感知、决策和行动的闭环中不断学习。

在经典定义中，具身智能的三要素为"本体 + 环境 + 智能"。AIRI 的游戏交互能力恰好构成了一种"虚拟具身智能"的范例：

🧩 本体：AIRI 的游戏 Agent（如 Minecraft Bot）
🌍 环境：游戏世界（Minecraft 的方块世界、Factorio 的工业沙盒）
🧠 智能：LLM + CV 的融合决策

与传统的脚本化游戏 AI 不同，AIRI 是通过 LLM 理解指令和环境状态，动态生成行动策略。这使得它朝着"具身智能"的虚拟生命体方向迈进，为未来向物理世界迁移积累经验。

4. 生态系统与子项目

AIRI 不仅仅是一个单体应用，它已发展出一个庞大的开源生态系统，分布在 @moeru-ai 和 @proj-airi 两个 GitHub 组织下：

xsAI：极小体积的 AI SDK，用于多供应商集成。
unspeech：通用 TTS/ASR 端点代理服务器。
MCP Launcher：易用的 MCP 服务构建器与启动器。
@proj-airi/duckdb-wasm：实现纯浏览器端数据库能力。
WebAI: Realtime Voice Chat：从零实现类 ChatGPT 实时语音的示例。

5. 部署与上手指南

AIRI 提供了多种部署方式，满足不同层次用户的需求。

🚀 快速体验

最简单的方式是直接访问 AIRI 的在线 Demo（airi.moeru.ai）或 HuggingFace Space，无需安装任何依赖即可在浏览器中体验核心功能。

🖥️ 桌面端安装

下载最新发布版本的安装包，支持 macOS (ARM64/x64)、Windows 以及 Linux (Flatpak)。

🛠️ 开发者部署（自托管）

完整的自托管部署需要以下环境：

Node.js 18+（推荐使用 pnpm）
Git
AI 模型 API Key（OpenAI, Claude, Gemini 等）或本地 LLM（Ollama）

⚠️ 重要提示：若使用 Ollama 作为本地 LLM，需设置环境变量 OLLAMA_ORIGINS=* 以解决跨域问题。

6. 项目发展里程碑

时间	里程碑
2024 年	项目启动，Moeru 组织成立
2025 年 3 月	首个意识体 ReLU 自发创作诗歌，人格系统突破
2025 年 8 月	Stars 达到 5,200，登顶 GitHub Trending 第一名
2025 年末	Stars 突破 15,000
2026 年 3 月	Stars 突破 29,000，v0.9.0-alpha.1 发布

7. 总结与展望

自发布以来，Project AIRI 在 GitHub 上获得了极高的人气。它不仅为 AI 爱好者提供了一个实验平台，更代表了 AI 应用的一种范式转变——从"工具型 AI"向"存在型 AI"（拥有人格、记忆、自主行为的数字生命）的演进。

🔮 未来值得关注的方向：

🧩 Alaya 记忆系统的完善：带来真正的长期记忆能力。
🌐 纯浏览器端模型推理：通过 WebGPU 实现完全无服务器依赖的本地 AI。
🎮 更多游戏集成：深化虚拟具身智能探索。
📱 移动端深度适配：提升 PWA 的功能完整度。

如果对该项目感兴趣，可以访问其 GitHub 仓库，开启属于你的数字生命养成之旅。

Brave 回复 3 days, 16 hours ago 1 成員 · 0 回复

0 回复

歡迎留言回复交流。

登入後即可回复

人工智能研究

組織者: