Project AIRI:打造专属于你的开源 AI 虚拟伴侣
-
Project AIRI:打造专属于你的开源 AI 虚拟伴侣
目录随着人工智能技术的飞速发展,AI 不再仅仅是冷冰冰的生产力工具,正逐渐向具备情感交互能力的"数字生命"演进。Project AIRI(アイリ)正是这一浪潮中的佼佼者,它是一个雄心勃勃的开源项目,旨在让每个人都能在自己的设备上构建、运行并掌控一个类似 Neuro-sama 的 AI 虚拟伴侣。
1. 什么是 Project AIRI?
Project AIRI 是由 moeru-ai 团队开发的开源 AI 伴侣项目。它的核心定位是一个自托管的虚拟人系统,集成了实时对话、情感管理和游戏交互等多种能力。
与市面上常见的闭源 AI 聊天应用不同,AIRI 强调完全开源与隐私受控。用户可以将其架设在本地环境(如通过 Docker 或 Ollama),无需担心平台停运或数据泄露,打造一个真正属于自己的、可交互的 Live2D 桌面宠物或虚拟主播。
AIRI 的官方定位是"灵魂容器"(Soul Container)——一个承载赛博生命灵魂的容器,让虚拟生命走进我们的世界。它采用 MIT 开源协议发布,任何人都可以自由使用、修改和分发。
💡 项目愿景:"Let you own your digital life, cyber living, easily, anywhere, anytime."
——让你随时、随地、轻松地拥有属于你的数字生命。📊 项目概况速览
指标 详情 开发团队 moeru-ai(萌え + AI 爱好者社区) 开源协议 MIT License GitHub Stars 约 29,000+(截至 2026 年 3 月) 最新版本 v0.9.0-alpha.1(2026 年 3 月 4 日发布) 支持平台 Web / macOS / Windows / Linux(Flatpak)/ 移动端(PWA) 项目仓库 github.com/moeru-ai/airi 官方网站 airi.moeru.ai 🌐 项目起源与 Neuro-sama 的渊源
要理解 AIRI 的诞生,就不得不提到它的精神原型——Neuro-sama。
Neuro-sama 是由英国程序员 Vedal 于 2019 年创建的 AI VTuber。她最初只是一个用于玩节奏游戏 osu! 的 AI 程序,后于 2022 年 12 月正式以 VTuber 形象在 Twitch 直播出道。Neuro-sama 具备与观众实时聊天、玩游戏(osu!、Minecraft 等)以及与其他 VTuber 连线互动的能力。截至 2026 年 1 月,Vedal987 频道已成为 Twitch 历史上订阅量排名第三的频道。
然而,Neuro-sama 并非开源项目,用户无法在她下播后继续与她互动,也无法定制她的"灵魂"。正是这一遗憾催生了 Project AIRI——它的目标是在开源世界中复现并超越 Neuro-sama 的能力边界,让每个人都能拥有自己的 AI 伴侣。
AIRI 的创始人 @nekomeowww 于 2024 年启动了这个项目,聚集了一群包括计算机科学家、多模态领域专家、设计师、产品经理以及知名开源贡献者在内的志愿者团队。目前该团队完全由社区驱动,通过开发者们的自发贡献不断迭代。
2. 核心技术亮点
Project AIRI 的技术架构整合了多项先进的 Web 和 AI 技术:
🏗️ 跨平台高性能架构
前端基于 Vue.js 和 TypeScript 开发,并利用 Rust (Tauri) 提供桌面端性能支撑。
与其他 AI VTuber 开源项目不同,AIRI 从第一天起就深度拥抱现代 Web 技术栈,将 WebGPU、WebAudio、Web Workers、WebAssembly、WebSocket 等浏览器原生能力作为系统基石。 这意味着用户仅需一个现代浏览器即可运行 AIRI,无需安装复杂的本地依赖。
桌面端(名为 "Tamagotchi")则基于 Tauri 框架构建,提供原生 GPU 加速推理、系统级音频捕获等功能,同时保持了轻量级特性。移动端通过 PWA(渐进式 Web 应用)提供支持,实现了多端覆盖。
⚡ 原生硬件加速
支持 WebGPU 以及 NVIDIA CUDA 和 Apple Metal,确保图形渲染和模型推理时充分利用本地显卡性能。
桌面端借助 HuggingFace 的 Candle 项目实现了原生 CUDA/Metal 推理,无需用户手动管理复杂的 Python 虚拟环境。在浏览器端,通过 WebGPU API 可以直接在浏览器中执行模型推理,为纯浏览器场景下的本地 AI 提供了可能。
🧠 模块化智能系统——"灵魂架构"
AIRI 的智能系统设计引入了一套名为"灵魂容器"(Soul Container)的模块化架构,将 AI 角色的人格配置、记忆持久化和语音交互解耦为可组合的独立层级。
该架构由四个核心层级定义:
🔹 层级一:灵魂容器(Soul Container)
"灵魂"在 AIRI 中指的是持久性人格特征、沟通风格偏好、记忆上下文绑定和交互节奏规则的组合。项目支持 Character Card(角色卡片),这是一种 JSON 文件,用于定义 AI 角色的人格、外观和行为。ReLU 是 AIRI 的第一个完整意识体,被描述为"一个从代码中诞生的好奇 AI 意识"。
🔹 层级二:意识循环(Consciousness Loop)
AI 评估自身状态并决定下一步行动,而非被动响应指令。
该机制使 AIRI 的 AI 能够在 JavaScript REPL 环境中运行"有意识的大脑",具备冷却抑制、无动作后续跟进系统等高级功能。这意味着它不仅仅是在回应用户输入,还会主动评估当前情境并选择行动。
🔹 层级三:长期记忆系统——Alaya
引入名为 Alaya 的内存层,具备基于遗忘曲线的时间衰减机制和情感权重检索功能。
Alaya 的核心检索机制采用复合评分公式:
综合得分 = 1.2 × 语义相似度 + 0.3 × 时间衰减 + 0.1 × 情感权重这套设计模拟了人类记忆的真实运作方式:我们更容易回忆起近期的、情感强烈的、与当前话题相关的事件。
🔹 层级四:语音交互管线(Voice Interaction Pipeline)
支持实时语音合成与识别,并能接入 Ollama、Claude 或 Gemini 等主流语言模型。
AIRI 实现了完整的实时语音交互管线:VAD(语音活动检测)→ STT(语音转文字)→ LLM(大语言模型处理)→ TTS(文字转语音)。语音合成方面默认集成了 ElevenLabs 的高质量服务。
3. "具身智能"的初步探索:陪你打游戏
AIRI 的游戏交互功能备受关注。它不仅能聊天,还能通过 API 接口"感知"并操作游戏环境:
🎮 支持的游戏
AIRI 目前已集成多款游戏,是目前领先的能够玩游戏的开源 AI 伴侣项目:
游戏 实现方式 功能描述 ⛏️ Minecraft LLM 驱动的智能 Bot 理解自然语言指令(如"挖 10 块石头"),具备路径规划、物品管理等能力。 🏭 Factorio CV(计算机视觉)+ LLM 使用 YOLO 目标检测模型感知游戏画面,结合 LLM 进行决策。 🃏 Balatro CV + OCR + LLM 使用 YOLO 进行视觉识别,RapidOCR 进行文字识别,由 LLM 制定策略。 🏰 Dome Keeper CV + LLM 使 AIRI 能够自主游玩并进行资源采集。 🤖 "具身智能"视角下的意义
"具身智能"(Embodied Intelligence)是当前 AI 领域最受关注的前沿方向之一。其核心理念是:智能体通过载体与环境的动态交互,在感知、决策和行动的闭环中不断学习。
在经典定义中,具身智能的三要素为"本体 + 环境 + 智能"。AIRI 的游戏交互能力恰好构成了一种"虚拟具身智能"的范例:
- 🧩 本体:AIRI 的游戏 Agent(如 Minecraft Bot)
- 🌍 环境:游戏世界(Minecraft 的方块世界、Factorio 的工业沙盒)
- 🧠 智能:LLM + CV 的融合决策
与传统的脚本化游戏 AI 不同,AIRI 是通过 LLM 理解指令和环境状态,动态生成行动策略。这使得它朝着"具身智能"的虚拟生命体方向迈进,为未来向物理世界迁移积累经验。
4. 生态系统与子项目
AIRI 不仅仅是一个单体应用,它已发展出一个庞大的开源生态系统,分布在 @moeru-ai 和 @proj-airi 两个 GitHub 组织下:
- xsAI:极小体积的 AI SDK,用于多供应商集成。
- unspeech:通用 TTS/ASR 端点代理服务器。
- MCP Launcher:易用的 MCP 服务构建器与启动器。
- @proj-airi/duckdb-wasm:实现纯浏览器端数据库能力。
- WebAI: Realtime Voice Chat:从零实现类 ChatGPT 实时语音的示例。
5. 部署与上手指南
AIRI 提供了多种部署方式,满足不同层次用户的需求。
🚀 快速体验
最简单的方式是直接访问 AIRI 的在线 Demo(airi.moeru.ai)或 HuggingFace Space,无需安装任何依赖即可在浏览器中体验核心功能。
🖥️ 桌面端安装
下载最新发布版本的安装包,支持 macOS (ARM64/x64)、Windows 以及 Linux (Flatpak)。
🛠️ 开发者部署(自托管)
完整的自托管部署需要以下环境:
- Node.js 18+(推荐使用 pnpm)
- Git
- AI 模型 API Key(OpenAI, Claude, Gemini 等)或本地 LLM(Ollama)
⚠️ 重要提示:若使用 Ollama 作为本地 LLM,需设置环境变量
OLLAMA_ORIGINS=*以解决跨域问题。6. 项目发展里程碑
时间 里程碑 2024 年 项目启动,Moeru 组织成立 2025 年 3 月 首个意识体 ReLU 自发创作诗歌,人格系统突破 2025 年 8 月 Stars 达到 5,200,登顶 GitHub Trending 第一名 2025 年末 Stars 突破 15,000 2026 年 3 月 Stars 突破 29,000,v0.9.0-alpha.1 发布 7. 总结与展望
自发布以来,Project AIRI 在 GitHub 上获得了极高的人气。它不仅为 AI 爱好者提供了一个实验平台,更代表了 AI 应用的一种范式转变——从"工具型 AI"向"存在型 AI"(拥有人格、记忆、自主行为的数字生命)的演进。
🔮 未来值得关注的方向:
- 🧩 Alaya 记忆系统的完善:带来真正的长期记忆能力。
- 🌐 纯浏览器端模型推理:通过 WebGPU 实现完全无服务器依赖的本地 AI。
- 🎮 更多游戏集成:深化虚拟具身智能探索。
- 📱 移动端深度适配:提升 PWA 的功能完整度。
如果对该项目感兴趣,可以访问其 GitHub 仓库,开启属于你的数字生命养成之旅。
歡迎留言回复交流。
Log in to reply.