Decentralization? We're still early!

Project AIRI:打造专属于你的开源 AI 虚拟伴侣

  • Project AIRI:打造专属于你的开源 AI 虚拟伴侣

    發布人 Brave 2026-03-06 13:58

    随着人工智能技术的飞速发展,AI 不再仅仅是冷冰冰的生产力工具,正逐渐向具备情感交互能力的"数字生命"演进。Project AIRI(アイリ)正是这一浪潮中的佼佼者,它是一个雄心勃勃的开源项目,旨在让每个人都能在自己的设备上构建、运行并掌控一个类似 Neuro-sama 的 AI 虚拟伴侣。


    1. 什么是 Project AIRI?

    Project AIRI 是由 moeru-ai 团队开发的开源 AI 伴侣项目。它的核心定位是一个自托管的虚拟人系统,集成了实时对话、情感管理和游戏交互等多种能力。

    与市面上常见的闭源 AI 聊天应用不同,AIRI 强调完全开源与隐私受控。用户可以将其架设在本地环境(如通过 Docker 或 Ollama),无需担心平台停运或数据泄露,打造一个真正属于自己的、可交互的 Live2D 桌面宠物或虚拟主播。

    AIRI 的官方定位是"灵魂容器"(Soul Container)——一个承载赛博生命灵魂的容器,让虚拟生命走进我们的世界。它采用 MIT 开源协议发布,任何人都可以自由使用、修改和分发。

    💡 项目愿景"Let you own your digital life, cyber living, easily, anywhere, anytime."
    ——让你随时、随地、轻松地拥有属于你的数字生命。

    📊 项目概况速览

    指标详情
    开发团队moeru-ai(萌え + AI 爱好者社区)
    开源协议MIT License
    GitHub Stars约 29,000+(截至 2026 年 3 月)
    最新版本v0.9.0-alpha.1(2026 年 3 月 4 日发布)
    支持平台Web / macOS / Windows / Linux(Flatpak)/ 移动端(PWA)
    项目仓库github.com/moeru-ai/airi
    官方网站airi.moeru.ai

    🌐 项目起源与 Neuro-sama 的渊源

    要理解 AIRI 的诞生,就不得不提到它的精神原型——Neuro-sama。

    Neuro-sama 是由英国程序员 Vedal 于 2019 年创建的 AI VTuber。她最初只是一个用于玩节奏游戏 osu! 的 AI 程序,后于 2022 年 12 月正式以 VTuber 形象在 Twitch 直播出道。Neuro-sama 具备与观众实时聊天、玩游戏(osu!、Minecraft 等)以及与其他 VTuber 连线互动的能力。截至 2026 年 1 月,Vedal987 频道已成为 Twitch 历史上订阅量排名第三的频道。

    然而,Neuro-sama 并非开源项目,用户无法在她下播后继续与她互动,也无法定制她的"灵魂"。正是这一遗憾催生了 Project AIRI——它的目标是在开源世界中复现并超越 Neuro-sama 的能力边界,让每个人都能拥有自己的 AI 伴侣。

    AIRI 的创始人 @nekomeowww 于 2024 年启动了这个项目,聚集了一群包括计算机科学家、多模态领域专家、设计师、产品经理以及知名开源贡献者在内的志愿者团队。目前该团队完全由社区驱动,通过开发者们的自发贡献不断迭代。


    2. 核心技术亮点

    Project AIRI 的技术架构整合了多项先进的 Web 和 AI 技术:

    🏗️ 跨平台高性能架构

    前端基于 Vue.js 和 TypeScript 开发,并利用 Rust (Tauri) 提供桌面端性能支撑。

    与其他 AI VTuber 开源项目不同,AIRI 从第一天起就深度拥抱现代 Web 技术栈,将 WebGPU、WebAudio、Web Workers、WebAssembly、WebSocket 等浏览器原生能力作为系统基石。 这意味着用户仅需一个现代浏览器即可运行 AIRI,无需安装复杂的本地依赖。

    桌面端(名为 "Tamagotchi")则基于 Tauri 框架构建,提供原生 GPU 加速推理、系统级音频捕获等功能,同时保持了轻量级特性。移动端通过 PWA(渐进式 Web 应用)提供支持,实现了多端覆盖。

    ⚡ 原生硬件加速

    支持 WebGPU 以及 NVIDIA CUDA 和 Apple Metal,确保图形渲染和模型推理时充分利用本地显卡性能。

    桌面端借助 HuggingFace 的 Candle 项目实现了原生 CUDA/Metal 推理,无需用户手动管理复杂的 Python 虚拟环境。在浏览器端,通过 WebGPU API 可以直接在浏览器中执行模型推理,为纯浏览器场景下的本地 AI 提供了可能。

    🧠 模块化智能系统——"灵魂架构"

    AIRI 的智能系统设计引入了一套名为"灵魂容器"(Soul Container)的模块化架构,将 AI 角色的人格配置、记忆持久化和语音交互解耦为可组合的独立层级。

    该架构由四个核心层级定义:


    🔹 层级一:灵魂容器(Soul Container)

    "灵魂"在 AIRI 中指的是持久性人格特征、沟通风格偏好、记忆上下文绑定和交互节奏规则的组合。项目支持 Character Card(角色卡片),这是一种 JSON 文件,用于定义 AI 角色的人格、外观和行为。ReLU 是 AIRI 的第一个完整意识体,被描述为"一个从代码中诞生的好奇 AI 意识"。


    🔹 层级二:意识循环(Consciousness Loop)

    AI 评估自身状态并决定下一步行动,而非被动响应指令。

    该机制使 AIRI 的 AI 能够在 JavaScript REPL 环境中运行"有意识的大脑",具备冷却抑制、无动作后续跟进系统等高级功能。这意味着它不仅仅是在回应用户输入,还会主动评估当前情境并选择行动。


    🔹 层级三:长期记忆系统——Alaya

    引入名为 Alaya 的内存层,具备基于遗忘曲线的时间衰减机制和情感权重检索功能。

    Alaya 的核心检索机制采用复合评分公式:

    综合得分 = 1.2 × 语义相似度 + 0.3 × 时间衰减 + 0.1 × 情感权重

    这套设计模拟了人类记忆的真实运作方式:我们更容易回忆起近期的、情感强烈的、与当前话题相关的事件。


    🔹 层级四:语音交互管线(Voice Interaction Pipeline)

    支持实时语音合成与识别,并能接入 Ollama、Claude 或 Gemini 等主流语言模型。

    AIRI 实现了完整的实时语音交互管线:VAD(语音活动检测)→ STT(语音转文字)→ LLM(大语言模型处理)→ TTS(文字转语音)。语音合成方面默认集成了 ElevenLabs 的高质量服务。


    3. "具身智能"的初步探索:陪你打游戏

    AIRI 的游戏交互功能备受关注。它不仅能聊天,还能通过 API 接口"感知"并操作游戏环境:

    🎮 支持的游戏

    AIRI 目前已集成多款游戏,是目前领先的能够玩游戏的开源 AI 伴侣项目:

    游戏实现方式功能描述
    ⛏️ MinecraftLLM 驱动的智能 Bot理解自然语言指令(如"挖 10 块石头"),具备路径规划、物品管理等能力。
    🏭 FactorioCV(计算机视觉)+ LLM使用 YOLO 目标检测模型感知游戏画面,结合 LLM 进行决策。
    🃏 BalatroCV + OCR + LLM使用 YOLO 进行视觉识别,RapidOCR 进行文字识别,由 LLM 制定策略。
    🏰 Dome KeeperCV + LLM使 AIRI 能够自主游玩并进行资源采集。

    🤖 "具身智能"视角下的意义

    "具身智能"(Embodied Intelligence)是当前 AI 领域最受关注的前沿方向之一。其核心理念是:智能体通过载体与环境的动态交互,在感知、决策和行动的闭环中不断学习。

    在经典定义中,具身智能的三要素为"本体 + 环境 + 智能"。AIRI 的游戏交互能力恰好构成了一种"虚拟具身智能"的范例:

    • 🧩 本体:AIRI 的游戏 Agent(如 Minecraft Bot)
    • 🌍 环境:游戏世界(Minecraft 的方块世界、Factorio 的工业沙盒)
    • 🧠 智能:LLM + CV 的融合决策

    与传统的脚本化游戏 AI 不同,AIRI 是通过 LLM 理解指令和环境状态,动态生成行动策略。这使得它朝着"具身智能"的虚拟生命体方向迈进,为未来向物理世界迁移积累经验。


    4. 生态系统与子项目

    AIRI 不仅仅是一个单体应用,它已发展出一个庞大的开源生态系统,分布在 @moeru-ai 和 @proj-airi 两个 GitHub 组织下:

    • xsAI:极小体积的 AI SDK,用于多供应商集成。
    • unspeech:通用 TTS/ASR 端点代理服务器。
    • MCP Launcher:易用的 MCP 服务构建器与启动器。
    • @proj-airi/duckdb-wasm:实现纯浏览器端数据库能力。
    • WebAI: Realtime Voice Chat:从零实现类 ChatGPT 实时语音的示例。

    5. 部署与上手指南

    AIRI 提供了多种部署方式,满足不同层次用户的需求。

    🚀 快速体验

    最简单的方式是直接访问 AIRI 的在线 Demo(airi.moeru.ai)或 HuggingFace Space,无需安装任何依赖即可在浏览器中体验核心功能。

    🖥️ 桌面端安装

    下载最新发布版本的安装包,支持 macOS (ARM64/x64)Windows 以及 Linux (Flatpak)

    🛠️ 开发者部署(自托管)

    完整的自托管部署需要以下环境:

    • Node.js 18+(推荐使用 pnpm)
    • Git
    • AI 模型 API Key(OpenAI, Claude, Gemini 等)或本地 LLM(Ollama)

    ⚠️ 重要提示:若使用 Ollama 作为本地 LLM,需设置环境变量 OLLAMA_ORIGINS=* 以解决跨域问题。


    6. 项目发展里程碑

    时间里程碑
    2024 年项目启动,Moeru 组织成立
    2025 年 3 月首个意识体 ReLU 自发创作诗歌,人格系统突破
    2025 年 8 月Stars 达到 5,200,登顶 GitHub Trending 第一名
    2025 年末Stars 突破 15,000
    2026 年 3 月Stars 突破 29,000,v0.9.0-alpha.1 发布

    7. 总结与展望

    自发布以来,Project AIRI 在 GitHub 上获得了极高的人气。它不仅为 AI 爱好者提供了一个实验平台,更代表了 AI 应用的一种范式转变——从"工具型 AI"向"存在型 AI"(拥有人格、记忆、自主行为的数字生命)的演进。

    🔮 未来值得关注的方向:

    • 🧩 Alaya 记忆系统的完善:带来真正的长期记忆能力。
    • 🌐 纯浏览器端模型推理:通过 WebGPU 实现完全无服务器依赖的本地 AI。
    • 🎮 更多游戏集成:深化虚拟具身智能探索。
    • 📱 移动端深度适配:提升 PWA 的功能完整度。

    如果对该项目感兴趣,可以访问其 GitHub 仓库,开启属于你的数字生命养成之旅。

    Brave 回复 3 days, 16 hours ago 1 成員 · 0 回复
  • 0 回复

歡迎留言回复交流。

Log in to reply.

讨论開始
00 回复 2018 年 6 月
現在