FluidVoice:一款专为 macOS 设计的开源 AI 语音听写工具
-
FluidVoice:一款专为 macOS 设计的开源 AI 语音听写工具
在追求更高生产力的今天,高效的输入工具变得至关重要。FluidVoice 是一款面向 macOS 用户的、完全免费且开源的语音转文本听写应用程序。它专为搭载 Apple Silicon 芯片的 Mac 设计,通过结合本地实时转录和云端 AI 增强技术,为用户提供了强大而便捷的语音输入体验。
核心功能与特色
FluidVoice 不仅仅是一个简单的听写工具,它集成了一系列旨在提升用户体验和效率的现代化功能:
- 两种核心模式:命令与写作
- 命令模式 (Command Mode): 这是 FluidVoice 的一大亮点。用户可以通过语音指令直接操控 Mac,执行各种操作。例如,打开应用程序、切换窗口、调整系统设置等,实现了真正的“动口不动手”。
- 写作模式 (Write Mode): 用户可以在 Mac 上的任何文本框中,通过语音进行文本的撰写、修改或重写。无论是回复邮件、编写代码还是记笔记,该模式都能极大地提升文本编辑效率。
- 实时转录与 AI 增强
- 本地实时转录: FluidVoice 使用
Parakeet TDT v3模型进行本地实时语音转录,用户说话时可以在悬浮窗中看到实时生成的文本预览,延迟低且响应迅速。 - AI 增强: 为了进一步提升准确性和功能性,FluidVoice 支持接入 OpenAI、Groq 等主流 AI 服务提供商,以及自定义的后端服务。用户只需在设置中添加自己的 API 密钥,即可利用强大的云端 AI 模型对转录结果进行优化、润色或执行更复杂的指令。
- 本地实时转录: FluidVoice 使用
- 便捷的集成与用户体验
- 全局快捷键: 用户可以自定义一个全局热键,随时随地激活 FluidVoice 进行语音输入,无需切换应用或点击鼠标。
- 多语言支持: 支持超过 25 种语言,并具备自动检测功能,方便多语言用户无缝切换。
- 菜单栏集成: 应用图标常驻在菜单栏,方便快速访问设置和查看状态。
- 智能键入: 转录完成的文本可以直接“键入”到当前光标所在的任何应用程序中。
- 现代化的界面: 拥有支持“刘海屏”的悬浮窗设计,并提供使用统计数据,帮助用户了解自己的使用情况。
系统要求
在安装和使用 FluidVoice 之前,请确保你的设备满足以下条件:
- 操作系统: macOS 14.0 (Sonoma) 或更高版本。
- 硬件: 搭载 Apple Silicon 芯片 (M1, M2, M3, M4) 的 Mac 电脑。
- 重要提示: 目前该软件不支持基于 Intel 芯片的 Mac。
快速上手指南
开始使用 FluidVoice 非常简单:
- 从项目的发布页面下载最新的
.dmg安装包。 - 将
FluidVoice.app拖拽到“应用程序”文件夹中。 - 首次运行时,系统会提示你授予麦克风和辅助功能权限,请务必允许,这是软件正常工作所必需的。
- 在应用的设置中,设定一个你习惯使用的全局快捷键。
- (可选)如果你希望使用 AI 增强功能,可以在设置中添加你的 AI 服务提供商的 API 密钥。密钥将被安全地存储在 macOS 的钥匙串 (Keychain) 中,保证了安全性。
开源与社区
FluidVoice 是一个遵循 Apache License 2.0 许可的完全开源的项目。这意味着任何人都可以免费使用、审查其源代码、参与贡献甚至自行构建。开发者鼓励用户在 GitHub 上为项目“点星”(Star),这有助于提升项目的知名度,并激励开发者持续进行更新和维护。
对于希望反馈问题、提出建议或与其他用户交流的用户,可以加入项目的官方 Discord 社区。对于有开发能力的用户,项目也欢迎各种形式的贡献,并提供了详细的开发环境配置和贡献指南。
总结
总而言之,FluidVoice 为 Apple Silicon Mac 用户提供了一个功能强大、设计现代且完全免费的语音输入解决方案。它通过创新的“命令模式”和“写作模式”,将传统的语音听写提升到了一个新的高度。如果你正在寻找一款能够深度集成于 macOS 系统、并通过 AI 提升工作效率的语音工具,FluidVoice 无疑是一个值得关注和尝试的优秀选择。
- 两种核心模式:命令与写作
歡迎留言回复交流。
Log in to reply.