faster-whisper-GUI：基于faster-whisper的图形用户界面(GUI)工具

人工智能研究

faster-whisper-GUI：基于faster-whisper的图形用户界面(GUI)工具

發布人 Brave 2023-12-28 06:59
faster-whisper-GUI是一个基于fast-whisper的音频转写和字幕生成工具。它不仅对原始的 Whisper 模型结构进行了改进和优化，还提供了一个更友好和直观的界面，使用户能够更轻松地使用faster-whisper进行音频转写和字幕生成。

faster-whisper-GUI的特点和功能

以下是faster-whisper-GUI的一些特点和功能：
1. 模型参数配置：faster-whisper-GUI允许用户配置模型参数，包括选择使用的模型、设置音频采样率和帧率等。
2. 输入文件处理：用户可以通过拖放文件或选择文件进行输入。支持的输入文件格式包括MP3、WAV等常见音频格式。
3. 输出文件格式：faster-whisper-GUI支持多种输出文件格式，包括SRT、VTT、TXT、LRC和SMI等。用户可以根据自己的需求选择合适的输出格式。
4. 自动加载模型：faster-whisper-GUI可以自动加载之前保存的模型参数配置，方便用户快速进行转写操作。
5. 设置界面：提供了一个设置界面，用户可以保存软件配置、设置自动加载模型、清除临时文件等。
如何自托管faster-whisper-GUI

第一步：先在Linux系统中安装Docker。
```
# 添加Docker的官方GPG key:
sudo apt-get update
sudo apt-get install ca-certificates curl gnupg
sudo install -m 0755 -d /etc/apt/keyrings
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
sudo chmod a+r /etc/apt/keyrings/docker.gpg
```
```
# 将repository添加到Apt来源:
echo \
"deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu \
$(. /etc/os-release && echo "$VERSION_CODENAME") stable" | \
sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
sudo apt-get update
```
```
# 安装Docker
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
```
```
# 运行Hello World来测试Docker安装是否成功
sudo docker run hello-world
```
第二步：安装faster-whisper-GUI的docker镜像
```
docker run -it -p 7860:7860 --platform=linux/amd64 \
    -e HK_ACCESS_TOKEN="YOUR_VALUE_HERE" \
    registry.hf.space/aadnk-faster-whisper-webui:latest python app.py
```
具体使用faster-whisper-GUI

可以根据命令行中的提示，通过本地网络来访问并使用faster-whisper-GUI。

推荐使用专门的电脑或虚拟机来托管faster-whisper-GUI，并谨慎处理和保管包含敏感个人信息的个人录音。

总之，faster-whisper-GUI是个方便易用的音频转写和字幕生成工具，借助图形界面，可以让大家更轻松地进行转写操作，按需生成文本或字幕文件，是主权个人值得一用的工具。

faster-whisper-GUI的demo链接：

https://huggingface.co/spaces/aadnk/faster-whisper-webui
Brave 回复 9 months, 2 weeks ago 1 成員 · 0 回复
0 回复

歡迎留言回复交流。

登入後即可回复

人工智能研究

組織者:

faster-whisper-GUI：基于faster-whisper的图形用户界面(GUI)工具

faster-whisper-GUI：基于faster-whisper的图形用户界面(GUI)工具

认识基地

基础设施

加入基地

支持基地

共建基地

探索基地

Connect Wallet