faster-whisper-GUI:基于faster-whisper的图形用户界面(GUI)工具
-
faster-whisper-GUI:基于faster-whisper的图形用户界面(GUI)工具
faster-whisper-GUI是一个基于fast-whisper的音频转写和字幕生成工具。它不仅对原始的 Whisper 模型结构进行了改进和优化,还提供了一个更友好和直观的界面,使用户能够更轻松地使用faster-whisper进行音频转写和字幕生成。
faster-whisper-GUI的特点和功能
以下是faster-whisper-GUI的一些特点和功能:
-
模型参数配置:faster-whisper-GUI允许用户配置模型参数,包括选择使用的模型、设置音频采样率和帧率等。
-
输入文件处理:用户可以通过拖放文件或选择文件进行输入。支持的输入文件格式包括MP3、WAV等常见音频格式。
-
输出文件格式:faster-whisper-GUI支持多种输出文件格式,包括SRT、VTT、TXT、LRC和SMI等。用户可以根据自己的需求选择合适的输出格式。
-
自动加载模型:faster-whisper-GUI可以自动加载之前保存的模型参数配置,方便用户快速进行转写操作。
-
设置界面:提供了一个设置界面,用户可以保存软件配置、设置自动加载模型、清除临时文件等。
如何自托管faster-whisper-GUI
第一步:先在Linux系统中安装Docker。
# 添加Docker的官方GPG key:
sudo apt-get update
sudo apt-get install ca-certificates curl gnupg
sudo install -m 0755 -d /etc/apt/keyrings
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
sudo chmod a+r /etc/apt/keyrings/docker.gpg# 将repository添加到Apt来源:
echo \
"deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu \
$(. /etc/os-release && echo "$VERSION_CODENAME") stable" | \
sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
sudo apt-get update# 安装Docker
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin# 运行Hello World来测试Docker安装是否成功
sudo docker run hello-world第二步:安装faster-whisper-GUI的docker镜像
docker run -it -p 7860:7860 --platform=linux/amd64 \
-e HK_ACCESS_TOKEN="YOUR_VALUE_HERE" \
registry.hf.space/aadnk-faster-whisper-webui:latest python app.py具体使用faster-whisper-GUI
可以根据命令行中的提示,通过本地网络来访问并使用faster-whisper-GUI。
推荐使用专门的电脑或虚拟机来托管faster-whisper-GUI,并谨慎处理和保管包含敏感个人信息的个人录音。
总之,faster-whisper-GUI是个方便易用的音频转写和字幕生成工具,借助图形界面,可以让大家更轻松地进行转写操作,按需生成文本或字幕文件,是主权个人值得一用的工具。
faster-whisper-GUI的demo链接:
-
Sorry, there were no replies found.
Log in to reply.