Buzz-0.8.4是一款开源软件,可用来对没有字幕的视频电影,通过音频分析自动生成正确的字幕。
基于whisper构建,可以说是whisper的界面版。Buzz-0.8.4可用来对视频文件、音频文件做语音转文字,生成带时间的字幕文件或纯文本,达到实时的字幕提取的目的。
Buzz-0.8.4支持windows、linux、和mac苹果电脑,根据whisper模型的大小可使用CPU或GPU进行加速。
以下是Buzz-0.8.4的一使用测试,成功的完成了对视频电影如中人物说话的字幕提取。
启动软件后首先需要下载语音转文字的模型,Buzz-0.8.4主要基于whisper架构,因此下载的模型也是whisper的模型,
软件界面Help-Preferences-Models
主要有Tiny Base Small Medium Large,越往下模型越大,需要的显存在越高,而第一个Tiny则不需要显卡可CPU运行。
本次测试中,选了Medium模型,主要是因为自己的显卡只有12G,如果用Large了万一视频还需要用显存怕不够。
完成模型的部署后,把视频托到软件界面窗口,基于简单的设置。
以下窗口显示字幕提取运行中
完成后即可在视频或音频所在目录,看到软件生成的字幕文件和txt文件。
字幕文件演示,使用的是 Subtitle Edit 软件打开字幕文件 方便查看,同时字幕文件可以导入到任意的视频编辑软件中。
txt文件演示
使用Buzz-0.8.4遇到的问题,
1、如果你提供的视频文件没有音频,软件会报错如下
RuntimeError: Failed to load audio: ffmpeg version 6.0-full_build-www.gyan.dev Copyright (c) 2000-2023 the FFmpeg developers
这并不是你的软件问题,就是这上视频没有音频,比如现在很多视频网站的视频和音频是分开两个文件的,如果你使用这种视频做字幕生成就会触发报错。你可以直接找到音频文件托进软件窗口做字幕提取即可。
如何下载Buzz-0.8.4:
用户可在github下载到Buzz-0.8.4,可下载到windows、mac和Linux,个人做了一份windows版的搬运。
本文《Buzz-0.8.4实时提取视频字幕并翻译,离线使用支持多平台使用》由爱思考吧 isres.com 分享,转载请注明出处。本文网址:https://www.isres.com/media/180.html
本站主要收集测评能够节省时间和提升效率的软件工具并分享使用与学习的过程和感受,任何情况下用户都需遵守所使用软件资源的相关协议。与《Buzz-0.8.4实时提取视频字幕并翻译,离线使用支持多平台使用》有关的本站文章及资源仅供个人学习交流使用,相关资源请下载后24小时内删除,请勿用于其它用途,因此产生的任何问题由您自行承担。