暂无菜单项

Chenyme AAVT - 全自动视频/音频翻译工具

发布于
210

工具介绍

一个简单易用的全自动视频(音频)识别、翻译工具,快速识别声音并翻译生成字幕文件,然后将翻译后的字幕与原视频合并,生成翻译后的视频。

主要基于 OpenAI 开发的 Whisper 来识别声音和 LLMs 辅助翻译字幕 ,利用 Streamlit 搭建快速使用的 WebUI 界面,以及 FFmpeg 来实现字幕与视频的合并。

特点:

⏺支持调用 openai
⏺本地运行 faster-whisper
⏺支持 GPU 加速、VAD 辅助
⏺支持 ChatGPT、KIMI、DeepSeek 翻译
⏺支持本地大语言模型翻译
⏺支持识别、翻译多种语言
⏺支持输出多种字幕格式
⏺支持对字幕修改、微调、预览
⏺支持对音频直接进行 AI 总结、问答

工具地址

项目地址:https://github.com/Chenyme/Chenyme-AAVT

0 讨论
热门最新
总结
暂无总结
0 / 600