winget install --id=buxuku.SmartSub.CUDA.11.8.Optimized -e
Video Subtitle Master is a powerful desktop application for batch generating subtitles for videos and translating them into other languages. This project is an enhanced version of the open-source VideoSubtitleGenerator, redesigned as a user-friendly client tool. This application retains all the features of the original VideoSubtitleGenerator command-line tool, with the following enhancements: - Graphical user interface for easier operation - Source and target language subtitle files are saved in the same directory as the video for convenient subtitle attachment during playback - Batch processing of video/audio/subtitle files - Support for generating subtitles from video or audio files - Ability to translate generated or imported subtitles - Multiple translation services supported: - Volcano Engine Translation - Baidu Translation - DeepLX Translation (Note: Batch translation may be rate-limited) - Local Ollama model translation - Support for OpenAI-style API translations (e.g., deepseek, azure) - Customizable subtitle file naming for compatibility with various media players - Flexible translated subtitle content: choose between pure translation or original + translated subtitles - Integrated whisper.cpp with optimization for Apple Silicon, offering faster generation speeds - Built-in fluent-ffmpeg, eliminating the need for separate ffmpeg installation - Support for running locally installed whisper command - Option to choose model download source (domestic mirror or official source) - Customizable number of concurrent tasks
Video Subtitle Master is a desktop application designed to batch generate subtitles for videos and audio files and translate them into multiple languages. Built as an enhanced version of VideoSubtitleGenerator, it offers a user-friendly interface while retaining all core functionalities.
Key Features:
Ideal for content creators, educators, and professionals who need efficient multilingual subtitle creation. Streamline workflows and enhance accessibility for global audiences while maintaining data privacy through local processing. Install via winget for easy setup.
让每一帧画面都能美妙地表达
智能音视频字幕生成与多语言翻译批量化解决方案
它保留了之前 VideoSubtitleGenerator 这个命令行工具的全部特性,并新增了以下功能:
whisper
命令因为本人使用的是苹果芯片,缺少 window CUDA 的开发环境,对于 CUDA 的支持,开发测试都存在较多场景无法兼顾的情况。
从 1.20.0 版本开始,在苹果芯片上,支持使用 Core ML 加速语音识别。如果是苹果芯片,请下载 mac arm64 版本的 release 包。将会自动启动 Core ML 加速。
本项目支持多种翻译服务,包括百度翻译、火山引擎翻译、DeepLX、Ollama 本地模型、 DeepSeek 以及 OpenAI 风格的 API。使用这些服务需要相应的 API 密钥或配置。
对于百度翻译、火山引擎等服务的 API 申请方法,可以参考 ,感谢 这款优秀的软件提供的信息。
对于 AI 翻译,翻译结果受模型和提示词的影响比较大,你可以尝试不同的模型和提示词,找到适合自己的组合。推荐可以尝试 AI 聚合平台 DeerAPI, 支持多个平台近 500 种模型,选择合适自己的模型进行翻译。
从视频或者音频里面,生成字幕文件,需要使用到 whisper 的模型。 whisper 的模型有多种,不同的模型,生成字幕的准确性不同,处理速度也不同。
tiny
或者 base
系列的模型,准确性虽然不如 large
系列,但是处理速度快,占用显存小small
或者 base
开始,平衡精度与资源消耗large
系列的模型,准确性高en
的模型,专为英语优化,减少多语言干扰q5
或者 q8
系列的模型,相对于非量化版本,牺牲少量精度换取更小体积请根据自己的电脑系统,芯片,显卡,选择下载对应安装包。
系统 | 芯片 | 显卡 | 下载安装包 |
---|---|---|---|
Windows | x64 | CUDA >= 11.8.0 < 12.0.0 | windows-x64_cuda11.8.0 |
Windows | x64 | CUDA >= 12.4.1 | windows-x64_cuda12.4.1 |
Windows | x64 | CUDA >= 12.2.0 | windows-x64_cuda12.2.0 |
Windows | x64 | 无 CUDA | windows-x64_no_cuda |
Mac | Apple | 支持 CoreML | mac-arm64 |
Mac | Intel | 不支持 CoreML | mac-x64 |
1️⃣ 克隆本项目在本地
git clone https://github.com/buxuku/SmartSub.git
2️⃣ 在项目中执行 yarn install
或者 npm install
cd SmartSub
yarn install
如果是 windows 平台,或者 Mac intel 平台,请前往 https://github.com/buxuku/whisper.cpp/releases/tag/latest 下载对应的 node 文件,并重命名为 addon.node
, 覆盖放在 extraResources/addons/
目录下。
3️⃣ 依赖包安装好之后,执行 yarn dev
或者 npm run dev
启动项目
yarn dev
因为模型文件比较大,如果通过该软件下载模型会存在难以下载的情况,可以手动下载模型并导入到应用中。以下是两个可用于下载模型的链接:
国内镜像源(下载速度较快): https://hf-mirror.com/ggerganov/whisper.cpp/tree/main
Hugging Face 官方源: https://huggingface.co/ggerganov/whisper.cpp/tree/main
如果是苹果芯片,需要同时下载模型对应的 encoder.mlmodelc 文件。并解压出来放在模型相同目录下。(如果是 q5 或者 q8 系列的模型,无须下载该文件)
下载完成后,您可以通过应用的"模型管理"页面中的"导入模型"功能将下载的模型文件导入到应用中。或者直接复制到模型目录里面即可。
导入步骤:
在终端中执行以下命令:
sudo xattr -dr com.apple.quarantine /Applications/SmartSub.app
然后再次运行应用程序。
👏🏻 欢迎提交 Issue 和 Pull Request 来帮助改进这个项目!
⭐ 如果您觉得这个项目对您有帮助,欢迎给我一个 star,或者请我喝一杯咖啡(请备注你的 github 账号)。
👨👨👦👦 如果您有任何使用问题,欢迎加入微信交流群,一起交流学习。
支付宝收款码 | 微信赞赏码 | 微信交流群 |
---|---|---|
![]() | ![]() | ![]() |
本项目采用 MIT 许可证。详情请见 LICENSE 文件。