工具简介
Buzz 是一款免费、开源且跨平台的本地离线语音转文字与翻译工具,由独立开发者 Chidi Williams 基于 OpenAI 强大的 Whisper 语音识别模型主导开发。
![图片[1]-Buzz-本地离线语音转文字与翻译工具-太阳鸽鸽资源站](https://tygege.com/wp-content/uploads/2026/03/df34981d1620260307124109-1024x538.jpg)
核心作用与特性
- 主要功能: 能够在完全断网的本地电脑环境下,将导入的音频/视频文件,或电脑麦克风的实时录音,极速且精准地转换为带时间轴的文本内容(字幕),并支持全球 90 多种语言的识别与互相翻译。
- 核心特性:
- 极致的隐私安全(100% 离线): 与依赖云端的商业转写工具不同,Buzz 的所有音频数据解析都在你的个人设备上完成。无需联网、无需上传,是处理公司机密会议记录、私密采访录音的绝佳选择。
- 多模型引擎与全平台硬件加速: 软件不仅内置了原版的 Whisper,还深度集成了经过优化的 Faster Whisper 和 Whisper.cpp。它能极其聪明地调用 NVIDIA 显卡 (CUDA)、苹果 Mac (Apple Silicon M系列芯片) 甚至普通核显的 Vulkan 算力进行硬件加速,实现“一小时录音,几分钟转完”的超快体验。
- 实时收音与“同声传译”: 支持直接监听系统麦克风。在参加无字幕的外语跨国会议、或观看外语无字直播时,它可以作为一个悬浮窗口,为你提供实时的滚动字幕和翻译。
- 智能声纹识别与音频降噪: 最新版本加入了强大的**说话人识别(Speaker Identification)**功能,能自动区分录音中是“张三”还是“李四”在讲话;同时支持转录前的音轨分离,在嘈杂环境下依然能保持极高的识别准确率。
- 解决的痛点: 完美解决了传统商业语音转写服务(如各类会议记录 App、录音笔软件)按录音时长高昂收费、严重依赖网络、且极易引发机密数据泄露的痛点。它为记者、自媒体创作者、研究员和跨国打工人提供了一个永久免费、安全不设限的生产力神器。
获取与使用指南
- 下载地址:
- GitHub 官方发布页(最权威): https://github.com/chidiwilliams/buzz/releases
- SourceForge 官方分发页: https://sourceforge.net/projects/buzz-captions/
- 安装方法:
- 确认硬件环境: Buzz 完美兼容 Windows、macOS 和主流 Linux。虽然纯 CPU 也能硬扛运行,但为了获得流畅体验,建议电脑至少拥有 8GB 内存。配备主流独立显卡或苹果 M 芯片的设备体验处于第一梯队。
- 下载与安装: 在下载页面根据你的操作系统选择安装包。Windows 用户下载
.exe文件双击运行;macOS 用户下载.dmg文件后拖拽安装即可。(注:Windows 安装时若遇到系统自带的安全拦截,点击“更多信息 -> 仍要运行”即可,开源项目无任何风险)。 - 初始设置与模型下载(关键): 首次打开软件导入音视频时,你需要在界面中选择一个 AI 模型尺寸(包含 Tiny、Base、Small、Medium、Large)。模型越大越准,但也越慢越吃内存。强烈建议新手日常办公选择
Base或Small模型,速度与准确率平衡得最好。选择后,软件会自动联网下载模型权重(仅首次需要联网,后续可永久断网使用)。 - 一键导出: 转录完成后,你可以在软件内置的高级编辑器中回放并修改错别字,最后将其一键导出为纯文本 (
.txt) 或标准的字幕格式 (.srt,.vtt)。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END














请登录后查看评论内容