🎙️ SenseVoice-Small 语音转文字神器使用指南(Windows版)
📌 基本介绍
SenseVoice-Small是基于阿里云开源模型的本地化语音识别工具,支持多种音视频格式转文字。
🚀 核心功能
实时录音转写
- 支持麦克风实时输入
- 延迟<1秒
多格式支持
- | MP3 | WAV | FLAC | M4A |
- | MP4 | AVI | MOV | WMV |
批量处理
- 支持文件夹批量导入
- 自动打包输出ZIP
🛠️ 安装步骤
- 下载安装包
- 解压到本地目录(建议英文路径)
- 运行
SenseVoice启动器.exe
- 等待自动打开浏览器界面
🎯 使用教程
单个文件转换
- 拖拽文件到界面
- 点击"开始识别"按钮
- 查看转换结果
- 导出TXT文本
批量处理
- 点击"批量处理"选项卡
- 选择输入文件夹
- 设置输出目录
- 开始批量转换
⚠️ 注意事项
- 首次使用需加载模型(约2-3分钟)
- 处理大型文件时建议关闭其他程序
- 输出文本编码为UTF-8
📁 文件结构
SenseVoice/
models/ # 模型文件
newmt-fun/ # 输出目录
SenseVoice-main/ # 临时文件
SenseVoice启动器.exe # 主程序
❓ 常见问题
Q:程序没有响应怎么办?
A:请检查是否被杀毒软件拦截
Q:识别准确率如何提高?
A:确保音频质量清晰,避免背景噪音
下载地址:
- SenseVoice独立转写整合包,语音转文字,支持中英日韩粤,音频/视频一键批量转文字,视频文案批量扒字幕,FunAsr,阿里开源,超越Whisper
- SenseVoice独立转写整合包,夸克网盘:https://pan.quark.cn/s/315efac11e20
- 官方项目地址:https://github.com/FunAudioLLM/SenseVoice