视频 / 音频 AI / Local AI
SenseVoice
阿里通义实验室的语音基础模型,支持 ASR、语种识别、情感识别和音频事件检测
质量分79
8,125 Stars
2025-12-30T02:36:56Z
unknown
medium
中文速读
SenseVoice 是阿里通义实验室推出的语音基础模型,具备自动语音识别、语种识别、语音情感识别和音频事件检测等多任务能力。支持中文等多种语言,有 HuggingFace Space 可在线试用。
适合
- 需要多任务语音理解的场景
- 中文语音识别需求
不适合
- 只需要单一 ASR 功能的轻量场景
选型答案
SenseVoice 适合什么场景?需要多任务语音理解的场景;中文语音识别需求
SenseVoice 的试用和部署门槛如何?已发现 3 个试用、文档或演示入口,可从页面的“快速试用”区域打开。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 SenseVoice 时要注意什么?只需要单一 ASR 功能的轻量场景
数据来源和更新时间GitHub 仓库 FunAudioLLM/SenseVoice,最近记录的推送时间为 2025-12-30T02:36:56Z。
标签
语音识别多模态阿里