视频 / 音频 AI / Local AI

SenseVoice

阿里通义实验室的语音基础模型，支持 ASR、语种识别、情感识别和音频事件检测

质量分79

8,125 Stars

2025-12-30T02:36:56Z

unknown

medium

中文速读

SenseVoice 是阿里通义实验室推出的语音基础模型，具备自动语音识别、语种识别、语音情感识别和音频事件检测等多任务能力。支持中文等多种语言，有 HuggingFace Space 可在线试用。

快速试用

在线体验live_app Hugging Face Spacehuggingface_space Hugging Face Spacehuggingface_space

适合

需要多任务语音理解的场景
中文语音识别需求

不适合

只需要单一 ASR 功能的轻量场景

选型答案

SenseVoice 适合什么场景？需要多任务语音理解的场景；中文语音识别需求

SenseVoice 的试用和部署门槛如何？已发现 3 个试用、文档或演示入口，可从页面的“快速试用”区域打开。当前难度标记为“中等难度”，许可证记录为“unknown”。

选择 SenseVoice 时要注意什么？只需要单一 ASR 功能的轻量场景

数据来源和更新时间GitHub 仓库 FunAudioLLM/SenseVoice，最近记录的推送时间为 2025-12-30T02:36:56Z。

标签

语音识别多模态阿里