视频 / 音频 AI

FunASR

阿里达摩院开源的工业级语音识别工具包，支持 ASR/VAD/标点恢复/说话人分离

质量分78

0 Stars

unknown

medium

中文速读

FunASR 是阿里巴巴达摩院（ModelScope）开源的端到端语音识别工具包，旨在搭建学术研究与工业应用之间的桥梁。支持语音识别（ASR）、语音活动检测（VAD）、标点恢复、语言模型、说话人验证、说话人分离和多说话人 ASR。提供预训练模型的推理和微调，支持 ModelScope 和 HuggingFace 模型库。有完整的中文文档和教程。

快速试用

在线体验live_app 在线体验live_app 在线体验live_app 在线体验live_app 在线体验live_app 在线体验live_app

适合

需要中文语音识别的开发者
语音 AI 研究者
构建语音交互产品的团队

不适合

非语音 AI 领域的开发者
需要开箱即用 SaaS 语音 API 的用户

选型答案

FunASR 适合什么场景？需要中文语音识别的开发者；语音 AI 研究者；构建语音交互产品的团队

FunASR 的试用和部署门槛如何？已发现 6 个试用、文档或演示入口，可从页面的“快速试用”区域打开。当前难度标记为“中等难度”，许可证记录为“unknown”。

选择 FunASR 时要注意什么？非语音 AI 领域的开发者；需要开箱即用 SaaS 语音 API 的用户

数据来源和更新时间GitHub 仓库 modelscope/FunASR，最近记录的推送时间为。

标签

语音识别ASRVAD说话人分离中文语音ModelScope达摩院