视频 / 音频 AI
FunASR
阿里达摩院开源的工业级语音识别工具包,支持 ASR/VAD/标点恢复/说话人分离
质量分78
0 Stars
unknown
medium
中文速读
FunASR 是阿里巴巴达摩院(ModelScope)开源的端到端语音识别工具包,旨在搭建学术研究与工业应用之间的桥梁。支持语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多说话人 ASR。提供预训练模型的推理和微调,支持 ModelScope 和 HuggingFace 模型库。有完整的中文文档和教程。
适合
- 需要中文语音识别的开发者
- 语音 AI 研究者
- 构建语音交互产品的团队
不适合
- 非语音 AI 领域的开发者
- 需要开箱即用 SaaS 语音 API 的用户
选型答案
FunASR 适合什么场景?需要中文语音识别的开发者;语音 AI 研究者;构建语音交互产品的团队
FunASR 的试用和部署门槛如何?已发现 6 个试用、文档或演示入口,可从页面的“快速试用”区域打开。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 FunASR 时要注意什么?非语音 AI 领域的开发者;需要开箱即用 SaaS 语音 API 的用户
数据来源和更新时间GitHub 仓库 modelscope/FunASR,最近记录的推送时间为 。
标签
语音识别ASRVAD说话人分离中文语音ModelScope达摩院