返回搜索GitHub

视频 / 音频 AI

whisper

OpenAI 开源语音识别模型,支持多语言转录

质量分85
65,000 Stars
unknown
easy

中文速读

Whisper 是 OpenAI 发布的开源语音识别模型,支持多语言自动检测和转录。可通过 pip install 快速安装,提供 Colab 示例和 PyTorch 集成。适合语音转文字、字幕生成等场景。

适合

  • 需要语音转文字的开发者
  • 字幕生成需求

不适合

  • 需要实时流式语音识别的场景
  • 需要超低延迟的应用

选型答案

whisper 适合什么场景?需要语音转文字的开发者;字幕生成需求
whisper 的试用和部署门槛如何?已发现 3 个试用、文档或演示入口,可从页面的“快速试用”区域打开。 当前难度标记为“上手简单”,许可证记录为“unknown”。
选择 whisper 时要注意什么?需要实时流式语音识别的场景;需要超低延迟的应用
数据来源和更新时间GitHub 仓库 openai/whisper,最近记录的推送时间为

标签

语音识别转录多语言OpenAI