视频 / 音频 AI
whisper
OpenAI 开源语音识别模型,支持多语言转录
质量分85
65,000 Stars
unknown
easy
中文速读
Whisper 是 OpenAI 发布的开源语音识别模型,支持多语言自动检测和转录。可通过 pip install 快速安装,提供 Colab 示例和 PyTorch 集成。适合语音转文字、字幕生成等场景。
适合
- 需要语音转文字的开发者
- 字幕生成需求
不适合
- 需要实时流式语音识别的场景
- 需要超低延迟的应用
选型答案
whisper 适合什么场景?需要语音转文字的开发者;字幕生成需求
whisper 的试用和部署门槛如何?已发现 3 个试用、文档或演示入口,可从页面的“快速试用”区域打开。 当前难度标记为“上手简单”,许可证记录为“unknown”。
选择 whisper 时要注意什么?需要实时流式语音识别的场景;需要超低延迟的应用
数据来源和更新时间GitHub 仓库 openai/whisper,最近记录的推送时间为 。
标签
语音识别转录多语言OpenAI