视频 / 音频 AI

whisper

OpenAI 开源语音识别模型，支持多语言转录

质量分85

65,000 Stars

unknown

easy

中文速读

Whisper 是 OpenAI 发布的开源语音识别模型，支持多语言自动检测和转录。可通过 pip install 快速安装，提供 Colab 示例和 PyTorch 集成。适合语音转文字、字幕生成等场景。

快速试用

文档docs 文档docs 链接colab

适合

需要语音转文字的开发者
字幕生成需求

不适合

需要实时流式语音识别的场景
需要超低延迟的应用

选型答案

whisper 适合什么场景？需要语音转文字的开发者；字幕生成需求

whisper 的试用和部署门槛如何？已发现 3 个试用、文档或演示入口，可从页面的“快速试用”区域打开。当前难度标记为“上手简单”，许可证记录为“unknown”。

选择 whisper 时要注意什么？需要实时流式语音识别的场景；需要超低延迟的应用

数据来源和更新时间GitHub 仓库 openai/whisper，最近记录的推送时间为。

标签

语音识别转录多语言OpenAI