AI 编程 / MCP / 视频 / 音频 AI
ASR-Studio
面向 Qwen、豆包、Gemini 等 ASR/多模态语音模型的网页操作界面。
质量分84
262 Stars
2026-05-23T13:52:46Z
unknown
easy
中文速读
ASR Studio 是一个中文 README 的现代 Web UI,用于音频上传、麦克风录音、上下文提示、多语言识别、ITN 和结果管理,支持 Qwen 官方 ASR、豆包语音识别和 Gemini 音频理解等 provider。它适合需要快速试用云端/模型 ASR 能力的中文用户;不适合要求完全本地离线或企业级权限的场景。项目有在线应用和截图,发布价值较高。
快速试用
适合
- 需要中文语音转写界面的个人和团队
- 评估 Qwen/豆包/Gemini ASR 的开发者
不适合
- 要求完全离线本地模型的人
- 需要企业级用户/权限管理的团队
选型答案
ASR-Studio 适合什么场景?需要中文语音转写界面的个人和团队;评估 Qwen/豆包/Gemini ASR 的开发者
ASR-Studio 的试用和部署门槛如何?已发现 1 个试用、文档或演示入口,可从页面的“快速试用”区域打开。 当前难度标记为“上手简单”,许可证记录为“unknown”。
选择 ASR-Studio 时要注意什么?要求完全离线本地模型的人;需要企业级用户/权限管理的团队
数据来源和更新时间GitHub 仓库 yeahhe365/ASR-Studio,最近记录的推送时间为 2026-05-23T13:52:46Z。
标签
ASRspeech-to-textQwenGeminiReact中文