AI 编程 / MCP / 视频 / 音频 AI

ASR-Studio

面向 Qwen、豆包、Gemini 等 ASR/多模态语音模型的网页操作界面。

质量分84

262 Stars

2026-05-23T13:52:46Z

unknown

easy

中文速读

ASR Studio 是一个中文 README 的现代 Web UI，用于音频上传、麦克风录音、上下文提示、多语言识别、ITN 和结果管理，支持 Qwen 官方 ASR、豆包语音识别和 Gemini 音频理解等 provider。它适合需要快速试用云端/模型 ASR 能力的中文用户；不适合要求完全本地离线或企业级权限的场景。项目有在线应用和截图，发布价值较高。

快速试用

适合

需要中文语音转写界面的个人和团队
评估 Qwen/豆包/Gemini ASR 的开发者

不适合

要求完全离线本地模型的人
需要企业级用户/权限管理的团队

选型答案

ASR-Studio 适合什么场景？需要中文语音转写界面的个人和团队；评估 Qwen/豆包/Gemini ASR 的开发者

ASR-Studio 的试用和部署门槛如何？已发现 1 个试用、文档或演示入口，可从页面的“快速试用”区域打开。当前难度标记为“上手简单”，许可证记录为“unknown”。

选择 ASR-Studio 时要注意什么？要求完全离线本地模型的人；需要企业级用户/权限管理的团队

数据来源和更新时间GitHub 仓库 yeahhe365/ASR-Studio，最近记录的推送时间为 2026-05-23T13:52:46Z。

标签

ASRspeech-to-textQwenGeminiReact中文