视频 / 音频 AI / Local AI
MiniCPM-o
手机可运行的轻量级多模态模型,支持图像和视频理解
质量分80
0 Stars
unknown
medium
中文速读
MiniCPM-o 是清华大学 OpenBMB 团队开发的端侧多模态大语言模型系列,专注于在手机等资源受限设备上实现高效的图像和视频理解。最新版本 MiniCPM-o 4.5 支持流式视频和音频输入的端到端交互。提供 Hugging Face Demo 和移动端 App。
快速试用
暂未发现稳定的 Demo 或视频入口。
适合
- 需要在端侧部署多模态模型的开发者
- 移动端 AI 应用开发
- 资源受限环境的 AI 部署
不适合
- 需要最强模型效果的场景(端侧模型能力有限)
- 纯文本 LLM 需求(有更轻量的选择)
选型答案
MiniCPM-o 适合什么场景?需要在端侧部署多模态模型的开发者;移动端 AI 应用开发;资源受限环境的 AI 部署
MiniCPM-o 的试用和部署门槛如何?暂未发现稳定的 Demo、视频或文档入口,适合先从 GitHub README 和 issues 判断成熟度。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 MiniCPM-o 时要注意什么?需要最强模型效果的场景(端侧模型能力有限);纯文本 LLM 需求(有更轻量的选择)
数据来源和更新时间GitHub 仓库 OpenBMB/MiniCPM-o,最近记录的推送时间为 。
标签
multimodaledge-aimobilevision-languagechinese-model