返回搜索GitHub

视频 / 音频 AI / Local AI

MiniCPM-o

手机可运行的轻量级多模态模型,支持图像和视频理解

质量分80
0 Stars
unknown
medium

中文速读

MiniCPM-o 是清华大学 OpenBMB 团队开发的端侧多模态大语言模型系列,专注于在手机等资源受限设备上实现高效的图像和视频理解。最新版本 MiniCPM-o 4.5 支持流式视频和音频输入的端到端交互。提供 Hugging Face Demo 和移动端 App。

快速试用

暂未发现稳定的 Demo 或视频入口。

适合

  • 需要在端侧部署多模态模型的开发者
  • 移动端 AI 应用开发
  • 资源受限环境的 AI 部署

不适合

  • 需要最强模型效果的场景(端侧模型能力有限)
  • 纯文本 LLM 需求(有更轻量的选择)

选型答案

MiniCPM-o 适合什么场景?需要在端侧部署多模态模型的开发者;移动端 AI 应用开发;资源受限环境的 AI 部署
MiniCPM-o 的试用和部署门槛如何?暂未发现稳定的 Demo、视频或文档入口,适合先从 GitHub README 和 issues 判断成熟度。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 MiniCPM-o 时要注意什么?需要最强模型效果的场景(端侧模型能力有限);纯文本 LLM 需求(有更轻量的选择)
数据来源和更新时间GitHub 仓库 OpenBMB/MiniCPM-o,最近记录的推送时间为

标签

multimodaledge-aimobilevision-languagechinese-model