MiniCPM-V & o Cookbook
用 MiniCPM-V / MiniCPM-o 轻松搭建强大的多模态 AI 应用 —— 视觉、语音、实时流媒体能力一站式获得。
最新动态
- 🎉 MiniCPM-V 4.6 发布 —— Instruct 与 Thinking 双版本,Qwen3.5 hybrid backbone,256K 上下文,重构后的视觉 merger 结构。
- 推理:单图问答 · 多图问答 · 视频 · OCR · PDF 解析 · Grounding
- 部署:vLLM · SGLang · llama.cpp · Ollama
- 量化:GGUF · BNB · AWQ
按场景选择
个人用户
在自己机器上轻松推理 —— 支持 CPU + GPU、macOS / Linux / Windows,甚至手机。
企业用户
高吞吐、可规模化的服务化部署:
研究者
训练 / 微调 / 定制:
版本一览
本 Cookbook 覆盖目前在维护的所有 MiniCPM-V & o 版本:
| 版本 | 状态 | 模态 | 语言模型 | 上下文 |
|---|---|---|---|---|
| MiniCPM-V 4.6 (最新) | 推荐 | 图像、视频 | Qwen3.5 hybrid | 256K |
| MiniCPM-V 4.5 | 稳定 | 图像、视频 | Qwen3 | 32K |
| MiniCPM-o 4.5 | 稳定 | 图像、视频、音频 | Qwen3 | 32K |
侧边栏的 版本切换器 可以跳到对应版本的文档。
资源链接
- 🤗 HuggingFace
- 🤖 魔搭社区
- 📖 技术博客
- 💬 Discord
- 🐛 反馈问题