MiniCPM-V MiniCPM-V & o Cookbook

MiniCPM-V & o Cookbook

MiniCPM-VMiniCPM-o 以及 MiniCPM LLM 系列轻松搭建强大的 AI 应用 —— 文本、视觉、语音、实时流媒体能力一站式获得。

最新动态

按场景选择

个人用户

在自己机器上轻松推理 —— 支持 CPU + GPUmacOS / Linux / Windows,甚至手机。

企业用户

高吞吐、可规模化的服务化部署:

研究者

训练 / 微调 / 定制:

版本一览

本 Cookbook 覆盖目前在维护的所有 MiniCPM 版本:

MiniCPM-V

版本 状态 模态 参数量 亮点 上下文
4.6 (最新) 推荐 图像、视频 ~1.2B 可上手机的多模态大模型,LLaVA-UHD v4 视觉塔 256K
4.5 稳定 图像、视频 9B 图像 + 视频理解,可选思考模式 32K

MiniCPM-o

版本 状态 模态 参数量 亮点 上下文
4.5 (最新) 推荐 图像、视频、音频 9B 端到端全模态(视觉 + 语音 + TTS),全双工流式 32K

MiniCPM (LLM)

版本 状态 模态 参数量 亮点 上下文
4.1 (最新) 推荐 文本 8B 混合思考、EAGLE3、InfLLM-V2 128K
4 稳定 文本 0.5B / 8B InfLLM-V2、FRSpec 投机解码 128K
SALA 研究 文本 8B 稀疏 + 线性混合注意力 1M+

侧边栏的 版本切换器 可以跳到对应版本的文档。

资源链接