官方目前只放出了MiniCPM-Llama3-V 2.5的paper,2.0只有技术博客而且主要是效果展示。 目前一共出了以下几代:MiniCPM-V、MiniCPM-V 2.0、MiniCPM-Llama3-V 2.5、MiniCPM-V 2.6。 项目地址:github.com/OpenBMB/Mini paper:arxiv.org/abs/2408.0180 title:《MiniCPM-V: A GPT-4V Level MLLM on Your Phone...
Results from the Paper Edit Ranked #7 on Multiple-choice on Neptune-Full Get a GitHub badge TaskDatasetModelMetric NameMetric ValueGlobal RankResultBenchmark Multiple-choice Neptune-Full MiniCPM-v (50 frames) Accuracy (% ) 56.59 # 7 Compare Zero-Shot Video Question Answer Video-MME Mini...
此外,在 OCRBench 上,MiniCPM-V 2.6 OCR 性能实现开源+闭源模型 SOTA,延续并加强了小钢炮系列最强端侧 OCR 能力的传统优势。 在幻觉评测榜单 Object HalBench 上,MiniCPM-V 2.6 的幻觉水平(幻觉率越低越好)优于 GPT-4o、GPT-4V、Claude 3.5 Sonnet 等众多商用模型。 🏆榜单成绩 Obiect HalBench | OCRBen...
官方目前只放出了MiniCPM-Llama3-V 2.5的paper,2.0只有技术博客而且主要是效果展示。 目前一共出了以下几代:MiniCPM-V、MiniCPM-V 2.0、MiniCPM-Llama3-V 2.5、MiniCPM-V 2.6。 项目地址:github.com/OpenBMB/Mini paper:arxiv.org/abs/2408.0180 title:《MiniCPM-V: A GPT-4V Level MLLM on Your Phone...
时隔1 个月,面壁小钢炮 MiniCPM 系列上新,带来MiniCPM-Llama3-V 2.5 8B,最强端侧多模态模型。 小钢炮系列通过一系列自研技术,所开创的高清图像识别(1344*1344 分辨率)、强大的 OCR 能力等,本次仍得到了延续。 8B 体量的新一代 MiniCPM-Llama3-V 2.5,仍带来一系列惊艳亮点。
🎉 2024.08.12: The SWIFT paper has been published on arXiv, and you can read ithere. 🔥 2024.08.05: Support for usingevalscopeas a backend for evaluating large models and multimodal models. 🔥 2024.07.29: Support for usingvllmandlmdeployto accelerate inference for large models and mult...
MiniCPM-V 1.0 is**the first end-deployable LMM supporting bilingual multimodal interaction in English and Chinese**. This is achieved by generalizing multimodal capabilities across languages, a technique from the ICLR 2024 spotlight[paper](https://arxiv.org/abs/2308.12038). ...
再次刷新端侧多模态天花板,面壁「小钢炮」MiniCPM-V 2.6模型重磅上新! 仅8B 参数,单图、多图、视频理解全面超越 GPT-4V! 更有多项功能首次上「端」:小钢炮一口气将实时视频理解、多图联合理解、多图 ICL 等能力首次搬上端侧多模态模型,更接近充斥着复杂、模糊、连续实时视觉信息的多模态真实世界,更能充分发挥端...
官方目前只放出了MiniCPM-Llama3-V 2.5的paper,2.0只有技术博客而且主要是效果展示。 目前一共出了以下几代:MiniCPM-V、MiniCPM-V 2.0、MiniCPM-Llama3-V 2.5、MiniCPM-V 2.6。 项目地址:https://github.com/OpenBMB/MiniCPM-Vpaper:https://arxiv.org/abs/2408.01800title:《MiniCPM-V: A GPT-4V Leve...
时隔1 个月,面壁小钢炮 MiniCPM 系列上新,带来MiniCPM-Llama3-V 2.5 8B,最强端侧多模态模型。 小钢炮系列通过一系列自研技术,所开创的高清图像识别(1344*1344 分辨率)、强大的 OCR 能力等,本次仍得到了延续。 8B 体量的新一代 MiniCPM-Llama3-V 2.5,仍带来一系列惊艳亮点。