面壁智能开源面壁小钢炮3.0 MiniCPM 3.0 ,性能超GPT-3.5,无限长文本超Kimi.
MiniCPM 3.0,4B 参数,在自然语言理解、知识、代码、数学等能力上赶超GPT-3.5,在 Qwen2-7B、 Phi-3.5、GLM4-9B、LLaMa3-8B 等一众中外知名模型脱颖而出。
与1.0/2.0比,MiniCPM3-4B 有更强大、更通用的技能集,可以实现更广泛的应用,支持函数调用和代码解释器。
32k上下文窗口, 配备 LLMxMapReduce,理论上可以处理无限的上下文,而无需占用大量内存。
Github地址:https://github.com/OpenBMB/MiniCPM
模型下载地址:https://huggingface.co/openbmb/MiniCPM3-4B
论文地址:https://arxiv.org/abs/2404.06395
微信扫描下方的二维码阅读本文
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)