Mistral NeMo,这是一款与 NVIDIA 合作打造的 12B 型号。Mistral NeMo 提供了一个包含多达 128k 个令牌的大型上下文窗口。它的推理、世界知识和编码准确性在其尺寸类别中是最先进的。由于它依赖于标准架构,因此 Mistral NeMo 易于使用,并且是使用 Mistral 7B 的任何系统的直接替代品。

Mistral NeMo 经过量化感知训练,可实现 FP8 推理,而不会造成任何性能损失。

下表比较了 Mistral NeMo 基础模型与两个最新的开源预训练模型 Gemma 2 9B 和 Llama 3 8B 的准确性。

Mistral AI发布Mistral NeMo小模型,与 NVIDIA 合作构建插图

该模型专为全球多语言应用程序而设计。它接受过函数调用的训练,具有较大的上下文窗口,并且在英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语方面尤其强大。

Mistral NeMo小模型下载地址:https://huggingface.co/mistralai/Mistral-Nemo-Base-2407



微信扫描下方的二维码阅读本文

Mistral AI发布Mistral NeMo小模型,与 NVIDIA 合作构建插图1

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。