Mistral AI 发布了两个新模型,Codestral Mamba和Mathstral,Codestral Mamba,专门用于代码生成的模型,Mathstral,专用于数学推理和科学发现的模型。

Codestral Mamba:

性能上,Mamba 模型经过高级代码和推理能力的训练,可以与最先进的基于 Transformer 的模型相媲美

在256k token的上下文检索能力上对 Codestral Mamba 进行了测试,预期它将成为一个出色的本地代码助手

Mistral AI 发布了两个新模型,Codestral Mamba和Mathstral插图

Mathstral:

7B参数,具有32k的上下文窗口,支持需要复杂、多步逻辑推理的高级数学问题研究 在同尺寸中推理能力优秀,在 MATH上达到了 56.6%,在 MMLU上达到了 63.47%

Mistral AI 发布了两个新模型,Codestral Mamba和Mathstral插图1


微信扫描下方的二维码阅读本文

Mistral AI 发布了两个新模型,Codestral Mamba和Mathstral插图2

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。