书生·蒲语发布InternLM3并开源InternLM3-8B-Instruct,支持通过长链推理解决复杂推理任务的深度思考模式,在推理和知识密集型任务上的表现达到先进水平,超越了如 Llama3.1-8B 和 Qwen2.5-7B 等模型,值得注意的是,InternLM3 仅使用了 4 万亿个高质量令牌进行训练,相比其他类似规模的模型,训练成本节省了超过 75%。
Github地址:https://github.com/InternLM/InternLM
论文地址:https://arxiv.org/abs/2403.17297
模型下载地址:https://huggingface.co/internlm/internlm3-8b-instruct
在线体验:https://huggingface.co/spaces/internlm/internlm3-8b-instruct
微信扫描下方的二维码阅读本文
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)