书生·蒲语发布InternLM3并开源InternLM3-8B-Instruct，支持通过长链推理解决复杂推理任务的深度思考模式-沃图社

书生·蒲语发布InternLM3并开源InternLM3-8B-Instruct，支持通过长链推理解决复杂推理任务的深度思考模式，在推理和知识密集型任务上的表现达到先进水平，超越了如 Llama3.1-8B 和 Qwen2.5-7B 等模型，值得注意的是，InternLM3 仅使用了 4 万亿个高质量令牌进行训练，相比其他类似规模的模型，训练成本节省了超过 75%。

书生·蒲语发布InternLM3并开源InternLM3-8B-Instruct，支持通过长链推理解决复杂推理任务的深度思考模式插图

Github地址：https://github.com/InternLM/InternLM

论文地址：https://arxiv.org/abs/2403.17297

模型下载地址：https://huggingface.co/internlm/internlm3-8b-instruct

在线体验：https://huggingface.co/spaces/internlm/internlm3-8b-instruct

微信扫描下方的二维码阅读本文

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

书生·蒲语发布InternLM3并开源InternLM3-8B-Instruct，支持通过长链推理解决复杂推理任务的深度思考模式

评论(0)

提示：请文明发言取消回复

每日推文

书生·蒲语发布InternLM3并开源InternLM3-8B-Instruct，支持通过长链推理解决复杂推理任务的深度思考模式

相关文章

Meta Movie Gen，Meta推出的AI视频模型，支持文字生成视频、文字编辑视频、生成音效和配乐

LTX-Video，基于 DiT 的视频生成模型，可以生成 24×768 分辨率的 512 FPS 视频

Object Cutter，一键去除背景，且支持通过文字或框选来指定保留什么物体

Segment Anything Model 2 （SAM 2），实时视频分割，自动追踪主体

评论(0)

提示：请文明发言 取消回复

标签云

每日推文

提示：请文明发言取消回复