Qwen2.5-Turbo，上下文长度扩展至百万 Tokens

2024-11-19 AI资讯

Qwen2.5-Turbo，上下文长度扩展至百万 Tokens，将处理 1M tokens 上下文时的首字返回时间从 4.9 分钟降低到68秒，实现 4.3 倍加速比，在相同成本下，Qwen2.5-Turbo 相比 GPT-4o-mini 能够处理 3.6 倍的 Token。

项目地址：https://qwenlm.github.io/zh/blog/qwen2.5-turbo/

在线体验：https://huggingface.co/spaces/Qwen/Qwen2.5-Turbo-1M-Demo

微信扫描下方的二维码阅读本文

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

评论(0)

提示：请文明发言取消回复