让我们看看官方演示视频吧!

智谱开源 CogVideoX 系列视频生成模型的第一个模型, CogVideoX-2B.

CogVideo是目前最大的通用领域文本到视频生成预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。

Github地址:https://github.com/THUDM/CogVideo

论文地址:https://arxiv.org/abs/2205.15868

模型下载地址:https://huggingface.co/THUDM/CogVideoX-2b

在线体验:https://huggingface.co/spaces/THUDM/CogVideoX



微信扫描下方的二维码阅读本文

CogVideo,智谱开源的DiT模型,清影同源视频生成模型插图

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。