AI开源
Sa2VA,字节跳动推出统一的图像和视频密集接地理解模型,将SAM 2与LLaVA结合,实现对图像和视频的密集理解
让我们看看演示视频吧! Sa2VA,字节跳动推出统一的图像和视频密集接地理解模型...
Hallo3,百度开源的Hallo的第三个版本,输入音频和角色图片,可以生成该角色讲对应语音的视频,嘴型与语音匹配,有表情,有头部动作
让我们看看演示视频吧! Hallo3,百度开源的Hallo的第三个版本,输入音频...
Stable Point Aware 3D,Stability AI推出的可在一秒钟内从单个图像实时编辑和生成3D对象的完整结构
让我们看看演示视频吧! Stable Point Aware 3D,Stabil...