AI开源
Zonos,开源的TTS模型,允许对说话速度、音高变化、音频质量以及快乐、恐惧、悲伤和愤怒等情绪进行精细控制
让我们看看演示视频吧! Zonos,开源的TTS模型,允许对说话速度、音高变化、...
MedRAX,集成最新 CXR 分析工具和多模态大型语言模型的多功能 AI 代理,可以解读胸部 X 光
让我们看看演示视频吧! MedRAX,集成最新 CXR 分析工具和多模态大型语言...
Midscene,浏览器操作AI助手,用自然语言描述你想做什么,它将帮助你操作网页、验证内容和提取数据
让我们看演示视频吧! Midscene,浏览器操作AI助手,用自然语言描述你想做...
VideoRAG,超长上下文视频处理理解,通过自适应多模态融合机制优化检索效率,保持多视频上下文中的语义连贯性
VideoRAG,超长上下文视频处理理解,利用单块 NVIDIA RTX 309...