开源模型
Spark-TTS,基于 Qwen2.5 构建文本转语音系统,支持中英文,并具备跨语言、代码切换场景的零样本语音克隆能力
Spark-TTS,基于 Qwen2.5 构建文本转语音系统,支持中英文,并具备...
QwQ-32B,Qwen开源的中型推理模型,能够媲美 DeepSeek-R1、o1-mini 等最先进的推理模型
QwQ-32B,Qwen开源的中型推理模型,能够媲美 DeepSeek-R1、o...
DiffRhythm,基于扩散模型的端到端音乐模型,可以在 10 秒内生成一首完整包含人声和伴奏的歌曲
DiffRhythm,基于扩散模型的端到端音乐模型,可以在 10 秒内生成一首完...
IndexTTS,B站开源的文本到语音(TTS)模型,可以使用拼音纠正汉字的发音,并通过标点符号在任何位置控制暂停
IndexTTS,B站开源的文本到语音(TTS)模型,可以使用拼音纠正汉字的发音...