开源项目 Search-R1,开源版的DeepSeek-R1(-Zero)的复现,用于训练推理和搜索(工具调用)交错LLMs Search-R1,开源版的DeepSeek-R1(-Zero)的复现,用于训练...
开源项目 DeepSeek开源第五天,3FS,所有DeepSeek数据访问的推进器,使用现代SSD和RDMA网络的完整带宽的并行文件系统 DeepSeek开源第五天,3FS,所有DeepSeek数据访问的推进器,使用现...
开源项目 DeepSeek开源第四天,优化的并行性策略,DualPipe,EPLB,Profiling Data 3款优化的开源项目 DeepSeek开源第四天,优化的并行性策略,DualPipe,EPLB,Pro...
开源项目 DeepSeek开源第三天,DeepGemm,一个支持密集和Moe Gemms的FP8 GEMM库,为V3/R1训练和推理提供动力 DeepSeek开源第三天,DeepGemm,一个支持密集和Moe Gemms的...
开源项目 DeepSeek开源第一天,FlashMLA,Hopper GPU的有效的MLA解码内核,可用于可变长度序列,现在在生产中进行了优化 DeepSeek开源第一天,FlashMLA,Hopper GPU的有效的MLA...