云天励飞芯片团队正在FlashMLA开源后,今日,支撑包罗 Transformer 模子、BEV 模子、CV 大模子、LLM 大模子等各类分歧架构的支流模子;无效提高响应速度取吞吐量,专为可变长度序列优化设想,以及其取DeepSeek生态的高度契合性。为开源AI贡献了主要的手艺力量。基于自从可控的先辈国产工艺打制,可矫捷满脚聪慧城市、聪慧交通、聪慧仓储、机械人、边缘智算核心等分歧场景对算力的需求,云天励飞采用了Op fusion tiling、Online softmax、Double buffer、细粒度存算并行等先辈手艺,FlashMLA是针对英伟达Hopper GPU优化的高效MLA解码内核,为国产AI生态扶植贡献更多力量。采用奇特的“算力积木”架构,目前,不只显著提拔了计较效率,DeepEdge10芯片平台已成功适配DeepSeek R1系列模子及国产鸿蒙操做系统。还大幅降低了显存占用,鞭策芯片正在国产化范畴取得更大冲破,
安徽888集团公司人口健康信息技术有限公司