8月21日,国产大模型厂商DeepSeek正式推出V3.1版本。除了首次支持128K长上下文窗口,还“暗藏”引爆行业的黑科技——UE8M0 FP8 Scale的参数精度标准。DeepSeek官微表示,这是“针对即将发布的下一代国产芯片设计”。
该模型上传至Hugging Face后,清微智能第一时间响应。凭借强大的技术实力和敏锐的行业洞察力,技术团队火速在清微TX8系列产品上完成DeepSeek V3.1模型适配。在数据表现上,清微TX81-1032具备单机2T显存(最高可支持4T显存),在128K长上下文的场景中,相比同类产品,可支持并发数达4倍以上。
此外,大显存带来的另一个优势是,可支持下一代DeepSeek R2(达1.3万亿参数)的单机部署,在行业中优势凸显。
值得一提的是,清微TX8云端芯片系列,是基于国际领先的可重构计算架构自研的训推一体计算产品,能够原生支持MXFP8格式(E4M3、E5M2和UE8M0 scale)与MXFP4,为用户提供原生、干净、高效的FP8 GEMM内核,且具备细粒度缩放功能。
经验证,相比于国际旗舰产品,清微智能提供的FP8精度误差近乎无损,端到端性能超越国际一流厂商旗舰产品。而原生支持的MXFP4,更能够运行业界典型的4-bit浮点变体数据(E2M1、E1M2等),为用户进一步节省显存,并提供更快的推理速度,已达到行业前沿水平。
另据媒体报道,在DeepSeek-V3.1正式发布并放出“针对即将发布的下一代国产芯片设计”讯息后,国内AI芯片概念股一片飘红,寒武纪、海光信息纷纷以20%涨停,多只股票股价创60日新高。
此前,清微智能已成功适配多个主流AI模型,积累了丰富的经验与技术。相较于GPU架构,清微智能“可重构计算架构”具备更高的灵活性与高效性,可显著减少开发者在模型适配过程中的技术投入,以更低的开发投入获取更高的性能。此次与DeepSeek V3.1的快速适配,体现了清微智能对前沿技术的高度关注与快速跟进能力,也进一步巩固了公司在AI领域的技术领先地位。
目前,国产AI芯片正处于技术突破与生态落地的关键窗口期。特别是以清微智能为代表的非GPU架构,在应对复杂地缘政治环境、产业链自主可控、国产创新突围等维度有着独特的产业价值。DeepSeek V3.1模型落地不仅助力国产芯片加速追赶,更标志着中国AI产业争夺底层标准话语权的开始。
“芯模一体”的生态将成为国产算力真正的护城河,中国AI产业正在“换道超车”。