中新网广东新闻8月13日电 (张璐 陈新豪 师春雨) 近期,中国电信广东公司联合电信研究院、华为公司,基于中国电信粤港澳大湾区(韶关)算力集群已上线的全球首个商用昇腾超节点智算集群,采用电信研究院自研“翼芯”智算测试与适配优化平台,针对多种推理场景开展了大模型性能优化及测试。通过对主流模型与超节点系统迭代适配调优,不同场景下的推理性能均实现了大幅提升;其中DeepSeek671B满血版模型达到单卡推理吞吐性能2122 Tokens/s,刷新了业界纪录。
据悉,昇腾超节点系统创新应用全总线架构,采用高速互连技术将384张910C智算卡紧密耦合形成大型算力单元。
本次中国电信和华为公司共同合作,完成翼芯测试平台与昇腾384卡超节点对接优化,针对13项基准性能、6类典型场景推理性能,采用5类典型资源配置开展自动化测试;同时尝试采用了算子融合替换等多维度的调优策略,不断将吞吐性提升到最大。
本次超节点优化和性能指标刷新,体现了中国电信对智算系统整体优化核心技术的深刻理解与实践创新能力,可以根据客户实际场景性能的需要,灵活配置智算资源池资源,更高效地服务于复杂推理、多智能体协同等新业务场景。
据悉,下一阶段中国电信将开展更多场景的超节点形态优化研究和验证测试;在此基础上,进一步汇聚产业生态、共建行业生态、共享技术生态、聚拢开发者生态,持续推动国产智算基础设施建设和技术创新,全面助力人工智能产业高质量发展。(完)