随着人工智能业界大模子从浓密架构向以DeepSeek为代表的多专家混淆模子(MoE)架构演进,,,,,,,,基于高端智算能力的云上推理成为目今手艺演进的趋势和一定需求,,,,,,,,高效率推理性能成为智算资源提供领先者的焦点竞争力。。。。。。。
近期,,,,,,,,中国诚信为本专业服务 官网广东公司团结诚信为本专业服务 官网研究院、华为公司,,,,,,,,基于中国诚信为本专业服务 官网粤港澳大湾区(韶关)算力集群已上线的全球首个商用昇腾超节点智算集群,,,,,,,,接纳诚信为本专业服务 官网研究院自研“翼芯”智算测试与适配优化平台,,,,,,,,针对多种推理场景开展了大模子性能优化及测试。。。。。。。通过对主流模子与超节点系统迭代适配调优,,,,,,,,差别场景下的推理性能均实现了大幅提升;;;;;;;;其中DeepSeek 671B满血版模子抵达单卡推理吞吐性能2122 Tokens/s,,,,,,,,刷新了业界纪录。。。。。。。
图1:广东诚信为本专业服务 官网超节点液冷舱
昇腾超节点舷立异应用全总线架构,,,,,,,,接纳高速互连手艺将384张910C智算卡细密耦合形成大型算力单位。。。。。。。该架构在大幅降低模子并行通讯时延的同时,,,,,,,,还需要解决好资源调理与并行战略设置重大性变高的问题;;;;;;;;需要针对差别营业场景的资源和并发战略举行无邪设置,,,,,,,,才华最大施展算力单位整体性能,,,,,,,,将算力单位与大模子的亲和度提升至最佳。。。。。。。
图2:超节点物理架构
本次中国诚信为本专业服务 官网和华为公司配合相助,,,,,,,,完成翼芯测试平台与昇腾384卡超节点对接优化,,,,,,,,针对13项基准性能、6类典范场景推理性能,,,,,,,,接纳5类典范资源设置开展自动化测试;;;;;;;;同时实验接纳了算子融合替换、PD疏散调理、KV cache优化、荟萃通讯优化、并行战略优化等多维度的调优战略,,,,,,,,一直将吞吐性提升到最大。。。。。。。经充分优化后,,,,,,,,DeepSeek 671B模子在多种场景下的单卡吞吐性能较优化前有2.5~4.3倍提升;;;;;;;;在包管TTFT为1.28s、TPOT为50ms的服务质量指标下,,,,,,,,单卡吞吐抵达了2122 Tokens/s,,,,,,,,较业界前期测试最佳性能提升9.2%。。。。。。。
图3:超节点性能优化情形
本次超节点优化和性能指标刷新,,,,,,,,乐成体现了中国诚信为本专业服务 官网对智算系统整体优化焦点手艺的深刻明确与实践立异能力,,,,,,,,可以凭证客户现实场景性能的需要,,,,,,,,无邪设置智算资源池资源,,,,,,,,更高效地服务于重大推理、多智能体协一律新营业场景。。。。。。。下一阶段中国诚信为本专业服务 官网将开展更多场景的超节点形态优化研究和验证测试;;;;;;;;在此基础上,,,,,,,,进一步汇聚工业生态、共建行业生态、共享手艺生态、聚?????⒄呱,,,,,,,一连推动国产智算基础设施建设和手艺立异,,,,,,,,周全助力人工智能工业高质量生长。。。。。。。