华为ICT大赛中国总决赛挑战赛圆满落幕!五道赛题,抢先解读!
4月15日至19日,备受瞩目的第十届华为ICT大赛中国总决赛挑战赛在华中科技大学隆重举行。
经过此前预赛的激烈角逐,来自北京航空航天大学、北京师范大学、北京邮电大学、东南大学、哈尔滨工业大学(深圳)、华中科技大学、兰州大学、青海大学、上海交通大学、山西大学、西安交通大学、西北工业大学、浙江大学、郑州大学、中国科学技术大学、中山大学(按拼音首字母排序)的16支超算战队杀出重围,齐聚武汉光谷,参加了这次的总决赛。

参赛战队
小枣君很荣幸受邀参加了本次总决赛,现场观摩了各支队伍的精彩表现。这些年轻参赛队员所展现出的专业知识储备、扎实工程实践能力以及团队协作精神,给我留下了非常深刻的印象。
正所谓“长江后浪推前浪”。这些朝气蓬勃的“后浪”们,为我们贡献了一场精彩纷呈的顶级算力科技盛宴!
█ 华为ICT大赛挑战赛,是一个什么样的比赛?
我们先简单说说华为ICT大赛挑战赛的基本情况。
华为ICT大赛是华为公司主办的一个ICT(IT+通信)领域公益赛事。大赛以“联接、荣耀、未来”为主题,以“I. C. The Future”为口号,主要面向全球高等院校师生。
大赛的举办目的,是为了促进高校ICT人才培养、成长和就业。通过打造一个国际化的技术竞技和交流平台,帮助大学生们有效提升理论知识水平和实践动手能力,尤其是ICT前沿科技的运用能力。
自2015年创办以来,这个大赛已连续举办十年,今年正好是第十届。
根据官方的数据,本届大赛共吸引了全球100多个国家和地区的2000多所院校、22万余名高校师生报名参与,其中中国赛区报名人数突破16万,创历史新高。
毫无疑问,这项赛事已经成为全球规模最大、影响力最广的大学生ICT赛事之一。

大赛发展至今,逐步形成了实践赛、创新赛、编程赛、挑战赛、教学赛、精英赛六大赛道。
今天我们介绍的挑战赛,是最具技术深度与实战强度的赛道之一,去年首次举办,今年是第二届。本届挑战赛聚焦“超智融合(超算+智算)”主题,全面采用国产算力平台(鲲鹏+昇腾),重点考察参赛队伍在系统优化、算法调优的综合能力。
挑战赛的目的和意义非常明确:
一方面,是为在校大学生提供一次难得的实践与学习机会,能够深入接触到国产算力平台,熟悉其技术架构、编程模型和开发环境,锻炼他们的创新思维和解决实际问题的能力,为未来的职业发展打下坚实基础。
另一方面,是加速国产算力平台的普及,为国产算力生态的自主可控与可持续发展进行人才储备。同时,也可以提升国产算力在高校师生群体中的认知度和认可度。
再有,就是深入助力产教融合,通过“以赛促练、以赛促用”,推动高校进一步探索算力人才培养体系和机制。比赛提供了一个展示教学成果和科研实力的平台,还能促进学校和企业、学校与学校之间的交流与合作。
超智融合是目前行业的重要发展趋势。而国产算力平台的崛起,也是时代大背景。华为ICT大赛,很好地将技术趋势、产业需求与人才培养相结合,真正做到了一举多得、多方受益。
█ 华为ICT大赛挑战赛,到底比些什么?
接下来,我们重点看看这次挑战赛总决赛的赛题。
第十届华为ICT大赛挑战赛立足产业真实应用场景,围绕人工智能与高性能计算深度融合设计赛题,涵盖超算基准性能优化、并行计算调优、AI算子实现与加速、大模型推理效率提升等方向,要求参赛队伍在昇腾、鲲鹏平台上对真实计算任务进行系统分析与工程级优化。
本次总决赛一共设置了5道赛题,具体如下:

赛题1和2是积分赛,赛题3和4是晋级赛。压轴的赛题5,决定最后的名次。
这些赛题有的是基于鲲鹏CPU进行优化,也有的是基于昇腾NPU进行优化。赛题既涵盖了超算性能评估、算子优化等基础领域,又涉及大语言模型推理加速、新型大模型架构开发等前沿技术方向,对参赛队伍提出了全方位的考验。
我们先看第1题——FFT性能优化。
FFT,就是快速傅里叶变换(Fast Fourier Transform),是信号处理、科学计算与AI训练中广泛使用的底层核心算法,其性能直接关系到图像识别、气象模拟、基因测序等关键应用的响应效率与能耗表现。
参赛队伍需基于标准计算库,在鲲鹏高性能处理器上,针对不同规模的FFT任务,完成从算法选择、内存访问优化到多线程负载均衡的全栈调优。目标是在保证精度的前提下,进一步压缩计算时间。
这道题不仅考验选手对FFT数学原理的掌握,更检验其对鲲鹏CPU特性的理解,以及底层性能挖掘的工程直觉。想要获得更好的优化效果,他们还需要掌握各种计算库、HPCKit等工具的使用和优化。
选手们要真正“钻进芯片里”,吃透鲲鹏CPU的架构,在多种要素之间寻找最优解,把理论模型转化为可部署、可复现、可量化的工程成果。
第2题,CANN算子优化。
CANN,全称是Compute Architecture for Neural Networks,神经网络计算架构。这是华为针对AI场景推出的异构计算架构,也是面向昇腾AI处理器的全栈软件栈核心。
在昇腾AI全栈解决方案中,CANN发挥着承上启下的作用。它的算子优化能力对于在昇腾NPU上进行AI模型性能优化非常关键。
参赛选手需要基于CANN算子,在昇腾处理器上进行算子性能的优化。这意味着,他们必须深入理解昇腾NPU的指令集架构与内存层次,掌握算子结构,才能充分优化其性能。
值得一提的是,华为在2025年8月正式宣布CANN全面开源。通过代码开放、技术赋能和社区运营,已经构建了一个能够与主流生态竞争的、充满活力的昇腾AI生态系统。
这也是本次挑战赛能够举办的重要前提,参赛选手可以从社区生态中获得丰富的技术文档、开源工具链与实战案例,以此来完成赛题。
第3题,推理模型性能优化。
大模型计算任务主要包括训练和推理。过去,大家关注的是训练效率。近年来,随着AI应用落地的加速,推理效率正成为决定AI商业价值的关键标尺。
本次赛题,围绕的是Diffusion LLM单卡推理优化,由xLLM团队为本次挑战赛精心设计。赛题要求参赛队基于xLLM,对LLaDA-MoE-7B-A1B-Instruct进行开发优化,实现在昇腾NPU单卡上的高效推理。
Diffusion LLM(dLLM)是近年来兴起的新型大模型架构,通过扩散过程生成文本,与传统自回归模型有显著差异。xLLM是一款高效的开源大语言模型推理引擎,基于国产算力进行了深度优化,支持众多知名大模型,可实现企业级部署,兼具更高效率与更低成本。
赛题具有一定的技术难度,要求参赛队伍不仅要熟悉昇腾NPU的硬件特性,还需深入理解Diffusion LLM的独特架构与运行机制。xLLM推理引擎的分离架构设计,为参赛队伍提供了灵活的优化空间,尤其是在服务层与引擎层的协同优化上,如何平衡资源调度、提升并行计算效率、减少内存占用,将成为关键挑战。
第4题,算子迁移优化。
算子迁移,就是将海外英伟达CUDA生态下的算子高效迁移至国产昇腾平台,将CUDA算子精准映射为昇腾CANN算子,并完成性能调优。
该赛题直面国产AI芯片规模化落地中的“最后一公里”难题——生态兼容性。想要让更多的人使用国产算力,就必须实现算子的高效迁移,降低算力环境切换的技术门槛和时间成本。
对于参赛选手来说,需在保持功能一致性的前提下,完成不同生态下算子的重构与深度调优,涵盖了多个关键环节。这是这不仅涉及指令集转换与内存访问模式重构,更要求选手深入理解两种架构在计算单元调度、数据搬运带宽及张量加速逻辑上的本质差异。
赛题也非常具有实用性。既考验选手对异构计算底层原理的掌握,也检验其在真实产业迁移场景中系统性解决问题的能力。
第5题,模型迁移优化。
作为最后的压轴题,也是决定比赛名次的关键题,模型迁移优化,具有更高的难度。
赛题要求参赛队伍将基于英伟达GPU训练完成的完整大模型,在不损失精度与推理质量的前提下,全流程迁移至昇腾AI平台,并实现端到端性能跃升。这不仅是模型权重的简单搬运,更是一场涵盖训练框架适配、算子替换、量化压缩与推理引擎集成的全栈式工程攻坚。
选手们需深入理解平台,灵活运用各种工具,直面混合精度对齐、动态shape支持、KV Cache内存管理等硬核挑战,在昇腾CANN工具链与MindSpore框架协同下,完成复杂的迁移和优化任务。
最终模型性能的比拼结果,将决定冠军的归属。这是16支参赛队伍技术能力的终极较量,可以说是关键决胜局。
以上,就是5道赛题的具体内容。
赛题的难题由浅入深,共同构成了一套层层递进、环环相扣的能力验证体系。参赛队伍想要顺利完成比赛,必须具备三方面的能力:
一、全栈贯通能力,掌握异构计算思维,熟悉从底层芯片架构到上层AI框架的完整技术栈。能深刻理解算法在底层硬件上的运行机制,而不是只会调用高级API。
二、软硬协同优化能力,具备模型迁移、算子开发、性能调优等硬核实战技能。
三、架构创新与系统思维,理解多核异构、存算一体等新型架构思想,并能从系统层面思考“算力-算法-数据”的整体协同。
除了个人专业能力之外,比赛还非常考验团队内部的分工和协作。5道赛题,需要在两天之内完成,必须充分发挥各个队员的专长与互补优势,仅靠单打独斗肯定行不通。
在与参赛队员的交流中,小枣君发现,16支队伍的队员中,既有经验丰富的研究生,也有初出茅庐的二年级本科生。甚至还有队员,接触HPC高性能计算不到一年。

这些年轻人展现出了对国产算力生态的深刻认同与澎湃热情。他们具有强大的学习能力和刻苦钻研的精神,还有对技术细节的极致追求。
很多参赛选手都表示,能不能拿到名次并不是最重要的,真正让他们感到兴奋的,是亲手把一行行代码跑在国产芯片上时的那种成就感,是解决问题灵光乍现的雀跃,是队员间激烈讨论时思维碰撞的火花,是调试成功那一刻不约而同的击掌欢呼。
这种纯粹的技术热忱,令我们这些观赛者都感到兴奋,对国产算力生态的未来更加充满信心。
█ 结语
最终,经过激烈的角逐,北京邮电大学的BUPTParCIS队、中国科学技术大学的鸿雁队、浙江大学的ZJU华华公子队获得了比赛的一等奖。

颁奖合影
以“超智融合”为名,这场赛事早已超越胜负本身。比赛所营造的浓厚竞技氛围和创新环境,将激发更多高校学子投身于算力领域的研究与创新。而学子们在比赛中收获的知识、技能和灵感,也将为国产算力的发展带来新的思路和突破。
比赛虽然已经圆满结束,但是,它对国产算力生态的深远影响才刚刚开始。中国算力领域的自主创新与发展,正以青年工程师们指尖跃动的代码为起点,加速奔向更美好的未来!

