如果把超级计算机比作物流中心,数据处理就像物流出货。如何更高效地“出货”?
有人选择“把货物放在离出货口更近的位置”,即通过内存优化让数据贴近处理器;也有人将“大包裹拆分成小包裹”,借助并行计算让CPU与GPU分工协作,同样可以提升数据的处理效率。但无论哪种策略,核心都指向同一命题:如何在有限的资源中获得更高的性能?
在刚刚结束的2025 ASC世界大学生超级计算机竞赛总决赛上,这道命题被具象化为一场“极限挑战”。来自全球的25支大学生队伍,需要在4000瓦功耗限制下,完成小型超算集群的搭建,并优化运行国际通行基准测试HPL和HPCG、AlphaFold3推理优化、RNA甲基化修饰位点检测、DeepSeek推理优化、宇宙中微子探测模拟等前沿科学与工程应用。
“这不是单纯的速度竞赛,而是用创新思维解锁算力的更多可能。”ASC组委会委员刘羽告诉记者,随着超算与智算的边界出现交融的趋势,既深谙超算系统设计优化又了解前沿科学技术应用的“π型人才”,正成为刚需。
作为中国发起、全球参与人数最多的超级计算机竞赛,ASC竞赛一直以来都扮演着前沿技术探索的实验场。今年的赛事命题,暗含着技术演进的深层逻辑。
在计算专家看来,当前超算与AI的协同发展正经历三个阶段:第一个阶段是赋能AI,超算为AI提供算力助推剂;第二个阶段是借力AI,用AI优化计算系统智能化;第三个阶段就是融合AI,构建内置智能引擎的新范式。
这种演进在本届赛题中尤为明显。以最受关注的“DeepSeek推理优化”为例,参赛队伍需要基于DeepSeek-R1-32B设计并部署一个仅使用CPU的大语言模型推理服务系统,在保证推理结果正确性和系统吞吐的前提下,尽可能缩短各类任务的推理时间。
在刘羽看来,这要求年轻的大学生们对于大模型推理系统有更深刻的洞察:如何用好集群的算力?如何针对延迟优先和吞吐优先的不同推理任务,做好整个推理服务的任务调度?
这场看似“螺蛳壳里做道场”的技术博弈,实则藏着产业界的真实需求:当前,以千亿级参数为代表的尖端模型持续突破智能边界,通常需要高性能计算设备支持其复杂任务处理;而以百亿参数为代表的“中小型模型”凭借优异的性能与适中的计算需求,正成为产业智能化升级的主流选择。根据IDC2024年最新报告,当前超过70%的企业核心系统仍运行在CPU架构上,CPU无须额外改造即可快速部署AI能力,显著降低硬件投入成本,助力企业高效实现大模型的应用落地。
“将大模型CPU推理设为赛题,就是要直面产业落地的真实痛点,探索通用算力潜在的可行性方案。”刘羽说。
也因此,在不少参赛学生看来,这不是一场编程考试,也不是硬件装机大赛,而是一场展现体力、智力与协作力的科技界铁人三项。
在前两个比赛日,已经熟悉并行计算技术的各支团队,需要亲手设计、安装性能均衡的小型超算集群,并且需要通过HPL、HPCG两项基准测试。HPL基准测试相当于超级赛车的直线加速赛,需要在最短的时间内跑出最好的成绩。HPCG相当于让这辆超级赛车,通过复杂的城市路段,考验其均衡性。
“看似是比拼硬件算力,实则是软硬件协同优化与战略布局的智慧博弈。”刘羽说,参赛队伍必须根据现场所公布的赛题特征以及自身的技术优势,作出四重关键决策,动态调整、团队分工,对计算资源的运筹帷幄,对技术路线的审时度势。
青海大学计算机学院院长翟季冬认为,培养具备软硬件协同优化能力的工程创新人才已成为时代命题。通过将计算机学科与众多一流学科进行交叉融合,不断促进大学生学习多种学科知识,掌握多种工程优化技术,以培养具备系统性工程能力的跨学科人才。
这种培养模式已初见成效。齐鲁工业大学生物工程专业学生李京鸿连续3年作为主力参加ASC比赛,不仅可以选择生物工程方向的工作,也可以选择计算机、AI for Science等方向的工作……
正如ASC专家委员会主席、图灵奖获得者、田纳西大学杰出教授杰克·唐加拉所言:“年轻人在比赛过程中展现出的对新兴技术的着迷、直面复杂挑战的无畏勇气,以及跨越边界的协作精神,共同点燃了学生们探索、创新并最终实现自我突破的火种。”
在他看来,超算的未来在于从速度竞争到价值创造的转变,而这一切变革的核心驱动力在于人才,特别是具备AI+X跨学科能力的青年科技人才。