ALCF超级计算机帮助解决大型强子对撞机的不断增长的计算需求

ALCF超级计算机帮助解决大型强子对撞机的不断增长的计算需求

粒子碰撞实验,在欧洲核子研究中心的大型Hadron Collider(LHC)-世界上最大的粒子加速器将产生大约50字节(5000万字节)的数据,今年必须进行处理和分析,以帮助工厂寻找新的物理发现。

在CERN转向高亮度大型强子对撞机(LHC)之前,已经有大量的数据有望显著增长,目前正在进行2026计划的设备升级。PCBA加工

“与高亮度的大型强子对撞机,我们预计的20倍,今天的大型强子对撞机产生的数据运行,”Taylor Childers说,在美国能源部(DOE)阿贡国家实验室的物理学家和阿特拉斯实验的一员,在大型强子对撞机的四个粒子探测器。根据我们最好的估计,我们需要大约10的计算资源的增加来处理数据量的增加。

德斯是一个团队在阿贡领导计算设施探索利用超级计算机的一部分(ALCF),美国能源部科学办公室用户设施,以帮助满足不断增长的计算需求的大型强子对撞机。他的合作者包括阿贡国家实验室的物理学家Thomas LeCompte,ALCF计算机科学家Tom Uram,和杜克大学的研究员Doug Benjamin。

自2002以来,位于法国和瑞士边界的LHC上的科学家们一直依赖于全球LHC计算网格来处理所有的数据处理和模拟需求。网格是一个国际分布式计算基础设施,它连接了42个国家的170个计算中心,允许一个由10000多名物理学家从事LHC四大实验的国际社会实时访问和分析数据。

LHC计算网格继续服务于社区,但通过他们的努力在ALCF,Childers和他的同事表明超级计算机可以作为数据模拟和分析空间的一个有力补充。研究小组使用ALCF的千万亿次系统展示他们的表演越来越精确的模拟能力,以及计算,传统的计算资源太密集。

“通过使LHC网格的工作量的一部分运行在ALCF超级计算机,我们可以加速仿真结果的生产,这将加速我们的努力,寻找新粒子的证据,”Childers说。

在过去的几年中,该团队使用的米拉ALCF 10 petaflops的IBM蓝色基因/ Q超级计算机进行计算的阿特拉斯实验的计算挑战下领导部分(空中发射控制中心)项目。与ALCF研究人员合作,他们alpgen规模,蒙特卡洛的事件发生器,对体系的有效运行,使粒子碰撞事件并行的数以百万计的模拟,同时释放了LHC计算网格运行其他,不计算密集型的任务。

该小组目前正在努力使θ,ALCF英特尔新的Cray系统,加入从ALCF数据科学计划分配(ADSP),开拓性的设计探索和提高计算和数据科学的方法,将有助于研究人员洞察非常大的数据集的实验,模拟产生,或观察方法。

此努力,ADSP队迁移和优化阿特拉斯合作的研究框架和生产流程运行在θ。他们的目标是创建在ALCF计算资源能够处理计算密集型任务的阿特拉斯实验的事件产生,探测器的模拟,重建一个终端到终端的工作流程,分析。

作为第一步,ALCF工作部署htcondor CE,“网关”软件工具开发的开放科学网格授权远程用户提供资源配置服务。htcondor CE已被安装在库勒ALCF的可视化和分析集群,但工作继续得到它运行起来的θ。这一工作需要编写代码来让HTCondor CE与ALCF的作业调度器,钴的互动,以及修改设备的认证政策。

“htcondor CE,研究人员将能够运行模拟自动通过工作流管理系统,”Uram说。“界面将简化ALCF资源整合生产计算,有像阿特拉斯这样复杂的工作流项目的终点。”

测试htcondor CE安装,ADSP团队已成功进行了端到端的生产工作的库勒,在不久的将来在更大的θ运行铺平了道路。

一旦仿真工作流程到位,阿特拉斯的研究人员将受益于在一个设施中执行多个计算步骤的能力。使用这种方法,他们将不再需要存储中间数据,在不同的位置执行不同的模拟步骤是必要的。ALCF工作流也会减少计算的时间绕过设置和完成时间,要求独立地进行每一步的时候。

该小组计划扩展这个工作流来他们正在进行的工作与能源部的计算资源在橡树岭领导计算设施在橡树岭国家实验室和国家能源研究科学计算中心在劳伦斯伯克利国家实验室,美国能源部科学办公室用户设施。

这项研究是由美国能源部科学办公室支持。一些早期的资金由美国能源部高能物理–中心计算卓越提供了(hep-cce)。

关于阿贡国家实验室

阿贡国家实验室试图压制民族问题在科学和技术解决方案。全国第一个国家实验室,阿贡进行领先的基础和应用科学的几乎所有学科的科学研究。阿贡国家实验室的研究人员密切合作,从企业、高校、研究人员和联邦数百,州和市政机构帮助他们解决具体问题,推进美国的科学领导和准备迎接美好的未来。来自60多个国家的员工,阿贡是管理的UChicago阿贡,LLC为科学系美国能源部。

相关新闻