分类
普林斯顿大学新闻

普林斯顿大学致力于开发国家高能物理数据培训框架

连续第三个夏天,高能物理的研究生,博士后和讲师来自美国,以及来自印度,意大利和瑞士,聚集在普林斯顿大学参加学校的工具、技术和方法为高能物理计算和数据科学或CoDaS-HEP,今年7月22日至26日举行。

普林斯顿大学物理学家彼得·埃尔默(Peter Elmer)是本次会议的主要组织者、国家自然科学基金会资助的高能物理软件研究与创新研究所(IRIS-HEP)的执行董事和首席研究员。目的是在高能物理领域创建更先进的软件网络基础设施,并为年轻物理学家提供他们成功所需的基本专业软件技能。

Students and researchers gather around a table

“高能物理计算与数据科学工具、技术与方法”(CoDaS-HEP)暑期项目连续第三年在普林斯顿大学(Princeton)举行。图中为普林斯顿大学的计算物理学家亨利·施莱纳(Henry Schreiner)和他的导师之一(左二),从左至右:布法罗大学研究生劳伦·海伊(Lauren Hay);Andres Quintero,费米实验室;斯蒂芬妮·关,普林斯顿大学研究生;迈克尔·里德,康奈尔大学研究生。

埃尔默说:“我们必须确保我们这个领域的研究软件生态系统在长期内是可持续的,特别是因为以高亮度大型强子对撞机(HL-LHC)为代表的升级,以及本世纪20年代的其他大型科学设施,至少在本世纪30年代都是相关的。”最重要的是,软件的可持续性需要具备正确技能的人,他们将软件视为研究产品的一部分。(大型强子对撞机(LHC)是一台强大的质子加速器,它被埋在欧洲核子研究中心(CERN)的一条隧道里,位于瑞士和法国边境之下,计划从2026年开始,产生目前数据量的10倍。)

CoDaS-HEP暑期学校是构建可持续科学软件开发社区的重要组成部分,该学校至少在2023年就获得了资助。由美国国家科学基金会和普林斯顿大学计算科学与工程研究所(PICSciE),和共同的物理和院长办公室研究,CoDaS-HEP结合实践培训和讲座,由教师从普林斯顿、康奈尔、英特尔、加州大学圣地亚哥分校,纽约大学芝加哥大学的。

Two students wearing white hard hats look into the machinery of CERN

里德(左)在欧洲核子研究中心获得了实践经验。

参与coda – hep项目的Michael ” Tres ” Reid是康奈尔大学高能物理学研究生,他说:”我正在欧洲核子研究中心的小型介子螺线管探测器(CMS)帮助进行暗物质搜索,[我]希望参与一个高性能计算项目,升级CMS的轨道重建软件。轨道重建背后的想法是,带电粒子在通过跟踪器的每一层时,会沉积少量的能量。我们称这些能量沉积为“撞击”,并用它们来重建每个粒子的轨迹。再过几年,目前的CMS重建软件将很难跟上碰撞速度。意识到他的物理背景并没有为他所面临的计算机科学挑战做好准备,里德决定参加coda – hep。“到目前为止,我只是真正需要我的代码来工作,而不一定能很好地工作,”他说。“优化只是事后的想法。但就CMS的工作而言,计算学习曲线是如此陡峭,到目前为止我只能做一些琐碎的任务。CoDaS-HEP的课程帮助我填补了并行编程技术知识方面的空白,我不再觉得自己会像深入研究项目的技术方面那样迷失了方向。”

2 researchers pose in front a building

IRIS-HEP的同事Pratyush Das(左)和导师Jim Pivarski一起在伊利诺斯州的Fermilab工作。

这种反馈对波多黎各大学马亚圭兹分校的物理学副教授苏希尔·马利克(Sudhir Malik)来说就是音乐。Malik是IRIS-HEP的成员,也是与Elmer合作的首席研究员,参与了一个由nsf资助的相关项目,名为“高能物理集成软件培训框架”(Framework for Integrated Software Training for High Energy Physics,简称FIRST-HEP)。马利克和他的同事负责为STEM教师建立各种拓展和培训理念的原型,比如黑客马拉松和编程研讨会。

马利克说:“虽然我们的核心软件培训模式是建立在世界各地的高能物理研究所、大学和国家实验室的基础上,但它也很有能力让STEM学科的K-12教师和学生参与到相应的网络培训和软件技能的本地社区中来。我们最近发起了几项活动,包括面向STEM教师的软件研讨会、机器学习黑客松和Python编程,这些都是朝着这个方向迈出的一步。”

IRIS-HEP正在与Carpentries合作,为高能物理专业的学生开发一门基础入门课程,该课程的规模可以在一年之内在美国和欧洲举办许多活动。Carpentries是一个非营利组织,向全球的研究人员教授基础编码和数据科学技能。这门基础入门课程将在所有研究生开始研究活动时提供。

此外,该研究所正在运行一个导师项目,“在这个项目中,我们试图将对研究软件开发非常感兴趣的学生和博士后与能够指导他们的人联系起来,并将他们与从事研究软件项目的更大社区联系起来,”埃尔默说。“通常,学生或博士后在他们自己的机构里不会有这样的人;为了解决这个问题,IRIS-HEP软件研究所为IRIS-HEP研究员提供资金,让他们与这样一位导师一起旅行和工作三个月。”

普拉图什·达斯(Pratyush Das)是目前的IRIS-HEP研究员和CoDaS-HEP与会者,今年夏天与普林斯顿大学物理学家吉姆·皮瓦斯基(Jim Pivarski)合作。

“我实际上是一名本科生,可能是这所学校唯一的一名学生,”达斯说,他是工程学院的一名学生管理在加尔各答,印度。

达斯说:“我在中学时听说希格斯玻色子的发现,这是推动我走向高能物理学的主要事件之一。”“作为一名IRIS-HEP研究员,我目前正在研究uproot,这是一个纯Python的根软件框架的实现,以及数值计算库numpy。它获得了巨大的成功,下载量超过1.5万次。在与学校的许多参与者交谈后,大多数人告诉我,这是他们保存在工具集中的东西。”

当被问及暑期学校的主要好处之一是什么时,达斯回答说:“能够自由地与该领域的中坚人士互动,并邀请他们发表演讲,这在通常情况下是不可能的。”

德州农工大学(Texas A&M)高能物理学博士生安德里亚·德尔加多(Andrea Delgado)也认为,这个项目非常值得参加。“我在家乡大学的研究团队专门研究喷气式飞机的重建,”她说。“喷流是非常抽象的物体,是由强子对撞机高能质子-质子碰撞产生的夸克和胶子重建而成。识别构成这些粒子的粒子并编写聚集这些粒子的算法是一项非常具有挑战性的任务,因此计算量非常大。”

“这就是为什么我对粒子物理学家可用的计算工具感兴趣,”德尔加多说。“我们通常没有获得适当的软件开发经验。coda -HEP学校的组织者在选择学校的主题方面做得很好,并引入了编程专家和物理学家,他们创造了专门针对HEP的工具。实际操作的练习确实帮助新获得的信息真正深入人心。这是一个非常紧张的一周,但也很高兴能够与其他学生合作解决教授布置的练习。”

3 researchers talk to each other

从左至右:伊利诺斯大学芝加哥分校的博士研究生雨果·贝格里尔和德克萨斯农工大学的博士研究生安德里亚·德尔加多与普林斯顿大学的彼得·埃尔默交谈。 

为了支持在CoDaS-HEP和其他培训活动中的实践练习,芝加哥大学的IRIS-HEP团队开发了一个可伸缩的基于web的机器学习平台。这为从太平洋研究平台(Pacific Research Platform)获得的CPU和GPU资源提供了一个科学门户。55名学生和讲师访问了34个节点,每个节点上都有两个Nvidia 1080 Ti处理器。

埃尔默展望了爱尔兰共和体- hep的发展以及明年CoDaS-HEP暑期学校的目标,他说:“我们之所以这样做,是因为这个全球科学项目下一阶段的成功,在一定程度上取决于我们是否拥有必要的工具,来分析规模越来越大的数据。

“从根本上说,这依赖于拥有构建这些高级软件工具的复杂技能的人。我们今天需要投资,以确保拥有软件工具和技术人员,我们需要继续在标准模型之外寻找物理,如果发现了物理,我们需要研究它的细节和含义。我想我们会准备好的。”

新闻旨在传播有益信息,英文原版地址:https://www.princeton.edu/news/2019/08/19/princeton-leads-efforts-develop-national-data-training-framework-high-energy