分类
康奈尔大学新闻

专为 AI 打造的处理器加速基因组组装

最初为人工智能操作开发的硬件加速器成功地加速了蛋白质和DNA分子的比对,使该过程比最先进的方法快10倍。

这种方法可以更有效地对齐蛋白质序列和DNA进行基因组组装,这是计算生物学中的一个基本问题。

康奈尔大学安·鲍尔斯计算与信息科学学院计算机科学助理教授Giulia Guidi领导了一项研究,使用现有的DNA和蛋白质序列数据测试了称为智能处理单元(IPU)的加速器的性能。IPU通过提供更多内存来加速数据移动,从而加速对齐过程,这是一种常见的滞留。

“序列比对基本上是任何计算生物学工作负载中极其重要且计算密集型的部分,”Guidi说。“这是非常普遍的,它通常是计算的瓶颈之一。

该研究题为“基于SRAM的计算的空间效率序列比对:Graphcore IPU上的X-Drop”,将由共同第一作者Luk Burchard在11月14日举行的Supercomputing2023会议上发表,他是康奈尔大学的前访问学者和Simula研究实验室的博士生。Max Xiaohang Zhao,也是康奈尔大学的前访问学者,现在在Charité Universitätsmedizin,也是共同第一作者。

在她的研究中,Guidi希望帮助科学家解决他们甚至还没有尝试过的问题,因为它们需要如此多的计算能力。这些复杂的问题需要大规模计算,即处理器、内存、网络和数据存储的组合,可以处理大型计算任务。

对齐DNA或蛋白质序列是这些复杂的问题之一。在对基因组进行测序时,生物学家最终会得到数千或数百万个短DNA序列,这些序列必须像拼图一样放在一起。他们使用一种算法来识别重叠的序列对,然后将这些序列对连接起来。

在过去十年中,科学家们转向图形处理单元 (GPU)——最初是为了加速视频游戏中的图形渲染而开发的——通过并行运行计算来加速序列对齐。随着人工智能应用IPU的发展,Guidi和她的同事们想知道他们是否可以利用新的加速器来解决这个问题。

“对于许多领域科学来说,对大规模计算的需求正在增长,因为我们现在比以往任何时候都更擅长生成数据,”Guidi说。“并行计算从一种奢侈品变成了一种不可谈判的东西。

IPU之所以吸引Guidi,是因为它们具有大量用于传输数据的设备上带宽,并且可以处理不均匀和不可预测的工作负载。X-Drop 是一种流行的序列对齐算法,具有非常不规则的计算模式。当两个序列匹配时,算法需要大量计算来确定正确的对齐方式,但当它们不匹配时,算法就会停止。GPU在这种不规则的计算中挣扎,但IPU表现出色。

当Guidi的团队在IPU的帮助下从模式生物大肠杆菌和秀丽隐杆线虫中组装序列时,与GPU相比,它们的性能提高了10倍,GPU花费了太多时间不必要地传输数据,性能比超级计算机上的中央处理器(CPU)快4.65倍。

目前,限制科学家可以处理的基因组大小的是可用的IPU和GPU设备的数量,以及主机CPU和硬件加速器之间数据传输的带宽。IPU上有大量内存,但从主机传输数据会导致主要瓶颈。

该团队通过将 X-Drop 算法的内存占用量缩小了 55 倍来帮助解决这个问题。这使它能够在IPU上运行,并减少从CPU传输的数据量。因此,该系统可以在IPU上运行更大的比较,并执行更多的序列比较,这有助于平衡不均匀的工作量。

“你可以利用IPU的高内存带宽,这使你能够使整个处理速度更快,”Guidi说。

如果供应商能够升级CPU和IPU之间的数据传输过程,并改善软件生态系统,Guidi希望她可以在相同的IPU上处理更大的基因组。

“IPU可能成为下一个GPU,”她说。

该研究的其他合著者包括Simula研究实验室的Johannes Langguth和劳伦斯伯克利国家实验室的AydınBuluç。

帕特里夏·沃尔德伦(Patricia Waldron)是康奈尔大学安·鲍尔斯(Cornell Ann S. Bowers)计算与信息科学学院的作家。

新闻旨在传播有益信息,英文版原文来自https://news.cornell.edu/stories/2023/11/processor-made-ai-speeds-genome-assembly