分类
布朗大学新闻

布朗大学的研究人员旨在将数据存储在分子中

在DARPA 410万美元的资助下,布朗大学的研究人员将寻找利用溶液中的分子存储和操纵数字数据的方法。

普罗维登斯,R.I.(布朗大学)——储存在我们日益数字化的世界中产生的海量数据正迅速成为一个严重的科学问题。布朗大学的一组化学家和工程师发起了一个新项目,他们试图用一种前所未有的方式来存储和处理数据——用溶解在溶液中的分子来表示数据。这样的系统有潜力在一个烧瓶的液体中存储数十亿兆兆字节的数据。

该项目名为“化学cpu:通过Ugi反应进行计算处理”,将获得美国国防部高级研究计划局(DARPA)分子信息学项目的410万美元资助。

“总的来说,人们每天产生数百万兆兆字节的数据,在小型设备中存储所有这些数据变得越来越困难,”布朗大学(Brown)的化学助理教授、该项目的首席研究员布伦达鲁宾斯坦(Brenda Rubenstein)说。“这个项目的目的是提出一种新的存储形式,比我们现有的存储结构紧凑许多倍。一个明显的候选者是分子。”

其他研究小组已经开始研究利用DNA分子存储信息的可能性。毕竟,DNA天生携带生物数据。但是鲁宾斯坦和她的同事们所追求的方法是不同的。他们的目标是使用合成分子,以数百万种独特的组合方式产生,作为编码数据的一种手段,这些数据可以存储在海量的溶液中。然后,这些数据将被一台能够识别分子组合的高性能质谱仪读出。

鲁宾斯坦说,这种方法使信息密度比DNA更高,而且还具有通过化学反应实现计算的潜力——在溶液中进行实际的数据处理,这是以前从未做过的事情。

鲁宾斯坦说:“对于这个项目,我们想展示我们可以读写信息,以及做一些非常基本的计算,所有这些都是在溶液中进行的。”“以后,我们想要超越这个范围,考虑如何把它与更大的系统连接起来。”

布朗大学工程学院(Brown ‘s School of Engineering)助理教授、该项目的联合首席研究员雅各布•罗森斯坦(Jacob Rosenstein)表示,尽管执行此类计算的复杂性令人生畏,但潜在的计算能力是巨大的。

罗森斯坦说:“我们可以开始思考,在某些计算中,溶液中分子的复杂性可能是一种优势。”“液体是三维的。这种维度可能是模式识别和搜索算法等领域的一个优势,这些领域在二维电路中并不总是能很好地伸缩。”

作为概念验证,该团队证明他们可以成功地编码并读出包含81个像素的黑白小图像。根据DARPA的合同,该团队将扩大这一过程的规模,从机器学习数据库中编码图像,从语音数据库中编码音频文件,以及从美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,简称noaa)获取天气数据。在项目的第一阶段结束时,团队的目标是能够每天读写100兆字节的化学信息。

要实现这些目标有许多挑战。对于这张81位的图像,研究人员只需要合成25个独特的分子。对于更大的数据集,它们将需要更多——也许是数百万——不同的分子。该团队计划利用Ugi反应合成他们的分子,Ugi反应通常用于药物开发,将多个成分合并成一个分子。然而,该技术还没有在该小组所提议的信息存储规模上得到使用。

杰森·塞洛(Jason Sello)和尤素克·金(Eunsuk Kim)都是布朗大学化学系的教员,都具有分子合成方面的专业知识。他们将与罗森斯坦和另一名工程系教员,沙瑟夫·瑞达(ef Reda)合作,自动优化合成这些令人眼花缭乱的分子的策略。除了化学的发展,这将涉及编写计算机辅助设计软件,以优化将数字数据映射成化学混合物的方法。

另一个挑战是在读取过程中有效地检测来自所有这些分子的不同信号。DARPA的合同将支持购买一个强大的质谱仪来解析这些信号。拥有光谱学专业知识的化学教授彼得·韦伯(Peter Weber)和研究科学家约瑟夫·盖泽(Joseph Geiser)将与该团队合作,优化读出系统。由罗森斯坦、瑞达和工程学教授克里斯·罗斯领导的一个小组将开发软件工具来解码这些质谱仪读数的原始数字数据。

鲁宾斯坦是一名理论化学家,他将领导寻找合适的分子用于溶液中,并为这些分子开发计算方案。罗斯是一位通信理论家,他的工作包括分子通信,他的专业知识也将加入到该项目的理论方面。

除了展示一种存储数据的新方法,研究人员还表示,为该项目开发的工具还可能在其他领域产生影响。将开发的高通量合成、分析和信息学将在蛋白质组学等领域得到应用。这项研究对分析其他复杂的化学混合物和理解自然系统中发生的分子信号也有帮助。

鲁宾斯坦说:“在这方面确实存在一些令人生畏的挑战,但与其他有用的技术一起,创造我们未来所需的信息存储密度也有巨大的潜力。”“我们认为我们已经组建了正确的团队来取得真正的进展。”

新闻旨在传播有益信息,英文原版地址:https://www.brown.edu/news/2018-01-22/chemcpus