分类
布朗大学新闻

研究人员报告了分子数据存储系统的进展

布朗大学的一个研究小组已经证明,他们可以存储和检索200千字节以上的数字图像文件,方法是将这些数据编码到新的自定义小分子库中。

普罗维登斯,R.I.[布朗大学]——布朗大学的一组研究人员在创建一种新型分子数据存储系统方面取得了重大进展。

在《自然通讯》上发表的一项研究中,研究小组将各种各样的图像文件——毕加索的一幅画、埃及神阿奴比斯的一幅画像等等——储存在含有自定义合成小分子的混合物阵列中。研究人员总共存储了200千字节的数据,他们说这是迄今为止使用小分子存储最多的数据。研究人员说,与传统的存储方式相比,这不是很多的数据,但在小分子存储方面是一个重大进展。

“我认为这是向前迈出的重要一步,”布朗大学工程学院(Brown ‘s School of Engineering)助理教授、该研究的作者之一雅各布·罗森斯坦(Jacob Rosenstein)说。“大量独特的小分子,我们可以存储的数据量,以及数据读出的可靠性,显示出进一步扩大这一技术的前景。”

随着数据领域的不断扩大,人们正在做大量工作来寻找新的、更紧凑的存储方式。通过在分子中编码数据,在几毫米的空间中存储相当于tb的数据是可能的。大多数关于分子存储的研究都集中在像DNA这样的长链聚合物上,它们是众所周知的生物数据载体。但与长聚合物相比,使用小分子有潜在的优势。小分子的生产可能比合成DNA更容易、更便宜,而且在理论上有更高的存储容量。

由化学教授布伦达·鲁宾斯坦(Brenda Rubenstein)领导的美国国防高级研究计划局(DARPA)资助的布朗研究小组,一直致力于寻找使小分子数据存储可行和可扩展的方法。

为了存储数据,研究小组使用了排列着1500个直径小于一毫米的小点的小金属片。每个点都含有分子的混合物。每种混合物中不同分子的存在或不存在表明了数字数据。每种混合物的比特数可以和可供混合的不同分子库一样大。然后可以用质谱仪读出数据,质谱仪可以识别出每口井中存在的分子。

在去年发表的一篇论文中,布朗团队展示了他们可以使用一些常见的代谢物(生物体用来调节新陈代谢的分子)来存储千字节范围内的图像文件。在这项新工作中,研究人员通过合成他们自己的分子,可以极大地扩展他们的文库,从而也可以大大扩展他们可以编码的文件的大小。

研究小组利用Ugi反应制造分子,这种技术常用于制药行业,以快速生产大量不同的化合物。Ugi反应将四大类试剂(胺、醛或酮、羧酸和异氰酸)合成一个新分子。通过使用不同种类的试剂,研究人员可以迅速产生大量不同的分子。在这项研究中,研究小组使用了五种不同的胺、五种醛、十二种羧酸和五种不同组合的异氰酸酯,创造了1500种不同的化合物。

“这里的优势是图书馆的潜在可扩展性,”鲁宾斯坦说。“我们只用了27种不同的成分,就在一天之内构建了一个包含1500个分子的文库。这意味着我们不必出去寻找1500个独特的分子。”

从那时起,研究小组使用化合物的子库来编码他们的图像。一个32个化合物的图书馆被用来存储埃及神Anubis的二进制图像。一个由575个化合物组成的文库被用来为毕加索一幅0.88百万像素的小提琴画编码。

化学图书馆中大量可用的分子也使研究人员能够探索其他的编码方案,使数据的读出更可靠。虽然质谱分析非常精确,但并不完美。因此,与任何用于存储或传输数据的系统一样,该系统将需要某种形式的错误纠正。 

这篇论文的第一作者、布朗大学的研究生克里斯·阿卡迪亚说:“我们设计图书馆和读取数据的方式包含了额外的信息,这些信息可以让我们纠正一些错误。”“这帮助我们简化了实验工作流程,准确率仍然高达99%。”

研究人员说,要将这一想法推广到实用的规模,还有更多的工作要做。但是,创建大型化学库并将其用于编码更大的文件的能力表明,这种方法确实可以扩展。

“我们不再受化学库大小的限制,这一点非常重要,”罗森斯坦说。“这是向前迈出的最大一步。几年前我们开始这个项目的时候,我们有过一些争论,关于这种规模的东西在实验上是否可行。所以我们能够做到这一点,真的很令人鼓舞。”

论文的其他合著者有:埃蒙·肯尼迪、约瑟夫·盖瑟、阿曼达·东布罗斯基、卡迪·奥克利、陈水灵、伦纳德·斯普拉格、穆斯塔法·奥兹曼、杰森·塞洛、彼得·韦伯、瑟夫·瑞达、克里斯托弗·罗斯和金尤素克。这项工作由DARPA (W911NF-18-2-0031)和美国国家科学基金会(1941344)资助。

新闻旨在传播有益信息,英文原版地址:https://www.brown.edu/news/2020-02-04/molecules