十多年来,Facebook和谷歌算法一直在尽可能多地了解你。而是他们如何完善他们的系统来传播你读到的新闻,你喜欢的小狗视频,以及你参与的政治广告。
东北大学化学和化学生物学助理教授史蒂文·a·洛佩兹(Steven A. Lopez)说,同样的算法可以用来发现数十亿分子,并催化目前由昂贵有毒金属引发的重要化学反应。
洛佩斯正在与一组研究人员合作,训练机器学习算法,以发现分子模式,这有助于快速发现大量的新分子。这是一种比在没有流线型流程的情况下扫描大量分子要聪明得多的方法。
“我们教机器学习我们拥有的化学知识,””洛佩兹说。为什么我自己要有化学直觉?”
这种奇异的晶体正在推动量子革命
read more
洛佩斯说,替代使用昂贵金属的是有机分子,特别是无处不在的塑料。根据它们的分子结构和吸收光的能力,这些塑料可以通过化学转化来生产出更好的材料来解决当今最重要的问题。
洛佩兹说,他们的目标是找到具有适当性质和类似结构的金属催化剂分子。但是为了达到这个目标,洛佩兹需要探索大量的分子。
到目前为止,科学家们只能合成大约100万个分子。但是保守估计可能被分析的分子数是1的15次方,也就是10的18次方,或者1后面跟18个0。
洛佩兹认为这个巨大的可能性是由数十亿个未被探索的分子组成的浩瀚海洋。如此巨大的分子空间几乎不可能航行——即使科学家们将实验与超级计算机分析相结合。
洛佩兹说,所有的计算都是由电脑完成的,加起来大约有10亿次,也就是10的9次方。这比可能的分子要少一百万倍。
“算了吧,没机会了,”他说。“我们必须使用更智能的搜索技术。”
这就是为什么洛佩兹要领导一个由国家科学基金会资助的团队,包括塔夫茨大学、圣路易斯华盛顿大学、德雷克塞尔大学和科罗拉多矿业学院的研究。该团队正在使用一个名为VERDE materials DB的有机分子开放数据库来改进他们的算法,并发现更多有用的分子。
该数据库还将登记新发现的分子,并可作为跨几个不同领域的研究人员的信息数据中心,洛佩兹说。这是因为它可以促使研究人员寻找具有许多新特性和新应用的不同分子。
他们想要揭示每一种酶的化学性质
read more
与数据库相结合,这些算法将使科学家更有效地利用计算资源。在发现感兴趣的分子后,研究人员将重新校准算法,以发现更多类似的分子群。
这种主动搜索算法由圣路易斯华盛顿大学(Washington University in St. Louis)的罗曼•加内特(Roman Garnett)开发,其过程类似于经典的棋盘游戏《战舰》(Battleship)。在这款游戏中,两名玩家猜测网格外的隐藏位置,然后瞄准并摧毁海军舰队中的船只。
在这个网格中,玩家将船只放置得尽可能远,以使对手无法击中目标。一旦一艘船被击中,玩家可以重新调整他们的战略,并将他们的攻击指向击中目标周围的坐标。
这正是洛佩兹对探索浩瀚分子海洋这一概念的看法。
他说:“我们正在这片海洋中寻找区域。”“我们开始建立所有可能分子的坐标。”
击中正确的候选分子也可能扩展化学家对这个未被探索的化学空间的理解。
洛佩兹说:“也许我们会通过分析发现,在我们所称的海洋边缘确实存在某种东西,我们可以在那个地区把海洋扩大一点。”“这些东西是我们无法用一种蛮力、反复试验的方法(通过搜索)找到的。”
媒体咨询,请联系Jessica Hair @northeastern.edu或617-373-5718。
新闻旨在传播有益信息,英文原版地址:https://news.northeastern.edu/2020/01/06/chemists-are-training-machine-learning-algorithms-used-by-facebook-and-google-to-find-new-molecules/