想要更便宜的核能?把设计过程变成一个游戏

在美国，核能提供的无碳电力比太阳能和风能加起来还要多，使其成为应对气候变化的关键力量。但美国的核电机组正在老化，运营商面临精简运营的压力，以与燃煤和燃气发电厂竞争。

削减成本的关键地方之一是反应堆核心深处，那里是产生能源的地方。如果驱动反应的燃料棒放置在理想的位置，它们燃烧的燃料更少，需要的维护也更少。经过几十年的反复试验，核工程师已经学会了设计更好的布局，以延长昂贵燃料棒的寿命。现在，人工智能正准备给它们一个助力。

麻省理工学院的研究人员和艾斯表明,通过将设计过程转化为一个游戏,一个人工智能系统可以被训练来生成数十个最佳配置,可以使每个杆寿命长约5%,节约一个典型电厂约300万美元一年,研究人员报告。人工智能系统还可以比人类更快地找到最优解决方案，并在一个安全的模拟环境中快速修改设计。他们的研究结果发表在本月的《核工程与设计》杂志上。

“这项技术可以应用到世界上任何一个核反应堆，”该研究的主要作者，麻省理工学院核科学与工程系的助理教授Koroush Shirvan说。“通过改善核能的经济效益，我们可以帮助限制全球碳排放的增长，并吸引最优秀的年轻人才进入这一重要的清洁能源领域。”

在一个典型的反应堆中，燃料棒按照内部铀和氧化钆的水平排列在一个网格或组件上，就像棋盘上的棋子，放射性铀驱动反应，而稀土氧化钆减慢反应。在一个理想的布局中，这些相互竞争的冲动相互平衡，从而驱动有效的反应。工程师们已经尝试使用传统算法来改进人类设计的布局，但在一个标准的100杆组件中，可能会有一个天文数字的选择来评估。到目前为止，他们取得的成功有限。

研究人员想知道，深度强化学习(deep reinforcement learning，一种人工智能技术，在国际象棋和围棋等游戏中取得了超人的精通)是否能使筛选过程加快。深度强化学习将擅长从大量数据中找出模式的深度神经网络与强化学习结合起来，后者将学习与奖励信号联系起来，比如在围棋游戏中获胜，或在《超级马里奥兄弟》中获得高分。

在这里，研究人员训练他们的代理人在一系列限制条件下放置燃料棒，每有利一步就能获得更多的分数。研究人员挑选的每个约束条件或规则都反映了数十年来植根于物理定律的专家知识。代理人可以得分，例如，通过在组装的边缘放置低铀棒，以减缓反应;通过分散钆“毒物”棒来维持一致的燃烧水平;将毒棒的数量限制在16到18根之间。

该研究的主要作者、Shirvan实验室的博士后Majdi Radaideh说:“在你输入规则后，神经网络开始采取非常好的行动，它们不会在随机过程中浪费时间。”看着它们学着像人类一样玩游戏是件很有趣的事。”

通过强化学习，AI已经学会玩越来越复杂的游戏，可以和人类玩得一样好，甚至更好。但在现实世界中，它的能力仍然相对未经检验。在这里，研究人员展示了强化学习具有潜在的强大应用。

“这项研究是一个令人兴奋的例子，它把玩桌面游戏和电子游戏的人工智能技术转化为帮助我们解决世界上的实际问题，”研究合著者、麻省理工学院智力探索项目的科学家乔舒亚·约瑟夫说。

Exelon公司目前正在虚拟环境中测试人工智能系统的测试版，模拟沸水反应堆内的组件，以及全球最常见的反应堆类型压水堆内的大约200个组件。总部位于伊利诺斯州芝加哥市的爱克斯龙公司在全美拥有并运营着21个核反应堆。一名公司发言人表示，该公司可能准备在一到两年内实施该系统。

该研究的其他作者是Isaac Wolverton，他是麻省理工学院的大四学生，通过本科生研究机会项目加入了该项目;Nicholas Roy和Benoit忘记了麻省理工学院;詹姆斯·图萨和尤吉·奥贡巴塔尔。

Paper: "Physics-informed reinforcement learning optimization of nuclear assembly design"

新闻旨在传播有益信息，英文原版地址：https://news.mit.edu/2020/want-cheaper-nuclear-energy-turn-design-process-game-1217

分享这篇新闻:

相关链接