分类
麻省理工学院新闻

麻省理工学院2022年夏季推荐阅读

又到了夏天,这意味着我们中的许多人会发现自己有新的机会去钻研书籍。以下标题代表了麻省理工学院教职员工在过去一年出版的精选作品。每本书都有出版商提供的链接,麻省理工学院图书馆还编制了一个有用的馆藏书目列表。阅读的快乐!

小说、传记、回忆录和诗歌

《Naiad Blood》(finish Line Press, 2021)作者:Sarah C. Beckmann,麻省理工学院媒体实验室的交流协调员

贝克曼的第一部诗集《娜雅德·布拉德》(Naiad Blood)描述了一位年轻女子在划船运动中发现了自己。虽然她在海边长大,但她又以一种全新的方式爱上了船和水;Crew不仅为她提供了一个个人成长的途径,也改变了她的人生观。《奈德之血》的创作灵感来自希腊神话和其他有关女性的文化观念,它承认女性面临的社会规范和问题,并直接挑战它们。

“Une Fille Indocile: L ‘ émancipation d ‘ Une femme nourrie par les运动féministes des années 60-70 aux États-Unis”(Iconoclaste, 2022)

作者:Isabelle de Courtivron, Ann F. Friedlaender人文学科荣誉教授,外国语言文学系主任

De Courtivron出生于二战后的巴黎一个价值观保守的家庭。当她的家人搬到美国时,她发现了另一种文化:它的着装规范,它的语言,尤其是它的抗议运动。在这本用法语写成的回忆录中,德·库尔蒂夫龙回忆了她在上世纪六七十年代在美国参加的女权斗争,以及这些斗争对她生活的影响。

《光辉城堡之旅》(Wizards of the Coast, 2022)
章节作者:D. Fox Harrell,数字媒体和人工智能教授,麻省理工学院高级虚拟中心主任

《光辉城堡之旅》是为角色扮演游戏“地下城&龙。”哈勒尔的这一章《夜海救援》的灵感来自于非裔美国人、根和祖先之间不同的历史传承、创新和相似的未来。

《沙普利的圆桌:天文学家女儿的回忆录》(BookBaby, 2021)
由物理学名誉教授June L. Matthews和Thomas J. Bogdan编辑

这是天文学家米尔德里德·沙普利·马修斯的回忆录,她是著名天文学家哈洛·沙普利的女儿,琼·马修斯的母亲。根据她的回忆、信件以及与父母玛莎·贝茨·沙普利(Martha Betz Shapley)的对话,沙普利·马修斯(Shapley Matthews)探索了与一位科学经理人和哈佛天文台的长期主任一起成长的经历。马修斯和博格丹在沙普利·马修斯2016年去世后工作了几年,创造了这个可读版本的她的手稿。

《碳女王:纳米科学先驱米尔德里德·德雷塞尔豪斯的非凡一生》(MIT出版社,2022)
,作者Maia Weinstock,麻省理工学院新闻办公室副编辑主任

在《碳女王》一书中,温斯托克描述了已故麻省理工学院教授米尔德里德·“米莉”·德雷塞尔豪斯(Mildred“Millie”Dresselhaus, 1930-2017)是如何凭借好奇心和动力,打破预期,成为一名领先的科学家和工程师。Dresselhaus对碳和其他材料的性质做出了极具影响力的发现,他以无数的方式重塑了我们的世界——从电子、航空、医药到能源。她也是女性在STEM领域的开拓者,也是受人爱戴的教育家、导师和同事。

科学和医学

《科学新闻的战术指南:前线的教训》(牛津大学出版社,2022)
由麻省理工学院奈特科学新闻项目主任黛博拉·布鲁姆编辑(KSJ);Ashley Smart, KSJ的副董事;以及由KSJ出版的数字科学杂志《暗黑》的编辑小汤姆·泽勒

本书借鉴了《纽约时报》、BBC、《华盛顿邮报》、《科学》、《纽约客》、《国家地理》等出版物的作者的见解,是对当今最好的科学报道的必要调查——也证明了独立新闻调查在理解研究和与读者建立信任方面的重要性。

“追逐黑洞:一个空间天文学任务的内部观点”(Van Dorn Books, 2021)
,物理学名誉教授Hale Bradt

这是罗西X射线计时探测器(RXTE)的故事,它是美国宇航局为研究发射X射线的天体而建造的地球轨道天文台。布拉特讲述了他的团队在麻省理工学院卡弗里天体物理和空间研究所20年的努力,以实现RXTE任务。该任务面临的技术和官僚障碍被用幽默和讽刺的个人轶事来描述。结果是:16年的成功观测带来了对黑洞和中子星的重要新见解。

“生命是什么?(HKW, 2022)
编辑Stefan Helmreich教授,麻省理工人类学Elting E. Morison主席;Natasha Myers博士07级;Sophia Roosth博士10;以及迈克尔·罗西博士,与卡特琳·克林根和尼克·豪德合作;其中包括伊芙琳·福克斯·凯勒的一章,她是科学、技术和社会项目中科学历史和科学哲学荣誉退休教授

“生命是什么?自从让-巴蒂斯特·拉马克(Jean-Baptiste Lamarck)和戈特弗里德·特雷维拉努斯(Gottfried Treviranus)在1802年独立创造了“生物学”一词以来,这个问题就一直困扰着生命科学。这个问题已经为许多文本命名,其中欧文Schrödinger 1944年出版的书和林恩·马古利斯和多利安·萨根1995年出版的书是最突出的。在这本创造性的艺术和科学书籍中,编辑们策划并评论了1829-2021年出版的出版物的第一页,标题为“什么是生活?”

“一剂重针:科学、工程和供应链如何融合为世界接种疫苗”(MIT CTL Media, 2021),作者约西·谢菲(Yossi Sheffi),工程系统以利沙·格雷二世教授,土木和环境工程教授,麻省理工学院运输和物流中心主任

在《一针强心剂》一书中,谢菲讲述了新冠疫苗从科学突破到解药和大规模接种的非凡历程。他还探讨了这项任务将如何改变对抗致命疾病和其他全球性挑战的斗争。

文化、人文和社会科学

《毁灭生命的图表》(杜克大学出版社,2022)
作者:尤金妮·布林克马,文学副教授

在《毁灭生命的图表》中,布林克马将她激进的形式主义的见解带入了极端危险的领域:恐怖和爱的伦理极端。通过仔细阅读电影、文学和哲学作品,她探索了图表、网格、图表、列表、启蒙、环形、节奏、模式、颜色、负空间、长度、增量和阈值如何证明酷刑和残忍、暴力和有限、友谊和性爱、债务和关怀的形式逻辑。

《当新闻爆发时:1968年的芝加哥和美国的两极分化》(芝加哥大学出版社,2022)
,作者是麻省理工学院比较媒体研究/写作电影和媒体教授希瑟·亨德shot

亨德肖特重温了1968年民主党全国代表大会的电视报道——街头暴力和混乱的大会本身,黑人公民挑战排除他们的南方代表团,反越南代表试图改变党的战争政策,记者和代表们受到戴利的安全部队和党的领导人的欺凌。亨德肖特指出,这次大会是美国政治史上的一个关键时刻,“自由媒体偏见”的错误观念成为主流并被国有化。

《直到我们赢得自由:种族隔离后的南非》(普林斯顿大学出版社,2022)
,作者埃文·利伯曼,政治学和当代非洲总教授,麻省理工学院国际科学和技术计划主任

在许多民主国家都处于压力之下的时候,利伯曼对摆脱少数人统治的最受关注的过渡之一所取得的标志性成就进行了新的阐释。南非的民主发展是混乱的,竞争激烈,有时甚至是暴力的。但正如利伯曼所言,它也为无声的、前所未有的政府问责和生活质量的切实改善提供了发言权。

《树梢上的语法》(MIT出版社,2022)
宫川茂,语言学教授,日本语言与文化高至万次郎教授(后任满)

“树梢上的语法”提出,通过在核心语法和会话参与者之间建立联系,语法扩展到语篇领域。Miyagawa从多种语言以及自闭症儿童的语言中提取了这种扩展句法结构的证据。他对语言学家使用的树形结构的最高层次所发生的事情的建议,为有时被称为“话语句法化”的新学科提供了独特的贡献。

《寻求核弹:核扩散战略》(普林斯顿大学出版社,2022)
,弗兰克·斯坦顿核安全与政治学教授维平·纳朗著

关于核扩散的许多工作都集中在各国为何追求核武器。到目前为止,它们是如何做到这一点的问题很少受到关注。在《寻找炸弹》中,纳朗发展了一种新的扩散策略类型:躲避、冲刺、隐蔽的追击和躲藏。纳朗深入研究了这些战略对核扩散和国际安全的影响。

《革命的意外教训:二十世纪墨西哥的学生教师和政治激进主义》(杜克大学出版社,2022)
作者:Tanalís Padilla,历史学教授

在《革命的意外教训》(Unintended Lessons of Revolution)一书中,帕迪拉追溯了农村师范学校的历史,这些寄宿学校为新的国家建设项目培训教师,展示了它们如何成为激进政治的场所。帕迪拉讲述了一个关于斗争和国家镇压的故事,他阐明了教育的激进可能性和年轻人政治意识的本质,这些年轻人的身份变化反映了墨西哥20世纪的转型。

《无所畏惧:剖析牙买加精神:非洲和非非洲侨民的团结与胜利之路》(自出版,2021年)
,作者Bianca Rose,麻省理工学院开放学习的行政助理

《无所畏惧》探索了牙买加文化的变化,从它的人民(即黑人、拉斯塔法里教徒和牙买加人),到牙买加方言的好战语言,到雷鬼音乐和舞蹈的影响,并通过传奇的自由斗争的教训。罗斯观察了拉斯塔法里教、音乐、体育和其他文化方面是如何影响非洲和非非洲侨民的。

《神话的共和国:国家叙事与美伊冲突》(约翰·霍普金斯大学出版社,2022),国际研究中心(CIS)执行主任兼首席研究科学家约翰·蒂尔曼;侯赛因·巴奈,CIS研究附属机构;以及CIS研究机构的马尔科姆·伯恩

伊朗和美国已经不和了40年。在《神话的共和国》一书中,蒂尔曼、巴奈和伯恩认为,导致两国之间敌意的一个主要因素是各自对自己的看法。他们对彼此有不同的利益和不满,但他们往往致命的对抗源自截然不同的国家叙事,这些叙事塑造了他们的政治、行动和对自己在世界上命运的愿景。

《当人们想要惩罚:报应正义和权威主义流行的困惑》(剑桥大学出版社,2021)
,作者:福特政治学教授、麻省理工学院院长蔡莉莉

为什么一些威权政权受到公民的欢迎,而许多民主政权却受到不信任或蔑视?在这本书中,蔡提供了一种理解普通民众何时更倾向于支持非自由主义和威权主义领导人的理论,并提供了一种理解威权韧性和民主脆弱性的统一框架。

《跨性别者的迫切需要:定义21世纪的性和性别》(Routledge出版社,2021年)
,作者是人文学科约翰·e·伯查德教授爱德华·斯基亚帕

在人类历史上,没有哪个时期的“女人”和“男人”、“男性”和“女性”、“男性化”和“女性化”的定义像现在这样有争议。这本书对定义和承认我们的定义实践的重要道德维度的行为提出了一种实用主义的方法。斯基亚帕的及时介入考察了包括学校、浴室、军队、体育、监狱和女权主义在内的辩论场所,引起了人们对定义自身行为的政治、实践和伦理维度的关注。

《隐藏的游戏:博弈论解释非理性人类行为的惊人力量》(基础书籍,2022)
,作者是麻省理工斯隆管理学院的研究科学家埃雷兹·约利和摩西·霍夫曼

我们喜欢认为自己是理性的。但正如行为经济学所显示的那样,大多数行为似乎根本不理性——不幸的是,这让人对博弈论在现实世界中的可信度产生了怀疑。在《隐藏的游戏》中,约利和霍夫曼发现了一个惊人的中间地带 在古典经济学的超理性和行为经济学的超非理性之间。他们称之为“隐藏游戏”。

科技与社会

《走进人类宇宙:麻省理工学院空间探索计划的整个空间目录》(麻省理工学院出版社,2021)
,麻省理工学院媒体实验室空间探索计划主任Ariel Ekblaw;由媒体实验室的研究员沙·菲什设计

在人类宇宙时代——一个太空探索的时代,我们将把人类的视野扩展到地球之外——人类对地球和太空负有双重责任,我们既不应因环境恶化而放弃我们自己的星球,也不应在银河系中乱扔太空垃圾。这本书展示了这个新时代的空间技术:原型、人工制品、实验和参与式空间探索时代的栖息地。

《人工智能时代:以及我们人类的未来》(Little, Brown &麻省理工学院苏世民计算学院院长Daniel Huttenlocher;亨利·a·基辛格;和埃里克•施密特(Eric Schmidt)

人工智能正在搜索、流媒体、医疗、教育和许多其他领域上线,并由此改变了人类体验现实的方式。在“人工智能时代”中,三位著名思想家共同探讨了人工智能将如何改变我们与知识、政治以及我们所生活的社会之间的关系。

“软件的本质:为什么概念对于伟大的设计很重要”(普林斯顿大学出版社,2021),电气工程和计算机科学教授丹尼尔·杰克逊(Daniel Jackson)

软件比以往任何时候都重要。那么,为什么会有这么多软件存在缺陷呢?为什么没有一种直接的方法来创建易于使用、健壮和安全的软件?这本书对老问题给出了新的答案,为软件设计提供了一个新的视角,并列举了100多个熟悉的应用程序的例子。任何人——战略家、市场营销人员、经理、设计师或程序员——都可以使用它,只要他们想要更强大、更可靠、更好用的软件。

《每个数据工程师都应该知道的97件事:来自专家的集体智慧》(O ‘Reilly, 2021)
由麻省理工学院开放学习平台副主任和开发人员Tobias Macey编辑

在这本书中,来自Twitter、谷歌、Stitch Fix、微软、Capital One和LinkedIn等著名公司的贡献者提供了97个简明而有用的关于清理、准备、争吵、存储、处理和吸收数据的建议。当前和有抱负的工程师将学习管理大大小小的数据的强大的现实世界最佳实践。

《构建新经济:以数据为资本》(MIT出版社,2021)
作者:东芝媒体艺术与科学教授、MIT连接科学主任Alex“Sandy”Pentland;亚历山大•利普顿;以及麻省理工学院连接科学和麻省理工学院信托::数据联盟的技术总监托马斯·哈德约诺

数据现在是经济、政府和卫生系统的核心——那么,为什么数据和解释数据的人工智能系统掌握在这么少的人手中呢?“建设新经济”认为,我们需要把数据视为一种新型的资本,数据信任和分布式账本可以让人们拥有以用户为中心的数据所有权、透明和负责任的算法、机器学习公平原则和方法,以及安全的数字交易系统。

《生物制造》(MIT出版社,2021)作者:里图·拉曼(Ritu Raman),达贝洛夫机械工程职业发展助理教授

你是一个由骨骼肌驱动的生物机器,就像汽车是由引擎驱动的机器一样。如果你能用生物材料自下而上制造出机器,其他机器也可以。这是推动生物构造的想法:用活细胞建造。麻省理工学院出版社的基本知识系列的一部分,“生物制造”提供了如何由细胞驱动的材料和机器可以解决医学、农业和全球安全的挑战的介绍。

《沉浸式封闭:日本的虚拟现实》(哥伦比亚大学出版社,2022)
,作者:媒体研究和日本研究副教授、三井现代技术职业发展教授Paul Roquet

Roquet对虚拟现实的分析揭示了它如何重塑劳工、性别、家庭和国家的政治。他探讨了日本的虚拟现实技术如何与美国的军国主义和技术乌托邦愿景分道扬镳,成为重新协商个人空间的工具。当数字平台继续侵蚀日常生活时,《沉浸式围栏》以批判的眼光审视了试图抛弃现有社会现实的尝试,并为理解未来的媒体环境提供了一种大胆的新方法。

教育、工作、金融和社会影响

《K-12的计算思维教育:人工智能素养与物理计算》(MIT出版社,2022)
由麻省理工学院计算机科学与工程1922级教授Harold Abelson和Siu-Cheung Kong编辑;其中一章由媒体艺术与科学教授、数字学习系主任辛西娅·布雷西亚尔(Cynthia Breazeal)撰写;麻省理工学院媒体实验室研究助理Blakeley H. Payne;媒体实验室的研究助理Daniella DiPaola

这本书提供了计算思维的概述和它在K-12教育的重要性。主题包括教学计算思维的基本原理,编程作为一种普遍的解决问题的技能,“基于现象的学习”方法,以及人工智能研究的爆发对教育的影响,讨论,除其他事项外,教育孩子成为认真的设计师和人工智能消费者的重要性。

《答案就是你:创造充满影响的生活指南》(Mango, 2022)
,作者Alex Amouyel,麻省理工学院Solve的执行董事

在《答案是你》一书中,Amouyel描述了作为一个变革的推动者如何从做好事和成为社区的帮手开始。她认为,每个人都可以利用自己已有的技能和资源做一些事情——他们只是需要如何做的想法。“答案是你”试图激励每个人批判性地思考我们面临的问题,以及他们可能提供的解决方案,以实现改变。

《未来的工作:在智能机器时代创造更好的工作》(麻省理工学院出版社,2022),福特经济学教授大卫·奥特;David A. Mindell,航空航天学教授和迪伯纳工程与制造史教授;以及麻省理工学院工业绩效中心执行主任兼首席研究科学家、城市研究与规划系讲师伊丽莎白·b·雷诺兹

《未来的工作》描述了为什么美国在与工人分享创新成果方面落后于其他工业化国家,并探讨了我们如何解决这个问题。在麻省理工学院未来工作工作组(MIT Task Force on the Work of the Future)多年的基础上,作者认为,为了创造更好的就业机会,我们必须促进制度创新,以补充技术变革。

《莎士比亚与数字教学法:案例研究与策略》(Bloomsbury, 2021)
由Arthur J. Conner文学教授Diana E. Henderson和Kyle Sebastian Vitale编辑

这个国际收集的新鲜的数字方法教学莎士比亚描述了15种方法,资源和工具最近开发,更新,并由各种贡献者在英国,澳大利亚,亚洲和美国使用。作者探索了这些数字资源如何满足课堂需求,并帮助促进关于学术素养、种族和身份、当地和全球文化、表现和跨学科思想的对话。

《学习工程工具包:来自学习科学、教学设计和其他领域的循证实践》
三章作者:Aaron Kessler,麻省理工学院开放学习学院学习科学和教学助理主任;Scotty d·克雷格;吉姆Goodell;迪娜·库兹韦尔;斯科特·w·格林沃尔德;和珍妮特Kolodner

随着工程学习逐渐成为一门正式的学科和实践,需要新的见解和工具来帮助教育、培训、设计和数据分析专业人员迭代开发、测试和改进复杂的系统,以实现参与和有效的学习。这本书是学习工程的丰富多样的应用的实用指南。在他的三章中,Kessler讨论了学习工程作为一个过程,如何应用学习科学,以及学习科学中的其他实用工具。

《追求完美投资组合:塑造我们投资方式的先驱们的故事、声音和关键见解》(普林斯顿大学出版社,2021年),作者:Andrew W. Lo,麻省理工斯隆管理学院Charles E. and Susan T. Harris教授和Stephen R. Foerster

是否存在一种完美平衡风险与回报的理想投资资产组合?《追求完美投资组合》通过剖析和采访10位金融界最杰出的人物来探讨这个问题。在这个过程中,读者可以了解现代投资科学是如何形成的。

艺术、规划和设计

《为生活而设计:来自难民营的日常发明》(MIT出版社,2021)
编辑:Azra Akšamija,建筑学副教授,麻省理工学院未来遗产实验室主任,麻省理工学院艺术、文化和技术项目主任;麻省理工学院未来遗产实验室(MIT Future Heritage Lab)项目主任梅丽娜·菲利普(Melina Philippou);和Raafat Majzoub

“Design to Live”展示了难民如何利用艺术和设计来改变他们的生活环境,在看似旨在剥夺他们人性的环境中恢复人性。这本书以约旦阿兹拉克难民营的叙利亚难民创作的20多个项目为特色,用英语和阿拉伯语编写的双语书提供了一种新的方式,将设计理解为一种颠覆性的制造世界的实践,以及在被迫流离失所的条件下作为一种收回机构的工具。

《新工业城市主义:生产场所的设计》(Taylor and Francis Group, 2022)
,作者是城市研究和规划教授Eran Ben-Joseph和Tali Hatuka

这本开放获取的书探讨了城市和生产场所之间的演变和未来关系,重点是将当代制造业融入城市的空间含义和物理设计。它从世界各地的案例中提供了经验教训,并呼吁重新考虑工业创造场所、维持就业和支持城市环境可持续性的方式。

《公平、评估与国际合作:在非洲城市中追求近邻》(牛津大学出版社,2022)
,城市研究与规划副教授Gabriella Y. Carolini著

本书以对莫桑比克马普托水和卫生部门的国际合作项目的仔细审查为基础,描述了在发展实践中形成公平的因素。它还提供了一个框架,说明项目评估作为一种关键的叙事工具,如何能够促进分配正义、程序正义和知识正义。

《Urban Play: Make-Believe, Technology and Space》(麻省理工学院出版社,2021)
作者:Fábio Duarte,麻省理工学院Senseable City Lab首席研究科学家,城市研究与规划系讲师,巴西PUCPR教授;里卡多Álvarez博士20年

在“城市游戏”中,Duarte和Álvarez认为,技术的强大不是在它的功能达到最佳状态时,而是在它仍然有趣和开放试验时。通过玩耍,我们可以探索新的领域,创造新的设备和语言,并转变自己。只有这样,创新的空间设计才能创造出超越功能主义的共振空间,唤起使用者的情感反应。

《用数据说服:设计、交付和捍卫你的数据的指南》(麻省理工学院出版社,2022)
,作者:米罗·卡扎科夫,麻省理工斯隆管理学院高级讲师

“用数据说服”为数据可视化、战略沟通和交付最佳实践提供了指南。这是第一本结合了解释性可视化和沟通策略的书,展示了如何使用可视化来创建有效的沟通,说服他人接受数据并对其采取行动。它解释了我们的大脑如何理解图表,如何设计有效的图表和幻灯片来支持想法,如何创建一个引人注目的演示,以及如何向观众传递和维护数据。

《规划中的领导力:如何沟通想法并影响积极的改变》(Routledge出版社,2021)
,作者是城市研究和规划讲师杰夫·莱文

简·雅各布斯(Jane Jacobs)等社区组织者正确地指责城市规划者以“进步”的名义破坏了社区,并认定这一领域存在缺陷。然而,在这本书中,莱文认为,经济适用房、气候变化和种族差异等重大社会挑战比以往任何时候都更需要规划者来带头。他提出了如何提供包容性的规划领导的想法。

对于年轻的读者

《艾达与星系》(Candlewick Press/MIT Kids Press, 2021)
人文实践教授艾伦·莱特曼(Alan Lightman)和奥尔加·帕斯图奇夫(Olga Pastuchiv);插图:苏珊娜·查普曼

在哈勃太空望远镜的帮助下,莱特曼和帕斯图奇夫为孩子们点亮了夜空,在一本向自然世界的相互联系致敬的图画书中,他们把星系拉近了。查普曼用哈勃望远镜拍摄的层层叠叠的图像变成了迷人而富有表现力的艺术,她放大了一个孩子的经历。

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/books-mit-authors-0708

分类
麻省理工学院新闻

记住屋大维-欧根·加内亚,他是麻省理工学院的天才博士后人工智能研究员,也是一位受人爱戴的同事

26日,在法国波利尼西亚徒步旅行时去世的天才人工智能博士后屋大维-欧根·加纳(Octavian-Eugen Ganea)就职于阿卜杜勒·拉提夫·贾米尔健康机器学习诊所(贾米尔诊所)和计算机科学与人工智能实验室(CSAIL)。他是34岁。

Ganea在罗马尼亚出生和长大,在苏黎世联邦理工学院数据分析实验室获得计算机科学博士学位后,于2019年加入麻省理工学院。在麻省理工学院期间,他与CSAIL教授Tommi Jaakkola和Regina Barzilay合作;Ganea专注于将几何思维引入机器学习,以加速药物发现,并计划在今年秋天继续这项工作,成为纽约大学Courant和纽约大学Tandon的终身职位助理教授。

“屋大维是一位杰出的科学家,他的研究在机器学习领域开辟了新领域,弥合了物理和神经在分子表征上的差距,”Barzilay说。她将Ganea对分子建模的几何信息算法的研究描述为“数学上干净、优雅和有效的解决方案,这些问题通常是用启发式方法解决的。从材料设计到药物发现,他的工作产生了革命性的影响。”除了Ganea的卓越技术,Barzilay对Ganea的“善良和对他人的关心,[这]给麻省理工学院和其他地方的许多人的生活带来光明”印象深刻。我们非常想念他。”

Jaakkola补充说,Ganea对有影响力的研究的热情突出:“他喜欢数学和几何,但希望理论有价值,影响人们。”Jaakkola还注意到,作为一名研究人员,Ganea是“一种自然的力量,他的积极的智力能量始终存在,具有传染性。”即使事情没有成功,Ganea也会系统地解决问题,“用创造力和毅力……作为一名研究人员,他具有罕见的真实性和诚实——看到并接受自己、其他人和他的科学,从不评判,”Jaakkola回忆道。“作为朋友、同事和导师,我们非常怀念他。”

许多同事都记得加内亚异常谦虚,即使他取得了许多成功。在接受纽约大学的教职邀请后,Ganea承认他不确定自己是否配得上这份工作,但他的许多同事坚持认为没有人比他更适合这份工作。CSAIL二年级博士生Jeremy Wohlwend说:“我无法想象有人能比他更有资格。”“他才华横溢,意志坚定,但又谦逊善良。他会成为一个了不起的教授。”

Ganea在麻省理工学院和其他地方指导了许多学生,许多人回忆他的指导不仅在专业上有意义,而且在个人生活上也有意义。他开始指导Hannes Stärk,后者现在是CSAIL的一年级博士生,而Stärk还在德国完成他的硕士学位。“我没有发表过论文,也没有令人满意的记录,”Stärk回忆道。“就因为我表现出了兴趣,他决定在2021年10月帮助我,并就一个项目给我提供建议。现在…我确信,如果没有屋大维,没有他的慷慨,没有他宝贵的建议,没有我从他那里学到的关于发展思想、创新、论文写作、学术世界和研究的一切,我就不会有今天的我。”在Ganea指导他的时间里,Stärk总是认为“从Ganea那里可以学到很多关于研究和个人层面的东西,这是令人震惊的。”

虽然Ganea对他的研究有一种传染的热情,他也深深投入到他的家庭。“有一天,我看到屋大维和他的女儿骑着自行车,他停下来和我和(我的妻子)聊天,”CSAIL的研究生Itamar Chinn说。“我记得我告诉她,他就是我想成为的那种父亲。非常专注于他的工作和他的目标,但同时把家庭放在第一位。他们都很喜欢骑车穿过剑桥。”Ganea也是一个狂热的登山和跑步爱好者,这两个爱好反映了他在整个学术生涯中坚持不懈的态度。

CSAIL主任Daniela Rus说:“屋大维是一位真正敬业、多产的科学家,他对计算生物学和为医学领域寻找有利工具的热情证明了这一点。”“他是真实的,充满正能量,有耐心,非常善良,对自己的时间非常慷慨。”

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/remembering-octavian-eugen-ganea-0707

分类
麻省理工学院新闻

机器人克服不确定性,检索被掩埋的物体

对于人类来说,找到埋在一堆东西下面的丢失的钱包非常简单——我们只需要从那堆东西中取出东西,直到找到钱包。但对于一个机器人来说,这项任务需要对其中的堆和物体进行复杂的推理,这是一个严峻的挑战。

麻省理工学院的研究人员此前展示了一种结合了视觉信息和射频(RF)信号的机械臂,它可以找到带有RFID标签(反射天线发送的信号)的隐藏物体。在这项工作的基础上,他们现在开发了一种新的系统,可以有效地检索埋在堆里的任何物体。只要堆中的一些物品有RFID标签,目标物品不需要被标记,系统就可以恢复它。

该系统背后的算法被称为FuseBot,可以判断堆下物体的可能位置和方向。然后FuseBot找到最有效的方法移除障碍物,提取目标物品。这种推理使FuseBot比最先进的机器人系统找到更多的隐藏物品,时间缩短了一半。

这种速度在电子商务仓库中尤其有用。电子工程与计算机科学系副教授、媒体实验室信号动力学小组主任、资深作者法德尔·阿迪布说,一个负责处理回报的机器人可以通过FuseBot系统更有效地在未分类的堆中找到物品。

“这篇论文首次表明,环境中仅仅存在一个带有rfid标签的物品,就可以更容易地以更有效的方式完成其他任务。我们之所以能够做到这一点,是因为我们在系统中添加了多模态推理——FuseBot可以通过视觉和射频推理来理解一堆物品,”Adib补充道。

与阿迪布一起发表这篇论文的还有研究助理塔拉·博罗沙基(Tara Boroushaki),她是论文的第一作者;劳拉·多兹;和Nazish Naeem。这项研究将在机器人:科学与系统会议上发表。

针对标签

最近的一份市场报告显示,超过90%的美国零售商现在使用RFID标签,但这项技术并不普遍,导致在一堆物品中只有部分物品被贴上标签的情况。

这个问题启发了这个小组的研究。

在FuseBot中,机械臂使用一个附加的摄像机和射频天线从混合堆中检索未标记的目标物品。该系统用摄像头扫描桩,创建环境的3D模型。同时,它从天线发送信号来定位RFID标签。这些无线电波可以穿过大多数固体表面,因此机器人可以“看到”堆的深处。由于目标物品没有标记,FuseBot知道该物品不能与RFID标签位于完全相同的位置。

算法融合这些信息来更新环境的3D模型,并突出目标物品的潜在位置;机器人知道自己的大小和形状。然后系统根据堆中物品的位置和RFID标签的位置来确定需要移除的物品,以最少的移动找到目标物品。

Boroushaki说,将这种推理纳入系统是具有挑战性的。

机器人不知道堆下的物体是如何定位的,也不知道一个黏糊糊的物体会如何被更重的物体压变形。它通过概率推理克服了这一挑战,利用它所知道的物体的大小和形状以及它的RFID标签位置来建模该物体可能占据的3D空间。

当它删除条目时,它也会使用推理来决定接下来删除哪个条目是“最好的”。

“如果我给一个人一堆东西去搜索,他们很可能会先把最大的东西拿掉,看看下面有什么。机器人所做的事情与此类似,但它还融入了RFID信息,以做出更明智的决定。它问:“如果它把这个东西从表面上移除,它会对这堆东西了解多少?”’”Boroushaki说。

在移除一个物体后,机器人会再次扫描这个堆,并利用新的信息来优化它的策略。

检索结果

这种推理,以及它对射频信号的使用,让FuseBot比只使用视觉的最先进的系统更有优势。该团队使用真正的机械臂进行了180多次实验,并放置了办公用品、填充动物和服装等家庭用品。他们改变了每一堆物品的大小和有射频识别标签的数量。

FuseBot系统提取目标物品的成功率为95%,而其他机器人系统的成功率为84%。它用少了40%的移动完成了这一点,并且能够以两倍多的速度找到和检索目标物品。

“我们看到,通过结合这种射频信息,成功率有了很大提高。令人兴奋的是,我们能够匹配我们之前的系统的性能,并在目标物品没有RFID标签的情况下超过它,”多德说。

Boroushaki补充说,FuseBot可以应用于各种设置,因为执行复杂推理的软件可以在任何计算机上实现——它只需要与带有摄像头和天线的机械臂通信。

在不久的将来,研究人员计划在FuseBot中加入更复杂的模型,使其在可变形物体上表现更好。除此之外,他们还对探索不同的操作方式感兴趣,比如用机械臂将物品推开。该系统的未来迭代还可以用于移动机器人,在多个堆中寻找丢失的物体。

“我认为这项工作在很多方面都非常令人兴奋,展示了将无线信号技术的一些进展与机器人紧密结合的潜力。例如,这篇论文所基于的一个关键观察结果是,与可见光和红外不同,射频信号可以通过标准材料,如纸板、木材和塑料。这篇论文进一步利用这一观察结果来解决机器人技术中一些传统传感器非常有限的难题,比如在混乱中搜索物体,”哈佛大学约翰·a·保尔森工程与应用科学学院计算机科学助理教授斯蒂芬妮·吉尔(Stephanie Gil)说,他没有参与这项研究。“该论文进一步推进了在机器人中使用射频信号的最先进技术,还考虑了在混乱中搜索未标记物品的非常困难的情况。总之,这篇论文展示了将无线通信技术集成到机器人中的传感和感知任务的巨大前景,并为机器人技术提供了一个非常令人兴奋的前景。”

这项工作得到了国家科学基金会、斯隆研究奖学金、NTT DATA、Toppan、Toppan Forms和麻省理工学院媒体实验室的部分资助。

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/robot-pick-place-hidden-objects-0629

分类
麻省理工学院新闻

探索人工智能政策中的新兴话题

上个月,公共部门、私营部门和学术界的成员召开了第二届人工智能政策论坛研讨会,探讨人工智能在我们的经济和社会中提出的关键方向和问题。

由AI政策论坛(AIPF)主办的虚拟活动——由麻省理工学院施瓦茨曼计算学院承担,旨在将AI政策的高层原则与治理的实践和权衡联系起来——汇集了一系列杰出的小组成员,深入研究了四个交叉主题:法律、审计、医疗保健和流动性。

去年,几个国家的人工智能监管和政策格局发生了重大变化——最显著的是欧洲的《欧盟人工智能法案》的制定,这是主要监管机构首次尝试提出有关人工智能的法律。在美国,《2020年国家人工智能倡议法案》于2021年1月成为法律,为联邦政府提供了一个协调计划,以加速人工智能研究和应用,促进经济繁荣和安全收益。最后,中国最近推出了几项自己的新规定。

每一项发展都代表了一种不同的人工智能立法方法,但如何制定一项好的人工智能法律?人工智能立法何时应该基于带有惩罚的约束性规则,而不是建立自愿准则?

哈佛大学法学院国际法教授、伯克曼·克莱因互联网与社会中心主任乔纳森·齐特林(Jonathan Zittrain)表示,互联网扩张期间采取的自我监管方法有其局限性,因为公司难以平衡自身利益与行业利益和公众利益。

他说:“一个教训可能是,真正让代议制政府尽早发挥积极作用是个好主意。”“他们只是受到了这样一个事实的挑战,即在这种监管环境中似乎有两个阶段。第一,现在说还太早,第二,现在做什么都太晚了。在人工智能领域,我认为很多人会说我们仍处于‘言之过早’的阶段,但鉴于在为时已晚之前没有中间地带,可能仍需要一些监管。”

由麻省理工学院施瓦茨曼计算学院院长、人工智能政策论坛主席丹·胡滕洛赫尔主持的关于人工智能法律的第一个小组讨论中,一个反复出现的主题是信任的概念。“如果你始终如一地对我说实话,我会说你是个诚实的人。如果人工智能能提供类似的东西,我可以说它是一致的,是相同的,那么我会说它是可信的人工智能,”内罗毕大学创业学教授、肯尼亚信息和通信部前常任秘书比坦格·恩德莫说。

欧洲议会副主席伊娃·凯里(Eva Kaili)补充说:“在欧洲,每当你使用某种东西,比如任何药物,你都知道它已经被检查过了。你知道你可以信任它。你知道控制在那里。我们必须在人工智能领域实现同样的目标。”Kalli进一步强调,建立对人工智能系统的信任不仅会让人们以安全的方式使用更多的应用程序,而且人工智能本身也会受益,因为它将产生更多的数据。

人工智能在各个领域迅速增加的适用性,促使人们需要解决新兴技术带来的机遇和挑战,以及它们对隐私、公平、偏见、透明度和问责制等社会和伦理问题的影响。例如,在医疗保健领域,机器学习的新技术在提高质量和效率方面显示出了巨大的希望,但公平性、数据获取和隐私、安全和可靠性、免疫学和全球卫生监测等问题仍然存在。

麻省理工学院电子工程与计算机科学系和医学工程与科学研究所的助理教授Marzyeh Ghassemi和电子工程与计算机科学副教授David Sontag与加州大学伯克利公共卫生学院卫生政策与管理副教授Ziad Obermeyer合作,组织了AIPF健康广泛覆盖,一系列讨论临床AI中的数据共享和隐私问题的会议。主办方召集了来自世界各地致力于人工智能、政策和卫生领域的专家,目的是了解如何减少获取高质量卫生数据的障碍,在尊重患者隐私的同时推进更创新、更强大和更包容的研究结果。

在这个系列的过程中,小组成员提出了一个专门的话题,并被要求提出具体的政策方法来应对所讨论的挑战。通过这些广泛的对话,与会者在研讨会上公布了他们的发现,包括非营利组织和政府的成功案例和有限的准入模式;上行示威;法律框架、法规和资金;隐私的技术途径;基础设施和数据共享。该小组随后讨论了他们的一些建议,这些建议总结在一份即将发布的报告中。

其中一项发现呼吁有必要为研究提供更多的数据。根据这一发现提出的建议包括:更新法规,促进数据共享,使人们更容易获得安全港,如《健康保险携带与责任法案》(HIPAA)用于去识别,以及扩大对私人卫生机构的资金,以管理数据集,等等。另一项为研究人员消除数据障碍的发现支持了一项建议,即减少对联邦创建的健康数据进行研发的障碍。Ghassemi说:“如果这些数据应该是可访问的,因为它是由一些联邦实体资助的,我们应该轻松地建立步骤,成为获得这些数据的一部分,从而为所有人提供更包容、更公平的研究机会。”该组织还建议仔细研究管理数据共享的道德原则。虽然已经有很多关于这方面的原则提出,但Ghassemi说:“显然你不能一次性满足所有杠杆或按钮,但我们认为这是一个非常重要的权衡,需要明智地思考。”

除了法律和医疗保健,会议还探讨了人工智能政策的其他方面,包括大规模审计和监控人工智能系统,以及人工智能在机动方面所扮演的角色,特别是自动驾驶汽车的技术、业务和政策挑战范围。

人工智能政策论坛研讨会旨在将实践社区聚集在一起,以设计人工智能的下一个篇章为共同目标。麻省理工学院Cadence Designs Systems教授、人工智能政策论坛的共同负责人Aleksander Madry在他的闭幕致辞中强调了协作的重要性,以及不同社区之间相互沟通的必要性,以便在人工智能政策领域真正产生影响。

马德里说:“我们的梦想是,我们所有人——研究人员、产业界、决策者和其他利益相关者——都能聚在一起,真正地相互交谈,理解彼此的关切,并一起思考解决方案。”“这是人工智能政策论坛的使命,也是我们希望实现的。”

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/exploring-emerging-topics-ai-policy-0628

分类
麻省理工学院新闻

用人工智能让牙齿护理不再需要猜测

当你想到医院的放射科医生时,你可能会想到一个坐在黑暗的房间里,花几个小时仔细研究x光片来做出诊断的专家。相比之下,你的牙医除了解读x光片之外,还必须进行手术、管理员工、与患者沟通以及经营他们的业务。当牙医分析x光片时,他们是在明亮的房间里,在不是专门用于放射学的电脑上进行分析的,通常病人就坐在他们旁边。

那么,牙医给同样的x光检查可能会提出不同的治疗方案,这就不足为奇了。

“考虑到他们要处理的所有事情,牙医的工作做得很好,”瓦尔达·伊纳姆(Wardah Inam)说。

Inam是Overjet公司的联合创始人,该公司使用人工智能为牙医和保险提供商分析和注释x光片。Overjet试图将x射线解释的主观性去除,以改善患者护理。

伊纳姆与亚历山大·杰里奇(Alexander Jelicich)共同创立了这家公司。他说:“我们要向更精准的医疗发展,在正确的时间提供正确的治疗。”“这就是技术可以提供帮助的地方。一旦我们对疾病进行量化,我们就可以很容易地推荐正确的治疗方法。”

美国食品和药物管理局(Food and Drug Administration)已批准Overjet检测和勾画龋齿,并对骨骼水平进行量化,以帮助诊断牙周病。牙周病是一种常见但可以预防的牙龈感染,会导致颌骨和支撑牙齿的其他组织恶化。

除了帮助牙医检测和治疗疾病,Overjet的软件还可以帮助牙医向患者展示他们看到的问题,并解释他们为什么推荐某些治疗方法。

该公司已经分析了数千万张x光片,在全国范围内的牙科实践中使用,目前正在与代表美国超过7500万患者的保险公司合作,Inam希望Overjet分析的数据可以用于进一步简化手术,同时改善对患者的护理。

“我们在Overjet的使命是通过创造一个临床精确、高效和以患者为中心的未来来改善口腔健康,”Inam说。

对Inam来说,这是一段旋风式的旅程,她对牙科行业一无所知,直到2018年的一次糟糕经历激发了她的兴趣。

找到问题的根源

伊纳姆2010年来到麻省理工学院,先是攻读硕士学位,然后是攻读电子工程和计算机科学博士学位。她说,她很早就爱上了创业。

“对我来说,麻省理工学院是一个沙盒,在这里你可以学到不同的东西,发现自己喜欢什么,不喜欢什么,”伊纳姆说。“另外,如果你对一个问题感到好奇,你就可以真正投入进去。”

在斯隆管理学院(Sloan School of Management)学习创业课程期间,伊南最终与同学们创办了一些新的企业。

“当我来到麻省理工学院的时候,我不知道我想要开一家公司,”Inam说。“我知道我想解决重要的问题。我经历了在学术界和工业界之间做出选择的过程,但我希望事情发生得更快,我希望在我的一生中产生影响,这就是吸引我创业的原因。”

在计算机科学与人工智能实验室(CSAIL)攻读博士后期间,Inam和一组研究人员将机器学习应用于无线信号,以创建生物医学传感器,可以跟踪人的运动,检测跌倒,并监测呼吸频率。

离开麻省理工学院后,她才对牙科产生了兴趣,当时她更换了牙医,接受了一套全新的治疗方案。这种变化让她感到困惑,她要求拍x光片,又请其他牙医看了看,结果却得到了另一种不同的诊断和治疗建议。

那时,Inam决定为自己深入牙科领域,阅读相关书籍,观看YouTube视频,并最终采访了牙医。在她意识到这一点之前,她花在学习牙科知识上的时间比她在工作上花的时间还多。

就在Inam辞职的同一周,她了解到麻省理工学院的黑客医学竞赛,并决定参加。从那时起,她开始组建自己的团队,建立人脉。Overjet的第一笔资金来自媒体实验室附属投资集团E14基金。

她说:“E14基金开出了第一张支票,如果不是他们给我们一个机会,我认为我们不会存在。”

Inam了解到,牙医对治疗建议的差异很大的一个原因是每种疾病的潜在治疗选择的绝对数量。例如,蛀牙可以用填充物、牙冠、根管、桥接等方法治疗。

对于牙周病,牙医必须进行毫米级别的评估,以确定疾病的严重程度和进展。疾病的程度和进展决定了最好的治疗方法。

伊纳姆说:“我觉得技术不仅可以加强诊断,而且可以更有效地与患者沟通,让他们理解,而不必像我一样,不知道谁是对的。”

Overjet最初是一个帮助保险公司简化牙科索赔的工具,后来该公司开始将其工具直接集成到牙医办公室。每天,一些全国最大的牙科组织都在使用Overjet,包括Guardian Insurance, Delta dental, dental Care Alliance和Jefferson dental and orthodental。

如今,当牙科x光片被输入电脑时,Overjet的软件会自动分析和注释图像。当图像出现在电脑屏幕上时,它包含了所拍x光片的类型、牙齿可能受到的影响、颜色叠加导致的骨质流失的确切程度、龋齿的位置和严重程度等信息。

该分析为牙医提供了更多的信息来与患者谈论治疗方案。

Inam说:“现在牙医或保健师只需要综合这些信息,他们就可以使用软件与你沟通。”“所以,他们会给你看带有Overjet注释的x光片,并说,‘你有4毫米的骨质流失,这是红色的,比你上次来这里时的3毫米高,所以我建议这种治疗。”

Overjet还整合了每个病人的历史信息,追踪每颗牙齿上的骨质流失,帮助牙医发现疾病进展更快的病例。

Inam说:“我们曾见过这样的案例:一名癌症患者在两次就诊之间的六个月时间里,口腔干燥从零变到了极其严重的程度,所以这些患者可能应该更频繁地去看牙医。”“这一切都是利用数据来改变我们实践护理的方式,思考计划,以及为不同类型的患者提供服务。”

牙科的操作系统

Overjet获得FDA的许可是因为两种非常流行的疾病。他们还让该公司能够进行行业层面的分析,并帮助牙科诊所与同行进行比较。

Inam说:“我们使用同样的技术来帮助实践人员了解临床表现并改进操作。”“我们可以查看每一个病人的每一个诊所,并确定诊所如何使用软件来改善他们提供的护理。”

展望未来,Inam认为Overjet在牙科手术的几乎每个方面都扮演着不可或缺的角色。

“这些x光片被数字化已经有一段时间了,但它们从未被使用过,因为计算机无法读取它们,”Inam说。“Overjet正在将非结构化数据转化为我们可以分析的数据。现在,我们正在建设基础设施。最终,我们希望这个平台能够改进实践能够提供的任何服务,基本上成为实践的操作系统,帮助提供商更有效地完成他们的工作。”

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/overjet-dental-artificial-intelligence-0624

分类
麻省理工学院新闻

机器人玩橡皮泥

当我们无意中发现一堆荧光的、橡胶般的水、盐和面粉的混合物时,我们许多人内心的孩子会感到一种难以抗拒的喜悦:play dough(游戏面团)。(即使这种情况在成年期很少发生。)

虽然对两岁的孩子来说,操纵橡皮泥很有趣也很容易,但机器人很难处理这些不成形的污泥。机器在处理刚性物体方面已经变得越来越可靠,但操作柔软、可变形的物体带来了一系列的技术挑战,最重要的是,就像大多数柔性结构一样,如果你移动了一个部分,你可能会影响到其他所有部分。

来自麻省理工学院计算机科学和人工智能实验室(CSAIL)和斯坦福大学的科学家们最近让机器人动手玩这种建模化合物,但不是为了怀旧。他们的新系统直接从视觉输入中学习,让一个有两个手指抓手的机器人看到、模拟和塑造松软的物体。“RoboCraft”可以可靠地计划一个机器人的行为,捏和释放玩耍面团,以做出各种字母,包括它从未见过的字母。只用了10分钟的数据,这只两根手指的手就可以与遥控机器的人类对手相匹敌——在测试任务中的表现与对手相当,有时甚至更好。

CSAIL博士生、一篇关于RoboCraft的新论文的作者李云珠(音)说:“对具有高度自由度的物体建模和操作是机器人学习如何实现复杂的工业和家庭交互任务的基本能力,比如饺子、寿司和制作陶器。”“虽然最近在处理衣服和绳子方面有了进展,但我们发现,像面团或橡皮泥这样的高可塑性物体——尽管在这些家庭和工业环境中无处不在——在很大程度上是一个尚未开发的领域。通过使用RoboCraft,我们可以直接从高维感官数据中学习动力学模型,这为我们执行有效规划提供了一个有希望的数据驱动途径。”

有了未定义的,光滑的材料,整个结构需要考虑在你可以做任何类型的高效和有效的建模和规划。通过将图像转换成小粒子的图形,再加上算法,RoboCraft利用图形神经网络作为动力学模型,对材料的形状变化做出了更准确的预测。

通常,研究人员使用复杂的物理模拟器来模拟和理解施加在物体上的力和动力学,但RoboCraft只使用视觉数据。该系统的内部工作依赖于三个部分来塑造软材料,比如说,一个“r”字。

第一部分——感知——是关于学习“看”。它使用相机从环境中收集原始的视觉传感器数据,然后这些数据被转化成小颗粒云来表示形状。然后,一个基于图形的神经网络使用这些粒子数据来学习“模拟”物体的动态,或它如何移动。然后,算法帮助规划机器人的行为,让它学会“塑造”一团面团,用来自多次捏捏的训练数据武装起来。虽然字母有点松散,但它们无疑具有代表性。

除了可爱的形状,这个团队(实际上)正在用面团和现成的馅料包饺子。现在,只有两个手指,这是一个很大的要求。《RoboCraft》将需要额外的工具(面包师需要多个工具来烹饪;机器人也一样)——擀面杖、印章和模具。

科学家们设想的未来更远的领域是使用RoboCraft来帮助做家务和家务,这可能对老年人或行动不便的人有特别的帮助。为了做到这一点,考虑到可能发生的许多障碍,需要一个更有适应性的面团或物品的表示,以及探索什么类型的模型可能适合捕捉底层的结构系统。

“《RoboCraft》从本质上证明,这种预测模型可以通过非常有效的数据方式学习来计划运动。从长远来看,我们正在考虑使用各种工具来操纵材料。”“如果你考虑做饺子或面团,仅仅一个手是无法解决的。帮助模型理解和完成更长远的规划任务,例如,在当前的工具、运动和动作下,面团将如何变形,是未来工作的下一步。”

李彦宏与斯坦福大学的硕士生施昊晨共同撰写了这篇论文;徐华哲,斯坦福大学博士后;黄志敖,加州大学圣地亚哥分校博士生;以及斯坦福大学助理教授吴家军。他们将在纽约举行的机器人:科学与系统会议上展示这项研究。这项工作得到了斯坦福人类中心人工智能研究所(HAI)、三星全球研究拓展计划(GRO)、丰田研究所(TRI)以及亚马逊、欧特克、Salesforce和博世的部分支持。

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/robots-play-play-dough-0623

分类
麻省理工学院新闻

研究人员发布了用于自动驾驶的开源逼真模拟器

超逼真的虚拟世界被誉为自动驾驶汽车(AVs)的最佳驾驶学校,因为它们已经被证明是安全试验危险驾驶场景的富有成效的试验台。特斯拉(Tesla)、Waymo和其他自动驾驶公司都严重依赖数据来实现昂贵且专有的逼真模拟器,因为测试和收集细微的i -几乎崩溃数据通常不是最容易或最理想的重现。

为此,麻省理工学院计算机科学和人工智能实验室(CSAIL)的科学家们创造了“VISTA 2.0”,这是一个数据驱动的模拟引擎,车辆可以在现实世界中学习驾驶,并从接近撞车的场景中恢复。更重要的是,所有的代码都是对公众开放的。

“今天,只有公司拥有像VISTA 2.0那样的模拟环境和能力的软件,而且这种软件是专有的。通过此次发布,研究界将获得一个强大的新工具,以加快自动驾驶自适应鲁棒控制的研究和开发,”麻省理工学院教授、CSAIL主任Daniela Rus说,他是一篇有关该研究的论文的资深作者。

Video thumbnail Play video
VISTA is a data-driven, photorealistic simulator for autonomous driving. It can simulate not just live video but LiDAR data and event cameras, and also incorporate other simulated vehicles to model complex driving situations. VISTA is open source and the code can be found below.

VISTA 2.0基于该团队之前的模型VISTA,它与现有的AV模拟器有本质上的不同,因为它是数据驱动的——这意味着它是根据真实世界的数据构建和逼真地渲染的——因此能够直接转移到现实中。虽然最初的迭代只支持使用一个摄像头传感器的单辆汽车的车道跟踪,但实现高保真的数据驱动模拟需要重新思考如何综合不同传感器和行为交互的基础。

进入VISTA 2.0:一个数据驱动的系统,可以模拟复杂的传感器类型,大规模的交互场景和交叉点。由于数据比之前的模型少得多,该团队能够训练出比那些在大量真实数据上训练的自动驾驶汽车更健壮的汽车。

CSAIL博士生Alexander Amini说:“这是自动驾驶汽车数据驱动模拟能力的巨大飞跃,也是处理更复杂驾驶的规模和能力的增长。”他和他的同事jun – hsuan Wang是两篇新论文的共同主要作者。“VISTA 2.0展示了模拟传感器数据的能力,远远超过了2D RGB摄像头,以及具有数百万点的超高维3D激光雷达,不规则计时的基于事件的摄像头,甚至与其他车辆的交互式和动态场景。”

该团队能够衡量诸如超车、跟随和谈判等交互式驾驶任务的复杂性,包括高度逼真环境中的多智能体场景。

训练自动驾驶汽车的AI模型涉及各种边缘情况和奇怪、危险的场景,这很难确保安全,因为我们的大多数数据(谢天谢地)只是日常驾驶的普通数据。从逻辑上讲,我们不能为了教神经网络如何不撞到其他车而撞到其他车。

最近,人们开始从更经典的、人类设计的模拟环境转向从真实数据构建的模拟环境。后者具有巨大的真实感,但前者可以很容易地模拟虚拟相机和激光雷达。随着这种范式的转变,一个关键问题也随之出现:自动驾驶汽车需要的所有传感器的丰富程度和复杂性,比如更稀疏的激光雷达和基于事件的摄像头,能否准确地合成出来?

在一个数据驱动的世界中,激光雷达传感器数据的解释要困难得多——你只能从世界的稀疏视图中有效地生成包含数百万点的全新3D点云。为了合成3D激光雷达点云,该团队使用了汽车收集的数据,将其投影到一个来自激光雷达数据的3D空间中,然后让一辆新的虚拟车辆在原始车辆所在的地方附近行驶。最后,在神经网络的帮助下,他们将所有的感官信息投影到这款新型虚拟汽车的视野框架中。

基于事件的摄像头的模拟运行速度超过每秒数千个事件,与此一起,模拟器不仅能够模拟多模态信息,而且所有这些都是实时进行的——这使得离线训练神经网络成为可能,还可以在汽车上的增强现实设置中进行在线测试,以进行安全评估。阿米尼说:“在数据驱动模拟领域,如此复杂和逼真的多传感器模拟是否可行,这是一个悬而未决的问题。”

这样一来,驾校就变成了一个派对。在模拟过程中,你可以四处移动,使用不同类型的控制器,模拟不同类型的事件,创建交互场景,甚至可以在原始数据中添加全新的车辆。他们测试了车道跟随、车道转弯、车辆跟随,以及静态和动态超车(看到障碍物并移动以避免碰撞)等更危险的场景。在多代理系统中,真实的和模拟的代理都可以交互,新的代理可以被放入场景中并以任何方式进行控制。

把他们的全尺寸车开到“野外”——也就是马萨诸塞州的德文斯——团队看到了结果的可转移性,有失败也有成功。他们还展示了自动驾驶汽车模型的一个大胆而神奇的词:“强大”。他们展示了完全用VISTA 2.0训练的自动驾驶汽车在现实世界中是如此强大,以至于他们可以处理难以捉摸的具有挑战性的失败。

现在,人类依赖的一个护栏还不能被模拟,那就是人类的情感。它是友好的挥手、点头或眨眼的确认开关,这是团队希望在未来的工作中实现的细微差别类型。

阿米尼说:“这项研究的核心算法是,我们如何获得一个数据集,并为学习和自主建立一个完全合成的世界。”“我相信,有一天,这个平台可以扩展到机器人领域的许多不同领域。不仅仅是自动驾驶,还有许多依赖视觉和复杂行为的领域。我们很高兴发布VISTA 2.0,以帮助社区收集他们自己的数据集,并将它们转换成虚拟世界,在那里他们可以直接模拟自己的虚拟自动驾驶汽车,在这些虚拟地形上驾驶,在这些世界中训练自动驾驶汽车,然后可以直接将它们转移到完整尺寸的真正的自动驾驶汽车。”

Amini和Wang与麻省理工学院CSAIL博士生刘志坚共同撰写了这篇论文;多伦多大学计算机科学助理教授Igor Gilitschenski;Wilko Schwarting, AI研究科学家,麻省理工CSAIL博士20;麻省理工学院电子工程与计算机科学系副教授宋涵;麻省理工学院航空航天副教授Sertac Karaman;以及麻省理工学院教授、CSAIL主任Daniela Rus。研究人员在费城举行的IEEE机器人与自动化国际会议(ICRA)上展示了这项工作。

这项工作得到了美国国家科学基金会和丰田研究所的支持。团队通过捐赠Drive AGX Pegasus来感谢NVIDIA的支持。

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/researchers-release-open-source-photorealistic-simulator-autonomous-driving-0621

分类
麻省理工学院新闻

从局部看整体

在观看照片并根据过去的经验绘制时,人们通常可以在本身完全平坦的照片中感知深度。然而,让电脑做同样的事情被证明是相当具有挑战性的。

这个问题的困难有几个原因,其中之一是,当一个发生在三维的场景被简化为二维(2D)表示时,信息不可避免地会丢失。有一些成熟的策略可以从多个2D图像中恢复3D信息,但它们都有一些局限性。麻省理工学院和其他机构的研究人员开发了一种名为“虚拟通信”的新方法,可以克服这些缺点,并在传统方法无法奏效的情况下取得成功。

Video thumbnail Play video
Existing methods that reconstruct 3D scenes from 2D images rely on the images that contain some of the same features. Virtual correspondence is a method of 3D reconstruction that works even with images taken from extremely different views that do not show the same features.

这种标准的方法被称为“从运动中获得结构”,它是以人类视觉的一个关键方面为模型的。因为我们的眼睛是分开的,所以每只眼睛对一个物体的看法都略有不同。可以形成一个三角形,其边包括连接两个眼睛的线段,加上将每个眼睛连接到所讨论的物体上的公共点的线段。知道了三角形的角度和两眼之间的距离,就有可能用初等几何来确定到那个点的距离——当然,人类的视觉系统可以对距离做出粗略的判断,而不需要进行繁重的三角计算。几个世纪以来,天文学家一直利用同样的基本思想——三角测量或视差观测——来计算到遥远恒星的距离。

三角剖分是从运动到结构的关键要素。假设您有一个物体的两张图片——例如,一个兔子雕塑——一张从这个物体的左边拍摄,另一张从右边拍摄。第一步是在兔子的表面上找到两个图像共享的点或像素。研究人员可以从那里确定两台相机的“姿势”——照片拍摄的位置和每个相机面对的方向。知道了摄像机之间的距离和它们的方向,人们就可以用三角测量法计算出到兔子身上选定点的距离。如果识别出足够多的共同点,就有可能对物体(或“兔子”)的整体形状有一个详细的感觉。

麻省理工学院电子工程与计算机科学系(EECS)的博士生Wei-Chiu Ma评论说,这项技术已经取得了相当大的进步,“现在人们匹配像素的准确度越来越高。只要我们可以在不同的图像上观察同一个点,我们就可以使用现有的算法来确定相机之间的相对位置。”但这种方法只适用于两幅图像有很大重叠的情况。他补充说,如果输入的图像有非常不同的视角——因此只有很少的共同点——“系统可能会失败。”

在2020年夏天,马云提出了一种新颖的做事方式,可以从运动中极大地扩展结构的范围。当时麻省理工学院因为疫情而关闭,而马云正在台湾的家里的沙发上休息。当他看着他的手掌,尤其是他的指尖时,他突然想到他可以清楚地描绘出他的指甲,尽管他看不见它们。

这就是虚拟通信概念的灵感来源,随后,马云和他的导师、EECS教授、计算机科学与人工智能实验室研究员安东尼奥·托拉尔巴(Antonio Torralba),以及多伦多大学的杨安琪、拉奎尔·乌尔塔松(Raquel Urtasun)和伊利诺伊大学的王神龙(Shenlong Wang)一起研究了这个概念。“我们想把人类的知识和推理整合到我们现有的3D算法中”,马云说,同样的推理使他能够看着自己的指尖,然后变出另一边的指甲——他看不到的那一边。

当两幅图像有共同的点时,运动中的结构就会起作用,因为这意味着总是可以绘制一个三角形将摄像机连接到共同的点,从而可以从中收集深度信息。虚拟通信提供了一种进一步沟通的方式。再一次假设,从兔子的左侧拍摄一张照片,从右侧拍摄另一张照片。第一张照片可能会显示兔子左腿上的一个斑点。但由于光是直线传播的,我们可以利用兔子的解剖学常识来知道从相机到腿的光线会从兔子的另一侧出现在哪里。这个点可能在另一张图像中可见(从右边拍摄),如果是这样,它可以通过三角测量来计算第三维度的距离。

虚拟对应,换句话说,允许人们从兔子左边的第一张图像上取一个点,并将它与兔子看不见的右边的一个点连接起来。“这样做的好处是,你不需要重叠图像来进行操作,”Ma指出。“通过观察物体的另一端,这种技术提供了最初不可用的共同点。”这样,传统方法所受的限制就可以被规避。

有人可能会问,这需要多少先验知识,因为如果你必须从一开始就知道图像中所有东西的形状,就不需要计算。马和他的同事们采用的技巧是利用图像中某些熟悉的物体——比如人的形状——作为一种“锚”,他们已经设计了一些方法,利用我们对人的形状的知识来帮助确定相机的姿势,在某些情况下,推断图像的深度。此外,马军解释说:“我们算法中内置的先验知识和常识首先是由神经网络捕获和编码的。”

马云说,这个团队的最终目标要远大得多。“我们希望制造出能像人类一样理解三维世界的计算机。”他承认,这一目标仍远未实现。“但要超越我们今天的水平,建立一个像人类一样运作的系统,我们需要一个更具挑战性的环境。换句话说,我们需要开发出不仅能解读静止图像,还能理解短视频片段,最终能理解全长电影的计算机。”

电影《心灵捕手》中的一个场景证明了他的想法。观众可以看到马特·达蒙和罗宾·威廉姆斯坐在波士顿公共花园的长椅上,俯瞰着一个池塘。下一张照片从对面拍摄,可以看到达蒙和威廉姆斯在完全不同的背景下正面的照片(虽然他们都穿着衣服)。每个看电影的人都马上知道他们看到的是同一个人,即使这两个镜头没有任何共同点。计算机还不能实现这种概念上的飞跃,但马云和他的同事们正在努力使这些机器更熟练,至少在视觉方面更像我们。

该团队的工作将在下周的计算机视觉和模式识别会议上展示。

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/seeing-whole-from-some-parts-0617

分类
麻省理工学院新闻

公司利用麻省理工学院的研究来识别和应对供应链风险

2020年2月,麻省理工学院教授大卫·辛奇-列维预测了未来。在《哈佛商业评论》(Harvard Business Review)上的一篇文章中,他和他的同事警告说,新的冠状病毒爆发将在3月中旬之前扼住供应链,关闭北美和欧洲的数万家企业。

辛奇-利瓦伊开发了供应链弹性的新模型,并就如何最好地保护自己不受供应链困境的影响向大公司提供建议。对他来说,供应链中断的迹象显而易见。两年后,这位麻省理工学院施瓦茨曼计算学院和土木与环境工程系的工程系统教授、麻省理工学院数据科学实验室主任发现,许多公司都对应用他的风险暴露指数(REI)研究来识别和应对自身供应链中的潜在风险产生了“大量兴趣”。

他在关键供应链的“压力测试”和指导全球供应链复苏的方法方面的工作被收录在今年4月提交给美国国会的总统《2022年经济报告》中。

辛奇-利瓦伊表示,数据科学研究很少能影响最高层的政策,但他的模型反映了企业现在需要的东西:一个持续全球危机的新世界,而不依赖历史先例。

辛奇-利瓦伊说:“过去两年的情况表明,你不能仅仅根据去年或过去两年发生的事情来制定计划。”

他回忆起冰球巨星韦恩·格雷茨基(Wayne Gretzsky)曾说过的一句名言:优秀的球员不会滑到冰球所在的位置,而是滑到冰球将要到达的位置。“我们现在关注的不是供应链的状态,而是六周、八周后可能发生的事情,我们今天要做好准备,防止未来出现问题。”

寻找隐藏的风险

REI的核心是一个供应链的数学模型,该模型关注不同供应链节点的潜在故障——例如,供应商工厂的洪水,或另一家工厂的原材料短缺。通过计算“恢复时间”(TTR)和生存时间(TTS)等变量,前者衡量一个特定节点恢复到完全功能所需的时间,后者确定供应链在中断后匹配供需的最大持续时间,该模型关注的是中断对供应链的影响,而不是中断的原因。

甚至在大流行之前,2010年冰岛火山爆发和2011年日本东北地震和海啸等灾难性事件就威胁着这些节点。辛奇-利瓦伊说:“多年来,不同行业的公司主要关注效率,尽可能地削减成本,采用外包和离岸外包等策略。”“他们在这方面做得非常成功,但这大大增加了他们面临的风险。”

利用他们的模型,辛奇-李维和同事在2013年开始与福特汽车公司合作,以改善该公司的供应链弹性。这次合作发现了一些令人惊讶的潜在风险。

首先,研究人员发现福特的“战略供应商”——公司每年花费大量资金的供应链节点——只有适度的风险暴露。辛奇-利瓦伊说,相反,最大的风险“往往来自那些为福特提供成本约为10美分零部件的小供应商”。

分析还发现,风险供应商遍布全球各地。“有一种观点认为,如果你把供应商搬到离市场更近、更贴近需求、更靠近北美或墨西哥的地方,你就能增加供应链的弹性。我们的数据并不支持这一点。”

奖励的弹性

通过创建一个福特供应链的虚拟代表,或“数字双胞胎”,研究人员能够在每个节点测试策略,看看什么会增加供应链的弹性。公司是否应该投资更多的仓库来储存一个关键部件?是否应该将零部件的生产转移到另一家工厂?

辛奇-利瓦伊说,企业有时不愿意在供应链弹性方面投资,但这项分析不仅仅涉及风险。“它还将帮助你发现储蓄机会。例如,该公司可能正在建立许多错误的、昂贵的库存,而我们的方法可以帮助他们识别这些效率低下的问题,并降低成本。”

自从与福特合作以来,辛奇-李维及其同事还与许多其他公司合作,包括与埃森哲的合作,将REI技术扩展到各种行业,包括高科技、工业设备、家装零售商、时尚零售商和包装消费品。

施耐德电气北美首席执行官安妮特·克莱顿(Annette Clayton)曾担任该公司的首席供应链官,她已经与辛奇- levi合作了17年。她说:“当我刚开始在施耐德工作时,我请大卫和他的团队帮助我们研究弹性和库存定位,以便为北美供应链做出最佳的成本、交付、灵活性和速度权衡。”“随着疫情的发展,我们在供应链弹性方面的经验变得更加重要,我们再次与大卫及其团队合作。”

“我们使用TTR和TTS来确定我们需要在哪些地方开发和复制供应商的能力,从原材料到组装零部件。由于物流时间延长,我们的库存恢复时间超过了生存时间,”Clayton补充道。“我们已经使用TTR和TTS来优先处理供应商开发、采购和扩大我们自己的制造能力的工作量。”

REI方法甚至可以应用于整个国家的经济,就像联合国减少灾害风险办公室(U.N. Office for Disaster Risk Reduction)在2011年灾难性洪灾后对泰国等发展中国家所做的那样。

Simchi-Levi和他的同事受到疫情的激励,希望用新的特性来增强REI模型。“因为我们已经开始与更多的公司合作,我们已经意识到一些有趣的、特定于公司的业务约束,”他说,这导致了更有效的计算潜在风险的方法。

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/companies-use-mit-research-identify-respond-supply-chain-risks-0615

分类
麻省理工学院新闻

通过计算创造艺术

切尔西·科金是一位跨学科艺术家,他利用计算机探索人体。在她的工作中,她开发了复杂的软件作为她的艺术工具,包括面部检测技术、身体跟踪软件和机器学习算法。

考克金对人体的兴趣源于她童年时的现代舞训练。她在牙买加的金斯敦长大,艺术和科学都是她的最爱,从不挑三拣四。对于大学,“我真的很想找到一种兼顾两者的方法,但这很难,”她说。“幸运的是,通过我的哥哥,我在乔治亚理工学院找到了计算媒体领域。”在那里,她学会了开发基于计算机的媒体技术,如动画和图形。

在她本科的最后一年,考金参加了一个工作室班,在那里她和其他两个学生一起创作了一件舞蹈表演作品。他们一起跟踪了三名当地舞者的动作,并实时投射出这些动作的可视化图像。Cocking很快就爱上了这种计算艺术媒介。但在她真正开始探索之前,她毕业了,开始了一份全职的产品设计工作,她已经做好了准备。

Cocking从事产品设计工作四年,先是在一家初创公司,然后是Dropbox。“在我的内心深处,我一直想回到研究生院”继续探索计算机艺术,她说。“但我真的没有勇气这么做。”当疫情爆发,一切都转移到网上时,她看到了追逐梦想的机会。在家人的鼓励下,她一边保持自己的日常工作,一边在诗意计算学院(School for诗意计算)上在线课程。她一开始,一切都灵光一闪:“这就是我想做的,”她说。

通过学校,科金听说她现在的导师、媒体实验室的兼职副教授扎克·利伯曼(Zach Lieberman)的研究小组“未来草图”(Future Sketches)有一个空缺。现在,她每天都在探索通过计算创作艺术的新想法。“乐趣足以证明我的研究是正确的,”她说。

期待已久的计算机艺术回归

去年秋天,当科金第一次加入未来草图小组时,她充满了想法,并拥有强大的设计技能,这是她作为一名产品设计师培养出来的。但她也有四年没有全职编码,需要恢复体型。在咨询了利伯曼之后,她开始了一个项目,在这个项目中,她既可以提高自己的编程技能,又可以探索自己对人体的兴趣。

在这个项目中,Cocking深入研究了一种新媒体:摄影。在一组名为“Photorythms”的照片中,她拍摄了人们的摄影肖像,并使用面部检测技术对他们进行了操作。她说:“在面部检测中,你可以得到你面部的68分。”“利用这些点,你可以操纵图像的外观,创造出更有表现力的人像摄影。”她的许多作品都是用一种特殊的形状,比如同心环或竖条纹,将它们重新组合成不同的形状,让人联想到立体主义。

通过Photorythms, Cocking还从她的导师那里采用了一种“每日素描”的做法,她每天开发新的代码来生成一件新的艺术作品。如果创作出来的作品是她引以为豪的,她就会与全世界分享,有时会通过Instagram。但她表示:“即使代码没有任何意义,我每天都在磨练自己的编程技能。”

现在她已经重新适应了密集编程,“我真的想在今年夏天投入到身体追踪中,”科金说。她目前还在构思阶段,在头脑风暴中想出不同的方法,将身体跟踪和现场表演互动结合起来。“我一半害怕,一半兴奋,”她说。

为了帮助产生想法,她将在7月初参加一个为期5天的密集研讨会,届时将汇集对计算机舞蹈艺术感兴趣的艺术家。Cocking计划和她最好的大学好友Raianna Brown一起参加研讨会,她是一名舞蹈演员。她表示:“我们将在英国查塔姆(Chatham)待上一周,只是在编舞和代码方面做些尝试。”“希望这能激发新的想法和新的关系”为未来的合作。

传播对编码和设计的热爱

在她曲折而勤奋的计算机艺术之旅中,“我从来没有认为我所处的位置是理所当然的,”科金说。她认识到从自己的经验中获得机会的价值,在一个地方获得机会的自我维持循环为她打开了另一个地方的大门。但她说,“我周围有很多聪明有才华的人,但他们没有机会”,尤其是在计算机科学和设计领域。正因为如此,从大学开始,科金就投入了一些时间,为来自弱势背景的儿童和年轻专业人士提供接触这些领域的机会。

今年春天,科金与媒体实验室的同学Cecilé Sadler合作开发了一个工作坊,以一种有趣的方式向孩子们介绍编码概念。五月和六月,两位合作伙伴在不同的地方同时教授工作坊:Sadler在剑桥与blackyard合作教授一系列课程,blackyard是一个以黑人、土著和POC青年为中心的草根组织,而Cocking则回到她的祖国牙买加,在Kingston附近的Freedom Skatepark青年中心任教。

为了把讲习班的课程送到牙买加,科金找到了她的朋友,在自由滑板公园青年中心教计算机科学的黎加。他们一起教了几个星期的课程。“我很紧张(孩子们)会直接走出去,”科金说。“但他们真的很喜欢!”

她说,Cocking希望利用这个研讨会作为跳板,有朝一日“为牙买加的孩子们建立一个探索创造性编码或计算艺术的核心中心”。“希望人们能够将编码视为创造和表达的工具,而不会感到害怕,并利用它让世界变得更奇怪。”

文章旨在传播新闻信息,原文请查看https://news.mit.edu/2022/chelsi-cocking-art-computation-0626