分类
麻省理工学院新闻

将人工智能交到有问题需要解决的人手中

Simple shapes like circles and squares are connected by dotted lines, against a black background.Split screen of monochromatic portrait of Karthik Dinakar and Birago Jones portrait

作为 2010 年媒体实验室的学生,Karthik Dinakar SM ’12、PhD ’17 和 Birago Jones SM ’12 联手开展了一个课堂项目,以构建一个工具,帮助 Twitter(现在的 X)和 YouTube 等公司的内容审核团队。这个项目引起了巨大的兴奋,研究人员被邀请在白宫举行的网络欺凌峰会上进行演示——他们只需要让事情发挥作用。

在白宫活动的前一天,迪纳卡花了几个小时试图整理一个工作演示,以识别Twitter上令人担忧的帖子。晚上11点左右,他打电话给琼斯,说他要放弃了。

然后琼斯决定查看数据。事实证明,Dinakar 的模型标记了正确类型的帖子,但海报使用了青少年俚语和其他 Dinakar 没有接受的间接语言。问题不在于模型;这是迪纳卡和他试图帮助的青少年之间的脱节。

“就在我们到达白宫之前,我们意识到,构建这些模型的人不应该只是机器学习工程师,”迪纳卡尔说。“他们应该是最了解自己数据的人。

这一见解促使研究人员开发了点击式工具,允许非专业人士构建机器学习模型。这些工具成为Pienso的基础,如今,Pienso正在帮助人们构建大型语言模型,用于检测错误信息、人口贩运、武器销售等,而无需编写任何代码。

琼斯说:“这些类型的应用程序对我们很重要,因为我们的根源在于网络欺凌,并了解如何将人工智能用于真正帮助人类的事情。

至于在白宫展示的早期版本,创始人最终与马萨诸塞州剑桥附近学校的学生合作,让他们训练模型。

“这些孩子训练的模型比我所能想到的任何东西都要好得多,也要细致入微,”迪纳卡尔说。“Birago和我经历了一个重大的’啊哈!’时刻,我们意识到赋予领域专家权力——这与人工智能民主化不同——是最好的前进道路。

一个有目的的项目

Jones 和 Dinakar 在麻省理工学院媒体实验室的软件代理研究小组读研究生时相识。他们在 Pienso 上的工作始于课程 6.864(自然语言处理),一直持续到 2012 年获得硕士学位。

事实证明,2010年并不是创始人最后一次被邀请到白宫演示他们的项目。这项工作引起了极大的热情,但创始人在Pienso上兼职工作,直到2016年,Dinakar在麻省理工学院完成了博士学位,深度学习开始流行起来。

“我们仍然与校园周围的许多人保持联系,”迪纳卡说。“我们在麻省理工学院的接触,人机界面的融合,拓宽了我们的理解。如果没有麻省理工学院校园的活力,我们在Pienso的理念就不可能实现。

创始人还称赞麻省理工学院的工业联络计划(ILP)和创业加速器(STEX)将他们与早期合作伙伴联系起来。

一个早期的合作伙伴是SkyUK。该公司的客户成功团队使用 Pienso 构建模型,以了解客户最常见的问题。如今,这些模型每天帮助处理五十万个客户电话,创始人表示,到目前为止,他们已经通过缩短公司呼叫中心的电话时间,为公司节省了超过700万英镑。

人工智能民主化和用人工智能赋予人们权力之间的区别归结为谁最了解数据——你、医生、记者或每天与客户打交道的人?琼斯说。“这些人应该创建模型。这就是您从数据中获取见解的方式。

2020 年,就在 Covid-19 疫情在美国爆发之际,政府官员联系了创始人,以使用他们的工具更好地了解这种新出现的疾病。Pienso帮助病毒学和传染病专家建立了机器学习模型,以挖掘数千篇关于冠状病毒的研究文章。迪纳卡尔说,他们后来了解到,这项工作帮助政府确定和加强了药物的关键供应链,包括流行的抗病毒药物瑞德西韦。

“这些化合物是由一个不了解深度学习但能够使用我们的平台的团队提出的,”Dinakar说。

构建更美好的 AI 未来

由于Pienso可以在内部服务器和云基础设施上运行,创始人表示,它为被迫使用其他人工智能公司提供的服务捐赠数据的企业提供了另一种选择。

“Pienso 界面是一系列拼接在一起的 Web 应用程序,”Dinakar 解释道。“你可以把它想象成用于大型语言模型的Adobe Photoshop,但在网络上。您无需编写任何代码即可指向和导入数据。你可以优化数据,为深度学习做好准备,分析数据,如果没有标记或注释,就给它结构,你可以在25分钟内得到微调的大型语言模型。

今年早些时候,Pienso宣布与GraphCore建立合作伙伴关系,后者为机器学习提供了一个更快、更高效的计算平台。创始人表示,此次合作将通过大幅减少延迟来进一步降低利用人工智能的障碍。

“如果你正在构建一个交互式人工智能平台,用户不会每次点击一个按钮时都喝杯咖啡,”Dinakar说。“它需要快速且响应迅速。”

创始人认为,他们的解决方案正在创造一个未来,即由最熟悉他们试图解决的问题的人为特定用例开发更有效的人工智能模型。

“没有一个模型可以做所有事情,”Dinakar说。“每个人的应用都不同,他们的需求不同,他们的数据也不同。一个模型不太可能为您完成所有工作。这是关于将模型花园聚集在一起,允许它们相互协作,并以一种有意义的方式编排它们——而进行编排的人应该是最了解数据的人。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2024/pienso-putting-user-friendly-ai-problem-solving-0226