分类
麻省理工学院新闻

利用生成式 AI 创造机会

Rama Ramakrishnan posing sidesaddle in a chair with an out-of-focus skyline behind him

早在2010年,Rama Ramakrishnan就与零售业高管交谈,得出了两个认识。首先,尽管为客户提供个性化推荐的零售系统得到了极大的关注,但这些系统通常为零售商提供的回报甚微。其次,对于许多公司来说,大多数客户每年只购物一两次,因此公司对他们了解不多。

“但是,通过非常勤奋地记下客户与零售商或电子商务网站的互动,我们可以创建一个非常好和详细的综合图片,说明这个人做了什么以及他们关心什么,”麻省理工学院斯隆管理学院的实践教授Ramakrishnan说。“一旦你有了它,那么你就可以应用机器学习中经过验证的算法。

这些认识促使Ramakrishnan创立了CQuotient,这是一家初创公司,其软件现已成为Salesforce广泛采用的AI电子商务平台的基础。“仅在黑色星期五,CQuotient技术可能在一天内看到超过10亿购物者并与之互动,”他说。

在经历了非常成功的创业生涯后,Ramakrishnan 于 2019 年回到麻省理工学院斯隆分校,并于 1990 年代获得了运筹学硕士和博士学位。他说,他不仅教学生“这些惊人的技术是如何工作的,还教你如何利用这些技术,并在现实世界中实际使用它们。

此外,Ramakrishnan还喜欢参加麻省理工学院的高管教育。他说:“对我来说,这是一个很好的机会,可以传达我所学到的东西,但同样重要的是,可以了解这些高级管理人员的想法,并引导他们朝着正确的方向前进。

例如,高管们担心需要大量数据来训练机器学习系统,这是可以理解的。现在,他可以引导他们使用针对特定任务预先训练的大量模型。Ramakrishnan说:“能够使用这些预先训练的AI模型,并非常快速地使它们适应你的特定业务问题,这是一个令人难以置信的进步。

Rama Ramakrishnan – 在现实世界的智能工作应用中利用人工智能
视频:麻省理工学院工业联络计划

了解 AI 类别

“人工智能是赋予计算机完成通常只有人类才能完成的认知任务的能力的追求,”他说。了解这个复杂、增压景观的历史有助于利用这些技术。

传统的人工智能方法基本上通过应用从人类那里学到的if/then规则来解决问题,事实证明,这种方法对相对较少的任务很有用。“一个原因是我们可以毫不费力地做很多事情,但如果被要求解释我们是如何做到的,我们实际上无法阐明我们如何做,”Ramakrishnan评论道。此外,这些系统可能会因与软件中规定的规则不匹配的新情况而感到困惑。

机器学习采用了一种截然不同的方法,软件从根本上通过示例进行学习。“你给它很多输入和输出的例子,问题和答案,任务和响应,让计算机自动学习如何从输入到输出,”他说。信用评分、贷款决策、疾病预测和需求预测是机器学习征服的众多任务之一。

但机器学习只有在输入数据结构化时才能正常工作,例如在电子表格中。“如果输入数据是非结构化的,例如图像、视频、音频、心电图或 X 射线,那么它就不能很好地从这些数据到预测的输出,”Ramakrishnan 说。这意味着人类必须手动构建非结构化数据来训练系统。

他说,大约在2010年,深度学习开始克服这一限制,提供了直接处理非结构化输入数据的能力。基于一种被称为神经网络的长期人工智能策略,由于全球数据泛滥的浪潮、称为图形处理单元(最初为视频游戏发明)的非常强大的并行处理硬件的可用性以及算法和数学的进步,深度学习变得实用。

最后,在深度学习中,去年出现的生成式人工智能软件包可以创建非结构化输出,例如听起来像人类的文本、狗的图像和三维模型。大型语言模型 (LLM) 如 OpenAI 的 ChatGPT 从文本输入到文本输出,而文本到图像模型(如 OpenAI 的 DALL-E)可以产生逼真的图像。

Rama Ramakrishnan – 记下少量数据以改善客户服务
视频:麻省理工学院工业联络计划

生成式 AI 能做什么(和不能做什么)

Ramakrishnan说,在互联网上难以想象的庞大文本资源上接受训练,法学硕士的“基本能力是预测下一个最可能、最合理的单词”。“然后它将单词附加到原始句子上,再次预测下一个单词,并继续这样做。

“令许多人(包括许多研究人员)感到惊讶的是,法学硕士可以做一些非常复杂的事情,”他说。“它可以创作出优美连贯的诗歌,写出宋飞正传的情节,并解决一些推理问题。下一个词的预测如何带来这些惊人的能力,这真的非常了不起。

“但你必须始终记住,它所做的与其说是找到问题的正确答案,不如说是找到一个合理的答案,”Ramakrishnan强调说。其内容可能与事实不符、不相关、有毒、有偏见或令人反感。

这给用户带来了负担,以确保输出正确、相关且对手头的任务有用。“你必须确保有某种方法可以检查其输出是否有错误,并在它发出之前修复它们,”他说。

Ramakrishnan补充说,正在进行深入研究,以寻找解决这些缺点的技术,他希望许多创新工具能够做到这一点。

为 LLM 寻找合适的公司角色

鉴于LLM的惊人进展,业界应该如何考虑将该软件应用于生成内容等任务?

Ramakrishnan建议,首先,考虑成本:“与创建整个草稿相比,修改草稿的成本要低得多吗?其次,如果LLM犯了一个溜走的错误,错误的内容被发布给外界,你能承受后果吗?

Ramakrishnan说:“如果你有一个同时满足这两个考虑因素的应用程序,那么最好做一个试点项目,看看这些技术是否真的可以帮助你完成特定的任务。他强调需要将试点视为一个实验,而不是一个普通的IT项目。

目前,软件开发是最成熟的企业LLM应用。“ChatGPT 和其他 LLM 是文本输入、文本输出,而软件程序只是文本输出,”他说。“程序员可以从英语文本输入到Python文本输出,也可以从英语到英语或英语到德语。有很多工具可以帮助你使用这些技术编写代码。

当然,程序员必须确保结果正确地完成工作。幸运的是,软件开发已经提供了用于测试和验证代码的基础设施。“这是一个美丽的甜蜜点,”他说,“让技术为你编写代码要便宜得多,因为你可以非常快速地检查和验证它。

LLM 的另一个主要用途是内容生成,例如撰写营销文案或电子商务产品描述。“同样,修复 ChatGPT 的草稿可能比你写整个东西便宜得多,”Ramakrishnan 说。“但是,公司必须非常小心,以确保有一个人在循环中。

LLM 作为搜索企业文档的内部工具也正在迅速普及。与传统的搜索算法不同,LLM 聊天机器人可以提供对话式搜索体验,因为它会记住您提出的每个问题。“但同样,它偶尔会弥补一些事情,”他说。“就面向外部客户的聊天机器人而言,现在还处于非常早期的阶段,因为存在对客户说错话的风险。”

总体而言,Ramakrishnan指出,我们生活在一个非凡的时代,以应对人工智能快速发展的潜力和陷阱。他说:“我帮助公司弄清楚如何利用这些变革性技术并将它们付诸实践,使产品和服务更加智能,员工的工作效率更高,流程更高效。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2023/generating-opportunities-generative-ai-rama-ramakrishnan-1102