解决生成式 AI 中的版权、补偿问题

view from behind a group of people walking on a well lit city street at night

卡内基梅隆大学研究人员最近的工作解决了创造新图像的生成人工智能模型的版权和补偿的棘手问题。

计算机科学学院生成智能实验室的一个团队与Adobe Research和加州大学伯克利分校合作开发了两种算法，以帮助生成AI模型在这些问题上采取重要步骤。第一种算法阻止这些模型生成受版权保护的材料，而第二种算法开发了一种在模型使用其作品生成图像时补偿人类创作者的方法。

图像生成模型（如 DALL-E 2、Midjourney 和稳定扩散）是从简单的文本描述创建逼真的视觉内容的强大工具。在幕后，这些模型在数百万到数十亿张互联网图像上进行了训练，其中一些可能是受版权保护的材料、许可图像和个人照片。

“作为该领域的研究人员，我们有责任解决随之而来的社会问题，”机器人研究所助理教授兼生成智能实验室负责人Jun-Yan Zhu（在新窗口中打开）说，该实验室正在努力解决与生成人工智能相关的伦理和社会问题。“创造解决这些问题的技术只是一个方面。我们还需要在立法和如何监管人工智能方面做更多的工作。

研究团队将在今年10月的2023年计算机视觉国际会议（在新窗口中打开）上发表两篇论文。

第一篇论文“文本到图像扩散模型中的消融概念（在新窗口中打开）”帮助AI生成模型避免创建特定的受版权保护的图像或样式。

例如，如果你向人工智能程序询问一位在世艺术家的画作，它将生成一个与该艺术家风格非常相似的图像。CMU研究人员提出的算法旨在防止这种情况，而是使AI模型生成通用绘画。

“当艺术家想要在任何时间点选择退出人工智能模型时，我们可以将其用作一种选择，”机器人学博士生，该论文的主要作者Nupur Kumari说。“它为那些不希望自己的图像被使用的人和公司创造了更多的控制和自由。

第二篇论文“评估文本到图像模型的数据归属（在新窗口中打开）”开发了一种补偿其数据用于训练AI的个人和公司的方法。该算法尝试确定每个训练图像对生成的图像的贡献程度。它可以用来公平地向人工智能数据库中受版权保护的图像的所有者分配付款。

例如，如果您要求AI模型生成水彩画的图像，则生成的图像将受到一些水彩画家的影响。这种新算法旨在量化每位艺术家对这件新合成艺术品的贡献。

“我们正在努力回答这个问题，’哪组图像影响了合成的图像？’”机器人学博士生、该论文的主要作者王胜宇说。“我们有可能使用这种算法为数据贡献者分配积分。最终，目标是公平地补偿那些为创建生成性人工智能做出贡献的数据所有者。

新算法仍处于开发的早期阶段，作者承认许多问题仍未得到解答。例如，目前还不清楚受版权保护的内容是否已完全删除或只是隐藏在某个地方，需要更多的研究来解释归因算法如何评估每个训练图像的影响。

尽管存在悬而未决的问题，但新算法为解决跨生成式人工智能平台的版权问题铺平了道路，并为补偿那些工作有助于人工智能图像的个人和公司迈出了第一步。

新闻旨在传播有益信息，英文版原文来自https://www.cmu.edu/news/stories/archives/2023/September/addressing-copyright-compensation