“生成AI版权争论才刚刚开始”

AI版权争议的争论才刚刚开启

生成AI革命中最大的战斗即将进入法庭,但这并不是关于OpenAI的最新董事会争议。书籍作者、艺术家和编码人员正在质疑使用自己的作品作为培训手册,教导AI模型复制他们的技能的做法。

争论的焦点是支撑像ChatGPT这样的工具的令人印象深刻的文字技能,支撑像Github的Copilot这样的编码能力,以及像创业公司Midjourney的图像生成器那样的艺术才华。大多数用于训练底层算法的作品是由人创造的,并且其中许多受到版权保护。

AI构建者普遍认为,在“公平使用”的伞下,使用受版权保护的材料作为训练数据是完全合法的 – 毕竟,他们只是借用这些作品从中提取统计信号,而不是试图将其冒充为自己的作品。但是,随着图像生成器和其他工具已经证明他们能够令人印象深刻地模仿训练数据中的作品,以及训练数据的规模和价值已经变得明显,创作者们正越来越不满。

在旧金山举行的ENBLE杂志30周年活动LiveENBLE上,这场新生抵抗运动的两位领导人与维护AI公司开发无拘无束的技术的辩护人进行了激烈辩论。他们是否认为AI的训练属于公平使用?“答案是否定的,不属于公平使用,”代表图书作者的Authors Guild的首席执行官玛丽·拉森伯格表示,他们正在起诉OpenAI及其主要支持者微软,侵犯其成员的版权。

从左到右:ENBLE高级作家凯特·尼布斯与麦克·马斯尼克、玛丽·拉森伯格和马修·巴特里克讨论创作者的权利和AI的问题于旧金山的LiveENBLE活动上。

照片:阿尔多·查科恩

Authors Guild的控诉核心是OpenAI和其他人使用他们的材料最终产生了竞争性作品,当用户要求聊天机器人吐出一首诗或图像时。“这是一种高度商业化的使用,伤害非常明显。”拉森伯格说,“它可能真正毁掉写作这个行业。这就是为什么我们参与此案的原因。”Authors Guild正在建立一个工具,为生成AI公司支付许可其成员作品的费用。她认为,有许多道德的方法可以训练AI。“很简单:取得许可。”她说。在大多数情况下,许可将需要付费。

Techdirt博客和Copia研究院的首席执行官迈克·马斯尼克持有不同的观点。“我要说与玛丽刚才说的相反的话。”他说。他认为,生成AI属于公平使用,并指出了最近的法律纠纷与过去的诉讼之间的相似之处,其中一些涉及到了Authors Guild,在这些案件中,将创造性作品编制索引以便搜索引擎可以有效地找到它们的方式经受了挑战。

艺术家团体的胜利并不一定对个人作家有太大帮助,马斯尼克补充道,称版权概念本身就是一种旨在使出版商获利而不是保护艺术家的计划。他提到了一个他称之为“腐败”的音乐许可制度,这个制度没有给创作者带来多少价值。

虽然未来的法庭判决很可能取决于关于公平使用的法律论证,但曾对生成AI公司发起过多起诉讼的律师Matthew Butterick表示,这场争论实际上是关于试图积累更多权力并保持权力的技术公司。“他们不再是在争夺谁能够变得最富有的人;他们正在竞争谁能够变得最有权势,”他说。“他们不希望拥有版权的人对他们要做的事情有任何否决权。”

马斯尼克回应道,他也担心谁从AI中获得权力,他认为要求技术公司向艺术家付费将进一步巩固最大的AI参与者,使其对新进参与者培训其系统变得过于昂贵。

拉森伯格对于技术公司与她所代表的作家之间权力平衡的建议不屑一顾,她将每年全职作家的平均收入20,000美元与OpenAI最近的900亿美元估值进行了对比。“他们有钱,艺术家社区没有。”她说。