“Meta的开源Llama打破了AI赛马的格局”

Meta's open-source Llama disrupts the AI horse racing landscape.

五月份,一位匿名的谷歌研究员对公司的未来表示担忧的备忘录在网上泄露。备忘录指出,当高管们为来自OpenAI的文本生成技术的竞争威胁争吵不休时,“开源软件正在悄悄吃掉我们的午餐。”

作为证据,备忘录引用了由Meta制作的大型语言模型Llama。最初,该模型只向研究人员发出邀请,但几天后就在4Chan上泄露出来,并迅速受到程序员的欢迎,他们对该项目进行了适应和扩展。在发布几周后,名为Alpaca和Vicuna的变种几乎和ChatGPT一样好,但足够灵活,可以在笔记本电脑上进行定制。“对社区的影响不容低估,”泄露的谷歌备忘录中写道,“突然间任何人都可以进行实验。”上周,Meta发布了其意外受欢迎的模型Llama 2的第二个版本。这次,它是开源的,并且从一开始就可以免费用于商业用途。Meta声称,与ChatGPT相比,新版本使用了比原版多40%的数据,并且使用该模型构建的聊天机器人能够产生与OpenAI的ChatGPT相当的结果。

与ChatGPT、谷歌的Bard和其他最近发布的生成式AI模型一样,Llama 2的创建成本可能高达数百万美元。但是,只有Meta的系统可以免费提供给开发人员、初创公司和其他有兴趣创建模型定制变体的人士。通过提供更便宜的选择,Meta的Llama 2使小公司或独立开发人员更容易创建新产品和服务,可能加速当前的人工智能热潮。

Meta不仅提供Llama 2,还得到了一些主要合作伙伴的支持,这些合作伙伴已经开始向客户提供该模型,包括人工智能初创公司Hugging Face、Databricks和OctoML。

投资了10亿美元的OpenAI的微软将向开发人员提供Llama 2的下载,供其在云端或Windows上使用。上周在面向微软客户的一次会议上,首席执行官萨蒂亚·纳德拉对开发人员能够在Meta的开源人工智能与OpenAI的专有产品并行使用表示兴奋。亚马逊的云计算部门AWS也提供对Llama 2的访问。

Meta的生成式AI副总裁Ahmad Al-Dahle拒绝透露第一个Llama模型泄露对公司新的Llama 2战略发挥了什么作用。

“如果回顾一下Meta的历史,我们一直是开源的强烈支持者,”他指的是开发人员在机器学习方面使用的流行工具PyTorch的例子。“建立一个围绕此类模型的社区的主要动机之一是,我们看到除了研究人员之外,还有需求来改进这些模型。” Al-Dahle表示,关于Llama 3的开发工作已经在进行中,但他不愿具体说明它将有何不同。

尽管Llama 2将Meta作为开源AI的领导者,但发布的各个方面并非都可以被称为开源。创建该模型所使用的训练数据在发布材料中仅描述为“公开可用的在线资源”,该公司不会提供有关模型创建的进一步细节。

Meta对Llama 2的许可证还要求拥有超过7亿月活跃用户的公司与Meta建立单独的许可协议。目前尚不清楚为什么有这个条款,但该条款对其他科技巨头在该系统上进行开发构成了一道障碍。该模型还附带了一项可接受使用政策,禁止生成恶意代码、宣扬暴力或促进犯罪活动、滥用或骚扰。对于如果Llama 2被违反该政策使用,Meta没有回答有关采取何种行动的问题。

西雅图Madrona Ventures的投资者Jon Turow表示,Meta从试图限制第一个Llama模型的分发转向开源第二个Llama模型,可以推动使用大型语言模型进行创造性的新浪潮。“开发人员和企业家非常足智多谋,他们将发现如何充分利用Llama 2,”他说。

Turow将Meta本月发布Llama 2的选择比作谷歌在2007年推出Android移动操作系统以与苹果的iOS竞争。通过提供一种便宜但功能强大的替代方案,Meta可以成为与OpenAI等专有系统相抗衡的力量,激发创新,并为改进Meta的产品和服务提供反馈。

据Hugging Face的人工智能研究员Nathan Lambert表示,Llama 2是第一个与ChatGPT相当的公开发布模型。他认为该项目并非真正的开源,因为Meta在其开发方面披露的信息有限,但他对社交媒体上看到的Llama 2变种的数量感到惊讶。一个例子是最新版本的WizardLM,这是一个类似于ChatGPT的AI系统,旨在按照复杂的指令进行操作。Hugging Face目前最热门的10个模型中有8个是Llama 2的变种,其中一些用于生成对话文本。

“我认为可以说Llama 2是人工智能领域今年最重要的事件之一,”兰伯特说道。他表示,尽管专有模型目前处于优势地位,但他相信Llama的后续版本将会迎头赶上,并且不久的将来能够完成人们今天通过ChatGPT来完成的大多数任务。

兰伯特还表示,Llama 2的发布仍然存在一些未解答的问题,部分原因是缺乏对训练数据的文档记录。而且,只有像Meta、Google、微软和OpenAI这样的主要参与者才拥有足够的计算资源和员工来打造领先的大型语言模型。

但他对于OpenAI专有方法的成功持有希望,认为语言模型正在进入一个透明的时代。白宫与七家主要人工智能公司之间的自愿协议要求在部署之前进行潜在的歧视、对社会或国家安全的影响等方面的测试。

这种趋势可能会面临日益增长的关于AI系统的法律责任和政治家们日益增加的监管压力的挑战,他们担心恶意行为者将开始使用开源模型。

与现在领导谷歌人工智能开发的AI研究员德米斯·哈萨比斯一样,图洛对泄露的谷歌备忘录中声称谷歌和其他主要人工智能公司受到开源人工智能的威胁的说法持不同意见。他认为数据、人才和计算能力的获取将继续保护最大的科技公司,但并不会使它们变得无敌。

他现在正密切关注初创公司和研究人员对Llama 2所做的工作,并期望他们能够迅速改进它,就像Meta模型的第一次迭代一样。他说,这将为初创公司和整个人工智能领域创造新的可能性。“我们看到开源不断变得越来越好,所以可能会有令人意外的情况打破早期的领导者,”图洛说。“我不知道会发生什么。”