高通的“圣杯”:生成式人工智能即将来到手机上

Qualcomm's Holy Grail Generative Artificial Intelligence Coming to Mobile Phones Soon.

ChatGPT和Midjourney等生成式人工智能让人们惊叹不已,也颠覆了行业,但它们的首次亮相主要限于桌面计算机上的浏览器窗口。明年,一旦配备高通顶级芯片的高端手机上市,您将能够随时随地使用生成式人工智能。

多年来,手机一直在使用人工智能来修饰照片和改善自动校正,但生成式人工智能工具可能为移动体验带来更高级别的增强。高通正在将生成式人工智能集成到其下一代高端芯片中,这些芯片计划于十月底在夏威夷举行的高通峰会上首次亮相。

峰会与会者将首次亲身体验生成式人工智能为手机带来的改变,但高通产品管理高级副总裁Ziad Asghar向ENBLE解释了为何用户应对设备上的人工智能感到兴奋。首先,将用户的数据(驾驶模式、餐厅搜索、照片等)集中在一个地方,使手机中由人工智能生成的解决方案比基于云的生成式人工智能的一般响应更加个性化和有帮助。

“我认为那将是终极目标,”Asghar说。“这是使我们对这项技术的发展非常兴奋的真正承诺。”

在设备上使用生成式人工智能还有其他优势。最重要的是,查询和个人数据搜索是保密的,不会通过远程服务器中继。使用本地人工智能也比等待云计算更快,而且可以在飞机上或其他没有手机服务的区域工作。

但设备上的解决方案也具有商业和效率上的优势。正如高通上个月在一份白皮书中解释的那样,随着机器学习模型的复杂性越来越高(从数十万个参数到数十亿个参数),运行回答查询的服务器成本也越来越高。今年四月,OpenAI估计每天花费约70万美元来让ChatGPT回答提示,而这个成本预测是基于旧版的GPT-3模型,而不是更复杂且可能更昂贵的GPT-4模型。高通的解决方案是让设备现有的硅脑做所有需要的思考工作,而无需额外费用。

“在您的手机上运行人工智能实际上是免费的 – 您预先支付了计算能力的费用,”Techsponential分析师Avi Greengart在电子邮件中告诉ENBLE。

Greengart在二月份的移动世界大会上亲眼目睹了高通的设备上生成式人工智能的展示,他使用一台配备骁龙8第2代芯片的安卓手机来运行图像生成软件Stable Diffusion。尽管这只是一个早期演示,但他认为它非常令人兴奋。

一款骁龙8第2代芯片。

David Lumb/CNET

设备上的生成式人工智能为用户提供了什么

高通对基于手机的生成式人工智能有许多想法,可以改善从生产力任务到观看娱乐和创作内容的各个方面。

正如Stable Diffusion演示所展示的那样,设备上的生成式人工智能可以让人们在命令下调整图像,比如要求其更改背景以将您放在威尼斯的运河前,Asghar说。或者他们可以让其生成一张全新的图像 – 但这只是个开始,因为文本和视觉大型学习模型可以相继工作,从一个想法流向一个准备好的输出。

Asghar表示,使用多个模型,用户可以通过自动语音识别将其语音转换为文本,然后将其输入到图像生成器中。进一步发展,让手机渲染出一个人的脸部,使用生成式人工智能制作逼真的口部动作并使用文本转语音回答您,这样您就拥有了一个可以进行全面对话的生成式人工智能助手。

这个具体的例子可能部分由第三方人工智能提供支持,例如Facebook母公司Meta最近与微软合作推出的大型语言模型Llama 2,以及高通。

高通在新闻稿中表示:“[Llama 2]将允许客户、合作伙伴和开发人员构建智能虚拟助手、生产力应用、内容创作工具、娱乐等用例。这些由Snapdragon提供支持的新的设备上人工智能体验可以在没有连接性的区域甚至在飞行模式下工作。”

高通总部的预约博物馆里摆满了复古手机

高通不会将这些功能限制在手机上。在即将举行的峰会上,公司计划宣布用于个人电脑和汽车的生成式人工智能解决方案。那个个人助理可以帮助您处理待办事项、安排会议和发送电子邮件。如果您被困在办公室外需要进行演示,Asghar表示,人工智能可以生成一个新的背景,这样看起来就不像您坐在车里,并且还可以打开幻灯片(甚至帮助演示)。

“对于我们这些从小看《神探奇兵》长大的人来说,现在KITT将成为现实,”Asghar说道,他指的是该电视节目中标志性的智能车。

无论是哪个平台,核心生成式人工智能解决方案将存在于设备上。它可以帮助处理办公室繁琐的工作,例如自动从电话中生成笔记,并创建一个总结其关键要点的五张幻灯片(“这就像是克利伯,但是更强大,对吧?”Asghar说)。或者它可以从头开始制作AR和VR中的数字世界。

除了幻想世界,生成式人工智能还可以帮助盲人在现实世界中导航。Asghar描述了这样一种情况,即图像到三维图像到文本到语音模型的交接可以使用手机的摄像头识别用户是否在十字路口,并告知他们何时停下来,以及从哪个方向有多少辆车驶来。

在教育方面,生成式人工智能可以通过网络摄像头或手机的摄像头来评估学生对教学课程的吸收情况,例如通过跟踪他们的表情和身体语言。然后,生成式人工智能可以根据每个学生的优点和缺点量身定制教材,Asghar推测。

这些都是高通的预测,但第三方将不得不决定如何最好地利用这项技术来改进他们自己的产品和服务。对于手机来说,一旦与移动应用程序集成,生成式人工智能可能会对定制游戏体验、社交媒体和内容创作产生真正的影响,Techsponential的Greengart表示。

在应用程序制作者手中拥有生成式人工智能技术进行调整和集成之前,很难确定这对用户意味着什么。根据目前人工智能如何帮助人们的情况,我们可以更容易地推断出它可能做什么。Recon Analytics的分析师Roger Entner预测,生成式人工智能将有助于修复低质量照片的缺陷,为社交媒体生成滤镜,并改进自动更正等问题。

“生成式人工智能在这里创造了一种使用质量的改进,我们很快会认为这是理所当然的,”Entner在电子邮件中告诉ENBLE。

一颗封装在红色圆盘中的骁龙8代2芯片,放在用于测试芯片生产的装置前面。

David Lumb / ENBLE

生成式人工智能将首先进入高端手机

当前的生成式人工智能解决方案依赖于大型服务器群来处理大规模的查询,但高通相信其设备上的芯片可以处理单用户的需求。在Asghar的实验室中,公司的芯片处理了具有70亿个参数的人工智能模型(评估数据并改变其输出的语调或准确性的方面),这远低于OpenAI的GPT-3模型的1750亿个参数,该模型驱动了ChatGPT,但应该适合移动搜索。

“我们将能够在[Hawaii]峰会上展示设备上的运行情况,”Asghar说。

演示设备可能会搭载高通的下一代顶级芯片,预计将在明年的高端安卓手机上使用的骁龙8代3芯片。在2023年MWC上运行稳定扩散的演示设备使用的是去年在夏威夷举行的骁龙峰会上宣布的骁龙8代2芯片。

在手机几乎在一天内就需要充电之前就无法持续使用的时代,还存在着在一天中频繁使用生成式人工智能会更快地耗尽电池的担忧。我们将不得不等待现实世界的测试来看手机如何实施和优化这项技术,但Asghar指出,2023年MWC的演示设备整天为与会者处理查询,并没有耗尽电池,甚至没有变得发热。他相信高通的芯片在功耗上有着独特的能力,生成式人工智能主要运行在骁龙芯片的Hexagon处理器和神经处理单元上,功耗非常低。

“我认为对于那些没有专门硬件来进行这种处理的人来说,会有担忧,”Asghar说。

Asghar认为,明年搭载高通芯片的高端安卓手机将能够使用生成式人工智能。但是,这需要一些时间才能在更便宜的手机上普及。就像当前手机上用于清理图像、音频和视频的AI辅助功能,在高端产品线中表现最佳,而在更便宜的手机上效果较差,生成式人工智能功能将会相对较低(但仍然存在),在高通芯片目录中,你所使用的芯片级别越低,功能也会相对较差。

“也许你可以在高端机型上做一个100亿以上参数的模型,而在更低一级的机型上可能会比这个少,如果你在更低一级以下,可能会更少,”Asghar说。“因此,这些体验将会逐渐降级,但它们也将扩展到其他产品中。”

与5G一样,高通可能是首个具备生成式人工智能的新技术,但不会是最后一个。苹果一直在悄悄改进其设备上的人工智能,软件高级副总裁Craig Federighi在世界开发者大会后的交流中指出,他们采用了更强大的变压器语言模型来改善自动纠正功能。据报道,苹果甚至在内部测试其自己的“Apple GPT”聊天机器人。这家科技巨头据说正在开发自己的框架,以创建大型语言模型,以便在人工智能领域竞争,自从OpenAI在2022年末向公众发布ChatGPT以来,这个领域的竞争也越发激烈。

观看视频:

苹果的人工智能可能与谷歌的Bard AI和微软的Bing AI展开竞争,这两者今年都有进行有限测试。这些都是传统的“智能聊天机器人”模型的生成式人工智能增强软件,但它们有可能通过应用程序进入手机或通过Web浏览器访问。谷歌和微软已经将生成式人工智能集成到其办公软件平台中,因此用户很可能首先在Google Docs或Microsoft Office的移动版本中看到它们的努力。

但对于大多数手机用户来说,基于高通芯片的生成式人工智能可能是新技术的首个有影响力的应用。我们将不得不等待骁龙峰会,看看我们的移动体验可能在明年发生多大的变化。