谷歌的双子座是生成人工智能繁荣的真正开始

谷歌的双胞胎车是人工智能繁荣的真正的开端

人工智能的历史一直被所谓的“AI寒冬”所打断,当技术陷入僵局,资金枯竭时。每一次都伴随着声称让机器真正变得智能对于人类来说实在是太难了。

谷歌的Gemini发布被宣称为一种全新的AI模型,也是该公司迄今为止最强大的AI,这意味着新的AI寒冬不会很快到来。实际上,尽管自从ChatGPT发布以来的12个月是AI的一个里程碑年,但我们有充分的理由认为当前的AI繁荣只是刚刚开始。

OpenAI在2022年11月推出了所谓的“低调研究预览”ChatGPT时,并没有太高的期望。它只是对其文本生成大型语言模型(LLMs)的新界面进行了测试。但是这个聊天机器人能够做 such 一系列的事情,从合成论文和诗歌到回答编码问题,令许多人感到印象深刻和紧张,并引起了技术行业的热情。当OpenAI将其新的GPT-4 LLM添加到ChatGPT中时,一些专家如此疯狂,以至于他们真的恳求该公司放慢速度

今天报名

ENBLE’s Fast Forward newsletterWill Knight

证据已经很少有人注意到这个警报。现在谷歌已经提高了赌注,而且也可能改变了游戏规则,通过宣布Gemini。

谷歌早些时候已经匆忙推出了对ChatGPT的直接响应形式是Bard,终于推出了它之前开发但选择保密的LLM聊天机器人技术。通过Gemini,谷歌声称开创了一种超越以文本为主的LLMs的新时代,可能为ChatGPT所能实现的AI产品打开了新一轮的显著不同。

谷歌称Gemini为“本质上的多模式”模型,这意味着它可以从除了文本以外的数据中学习,还可以从音频、视频和图像中获取见解。ChatGPT展示了如果提供足够的文本,AI模型可以从中学习到关于世界的大量信息。一些AI研究人员认为,仅仅扩大语言模型的规模将使其能力提升到与人类相媲美的程度。

但是通过人们编写的文字过滤器,你所能了解到的关于物质实际的知识是有限的,而GPT-4等LLMs的难以消除的局限性,如虚幻信息、推理不当和奇怪的安全漏洞,似乎表明扩展现有技术是有限的。

在昨天的Gemini发布会前,ENBLE和负责Gemini开发的执行官Demis Hassabis进行了交谈,他之前的成就包括领导开发超级人类级别的围棋AI AlphaGo的团队。他对Gemini毫不吝啬地赞赏,并声称Gemini引入了新的能力,最终将使谷歌的产品脱颖而出。但Hassabis还表示,为了开发出能够像今天的聊天机器人那样理解世界的AI系统,LLMs需要与其他AI技术相结合。

Hassabis正在与OpenAI展开激烈竞争,但这两家公司似乎都认同需要采取激进的新方法。OpenAI正在进行一个名为Q*的神秘项目,这表明该公司也在探索不仅仅是扩大类似GPT-4的系统的规模的想法。

这与OpenAI CEO Sam Altman在MIT的四月发表的言论一致,当时他明确表示,尽管ChatGPT取得了成功,但人工智能领域需要一个新的重要想法来取得重要的进展。“我认为我们已经到了这个时代的尽头,在这个时代,不再是这样的庞大模型了,”Altman说。“我们会通过其他方式让它们变得更好。”

谷歌可能刚刚展示了一种能够超越ChatGPT的方法。但也许Gemini发布的最显著信息是,谷歌正着力追求比今天的聊天机器人更重要的目标——就像OpenAI似乎也在追求的一样。