《AI与你:纽约市长并不会真的讲普通话,AI的资金流向,谁制定规则》

《人工智能与你:揭秘纽约市长不会真的会说普通话的秘密,AI资金的流向由谁掌控规则?》

我在采访中经常问人们一个问题,那就是他们想要看到什么样的科技发明。受欢迎的要求包括传送装置,可以即刻从一个地方到另一个地方;克隆技术,这样他们就可以同时在两个地方;还有一个能够做家务事的人工智能机器人/智能助手,可以像《宇宙飞船杰森一家》中的罗茜那样,管理日程安排并回答复杂问题,就像《复仇者联盟》中的贾维斯那样。

但是每当有人问我想要什么科技的时候,我总是说“通用翻译器”,它可以让你理解和说任何语言。

在过去一年中,人工智能成为大事,ChatGPT在手机上推出,那个热爱《星际迷航》的我欢迎这个版本的通用翻译器。我为朋友将电子邮件翻译成其他语言(包括克林贡语和辛达林语),并且有人为我将文本从希腊语翻译成其他语言。现在有了AI语音技术,你不仅可以将任何东西翻译成文本,还可以用你的声音说出来,翻译成其他语言。相当酷炫,对吧?

当然,做到这种程度的关键是透明性-告诉接收者这些话是你的,但是说话的声音不是你的,这样你就不会让他们误以为你学会了另一种语言。而这也似乎是纽约市市长埃里克·亚当斯上周犯错的地方。

亚当斯及其技术团队利用ElevenLabs的AI语音翻译工具,以多种语言通过城市的群呼系统发送信息。据The City新闻服务报道,他表示这部分是为了应对纽约法律的要求,“大多数公共机构都需要有一个’语言服务协调员’,并提供100种语言的’电话口译’。它还要求将重要文件和直接服务翻译成10种语言:阿拉伯语、乌尔都语、法语、波兰语、西班牙语、汉语、俄语、孟加拉语、海地克里奥尔语和韩语。

亚当斯通过群呼电话“向400多万纽约市民传达信息,并向人们发送了数千条西班牙语、250多条意第绪语、160多条普通话、89条粤语和23条海地克里奥尔语的电话”,市长的发言人告诉记者。

“人们经常在街上拦住我,说:‘我不知道你会说普通话,你知道吗?’”亚当斯根据美联社的报道说。“我们使用的群呼电话,我们使用不同的语言直接与纽约市多样化的民众交流。”

问题是:他没有透露使用了人工智能来使他的发音像母语者一样。这引起了一些伦理学家的不满。“市长正在制作自己的深度伪造”,监控技术监督项目的执行主任艾伯特·福克斯·卡恩告诉美联社。“这是非常不道德的,特别是用纳税人的钱。使用人工智能让纽约市民相信他会说一些他不懂的语言是很奥威尔式的。是的,我们需要用纽约市民的母语进行通告,但是利用深度伪造只是一项令人毛骨悚然的虚荣心项目。”

至于亚当斯本人,他对伦理问题不屑一顾,并告诉记者,他只是想与他的多样化选民沟通。“我只有一件事要做:我必须管理好这个城市,我必须能够用他们理解的语言和人们交流,我很愿意这样做。”亚当斯根据美联社的报道说。“对于一切,我只能说‘你好’。”

对于亚当斯,我只想说:“ghoHlaHchugh Hutlh纽约市政府负责人,Hoch tlhInganpu’ je jatlhlaHbe’chugh QaQ yIn ‘e’ chaw’。”这是克林贡语,意思是“告诉纽约居民,你正因为AI的语音翻译技术与他们交流。”

以下是 AI 领域的其他新动态,值得关注。

Meta 称监管将抑制创新,AI 仍然不如你家猫聪明

Meta 的首席 AI 科学家 Yann LeCun 警告称,对 AI 进行监管的努力将是“适得其反”的,因为这些法律只会“加强大型科技公司的主导地位,扼杀竞争”,据《金融时报》本周报道。LeCun 认为,大型 AI 制造商(包括 OpenAI、Google 和 Microsoft 等公司)希望以“AI 安全”的名义获得监管控制。

相反, LeCun 认为像 Meta 这样的公司,其 「开源了 LLaMA 生成 AI 大型语言模型」 — 无法与大型科技公司竞争,后者在市场上拥有显著的头部优势。他告诉 FT,「类似于控制快速发展的技术的必要性的论点… 在互联网开始时也产生了,但只有因为它仍然是一个开放的、分散的平台,这种技术才得以繁荣。」

LeCun 承认一些监管努力的背后是对 AI 可能破坏人类的担忧。但他称这些担忧「荒谬」,并表示现今的 AI 系统 「仍然没有像猫一样聪明」。虽然未来机器在某些领域将比人类更聪明,但 LeCun 认为这没关系,因为科技将帮助人们解决复杂的问题。

LeCun 告诉 FT:“问题是:这是令人害怕还是令人兴奋?”「我认为这是令人兴奋的,因为这些机器将按我们的意愿行事。它们将处于我们的控制之下。」

我们希望如此。

让普通人为 AI 聊天机器人制定规则

尽管 LeCun 的警告,美国和全球各地的监管机构正在就如何监管生成 AI 进行讨论。与此同时,Anthropic(Claude 的开发者)正在尝试不同的做法:征求普通人帮助编写其 AI 聊天机器人的规则。

据纽约时报报道,它的 AI 治理实验被称为「集体宪法 AI」,扩展了这家总部位于旧金山公司早期工作的内容,旨在创造「依赖书面原则的大型语言模型训练方式」。「它旨在为聊天机器人提供明确的指示,以处理敏感请求,明确哪些主题是禁止的,并如何符合人类价值观。」

有很多批评指向 AI 领导者们决定发布他们的技术 — OpenAI 的 ChatGPT 于 2022 年 11 月首次面市 — 「未首先考虑将强大工具提供给数百万人所引发的影响」。纽约时报提醒我们,就目前而言,开发 AI 引擎的一小群公司领导者是他们的 LLM 如何运作的唯一决策者,「基于他们的个人伦理、商业激励和外部压力的某种组合。对这种权力没有任何限制,普通用户也无法参与其中。」

Anthropic 在其于 10 月 17 日发布的「集体宪法 AI」背景介绍中表示,它邀请了一个由 1,000 名美国人组成的人口多样化群体来「起草一个 AI 系统的宪法」。Anthropic 补充说,治理 Claude 的当前宪法由公司员工策划,并基于包括「联合国《宪章》」在内的外部来源。

您可以阅读该草案宪法以及 Anthropic 对其称之为「不完美」而且仍在积极进行的过程的发现。虽然公共宪法与 Anthropic 的书面宪法之间有 50% 的概念和价值重叠,但公司指出存在关键差异。

「公共宪法中的原则似乎主要是自成一体的,而非来自现有的出版物,它们更注重客观性和公正性,更加强调可访问性,整体上更倾向于提倡期望的行为,而非避免不希望的行为。」

最终,Anthropic 表示「我们正在努力找到一种由许多第三方共同制定的宪法的方式,而不是由在旧金山实验室工作的人来制定。」Anthropic 的政策负责人杰克·克拉克告诉纽约时报。

追随金钱 — 它引领着 AI

预计全球各地的公司将在 2023 年花费 160 亿美元用于生成 AI 技术,市场研究公司 IDC 预测这个数字将在四年内激增至 1430 亿美元。

“生成AI不仅仅是一个短暂的趋势或简单的炒作。它是一项具有深远影响和商业影响的变革性技术。”IDC全球人工智能和自动化研究组副总裁Ritu Jyoti表示。“在实施道德和负责任的前提下,生成智能将重塑行业,改变我们工作、娱乐和与世界互动的方式。”

与此同时,Activate Consulting在其204页关于技术和媒体状况的分析中提供了三个有关人工智能的有趣数据点。该报告可在此处以PDF格式获取。

该公司发现,现在有1300万人通过AI服务开始网页搜索。在四年内,Activate预测这一数字将上升到9000万。这与其他人的预测相吻合,即搜索引擎需要发展,这解释了为什么谷歌和微软正在大力投资更新各自的搜索产品。

在人们使用人工智能的方式方面,Activate称有30%的消费者使用人工智能工具进行写作,25%的人使用它进行内容创作,22%的用户求助于人工智能进行自助,20%的人现在将人工智能作为个人助手使用。

至于风险投资对人工智能公司的兴趣,Activate的数据显示,与去年相比,人工智能投资增长了181%,而投资其他领域的风险投资额下降了42%。

OpenAI的Dall-E 3生成AI可以创造出如此奇幻的图片。

Stephen Shankland/CNET

Dall-E 3生成更多色彩丰富的图片

OpenAI本周向付费客户发布了其Dall-E 3 AI图像技术,这一新的AI模型旨在更好地理解您的文本提示在转化为图像之前的含义。它也旨在产生更详细的图像,并回避模仿生活艺术家风格的法律风险。

“在我的测试中,我发现Dall-E 3相比于2022年的Dall-E 2有了很大的进步。图像更生动、更详细,经常令人娱乐。”Shankland说。“而且它们更具说服力,减少了分散注意力的怪异情况。新的提示放大技术可以使图像更引人注目,但如果你不想把音量调到极致,有时也会走得太远。”他补充道。

“我们希望该模型能够更深入地理解自然语言。”OpenAI研究人员之一Gabriel Goh说。Shankland解释说,这个想法是“更好地解释短语和描述,例如理解您想要在场景中的男人上有胡子,女人上有红发。此外,按照ChatGPT更具对话性的界面的要求,您可以要求进行后续的改进,比如‘现在在加上一个浅绿色的迷幻背景’,Dall-E 3将更新其先前的输出。”

通过Dall-E 3,图像生成系统直接嵌入在OpenAI的热门AI对话机器人ChatGPT中。Dall-E可以以每月20美元的价格提供给消费者。

10秒的声音片段可以检测出2型糖尿病

在由Klick Labs与Mayo Clinic合作的一项新研究中,研究人员使用智能手机的语音录音创建了一个人工智能模型,旨在帮助识别可能患有2型糖尿病风险的人。

Klick Labs要求267人每天六次通过智能手机录制一个6至10秒的短语,并持续两周。科学家们使用这些语音数据,以及每个人的基本健康数据,如年龄、身高和体重,分析了18000次录音,并确定了“14个反映非糖尿病患者和2型糖尿病患者之间差异的声学特征”。

他们还指出这些声音差异 “男女表现方式不同”,研究人员称AI模型对女性的准确率为89%,男性为86%。

这有什么了不起的? Klick指出,全世界有将近一半,即2.4亿患有糖尿病的成年人,甚至不知道自己有这种病,而近90%的糖尿病病例是2型糖尿病。Klick实验室的研究科学家Jaycee Kaufman说:”目前的检测方法可能需要大量时间、旅行和费用”。”语音技术有潜力完全消除这些障碍”。

解读古卷轴

肯塔基大学的计算机科学家Brent Seales在将新AI技术与CT扫描中使用的技术相结合后,使学者们能够解读一卷将近两千年的脆弱帕皮鲁斯卷轴中的一个词。

《纽约时报》报道道,赫库兰尼姆卷轴上只有”几个字母和一个单词:porphyras,古希腊语中的 ‘purple’(紫色)”。这卷轴来自1752年发掘庞贝附近一座别墅的工人发现的约800卷,后来这些卷轴被火山泥浆埋在了维苏威火山79年的喷发之后。

《时报》称:”与许多含有金属的古代墨水不同,赫库兰尼姆文书的墨水是由木炭和水制成的,与其所处的炭化帕皮鲁斯几乎无法区分”,他们形容这些卷轴看起来像块煤。《时报》还说:”通过对Seales博士技术不断改进,最新使用AI来帮助区分墨水和纸草的技术,这些卷轴至少开始产生一些字母”。

如果你觉得这很酷,你可以在Vesuvius Challenge这里找到更多专家发现的信息。

本周AI词汇:调整

考虑到将AI制定规则的讨论,本周的词汇强调了对AI模型进行微调的需求,这个过程被称为 “调整”。以下是这个概念的定义,摘自CNBC的AI术语表。

“调整:调整AI模型以产生其创建者所期望的输出。在短期内,调整指的是构建软件和内容的调节工作。但它也可以指涉更大范围、仍然理论性的任务,即确保任何人工智能(AGI)友好地对待人类。

举例:“这些系统将要调整得符合什么——是谁的价值观,界限是什么——这些由整个社会、政府设定。因此,创造数据集,我们的调整数据集,可能是一个人工智能宪法,无论是什么,都必须广泛来自社会,” OpenAI首席执行官Sam Altman在参议院的听证会上说。

编者按:ENBLE正在使用AI引擎来帮助创作一些故事。更多信息,请参见这篇文章。