数百万工人只赚几毛钱的代价在为人工智能模型进行培训

数百万工人只赚几毛钱的代价在为人工智能模型训练付出

在2016年,Oskarina Fuentes从一个朋友那里得到了一个看起来太好以至于让人觉得不可思议的提示。她在委内瑞拉的生活已经变得艰难:在总统尼古拉斯·马杜罗的领导下,通货膨胀率已达到800%,26岁的Fuentes没有稳定的工作,只能借助多个副业来维持生计。

她的朋友告诉她有关Appen的事情,这是一家澳大利亚数据服务公司,正在寻找众包工人为人工智能算法标记训练数据。大多数互联网用户都会进行某种形式的数据标注:为在线验证码识别交通灯和公交车的图像。但是,为了训练能够通过法律考试、在几秒钟内创建奇幻图像或移除社交媒体上有害内容的新型机器人的算法,需要使用世界上最便宜的劳动力市场上的零工经济工作者标记的数据集包括图像、视频和文本。

Appen的客户包括亚马逊、Facebook、谷歌和微软,该公司的100万名贡献者只是一个庞大而隐秘的行业的一部分。根据咨询公司Grand View Research的数据,全球数据收集和标注市场在2022年价值22.2亿美元,并预计到2030年将增长到171亿美元。随着委内瑞拉陷入经济灾难,像Fuentes和她的朋友这样接受过大学教育的委内瑞拉人加入了Appen等众包平台。

有一段时间,这是救命稻草:Appen意味着Fuentes可以在家工作,任何时间都可以。但是然后停电开始了——断电持续数天。在黑暗中,Fuentes无法接任务。“我再也受不了了,”她说,用西班牙语说。“在委内瑞拉,你不是活着,你只是为了生存。” Fuentes和她的家人移民到了哥伦比亚。如今,她与她的母亲、祖母、叔叔和狗一起住在安提奥基亚地区的一间公寓里。

Appen仍然是她唯一的收入来源。Fuentes说,任务的报酬范围是2.2美分到50美分。通常,一个半小时的工作可以赚1美元左右。当有足够的任务可以工作一个完整的星期时,她每月大约能挣到280美元,几乎达到了哥伦比亚的最低工资标准285美元。但是填满一个星期的任务很少见,她说。她说,近来出现的闲置天数不会带来超过1到2美元的收入。Fuentes每天在床上用笔记本电脑工作,每天超过18小时,以便随时抢到可能随时到来的任务。考虑到Appen的国际客户,工作开始于任务发布时,这可能意味着凌晨2点开始。

这是发展中国家中正在重复的一种模式。在东非、委内瑞拉、印度、菲律宾,甚至肯尼亚的难民营和黎巴嫩的沙蒂拉难民营中,标注热点地区提供了廉价劳动力。工人们在Appen、Clickworker和Scale AI等平台上以几分钱的价格接任务,或者在实体数据中心(如肯尼亚内罗毕的Sama拥有3000名员工的办公室)签订短期合同,这引发了《时代》杂志对内容审核人员剥削的调查。数字劳动市场中的劳动力市场作者Florian Schmidt说,这些地方的人工智能繁荣并非巧合。“这个行业可以灵活地迁移到工资最低的地方,”他说,而且比如纺织品制造商可以更快速地做到。

一些专家将Appen等平台视为一种新形式的数据殖民主义,东北大学公民AI实验室主任Saiph Savage说。“拉美地区的工人正在为图像进行标注,而这些被标注的图像将用于北方国家的人工智能,”她说。“虽然这可能创造了新型的工作,但对于该地区的工人来说,这些工作的满足程度并不完全清楚。”Schmidt说,在AI的目标不断变化下,工人们与技术处于不断的竞争。“一个劳动力被训练得可以精确地在汽车周围放置三维识别框,突然之间又要找出一个大型语言模型是否给出了适当的答案,”他说,这涉及到行业从自动驾驶汽车转向聊天机器人。因此,专业的标注技能具有“非常短暂的半衰期”。

“从客户的角度来看,对于微任务中的工人来说,不可见性并非错误,而是一种特征,”Schmidt说。在经济上,由于任务非常小,与其单独处理承包商,与其作为一个群体处理更为可行。这创造了一种没有面对面解决纠纷的非正规劳动力行业,比如当客户认为他们的答案不准确或者工资被扣留时。

ENBLE采访的工人表示,低费用并不是关键问题,而是平台支付方式。福恩特斯说:“我不喜欢不知道什么时候会有任务的不确定性,这迫使我们整天坐在电脑前。”她希望能获得在屏幕前等待的额外补偿。来自巴基斯坦的18岁的穆特迈因(Mutmain)请求不使用姓氏,并表示同样的观点。他说自己15岁加入Appen,并使用家人的身份证,在早上8点到下午6点工作,然后再从凌晨2点到6点工作。“我需要随时都待在这些平台上,以免失去工作机会,”他说,但他很难每月赚到超过50美元。

他表示,他只能获得在平台上输入信息所花费的时间的补偿,这低估了他的劳动力。例如,与社交媒体相关的任务可能支付每小时一两美元,但该费用并不考虑在线上额外的研究时间。“为了完成实际上只相当于一小时工作的任务,需要工作五六个小时,赚到2美元,”他说。“在我看来,这就是数字奴隶制。”Appen的发言人表示,公司正努力减少寻找任务的时间,但平台必须在为客户提供快速完成的任务和确保贡献者具有稳定工作流之间“谨慎平衡”。

福恩特斯现在与其他委内瑞拉的Appen工人在Telegram聊天群中交流建议和诉求,这是他们的一种Slack频道或水冷却替代品。在完成Appen任务七年后,福恩特斯表示,她和同事们希望被视为他们为算法进行训练的技术公司的雇员。但在AI标注的竞争中,年长合同和福利都不在视野范围之内。与此同时,她希望看到该行业实现工会组织。“我希望他们不仅将我们视为工具,当我们不再有用时被抛弃,而是将我们视为帮助他们技术进步的人类,”她说。

本故事刊载于2023年11月/12月的ENBLE UK杂志。