索尼人工智能提出解决计算机视觉偏见对黄色皮肤的新方案

Sony AI proposes new solution for addressing computer vision bias against yellow skin.

日本技术巨头索尼在最近的一篇论文中描述了一种可能的方法来衡量系统对某些肤色的偏见。

计算机视觉系统在准确检测和分析黄色肤色的个体方面一直存在困难。标准的菲茨帕特里克肤色类型刻度不足以充分考虑皮肤色调的变化,只关注从浅到深的色调。因此,标准数据集和算法在黄色肤色的人群上表现出降低的性能。

这个问题对某些族群,如亚洲人,影响较大,导致不公平的结果。例如,研究表明,西方生产的面部识别系统在亚洲人脸上的准确度较其他种族低。训练数据缺乏多样性是导致这些偏见的关键因素。

在这篇论文中,索尼人工智能研究员提出了一种多维度方法,用于测量图像中明显的肤色,以更好地评估计算机视觉系统的公平性。该研究认为,使用菲茨帕特里克肤色类型刻度来表征肤色的常见方法是有限的,因为它只关注从浅到深的肤色。相反,研究人员提出了同时测量感知亮度L*以捕捉肤色和色调角度h*以捕捉从红色到黄色的肤色的方法。该研究的主要作者威廉·汤解释道:

“虽然实用和有效,但将肤色简化为色调是有限的,因为肤色的构成复杂。[…] 因此,我们提倡使用多维度刻度来更好地表示图像中个体间明显的肤色变化。”

研究人员通过几个实验展示了这种多维度方法的价值。首先,他们展示了像CelebAMask-HQ和FFHQ这样的标准面部图像数据集对浅红色肤色有偏差,并且对暗黄色肤色的代表性不足。在这些数据集上训练的生成模型也会产生类似的偏见。

其次,该研究揭示了基于显著性的图像裁剪和人脸验证模型中的肤色和色调偏见。Twitter的图像裁剪算法对浅红色肤色有偏好。流行的人脸验证模型也在浅红色肤色上表现更好。

最后,操作肤色和色调揭示了属性预测模型中的因果效应。肤色较浅的人更有可能被分类为女性,而肤色较红的人更容易被预测为微笑。汤总结道:

“我们对多维度方式评估肤色的贡献提供了新的、以前看不见的洞察,以更好地了解数据集和模型的公平性评估中的偏见。”

研究人员建议在收集新数据集或评估计算机视觉模型时采用多维度肤色刻度作为公平工具。这可以帮助缓解特定肤色的代表性不足和性能差异等问题。

特色图片来源: