IBM 的 AI 人脸识别「训练数据集」惹官司!

上周晚些时候提起的一起集体诉讼指控IBM使用伊利诺伊州数百万人的照片来建立一个人脸识别数据集,却没有告知他们。



首席原告Tim Janecyk在法律文书中声称,IBM使用了来自Flickr网站的至少七张他拍的照片,并未告知他或被拍摄对象,此举违反了伊利诺伊州的《生物特征识别信息隐私法》(BIPA)。

这个名为“Diversity in Faces”的数据集包含从流行的照片共享网站Flickr获取的数百万张照片,这些照片采用Creative Commons(CC)许可证。这意味着可以在各种CC许可证中概述的某些条件下,合法地与第三方共享这些照片,而这些条件几乎总是禁止将照片用于商业用途。

IBM一直声称该数据集用作学术资源,该数据集用于训练其他人脸识别系统以减少偏见。该数据集不是公开可用的,用户需要获得授权才能访问它。

在绝大多数情况下,这意味着照片是光明正大的。不过在草原州伊利诺伊州除外,该州对此有自己的特定的州法律。

伊利诺伊州的BIPA是2008年出台的一部美国州法律,该法律要求收集或以其他方式获取生物特征识别信息(比如指纹、视网膜扫描或Flickr照片)的公司企业须事先征得有关人员的书面同意。

Janecyk及集体诉讼的其他成员要求IBM为未经同意擅自使用的每张照片支付5000美元。

几个州也有类似的法律,包括华盛顿州和得克萨斯州,但只有伊利诺伊州允许个人、而不是公司可以因侵权行为向对方索要损害赔偿金。

IBM在一份声明中说:“我们认为,原告诉状中的指控是毫无根据的,我们打算对这些指控作出有力辩护。”

这可不是IBM的人脸识别软件头一回遭到抨击了。去年,许多Flickr用户被告知他们的照片被用于训练人脸识别算法时,大声反对。照片的所有者发现很难从IBM的数据集删除自己的照片,也无法从已经提供给研究人员的副本删除这些照片。

Creative Commons组织对这些报道做出了回应,称“合理使用允许所有类型的内容可自由使用。”

相关链接:上周美国最高法院驳回了Facebook要求最高法院裁定是否可以根据同一部法律:BIPA就其自己的人脸识别软件对Facebook提起诉讼的主张。该功能可以扫描照片中的“好友”人脸,并建议标签以识别其ID身份(关键是未经明确同意)。Facebook声称该功能没有造成“实际的危害”。最高法院并不同意。

同样上周在伊利诺伊州,另一个人David Mutnick根据伊利诺伊州的同一部法律对Clearview及其创始人提出了集体诉讼。诉状要求法院对这家公司实施禁制令,并要求该公司删除从Mutnick和该州其他居民获取的任何数据。