客服热线:17600109315

普林斯顿人工智能工具将帮助数据集的构建者以及用户解决图像偏差

2020-10-10 11:51:21浏览:634来源:中国激光网   

普林斯顿大学视觉人工智能(AI)实验室的一个计算机科学家团队开发出一种方法,这种方法可以检测图像集和视觉模式中的偏差。该方法依赖于开源工具来标记用于训练 AI 系统图像中的潜在的以及明显存在的偏差,例如那些启用自动信贷服务和法庭宣判程序的开源工具。这个工具特别允许数据集的建立者和用户在图像收集用于训练计算机视觉模型之前,纠正视觉代表性不足或者陈旧型画像的问题。

工程师使用在网上收集的大量图像或图像汇编来开发计算机视觉,使计算机能够识别人、物体以及动作。数据集是计算机视觉的基础,这意味着反映社会或其它成见和偏见的图像会严重(而且有害地)影响计算机视觉模型。

在一个数据集中,REVISE 揭露了在包含人(红框)和乐器(蓝框)的图像中潜在的性别偏见。通过分析和推断人与乐器之间的3D距离分布表明,男性往往被认为是演奏乐器者,而女性往往只被认为是在同一空间的乐器。普林斯顿大学研究人员供图。

新的基于工具的新方法推动了相关的进步,普林斯顿视觉人工智能实验室的成员发表了一篇文章,对当前关于防止计算机视觉模型中的偏差的方案进行了比较。这篇文章还另外增加了一项建议,即采用新的、更有效的方法来减少偏见,即使用统计方法检查数据集中潜在偏见和基于物体、地理以及性别维度的代表性不足。

这个工具称为REVISE ( 揭露,视觉,偏见),使用现有的图像注释和可量化、可识别的测量值(如物体个数、人与物体同现以及原产地),从而揭示与平均分布不同的模式。在测试REVISE的数据集中有一个例子,这个例子显示人和花在内的图像在男性和女性之间有所不同。男性更经常出现在仪式和会议背景中,而女性更经常出现在舞台设置和绘画中。这项研究的合作者Angelina Wang说:“计算机科学中的数据集收集工作直到最近才被详细的审核。她说图像经常从互联网上被下载,但是大家通常不知道某些图像是数据集的组成部分。”

普林斯顿视觉人工智能实验室的科学家在今年夏天的欧洲计算机视觉会议上介绍了这种方法,这个方法基于之前的工作,它描述了一种以需要用户指导的方式来过滤和平衡数据集图像。这项工作得到了美国国家科学基金会(NSF)、谷歌云和普林斯顿工程与应用科学学院颁发的Yang Family创新研究基金的支持。

(责任编辑:CHINALASER)
下一篇:

金蝶走进大族激光,共论高科技制造业的数字化转型实践

上一篇:

【材料】具有超长电荷传输寿命的无金属卤化物钙钛矿单晶用于X射线探测

  • 信息二维码

    手机看新闻

  • 分享到
打赏
免责声明
• 
此文内容为本网站刊发或转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。涉及到版权或其他问题,请及时联系我们 189888977@qq.com