斯坦福大学的研究人员周三表示,在一个用于训练人工智能工具的著名数据库中发现了1000多张儿童性虐待图片,这突显出一种严峻的可能性,即这些材料帮助人工智能图像生成器创建了新的、逼真的儿童剥削假图像。
在斯坦福大学互联网观测站发布的一份报告中,研究人员表示,他们在一个名为LAION-5B的流行开源图像数据库中发现了至少1008张剥削儿童的图像,稳定扩散等人工智能图像生成模型依赖于该数据库来创建超逼真的照片。
儿童安全研究人员表示,这一发现正值人工智能工具越来越多地在恋童癖论坛上被推广为制作未经审查的儿童色情内容的方式。专家表示,考虑到人工智能图像通常只需要在少数照片上进行训练就能准确地重建它们,在训练数据中存在一千多张儿童虐待照片,可能会为图像生成器提供令人担忧的能力。
该报告的作者、斯坦福大学互联网观测站(Internet Observatory)的首席技术专家戴维·蒂尔(David Thiel)表示,这些照片“基本上给了(人工智能)模型一个优势,使其能够以一种类似于现实生活中儿童剥削的方式制作儿童剥削的内容。”
LAION的代表表示,他们暂时删除了LAION- 5b数据集,“以确保在重新发布之前是安全的”。
近年来,被称为扩散模型的新型人工智能工具出现了,任何人都可以通过输入他们想要看到的东西的简短描述来创建令人信服的图像。这些模型从互联网上获取了数十亿张图片,并模仿视觉模式来创建自己的照片。
这些人工智能图像生成器因其创造超现实照片的能力而受到称赞,但它们也提高了恋童癖者创造新的露相图像的速度和规模,因为这些工具不像以前的方法那样需要太多的技术知识,比如把孩子的脸粘贴到成人身上来制造“深度伪造”。
蒂尔的研究表明,人们对人工智能工具如何生成虐待儿童内容的理解发生了变化。此前,人们认为人工智能工具将“儿童”和“显性内容”等两个概念结合在一起,创造出令人讨厌的图像。现在,研究结果表明,真实的图像正被用来改进滥用假货的人工智能输出,帮助它们看起来更真实。
这些虐待儿童的照片只是LAION-5B数据库的一小部分,该数据库包含数十亿张图片,研究人员认为,这些照片可能是数据库创建者从社交媒体、成人视频网站和开放互联网上抓取图片时无意中添加的。
但非法图像被收录的事实再次突显出,人们对最强大的人工智能工具的核心数据集知之甚少。批评人士担心,在人工智能图像数据库中发现的有偏见的描述和露骨的内容,可能会无形地影响它们所创造的东西。
蒂尔补充说,有几种方法可以规范这个问题。可以制定协议,从数据库中筛选和删除虐待儿童的内容和未经同意的色情内容。训练数据集可以更加透明,并包括有关其内容的信息。使用包含虐待儿童内容的数据集的图像模型可以被教导“忘记”如何创建明确的图像。
研究人员通过寻找“哈希值”来扫描这些虐待图片,哈希值是识别这些图片的相应代码位,并被保存在国家失踪和受虐儿童中心和加拿大儿童保护中心的在线观察列表中。
蒂尔说,这些照片正在从训练数据库中删除。