擅自收集图片数据!AI抓取工具img2dataset困扰着图片网站

2023-06-19 17:18:00
aiadmin
原创
1990

站长之家(4月26日 音问:img2dataset是一款自愿正在互联网上查找图像数据并用陶冶于人工智能图像天生器的免费东西,然而这款东西激发了网站全盘者的忧愁。

网站全盘者以为这款东西将专断获取他们的图像和数据,而不是通过许可,心愿img2dataset放手抓取手脚的做法。对此,这款东西的创修者罗曼·博蒙特(Romain Beaumont)正在其GitHub体现,他们(网站具有者)正正在与人工智能不行避免的兴起作斗争,这是“可悲的”。“令人难受的是,你们中的少少人不认识人工智能和盛开人工智能的潜力,是以决心与之斗争。”“正在异日的几年里,你将有良众机遇从人工智能中受益。我心愿你尽早看到这一点。行为创作家,你有更众的机遇从中受益。”

Img2dataset是博蒙特正在GitHub上共享的免费东西,应承用户自愿下载和调解URL列外,从而取得图像数据集,这种数据集陶冶图像天生人工智能模子,如OpenAI的DALL-E,开源的Stable Diffusion和谷歌的Imagen。

博蒙特仍是LAION-5B的开源奉献者,LAION-5B是天下上最大的图像数据集之一,蕴涵领先50亿张图像,供应Imagen和Stable Diffusion应用。

博蒙特为img2dataset辩护,将该东西与Google索引网站的形式实行对比,称谷歌索引形式对任何念查找互联网的人都有好处。

对此有专家以为,网站全盘者是直领受益于查找引擎,由于它们为网站带来了有效的流量。谷歌的呆板人是有规定的,不会攻击网站,大家半呆板人都敬重robots.txt指令。而Img2dataset则没有,该东西好像是有心设看轻网站全盘者的指令。坦率地说,它并没有给网站全盘者带来任何直接好处。

毫无疑义,Img2dataset这款AI东西惹起了网站全盘者的忧愁,他们操心他们的敏锐数据和隐私正正在被侵凌,倘若AI技艺的发扬不受掌握,很容易利用巨额的数据。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号