我正在监督一个编程项目,其目标是检测社交网络上的攻击性图像。我想要一个具有代表性的社交网络图像数据集。如果数据集已经分类,那将是最好的。否则,(小)数据集的分类可能是项目的一部分。
我浏览了互联网并搜索了各种免费提供的数据集集合,但我一直无法找到任何合适的东西。
如今,获取大型社交网络图像数据集的最佳方法是什么?
我正在监督一个编程项目,其目标是检测社交网络上的攻击性图像。我想要一个具有代表性的社交网络图像数据集。如果数据集已经分类,那将是最好的。否则,(小)数据集的分类可能是项目的一部分。
我浏览了互联网并搜索了各种免费提供的数据集集合,但我一直无法找到任何合适的东西。
如今,获取大型社交网络图像数据集的最佳方法是什么?
谷歌刚刚发布了一个用于数据集的测试版搜索工具。这可以帮助您找到所需的任何类型的数据集:https ://toolbox.google.com/datasetsearch
大多数社交网络(如 Instagram)都有服务条款,禁止通过自动方式抓取、抓取、缓存或以其他方式访问服务上的任何内容,包括但不限于用户资料和照片,请查看https://www.kaggle.com/ general/23419讨论此事。
您可能需要自己废弃它(那里有脚本为您做),但您找不到准备好下载的数据集。
不确定它们是否相关,但根据您的选择标准,发现了各种可分为攻击性和非攻击性图像的图像数据集。
链接是:
这两个链接都根据其特征对数千个文件进行了分类,并包括图像的 URL。
根据您的标准,您将特定的文本文件图像标记为攻击性/非攻击性。只需编写小代码即可下载这些文件并相应地设置标签。