在哪里可以找到社交网络图像数据集?

数据挖掘 数据集
2021-09-23 14:18:40

我正在监督一个编程项目,其目标是检测社交网络上的攻击性图像。我想要一个具有代表性的社交网络图像数据集。如果数据集已经分类,那将是最好的。否则,(小)数据集的分类可能是项目的一部分。

我浏览了互联网并搜索了各种免费提供的数据集集合,但我一直无法找到任何合适的东西。

如今,获取大型社交网络图像数据集的最佳方法是什么?

3个回答

谷歌刚刚发布了一个用于数据集的测试版搜索工具。这可以帮助您找到所需的任何类型的数据集:https ://toolbox.google.com/datasetsearch

大多数社交网络(如 Instagram)都有服务条款,禁止通过自动方式抓取、抓取、缓存或以其他方式访问服务上的任何内容,包括但不限于用户资料和照片,请查看https://www.kaggle.com/ general/23419讨论此事。

您可能需要自己废弃它(那里有脚本为您做),但您找不到准备好下载的数据集。

不确定它们是否相关,但根据您的选择标准,发现了各种可分为攻击性和非攻击性图像的图像数据集。

链接是:

  1. https://github.com/EBazarov/nsfw_data_source_urls
  2. https://github.com/alex000kim/nsfw_data_scraper

这两个链接都根据其特征对数千个文件进行了分类,并包括图像的 URL。

根据您的标准,您将特定的文本文件图像标记为攻击性/非攻击性。只需编写小代码即可下载这些文件并相应地设置标签。