作为我们伟大的公开可用数据集列表的扩展,我想知道是否有任何公开可用的社交网络数据集/爬网 API 列表。如果与数据集/API 的链接一起添加可用数据的特征,那就太好了。此类信息应且不限于:
- 社交网络的名称;
- 它提供了什么样的用户信息(帖子、个人资料、友谊网络……);
- 是否允许通过 API 抓取其内容(和速率:10/分钟,1k/月,...);
- 它是否只是提供整个数据集的快照。
非常欢迎任何建议和进一步添加的特性。
作为我们伟大的公开可用数据集列表的扩展,我想知道是否有任何公开可用的社交网络数据集/爬网 API 列表。如果与数据集/API 的链接一起添加可用数据的特征,那就太好了。此类信息应且不限于:
非常欢迎任何建议和进一步添加的特性。
关于社交网络 API 的几句话。大约一年前,我为研究人员撰写了一篇关于流行社交网络 API 的评论。不幸的是,它是俄语的。这是一个摘要:
推特(https://dev.twitter.com/docs/api/1.1)
脸书(https://developers.facebook.com/docs/reference/api/)
Instagram ( http://instagram.com/developer/ )
Foursquare ( https://developer.foursquare.com/overview/ )
Google+ ( https://developers.google.com/+/api/latest/ )
和非竞争性:我为俄罗斯读者审查了社交网络,这里排名第一的网络是vk.com。它被翻译成多种语言,但仅在俄罗斯和其他独联体国家流行。API 文档链接:http: //vk.com/dev/。在我看来,它是自制社交媒体研究的最佳选择。至少,在俄罗斯。这就是为什么:
它本身不是一个社交网络,但 Stackexchange 会定期发布他们的整个数据库转储:
您可以通过分析哪些用户互相提问和回答来提取一些社交信息。一件好事是,由于帖子被标记,您可以轻松分析子社区。
可以在斯坦福网络分析项目网站上找到公开可用的社交网络数据集的一个很好的列表:
该网站包含互联网社交网络数据(Facebook、Twitter、Google Plus)、学术期刊的引文网络、来自亚马逊的联合采购网络和其他几种网络。它们有有向图、无向图和二分图,所有数据集都是可以以压缩形式下载的快照。
德国的一个例子:兴建一个类似于linkedin但仅限于德语国家的网站。
链接到它的开发者中心:https ://dev.xing.com/overview
提供对以下内容的访问:用户个人资料、用户之间的对话(仅限于用户本身)、招聘广告、联系人和联系人的联系人、来自网络的新闻和一些地理位置 api。
是的,它有一个 api,但我没有找到有关费率的信息。但在我看来,某些信息仅限于用户的同意。