除了我们的公开可用数据集列表之外,我想知道是否有任何公开可用的新闻数据集/抓取 API 列表。如果与数据集/API 的链接一起添加可用数据的特征,那就太好了。此类信息应且不限于:
- 新闻网络/新闻聚合器的名称;
- 它提供什么样的新闻信息(标题、片段、全文、日期、作者、网址……);
- 是否允许通过 API 抓取其内容(和速率:10/分钟,1k/月,...);
- 它是否只是提供整个数据集的快照。
- 涵盖的新闻来源
- 新闻内容报道的日期范围
非常欢迎任何建议和进一步添加的特性。
除了我们的公开可用数据集列表之外,我想知道是否有任何公开可用的新闻数据集/抓取 API 列表。如果与数据集/API 的链接一起添加可用数据的特征,那就太好了。此类信息应且不限于:
非常欢迎任何建议和进一步添加的特性。
有适用于 Python 的GoogleNews包。它允许按数据范围、关键字和语言进行查询。