公开可用的新闻 API/数据集?

数据挖掘 数据集 开源的 爬行
2022-03-16 18:09:13

除了我们的公开可用数据集列表之外,我想知道是否有任何公开可用的新闻数据集/抓取 API 列表。如果与数据集/API 的链接一起添加可用数据的特征,那就太好了。此类信息应且不限于:

  • 新闻网络/新闻聚合器的名称;
  • 它提供什么样的新闻信息(标题、片段、全文、日期、作者、网址……);
  • 是否允许通过 API 抓取其内容(和速率:10/分钟,1k/月,...);
  • 它是否只是提供整个数据集的快照。
  • 涵盖的新闻来源
  • 新闻内容报道的日期范围

非常欢迎任何建议和进一步添加的特性。

1个回答

有适用于 Python 的GoogleNews包。它允许按数据范围、关键字和语言进行查询。