是否有从雅虎答案中提取问题和标签的 API?

数据挖掘 机器学习 数据 朴素贝叶斯分类器
2022-02-27 04:45:29

我想从事一个 ML 项目,该项目涉及来自 yahoo 答案的家庭和关系类别。我想从雅虎答案(只有标题)中提取问题,并将标签作为它在雅虎答案中的类别。我想以 csv 形式使用它来训练我的朴素贝叶斯模型。有 API 或类似的东西吗?

1个回答

似乎在Yahoo Developer Site上有很多建议。

基本步骤将是:

  1. 给自己一个标准的雅虎帐户
  2. 使用该帐户,为自己获取一个应用程序 ID(基本上是一个 API 密钥)
  3. (可能)获得一个唯一的密码来使用你的 API 密钥

这一切都将允许您在请求数据时对自己进行身份验证。

他们说,数据请求有每日速率限制:

每个服务可能对每个查询返回的结果数量有不同的限制,以及支持的参数的其他变化。每个服务的文档都指定了您可以接收的默认数量和最大数量。

我还应该指出,该服务不打算用于商业用途,所以如果您打算根据雅虎数据制作产品并销售它,您可能需要与他们讨论 API 的使用。


结果将采用需要解析的形式,例如 XML,因为它似乎是标准的 Web 请求 API。这意味着您可以查看BeautifulSoup4或 xml ElementTree等工具。然后,您可以从 Yahoo 的 API 中选择接收到的数据的特定部分。