我想从事一个 ML 项目,该项目涉及来自 yahoo 答案的家庭和关系类别。我想从雅虎答案(只有标题)中提取问题,并将标签作为它在雅虎答案中的类别。我想以 csv 形式使用它来训练我的朴素贝叶斯模型。有 API 或类似的东西吗?
是否有从雅虎答案中提取问题和标签的 API?
数据挖掘
机器学习
数据
朴素贝叶斯分类器
2022-02-27 04:45:29
1个回答
似乎在Yahoo Developer Site上有很多建议。
基本步骤将是:
- 给自己一个标准的雅虎帐户
- 使用该帐户,为自己获取一个应用程序 ID(基本上是一个 API 密钥)
- (可能)获得一个唯一的密码来使用你的 API 密钥
这一切都将允许您在请求数据时对自己进行身份验证。
他们说,数据请求有每日速率限制:
每个服务可能对每个查询返回的结果数量有不同的限制,以及支持的参数的其他变化。每个服务的文档都指定了您可以接收的默认数量和最大数量。
我还应该指出,该服务不打算用于商业用途,所以如果您打算根据雅虎数据制作产品并销售它,您可能需要与他们讨论 API 的使用。
结果将采用需要解析的形式,例如 XML,因为它似乎是标准的 Web 请求 API。这意味着您可以查看BeautifulSoup4或 xml ElementTree等工具。然后,您可以从 Yahoo 的 API 中选择接收到的数据的特定部分。
其它你可能感兴趣的问题