是否有任何正在进行的项目使用 Stack Exchange 进行机器学习?

人工智能 机器学习 人工智能设计
2021-11-06 19:55:40

是否有任何正在进行的 AI 项目使用 Stack Exchange 进行机器学习?

2个回答

当然似乎有一些研究项目涉及某种形式的文本挖掘/信息检索/等。和 StackExchange 站点。

我可以通过谷歌/谷歌学者找到一些例子(不太可能接近详尽的列表):


更一般地说,自动问答系统似乎仍然是一个相当活跃的研究领域,而不是一个微不足道/“已解决”的问题。StackExchange 可以是此类系统的一种数据来源,但也有许多其他数据来源(维基百科、Quora 等)。

DuckDuckGo从 StackExchange 学习技术问题的答案。在 DuckDuckGo 中输入诸如“正在进行的项目使用 stackexchange”之类的技术问题,它将在右侧提供突出显示的答案摘要。鸭子有一个开放的 API,可用于更多(100 多个)问答数据源。或者你可以直接去stackexchange api

项目可以使用来自 SE 开放 API 的数据,只要它们遵守其TOU即可。基本上只要确保您的用户能够分辨出数据来自 Stack Exchange。版权许可也可能会限制您更改文本内容的能力,例如学习抽象摘要器。也许这就是 Duck.com 只突出关键字的原因。

数据权利法不断变化,尤其是涉及到您提交到网站的数据以及从该数据派生的机器学习模型时。新的欧洲数据和隐私规则使您能够下载或删除您提交到堆栈交换等站点的所有数据。