我在哪里可以获得练习 NLP(自然语言)处理的保险索赔数据?

数据挖掘 机器学习 深度学习 数据科学模型 nlp
2022-02-23 05:18:20

我正在寻找专门用于练习机器学习和 NLP 的保险数据集,但在 kaggle、udemy 或其他网站上找不到太多。有没有办法获取该数据集或任何存储该数据集的网站。

我主要是为自动索赔生成或其他保险活动寻找 NLP 实践,请建议该方法

2个回答

我在同一个行业工作了几年,我可以告诉你,由于文档的性质,没有公开可用的数据集。它们非常私密,并且包含受规则和法规约束的敏感信息。

每当在 NLP 的情况下数据集不可用时,我遵循的一种方法是使用基于模板的方法生成数据集。实现看起来像这样

cities = ['paris', 'munich', 'new york']
days = ['monday', 'tuesday', 'sunday', 'friday']

templates = ['i am flying from {cities} to {cities}',
'my flight is arriving in {cities} on next {days}']

因此,现在编写一个脚本来帮助您填充模板中存在的这些缺失值。