我正在寻找专门用于练习机器学习和 NLP 的保险数据集,但在 kaggle、udemy 或其他网站上找不到太多。有没有办法获取该数据集或任何存储该数据集的网站。
我主要是为自动索赔生成或其他保险活动寻找 NLP 实践,请建议该方法
我正在寻找专门用于练习机器学习和 NLP 的保险数据集,但在 kaggle、udemy 或其他网站上找不到太多。有没有办法获取该数据集或任何存储该数据集的网站。
我主要是为自动索赔生成或其他保险活动寻找 NLP 实践,请建议该方法
我在同一个行业工作了几年,我可以告诉你,由于文档的性质,没有公开可用的数据集。它们非常私密,并且包含受规则和法规约束的敏感信息。
每当在 NLP 的情况下数据集不可用时,我遵循的一种方法是使用基于模板的方法生成数据集。实现看起来像这样
cities = ['paris', 'munich', 'new york']
days = ['monday', 'tuesday', 'sunday', 'friday']
templates = ['i am flying from {cities} to {cities}',
'my flight is arriving in {cities} on next {days}']
因此,现在编写一个脚本来帮助您填充模板中存在的这些缺失值。