使用机器学习提取金融 SEC 填充表数据

数据挖掘 机器学习
2022-03-14 00:31:47

我正在尝试构建一个从表格中提取财务数据的机器学习系统。

示例表如下所示。

在此处输入图像描述

从上图中您可以看到净销售额是一个属性以及两个不同季度的两个值 2707.1 和 1994.5。所以我想用日期、季度、货币价值等元数据提取这些数据。如下图。 在此处输入图像描述

通常,如果它是在自由文本中,我会使用使用 Spacy 或其他模块的实体提取方法。我们不能应用规则,因为我们必须从中提取很多种类的表。

编辑: 数据来自 HTML 文件。

示例网站

0个回答
没有发现任何回复~