如何从绘图图像中提取信息?

数据挖掘 机器学习
2021-09-23 13:50:45

有没有可以自动理解绘图图像文件的免费工具或库?诸如类型检测(线、条、散点图)以及标签和轴缩放检测之类的东西。

在我目前找到的工具中,必须进行手动配置。我问的是在我们的人工智能驱动的世界中是否有可能让机器来做这件事。

如果没有,我将为自己启动一个项目,因为这似乎是一项具有挑战性但有启发性的 AI 任务。这种努力从一开始就注定要失败吗?是否有任何有用的 C++ 或 Java 库以及可以考虑的理论算法?

谢谢,
托马斯

2个回答

在一般意义上,这绝对是一个非常重要的问题,任何功能齐全的解决方案都需要大量的工作。

成功可能取决于你对问题的约束程度。单色比彩色更容易。有限的字体、字体大小、线条和标记样式会有所帮助。

约束越多,成功的机会就越大。

对于线检测,例如轴,您可能需要考虑HoughRadon变换。

这里有一些 stackexchange 问题,涵盖了您可能想要解决的一些主题,遗憾的是没有条形图,有些有一个手动组件,您可能会认为如何自动化。它们是回顾问题中涉及的一些困难的一个很好的起点。

选择曲线: https ://mathematica.stackexchange.com/questions/44355/how-to-make-a-curve-selectable-from-a-scaned-image-and-convert-it-to-a-list-的-c

数据点和轴: https ://mathematica.stackexchange.com/questions/1524/recovering-data-points-from-an-image

散点图: https ://mathematica.stackexchange.com/questions/26356/how-do-i-find-the-coordinates-of-points-in-this-image

数据点: https ://mathematica.stackexchange.com/questions/3831/how-can-i-extract-data-points-from-a-black-and-white-image

https://mathematica.stackexchange.com/questions/14444/obtain-data-points-from-a-graph-on-an-image-without-axes

正如@image_doctor 所提到的,这显然是一个重要的问题,但是如果您需要一些帮助来从现有图表中提取数值数据,WebPlotDigitizer可能会有所帮助。

也许通过他们的来源调查他们的方法可能对你很有帮助。