我正在写我的论文。在这篇论文中,我说神经网络可以被认为是一种数据分析方法。经过一段时间后,我现在不确定这种说法是否合理。
维基百科指出:
“数据分析是一个检查、清理、转换和建模数据的过程,其目标是发现有用的信息、得出结论并支持决策制定。”
因此,前馈网络确实对数据进行了建模,但由于其黑盒性质,发现有用信息可能不太有用。然而,由于它的预测能力,它当然可以支持决策。然而,使用神经网络的主要目标仍然是做出简单的预测,不一定支持决策。
你对此有什么看法?前馈神经网络可以被认为是一种数据分析方法吗?
我正在写我的论文。在这篇论文中,我说神经网络可以被认为是一种数据分析方法。经过一段时间后,我现在不确定这种说法是否合理。
维基百科指出:
“数据分析是一个检查、清理、转换和建模数据的过程,其目标是发现有用的信息、得出结论并支持决策制定。”
因此,前馈网络确实对数据进行了建模,但由于其黑盒性质,发现有用信息可能不太有用。然而,由于它的预测能力,它当然可以支持决策。然而,使用神经网络的主要目标仍然是做出简单的预测,不一定支持决策。
你对此有什么看法?前馈神经网络可以被认为是一种数据分析方法吗?
关于这个话题有很多话要说。首先,在学术界之外,机器学习系统(以及神经网络)有一个非官方的分类(更倾向于商业类型),按照效用/自主性的增加顺序将它们分为三类:描述性、预测性和规范性.
描述性系统总结数据,预测性系统预测未来趋势(或数据中未明确存在的任何其他内容),规范性系统推荐行动方案。神经网络当然不仅仅是汇总数据,因此它们中的大多数都属于预测类别,但通过其他技术,它们可以并且确实达到规定类别。
正如您所提到的,为了支持决策制定,系统应该具有许多理想的属性和功能,但是由于您强调了它,我将重点关注的是模型可解释性,这将使我们进一步了解神经网络数据分析方法。
就目前而言,神经网络是非常难以解释的黑盒模型:这通常会导致人们采用更简单的模型,例如决策树或随机森林。然而,这不是生活中的事实:很多有用的信息可以从神经网络学到的东西中提取出来,这些信息是人类可以理解的。
对于简单表格数据(例如房价)的网络,[https://eli5.readthedocs.io/en/latest/blackbox/index.html] 提供了对估计特征(例如表面积)的预测能力很重要的排列很重要,墙壁的颜色不是那么多)。它还提供了一种更复杂的方法 LIME,它构建了神经网络的代理线性模型(更容易解释)。LIME 也可用于 CNN。其他可解释性方法包括部分图和SHAP。
由于我们讨论的是 CNN,因此存在专门为它们量身定制的其他方法,例如(目前基本上是行业标准)Grad-CAM,它强调了图像的一部分对 CNN 输出的贡献。
如果您查阅有关可解释 AI (XAI)的文献综述论文,您会注意到主要目标之一是从经过训练的模型中提取知识。
最重要的是,在我看来,没有任何花哨的解释方法的普通神经网络可以被视为数据分析方法。例如,图像分割、语义分割、自动编码,听起来就像你引用的数据分析定义,它们都是用神经网络完成的。