我非常喜欢DSP,但最近每个人都在谈论"Data science"和"deep learning",据我所知,数据科学的全部内容是获取大量数据,并仅从中提取有意义的数据。
DSP当您有一个带有噪声的信号并且您从原始采样中提取数据时,这不是您所做的吗?或者例如当您自动关联以查找信号之间的匹配时?你在这两种情况下都使用相同的统计工具吗?
我非常喜欢DSP,但最近每个人都在谈论"Data science"和"deep learning",据我所知,数据科学的全部内容是获取大量数据,并仅从中提取有意义的数据。
DSP当您有一个带有噪声的信号并且您从原始采样中提取数据时,这不是您所做的吗?或者例如当您自动关联以查找信号之间的匹配时?你在这两种情况下都使用相同的统计工具吗?
DSP 和机器学习的目的都是将输入信号/数据集转换为更有意义的信息。这可能是,
我看到的主要区别在于,在 DSP 中,变换是由工程师设计的。工程师将选择一组提供所需输出的信号处理操作。这种选择以经验为指导,并从实验结果中得到验证。
在机器学习中,转换是学习的。通常,这需要一组具有已知输出的训练信号,系统将在这些信号上优化其变换。工程师仍然必须选择可以复制所需转换的机器学习架构。
通常这两者会结合在一起。无论如何,DSP 是一种机器学习——机器学习部分是由人类完成的,而测试集是它们存在的总和。
目前,数据科学和 DSP 之间的一个区别似乎在于关于在较低晶体管数量和/或能量水平下计算效率的文献数量。一个装满几千瓦水冷的 GPU 内核的机架可以找到许多不同的应用,而不是使用助听器电池“提取有意义的结果”的小东西。
另一个区别是,一些定义明确的问题具有简洁的数学封闭式 DSP 解决方案,不需要大量数据集进行训练,甚至需要更多测试。
在对问题进行微小编辑时,我查看了标签,发现到目前为止,这里只有一个标签包含data: data-request。
我认为信号处理和图像分析领域非常复杂。几乎每个人(我的祖母也是如此)对什么是化学家、生物学家都有一定的了解。在我那个时代,向我的家人解释信号处理的含义是ASIC的一大难题。我必须解释什么是传感器,以及数字信号是如何组成的。然后,在失去耐心之后,我会说我处理 mp3 和 photoshop。然后大家都明白了,可是我所谓的科学一下子就消失了。
信号处理和图像分析是复合的。但不相似。他们从不同的其他领域借鉴。除了对低级效率的兴趣之外,我相信 DSP 的很大一部分致力于或多或少的结构化数据,目的是提取或多或少的“构造”特征。
数据科学是另一个总称,它包含的内容甚至超过了后者。从维基页面:
[它吸取]数学、统计学、信息科学和计算机科学等广泛领域的许多领域,包括信号处理、概率模型、机器学习、统计学习、数据挖掘、数据库、数据工程、模式识别和学习、可视化、预测分析、不确定性建模、数据仓库、数据压缩、计算机编程、人工智能和高性能计算。
因为它很时尚,因为随着社交媒体的出现,人们现在知道有数据了。声音、信号和图像已不再是“一些数据”。几乎每个人都知道数据是什么:位,非结构化。或不。
这很有趣:很多人(过去)要求我定义一个信号,没有人问我数据是什么(而这个问题更基本)。
每个人都产生数据,而很少人产生信号。时机成熟了。随着数据类型越来越多、结构化程度越来越低,要提取的特征变得越来越少“构建”,越来越少“低维”和手工制作,并与机器学习交互。
现在,深度学习中使用的一些特征没有通常的特征设计那么精细,而巨大的人工标记数据弥补了这一点。
我看到并尝试编写的 DSP 代码的条件执行结构(if语句)通常比 AI 代码少得多。