我目前在一个项目中,我基本上需要像我们一样了解输出与输入的关系。这里的特殊性是数据一次只给我一个,所以我想在每次收到新的时更新我的分析。我相信这被称为“在线”处理,而不是“批处理”处理,您拥有所需的所有数据并同时使用所有数据进行计算。
所以我四处寻找想法,最后得出的结论是,世界分为三部分:
第一部分是统计学和计量经济学的领域。那里的人做OLS,GLS,仪器变量,ARIMA,测试,差异差异,PCA等等。这片土地主要以线性为主,只做“批处理”。
第二部分是机器学习和人工智能、监督和非监督学习、神经网络和支持向量机等其他词的孤岛。“批处理”和“在线”处理都在这里完成。
第三部分是我刚刚发现的整个大陆,主要由电气工程师组成,看起来是这样。在那里,人们经常在他们的工具中添加“过滤器”这个词,他们发明了一些很棒的东西,比如 Widrow-Hoff 算法、递归最小二乘法、维纳滤波器、卡尔曼滤波器,还有可能我还没有发现的其他东西。显然,他们主要进行“在线”处理,因为它更符合他们的需求。
所以我的问题是,你对这一切有全球视野吗?我的印象是,世界上的这三个部分彼此之间并没有太多的交谈。我错了吗?与的关系的大统一理论?你知道任何可以奠定该理论基础的资源吗?
我不确定这个问题是否真的有意义,但我在所有这些理论之间有点迷茫。我想像“我应该使用这个还是那个?”这个问题的答案。将是“这取决于您想要做什么(以及您的数据)”。然而,我觉得这三个世界试图回答同一个问题(?),因此应该可以对这一切有更高的看法,并深入了解每种技术的特殊之处。