我需要一个模型,它会接受一些数值参数,并给出一个数值答案(上下文:根据环境因素预测斜率,而无需实际进行测量以找到斜率)。
但是,鉴于我(在网络上)没有找到任何能够解决此任务的模型,我迷路了。如果有人可以建议一种能够解决此类问题的模型,我将不胜感激。如果您愿意提出任何建议,资源和图书馆也会很有用。我正在使用 Python。
我需要一个模型,它会接受一些数值参数,并给出一个数值答案(上下文:根据环境因素预测斜率,而无需实际进行测量以找到斜率)。
但是,鉴于我(在网络上)没有找到任何能够解决此任务的模型,我迷路了。如果有人可以建议一种能够解决此类问题的模型,我将不胜感激。如果您愿意提出任何建议,资源和图书馆也会很有用。我正在使用 Python。
您可能正在寻找回归,无论是线性的还是非线性的,这通常是指一组可用于预测连续(或数值)值(所谓因变量的值)的方法,给定一个或更可能的数值(自变量的值)。(另一个常见任务称为分类,其中结果变量是离散的。)
因变量和自变量也可以是向量。在这种情况下,它被称为多元线性或非线性回归。如果有多个自变量(或,也称为预测变量),则称为多变量(或多重)线性或非线性回归。参见,例如,多变量或多变量回归?(2013),伯莎·伊达尔戈和旋律古德曼。
在线性回归中,因变量被假定为自变量的线性组合,而在非线性回归中,因变量被假定为非线性组合(即任何非线性组合或关系)。
自变量(或预测变量)实际上不需要相互独立,当然,因变量也不需要独立于预测变量(否则您将无法预测因变量的值,给定预测变量),因此表达式预测变量可能比自变量更合适。参见,例如,在回归分析中,为什么我们称自变量为“独立的”?, 弗兰克·哈雷尔。但是,假设因变量依赖于自变量,因此您可以将自变量视为不是因变量的变量(如果这有助于您记住这个概念)。
因变量和自变量有更多同义词,具体取决于上下文或区域。例如,预测变量(或自变量)也可以称为协变量、回归变量或解释变量。因变量也可以称为回归变量、结果变量或可解释变量。
还有其他类型的回归模型。特别是广义回归模型(GLM),它(顾名思义)是几个回归模型的泛化。著名的逻辑回归(结果实际上是二项式或二元式,因此是离散的)是广义回归模型的应用,其中链接函数(这是在 GLM 上下文中使用的概念)是logit 函数。例如,参见为什么逻辑回归是线性模型?. 请注意,线性回归也是 GLM 的一种应用。另见本文1.1。广义线性模型,它为您提供不同 GLM 的概述。
还请查看这篇文章选择正确的回归分析类型,它提供了一些指导方针来帮助您为您的任务选择最合适的回归模型。
例如,在 Python 中,您可以使用sklearn.linear_model.LinearRegression. Python 库sklearn提供了其他几个回归器。例如,sklearn.ensemble.AdaBoostRegressor或sklearn.ensemble.RandomForestRegressor。(当然,在调用它们的方法时,您将需要一个训练数据集来训练这些回归器fit)。