作为新手,我有一个问题。我正在开发一种使用回归分析(线性、多元、多元)来推导回归模型的工具。为了验证工具的正确性,我试图找到一个基准,或者一个基准数据集来测试这个工具。欢迎任何想法或评论。提前致谢。
用于测试多元回归或多元回归模型的基准数据集?
机器算法验证
回归
广义线性模型
数据集
2022-03-28 14:02:55
2个回答
请参阅 NIST 的统计参考数据集。这些包括选择或设计用于对回归算法提出数值挑战的数据。具有高度共线预测变量的 Longley 数据可能是最著名的例子。
以您使用的任何语言自己生成一些随机数据,这些数据遵循您的模型假设,例如,对于线性回归生成,然后,然后执行其中正态分布表示 0 和 sd 的意思是 1。看看你是否可以在改变错误 stdev 时与用于进行回归的众多已建立工具进行比较。