我有一系列由大约 100 个变量和一个相应的响应变量组成的数据集。我经常面临试图将响应变量的差异归因于 100 个左右的变量的问题。
我的问题是,由于变量数量众多,通常很难比较两个或多个数据集并将响应变量归因于 100 个左右的变量。
面对这样的问题,人们会怎么做?做这种工作有哪些常见的分析?如果可以向非技术背景的人解释解决方案,那就更好了。
我有一系列由大约 100 个变量和一个相应的响应变量组成的数据集。我经常面临试图将响应变量的差异归因于 100 个左右的变量的问题。
我的问题是,由于变量数量众多,通常很难比较两个或多个数据集并将响应变量归因于 100 个左右的变量。
面对这样的问题,人们会怎么做?做这种工作有哪些常见的分析?如果可以向非技术背景的人解释解决方案,那就更好了。