我在 dask 文档中看到了这个主题和这个主题。
我想知道为每个组制作模型而不是考虑所有组都会出现的整个样本的真正兴趣是什么?据我所知,您拥有的信息越多,您所拥有的复杂性就越高(不利于过度拟合),经过训练的模型就越适合现实。那么目标是什么?更准确地说,在你回答了上面的一般性之后,用逻辑回归制作优势比是否有趣,其中每个模型都应用于一组(每个模型中不包括其他模型)?优点、缺点和限制是什么?