我有两个分布,它们来自 2 个独立的数据集。这些分布不是正态分布,目前尚不清楚它们是否属于任何已知 pdf 家族(它们也不是对称的)。给定一个数据点,我需要确定它最有可能属于哪个分布。如果这些是正态分布,我可以进行通常的参数测试并从那里开始,但在这种情况下,我不确定如何进行。我搜索了一下,但找不到任何东西,可能是因为我没有使用正确的关键字。任何帮助深表感谢。
编辑澄清:我应该提到它是单变量的。我也不妨在这里解释一下实际问题。我们有用户在网站上花费的时间数据。我们也有关于用户喜欢或不喜欢其中一些网站的信息(约占所有网站的 4%)。所以我们知道喜欢和不喜欢所花费的时间分布。那么,一个明显的问题是,对于花费 x 时间的随机用户,他们更有可能喜欢该页面还是不喜欢该页面。我们花费的时间信息是基于秒的,所以分布非常谨慎,但在现实生活中,它们是连续的。


