我有一个显示双峰分布的数据集。这是通过绘制频率与数量的直方图来确定的。
我现在需要将两个原始种群分开,从而找到一个交点。从情节上看,这个点可能是大约。-1.0 到 -0.8。
是否有直接的计算或函数可以用来更准确地定位该点?

我有一个显示双峰分布的数据集。这是通过绘制频率与数量的直方图来确定的。
我现在需要将两个原始种群分开,从而找到一个交点。从情节上看,这个点可能是大约。-1.0 到 -0.8。
是否有直接的计算或函数可以用来更准确地定位该点?

实际上,该算法听起来就像是使用了 Macro 建议的方法。这个想法是你有一个分布
对于其他感兴趣的人,我使用高斯混合建模 (GMM) 算法来确定两个总体的均值并将它们分开。
本页链接的论文中解释了所使用技术的详细信息:
http://www-personal.umich.edu/~ognedin/gmm/gmm_user_guide.pdf
Gnedin, O. (2010)。量化双峰
您可以使用Otsu 方法,您可以将直方图视为图像中像素灰度值的直方图。
然后,在计算机视觉和图像处理中,Otsu 的方法,以 Nobuyuki Otsu (大津展之 Ōtsu Nobuyuki) 1命名,用于自动执行基于聚类的图像阈值化,或者,这就是你的情况,减少灰度图像为二值图像。
该算法假设图像包含遵循双模直方图的两类像素(前景像素和背景像素),然后计算分离这两类像素的最佳阈值,以使它们的组合散布(类内方差)最小,或等效地(因为成对的平方距离之和是常数),因此它们的类间方差最大。
您可以使用检查来“正常”(有很多包):算法很简单:将 var 拆分为 bin。计算观察次数和期望值,取差值,按期望值标准化。我们拥有最小标准化 res 的 bin - 将包含所需的二分法最佳阈值!(2 个具有 max stdRes= 您的 2 个分布模式的箱 ;-)。不要忘记玩(尝试)不同的 bin 编号!接下来,您尝试通过模型选择(KLIC/CAIC/BIC/等)在此区间内进行澄清。