我正在尝试将分布拟合到我的数据集。例如,我有数据的频率分布如下所示。

以下是频率表,将数据划分为 10 个 bin。
xvar lvar yvar
1 1 y1 25
2 2 y1 22
3 3 y1 16
4 4 y1 15
5 5 y1 10
6 6 y1 2
7 7 y1 NA
8 8 y1 NA
9 9 y1 NA
10 10 y1 NA
11 1 y2 2
12 2 y2 5
13 3 y2 8
14 4 y2 10
15 5 y2 15
16 6 y2 9
17 7 y2 6
18 8 y2 3
19 9 y2 2
20 10 y2 1
21 1 y3 NA
22 2 y3 NA
23 3 y3 NA
24 4 y3 6
25 5 y3 12
26 6 y3 14
27 7 y3 18
28 8 y3 6
29 9 y3 2
30 10 y3 1
yvar是每个 bin 中的频率。我想找到最适合这种趋势的相应分布(可能是 beta 分布或正态分布?)。我怎样才能做到这一点?
编辑:
(1)我不需要完美契合,但要紧密契合,简单:一个常用的分布就足够了
(2)xvar是连续变量(如血压)或离散量表(例如 1:10 评分量表)
(3) 我相信大部分都可以用正态分布来描述,但我有一些像y1. 我想知道这些值可以通过 beta 分布来描述,但不知道如何找到合适的值(除了猜测之外)?
解决方案不一定需要在 中R,但以下是R上述数据集和绘图的代码。
y1 = c(25, 22,16, 15, 10, 2, NA, NA, NA, NA)
y2 = c(2, 5,8, 10, 15, 9, 6, 3, 2, 1)
y3 = c(NA, NA,NA, 6, 12, 14, 18, 6, 2, 1)
myd <- data.frame (xvar = 1:10, lvar = rep(c("y1", "y2", "y3"), each = 10), yvar = c(y1, y2, y3))
library(ggplot2)
ggplot(myd, aes(x = xvar, y = yvar, fill = lvar, colour = lvar)) + geom_point () + geom_line () + theme_bw()