首先,让我们从原始图 2 中手动提取值并绘制数据,不要使用任何颜色或回归线来影响我们对原始数据的第一次视觉检查。
year <- c(1968, 1970, 1973, 1975, 1978, 1979, 1980, 1981, 1982,
1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990, 1991,
1992, 1994, 1993, 1995, 1996, 1998, 1997, 1999, 2000,
2001, 2002, 2003, 2004, 2005, 2006)
age <- c(111, 111, 112, 111, 111, 110, 111, 113, 113, 113, 111,
114, 113, 114, 114, 112, 112, 112, 114, 115, 117, 112,
114, 115, 121, 119, 114, 115, 115, 114, 113, 114, 112)
plot(year,age,xlab="Year",
ylab="Yearly maximum reported age at death (years)",
pch=20,cex=2,ylim=c(108,124),xlim=c(1960,2010))
我们获得:
而且,让我们对图 6 中的数据做同样的事情(如上面的问题所示):
age <- c(113, 109, 109, 110, 113, 109, 110, 111, 111, 111,
112, 112, 113, 111, 111, 113, 113, 113, 114, 115,
113, 114, 122, 119, 117, 114, 115, 115, 114, 114,
115, 116, 115, 115, 114, 114, 116, 116, 117)
year <- c(1954, 1957, 1958, 1958, 1963, 1964, 1965, 1967,
1968, 1970, 1975, 1972, 1976, 1976, 1977, 1980,
1981, 1982, 1984, 1985, 1986, 1987, 1997, 1998,
1998, 1999, 2001, 2001, 2002, 2003, 2006, 2006,
2008, 2007, 2010, 2011, 2011, 2012, 2015)
plot(year,age,xlab="Year",
ylab="MRAD from GRG",
pch=20,cex=2,ylim=c(108,124),xlim=c(1950,2020))
似乎一个简单的线性回归模型将是挑战作者提出的不那么简约的变化点模型的自然候选者。事实上,Philipp Berens 和 Tom Wallis 已经这样做了,并在 github 上发表了他们的重新分析:https ://github.com/philippberens/lifespan