机器算法验证 - boot() 函数中的 Wilcoxon 测试 - 吾爱随笔录

我正在尝试使用 AUC（又名 c 统计量）作为我的性能衡量标准的 boot() 函数来对逻辑 glm 模型进行内部验证。我的问题是，根据我使用的数据集，有时该函数会收到“50 个或更多警告”，所有这些都是这种类型：

Warning messages:
1: In wilcox.test.default(pred[obs == 1], pred[obs == 0],  ... :
  cannot compute exact p-value with ties

即使该函数产生这些警告，它也会产生相关的引导统计信息。

我不确定如何处理这种情况，因为我什至不知道 boot() 在什么上下文中调用 wilcox.test。文档 ?boot 没有提到使用 Wilcoxon 测试。

以下是生成这些警告的示例：

data(nuclear)
library(verification)

AUC = function(data, i) {
    d = data[i,]
    rs1 = glm(ne ~ cost, family=binomial(link="logit"), data=d)
    return(roc.area(d$ne, predict(rs1))$A)
}

library(boot)
boot(data=nuclear, statistic=AUC, R=600)

还有一个例子：

data(melanoma)

AUC = function(data, i) {
    d = data[i,]
    rs1 = glm(ulcer ~ thickness, family=binomial(link="logit"), data=d)
    return(roc.area(d$ulcer, predict(rs1))$A)
}

boot(data=melanoma, statistic=AUC, R=600)

（如果这个问题属于 Stack Overflow 而不是这里，我深表歉意——不确定这个问题是统计性还是程序性。）