假设我正在构建一个医疗援助聊天机器人。
我如何验证我的模型运行良好或比其他模型更好。
是否有任何标准的验证指标?
不可能回答这个问题,因为您还没有明确定义您希望聊天机器人做什么(而不是做什么!)。一旦你定义了它,你就有了你的指标。
所以第二个问题的答案是:不,没有标准的验证指标。