对于作为性能的非功能性需求,可以找到简单的指标来衡量软件质量。例如,如果您想知道在某些代码更改后您的系统性能是变好还是变差,您可以比较这些更改前后执行某些操作(理想情况下是所有操作)所花费的时间。
然而,对于功能需求,系统是否比上一个版本更好或更差是一个更主观的问题。跨版本的失败测试用例数量的简单比较可能会带来误导性的结果,因为这并没有说明测试用例的重要性,也没有考虑问题对用户体验的影响。甚至可以尝试根据测试用例的重要性为其赋予适当的权重,但我认为分配权重的规则本身就是主观的。
什么样的指标可以用来表示一个软件满足其功能需求的程度?