大家好,在上一篇文章当中,我们开始了对产品开发的第一阶段进行了深入的分析,从这篇文章开始,我们将进入产品的第二阶段,证明项目的可行性。
1
性能要求的重要性
正如在EP.6和EP.7中所讨论的,诊断检测业务的管理方式和决策对研发科学家和工程师来说意义重大。
如果一个项目不再被认为是有经济效益的,往往是因为它落后于计划,那么它就有可能会被取消。
适当的性能要求可以帮助防止项目延期。
性能要求提供了一个终点,可以为项目经理提供一个信号,在达到某些目标时停止开发,转入下一个环节。
否则,一个科学家可能会继续完善一个检测项目,而牺牲它的进度。
此外,具有充分评估标准的性能要求可以加速决策,因为它允许项目经理更快地确定性能要求是否得到满足。
图1显示了性能要求与整个评估过程的关系,以及为什么产品开发过程是如此具有挑战性。存在困难的项目在图1中的不规则形状内。
图1|产品开发周期中的评估过程
在一个项目的开始,人们必须从众多可能的目标中选择一套性能要求,作为产品的设计要求。
市场研究工具有助于正确识别这些目标,为了确定一个目标是否已经实现,人们必须在实验设计的基础上进行评估,试图让人们观察到真实的自然状态,而这是无法直接观察的。
适当的数据分析和报告从评价的原始结果中提取所包含的信息。
2
适当的和不适当的性能要求
令人惊讶的是,尽管性能要求很重要,但它们往往是不充分的。
编写好的性能要求是很困难的,部分原因是它们描述的是具有不确定性估计参数的目标。在描述一个好的性能要求的要素之前,让我们列举一下几种不充分的性能要求。
2.1、不存在的性能要求
当没有性能要求存在时,许多事情都被简化了。不需要制定方案或进行分析,也不需要做出发布/不发布的决定。
然而,没有性能要求并不意味着没有问题会发生;它只意味着问题开始出现的限度是未知的。
性能异常值的允许率就是一个经常没有规定的性能特征的例子。然而,产品却因为不符合这种隐含的性能要求而被从市场上召回。
2.2、非量化的性能要求
一个典型的性能参数,如不精密度,最初可能被指定为「与竞争对手一样好或比竞争对手好」或「好到不会引起投诉」。如果不加以量化,这些想法将很难评估。
一些性能参数可能被留作定性的,因为看起来好像不可能量化。例如,今天的仪器系统通常被指定为具有高度的「易用性」。
然而,人们可以进行实验来量化或比较使用的方便性,这意味着有可能创建一个量化的性能要求。下面是一个简短的例子方案,展示了量化使用的便利性。
为了模拟客户的仪器操作人员,人们选择具有所需背景的参与者,通常事先没有被测仪器的知识。为每个参与者提供特定数量的培训,并要求他们执行一系列的任务。
观察者记录下所犯的错误(如果有的话),以及测试者查阅手册或寻求帮助的次数。
在结束这种类型的实验时,要对用户进行调查,了解他或她的经验。调查提供了对用户体验的看法,而对错误、寻求帮助的次数和类型的统计则提供了对易用性所取得的性能的定量测量。
很常见的情况是,感知与表现不一致。
2.3、不现实的性能要求
作为一个不现实的产品性能要求例子,一位产品经理试图将一台新的分析仪的可靠性性能要求设定为每台仪器每年有四次计划外的服务呼叫。
这台新的分析仪是目前同类产品中最复杂的仪器,对类似产品的分析表明,它们的服务呼叫率都大于10。
尽管任何事情都是可能的,而且需要跳一跳才能摸到目标有时也能激励人们,但依旧要进行具体的分析,看是否为新的分析仪提出新的技术或资源,来保证这个目标是可以实现的。
最后,这种类型的目标会被产品设计工程师所忽视,从这个意义上说,它类似于一个不存在的性能要求。
在诊断行业中,软件错误率似乎常常无法被正确指定,可以被认为是属于这种不现实的性能要求。
人们经常听到:「直到没有严重的软件错误,我们才会发布产品」。实际上,人们必须把软件质量指定为一个比率,即软件故障强度。这个比率提供了在某个时间尺度(CPU周期或日历时间)内观察到的允许的故障数量。
对于复杂的软件,包括诊断仪器系统中的大多数软件,不可能测试软件代码的所有组合,这使得不可能证明故障强度为零,因为多个软件分支产生了太多的组合来测试。
这一点,再加上在整个开发过程中都会发现软件故障的事实,使得软件故障强度为零的目标是不现实的,即使我们把故障限制在严重事件上。
这种情况之所以长期存在,是因为实际的软件测试项目的结果经常以一种误导的方式陈述,试图表明没有软件错误的目标已经达到。它们包括如下陈述:
➤ 所有软件模块都已成功测试;
➤ 我们已经修复了所有的错误;
➤ 我们作为客户对该软件进行了规定时间的测试,没有发现任何错误。
具有讽刺意味的是,尽管软件质量的规定不正确,所需的指标没有被评估,而且实际的软件故障强度大于零,但软件质量和相关的测试项目完全可能是充分的。
2.4、不正确的性能要求
有时性能要求是不正确的。这往往只是有人不了解如何正确制定性能要求的情况。
例如,一个干扰目标可能被表述为「没有阿司匹林的干扰」,这个目标是无法验证的。真正的意思是,阿司匹林的干扰必须小于1 mg/dL,一个不会引起问题并且可以验证的量。
在另一个案例中,一位项目经理要求检测限的CV值为10%或更低。这是不可能的,因为根据定义,检测限的CV非常高。
2.5、没有相关的测试和分析方法的性能要求
假设我们有一个明确的定量性能要求,如「50-150 mg/dL葡萄糖范围的不精密度应该是2%CV或更少」。
但如果没有提供评估方案,如何验证是否达到了这一性能要求?
我们是测试10个样品还是1000个样品?
在一天内还是一个月内?
我们是使用点估计还是置信区间?
如果是后者,在什么概率水平上?
我们能扔掉一个「坏」值或重复一个可疑的运行吗?
如果项目经理在产品开发过程中离开并被其他人取代,正在使用的测试方法会发生什么?
这些问题说明了为什么一个适当的性能要求需要一个验证方案和分析方法。方案描述了要使用的取样方法和条件,而分析方法定义了要使用的统计分析和报告方法。
3
适当的性能要求的特点
一个适当的性能要求将:
✔ 要有定量;
✔ 可以理解;
✔ 是可衡量的,最好能够预测未来的价值;
✔ 包含评价标准,以提供一种方法来确定是否满足性能要求。
3.1、血气分析仪葡萄糖不精密度的性能要求实例
在50-150 mg/dL的范围内,葡萄糖的运行内CV值应该是2%或更小。
应该使用的方案是按照CLSI方案EP 10中描述的五次运行中的每一次,对10个连续样品进行检测。
该方案使用三个浓度水平,在这种情况下应该是50、100和150 mg/dL。运行内CV的计算方法如该指南中所述。
该性能要求符合上述建议的标准,也可用于预测未来的价值。尽管该方面没有包含在性能要求中。
好了,以上就是今天分享的全部内容,如果大家有什么疑问,欢迎在后台给我们留言,或者加入我们一起讨论,若觉得文章不错,也请关注我们,以免错过后续更新~
来源:诊断科学
声明:本平台注明来源的稿件均为转载,仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!