欢迎来到专业的体外诊断原材料信息平台

当前位置> 首页> 技术文章>

刘博谈|基于回归的曲线拟合,干扰效应验证手册 EP.13

本文只适用于那些拥有回归软件和了解回归分析基础统计的人,下面的讨论只限于与两个例子有关的概念和复杂情况。


1、简介


基于回归的方法更加复杂,但并没有为干扰测试提供任何相关的,或更大的严谨性或精确度。


一些剂量效应研究的数据集可以用来拟合一条参数曲线:一条横跨研究中所有干扰物质浓度的「全球」曲线。在实践中,这种方法通常需要通过(分别是简单或多重)线性回归对整个数据集进行直线或抛物线的拟合。


当适用时,主要是对于像图2那样表现出直线轨迹的数据集,参数化曲线拟合是一种可接受的替代方法,而不是上述更普遍适用的点到点方法。基于回归的方法甚至可能在计算上更方便,这取决于软件资源。


很难说基于回归的方法有什么优越性。考虑到所划定的关系和随后的插值的近似性质,所涉及的更复杂的计算并没有为干扰测试提供更大的严格性或精确度。


在实践中,基于回归的方法仅限于在两种形状之间进行选择,即直线和抛物线,分别对应于一阶和二阶多项式。这种选择本质上是经验性的(即数据驱动),而不是基于理论。最后,由(线性或多线性)回归分析产生并得到数据支持的全局曲线预计不会与第4节中描述的方法产生的多边形曲线有很大区别。


此外,抛物线(二次方关系)是一个高度特殊的曲线形状,不能指望它能对每一个表现出非线性轨迹的数据集产生良好的拟合。本节中说明的基于回归的方法不能被视为比点对点的方法更准确或更可靠,因为除了上一节中触及的许多考虑因素外,还有关于回归分析中采用的模型(线性或二次)是否合适的不确定性。


在大多数情况下,只有经验(内部)证据,而不是一些预先确定的(外部)论据,支持数据集符合一个特定的整体形状的假设。


回归分析的软件应用通常会产生置信带(见图2)或预测带,包围着拟合曲线。重要的是,不要过度解释这些带子。它们可以帮助判断拟合曲线是否有经验证据。然而,由于上述原因,这两种类型的带子都低估了与剂量效应研究相关的变异和不确定性。因此,它们不应该被视为划定特定干扰物质浓度下的影响的上限和下限。


2、回归程序简介,直线轨迹


对于一个总共有N个单独测量结果的数据集(N=25,除非有缺失值或作为统计异常值的结果被搁置)。


1.       确定哪一个反应变量(效果测量),差异或差异百分比,与所考虑的查询有关。

2.       构建一个N行两列的表格(与表2的第6列和第7或8列相当),列出每个复测的干扰物质浓度(X)和相关的效果测量(Y)。

3.       对N对X,Y值进行线性回归分析,将Y回归到X(而不是X回归到Y),得到一个直线关系,y = ax + b,其中a和b分别代表斜率和截距。

4.       最后,输入查询的给定值(在步骤1中指定的效应水平或干扰浓度),并求出其他变量的相应值。这就产生了与给定效应(差异或偏倚百分比)相对应的干扰物质浓度的粗略估计,或者反过来说,对给定干扰物质浓度预期效应的粗略估计。


这个程序有几种变化。特别是,如下面的例子所示,不是直接用相关的效应测量(差异或偏倚百分比)作为Y,而是将原始测量结果(以测量单位)与干扰物质浓度作为X进行回归,然后应用适当的转换从测量单位到效应测量。


3、直线型轨迹示例


在图2中,显示了表2中列出的25个单独数值与干扰物质浓度的关系,数据点的整体路径非常类似于一条直线。图中显示了一条由线性回归拟合的直线(红色实线),周围有一个置信带(虚线,也是红色的),它提供了一个关于拟合曲线位置的不确定性的有限感觉,只反映了运行中的采样变化。


图2还显示了多边形的、点对点的轨迹(蓝色),仅仅是为了表明,正如预期的那样,它与本例中的参数曲线非常一致。


拟合曲线是通过对干扰物质浓度(X)与单个测量结果(Y3)进行回归,以测量单位(不是样品特定的平均值)产生的关系。Y3 = 1.2324X + 201.17。


:截距,即本例中的201.17 nmol/L,代表了对M0的另一种基于回归的估计,即在没有添加任何干扰物质的情况下预期的被测量浓度。在本例中,这一数值与表2中标本1的五个测量结果的平均值所得到的201.44 nmol/L的估计值仅有细微差别。(对于另一项研究,差异可能更大)。


鉴于线性关系,Y3 = 1.2324X + 201.17,减去M0可得到与干扰物质浓度绝对值的简单关系,即偏倚 = Y1 = 1.2324X - 0.27或Y1 = 1.2324X,取决于对M0的估计(即201.44或201.17)。另外,通过减去标本1的平均值,即201.44,将单个结果重新表示为差异(表2,Y1),可以直接回归到相应的干扰物质浓度(X)上,得出差异 = Y1 = 1.2324X - 0.272;四舍五入后,这基本上是相同的直线关系。


用测量单位表示的差异是干扰物质浓度的(单一)线性函数,第一种类型的查询(给定X,近似Y1)很容易回答,然后在需要时,用差异百分比重新表示。相反方向的查询(给定Y1或Y2,近似X)则需要倒置回归方程,这对线性关系来说很简单,对二次关系来说则不那么简单。



注:不适合进行反方向的回归分析,即把干扰物质浓度(作为Y)回归到被测量浓度、差异或差异百分比(作为X)上。


4、弯曲型轨迹示例


不建议使用回归法对剂量效应研究数据集进行直线以外的形状拟合,但偶尔也是可行的。可以用二次函数(二阶多项式)来拟合表1中所列的数据:将单个测量结果(以原生测量单位)回归到干扰物质浓度上,通过多元线性回归得到Y3 = -0.032843X2 + 2.5691X + 200.64。


这个代数关系是一个很好的拟合,充分代表了数据集的曲线轨迹,尽管它错误地暗示了干扰物质在第四和第五个标本水平之间的某个地方达到了峰值并开始向零下降,大约在干扰物质的39.1 mg/dL。


与此方程相对应的平滑抛物线曲线(未显示),或以差异或差异百分比为Y变量的类似形式的方程,与图1所示的多边形曲线主要在干扰物质浓度接近标本4(30 mg/dL)时有所不同,由于相对于测量结果的不精密度,这种关系逐渐变平,精确插值是不可行的。


注:对于第二种形式的查询(给定Y1或Y2,近似X),必须倒置适当的二次方程(即解出X与Y的函数)。如果是手工操作,这将比倒置直线方程花费更多精力。


基于这两个例子,线性回归分析最多应该应用于表现出直线关系的数据集。


表1 | 第一个剂量效应的例子

缩略语:CV,变异系数;rep,复测。


注1:以下几点有助于解释表1:


➤  M0被计算为样品1的测量结果的平均值(平均)。

➤  M0代表根据剂量效应研究数据,对干扰物质浓度为零的样品的预期被测量浓度的估计。


✔  在上面的例子中,M0是200.02,是样品1(n=5)的平均值,以本土测量单位计算。


➤  Y3:每个样品的n=5的平均值,以测量单位计算;

➤  CV%:变异系数(SD-100/平均数);

➤  X:每个样品中添加的干扰物质的浓度;

➤  Y1(偏倚):用每个样品的平均值减去相应的测量值M0,得到以测量单位计算的绝对偏倚。偏倚=平均测量结果-M0;

➤  Y2:相对偏倚百分比,相对于每个标本平均值的M0(即干扰物质的相对影响);

➤  偏倚百分比:相对偏倚百分比是通过每个标本平均值的测量单位的差异除以M0,然后乘以100而得到的:偏倚百分比=差异-100%/M0;

➤  蓝色显示的数值与图1中的X,Y数据点(绿色圆圈)相对应;如果25个测量结果首先被重新表述为差异或差异百分比,它们将被绘制在相同的位置。


注2(表1和表2):对于表2中的数据集,也可以计算出特定标本的差异(Y1)和差异百分比(Y2)的平均值,方法是首先转换各个测量结果,然后对每个特定标本的转换值子集进行平均。以这种方式处理第一个例子的原始数据将产生与表1最右边两列显示的相同的差异和差异百分比值(四舍五入)。在表1和表2的原始数据和转换值之间的选择部分取决于是使用点对点的曲线拟合和插值方法还是使用基于回归的方法。

图1 | 第一个剂量效应的例子,点对点拟合(四条线段)。


在图1中,直线段(蓝色)连接了连续的混样特定的平均值(「+」符号)。上方的水平虚线被任意设定为10%的差异,仅代表一个假设的利益水平;下方的水平虚线被设定为M0。


注1:该图显示了所有三个纵轴,以证明它们之间的相互关系;在实践中,三个纵轴中的任何一个都足以构成一个合适的散点图。


注2:无论使用偏倚(Y1)还是偏倚百分比(Y2),连接相邻的手段也会产生相同的线段。


相邻的中位数也可以连接起来,因为这将产生一个类似的轨迹。但是,一般来说,除非真的担心原始数据集中的异常测量结果,否则以平均值来分析比较好。


注3:为了更全面地描述一种干扰物质的特性,可以用较低水平的干扰物质(例如,用12mg/dL的高水平而不是40mg/dL)复测这种剂量效应测试。此外,还可以使用不同的试剂批次、仪器运行和不同形式的干扰物质来复测测试。


表2 | 第二个剂量效应实例

缩略语:CV,变异系数;rep,复测。


:在表2中,M0 = 标本1的平均测量结果,偏倚 = 测试结果 - M0,偏倚百分比 = (偏倚×100%)/M0。

图2 | 第二个剂量效应实例。回归的直线拟合,95%置信区间(红色),点对点拟合比较(蓝色)。


该图显示了最佳拟合的直线(红色实线),周围是95%的置信区(红色虚线)。同时显示的还有点对点的拟合(蓝色的直线段)。


好了,以上就是今天分享的全部内容,如果大家有什么疑问,欢迎在后台给我们留言,或者加入我们一起讨论,若觉得文章不错,也请关注我们,以免错过后续更新~


来源: 诊断科学

声明:本平台注明来源的稿件均为转载,仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!



返回顶部