一、概述
任何实验方法都有两种潜在的误差来源:随机误差(如抽样误差)和系统误差(如观察者偏倚),要评价实验检测的结果,就必须了解这两种因素的大小。
随机误差(random error)通常用结果的精密度来描述,可以通过反复测量同一样本而计算出来。其数值大小一般用平均数 ± 标准差( x± s)来表示,但由于方差(variance)通常是与平均数绝对值成比例,故用相对离散指标表示可能更加合适。这就是变异系数(coefficientofvariation,CV),用标准差除以平均数再乘以 100,就得出其百分数值。
通常用准确度(accuracy)来描述系统误差(system error),其定义是观察研究的估计值与真实值之间的真实差异。一种新方法(如 CASA)的准确度可以通过与另一种早已建立的方法的结果相比较而确定,其精密度和准确度均得到公认,也可以通过检验增减已知量而得以确定。CASA 系统的准确度能通过混合不同比例的精液和无细胞精浆来确定,这将导致总的精子浓度成比例降低,但活动精子百分比减少最少。新鲜的精液,还可以不同比例与其同时射出的另一部分精液混合,后者应经过 2~ 3 次冻融以杀死所有精子,这样可以保持精子浓度恒定,而降低了活动精子的百分比,对于这两种情形均应使用已知准确度和精密度的方法,作精子浓度的标准血细胞器计数及目测可视活动力计数。
二、存在的几个特殊困难
(一)稀释的准确性
应用容积烧瓶和加样器可高度精确和准确地稀释水溶液或悬浮液。然而,这些器皿均是在 20℃ 蒸馏水条件下标定刻度。由于精液具有黏性,在用加样器稀释精液时精液黏附于吸嘴内壁而有显著损失。必须使这些粘附的精液回收以获得准确的容积。即使是使用自动吸管,同样的问题依然存在。精液会粘在一次性塑料吸嘴的内外表面,当然若是用不湿吸嘴,则粘着要少些。然而这些装置的管腔内空气无效腔与标本容量相比却占相当比例。此外精液黏性的增加会打破加样器内外空气压力之间的平衡,且加样器吸嘴末梢孔眼愈小,这种情况就愈糟。解决精液黏附和空气无效腔问题的一个简易方法是在测量容积时一律使用"阳性"加样器(positive displacementpipettes)。这些加样器使用一次性的玻璃毛细管来度量吸纳和排出的液体容积而不受其黏性的影响,它们吻合甚佳且带有一个容易清洗活塞,直接与样品接触,因此,在样本凹面与活塞之间不存在无效腔。
(二)放大率的校订
精子运动特征的准确测定要求光学和影像系统的放大率必须是已知的。这一点对于各种使用显微镜的测定方法来说特别简单,照片、电影胶片和录像带均与台式测微计组合在一起(通常把 1mm 再分成以 100或 10μm为 1个刻度单位),其长度在最终影像中测得。CASA系统通常包含根据 Makler格子网(100个μm的方格)确定的图像校正功能。当光学系统的任何部分,如照相机发生了变化时,则系统的实际放大率必须重新校订。照相机放大率由6.7× 变成 3.3× 时,则最后影像的放大率将缩小近一半,但必须确定精确的数值。即使使用相同倍数的物镜,不同型号的显微镜常会有不同的实际放大率。此外,中途放大或显微镜的"镜筒因素"(tube factor)也会使最终影像的放大率有显著变化。
(三)温度控制
精子的活动力取决于其本身的代谢,因此也受到温度的影响。温度的变化可能不会引起活动与不活动精子之间的比例,以及非前向性活动精子与前向性活动精子之间的比例的明显改变,但其运动特征将受影响。精子运动速度对温度极其敏感,当精液温度从 25℃ 上升到 37℃ 时,其速度可增加 60% 到 100% 。显然,对于精子运动的各种评价研究须在 37℃进行。
所有的计数池、标本瓶、加样器的吸嘴在使用之前,须放置于 37℃ 条件下,显微镜亦须装备一个可加热的载物台。
(四)抽样误差
在取样作定量分析之前必须彻底混匀精液标本。合适的混合方法有许多种如可用震荡轻柔的混旋器、自动摇匀器,也可用一次性的玻璃或塑料棒搅拌以及持标本瓶作划圈样运动等,但应避免高速旋涡混合,因为这样会影响精子运动或运动特征。
由于在应用 Makler等计数池时,仅需取极少量的标本即可,对每一个样品进行计数观察时应重复几次,且为了获得正确的结果,每次都要观察若干视野。至少观察 3~ 9 个视野才能得到稳定的观察值。有人认为,倘若用肉眼计数,则平均需要 3份 Makler制备液才能获得有关精子浓度和动力学的可靠数值。另一项研究表明,使用 Cellsoft获得的最佳结果是至少要从 4个视野中分析 225个精子,并重复 3次。显然,CASA 系统目前既不简便也不快速。
减少抽样次数会显著增加潜在的抽样误差,但不至于改变临床诊断,从总体上讲数据的变异性增加,则会限制其在流行病学或有关研究中的应用价值。
总之,目前认为要获得可接受的准确度和精确度,用 CASM /CASMA 系统进行分析时,精子活动率至少须观察 4个不同的视野,且观察的细胞总数须达 200个以上。而分析精子群体的平均运动特征时则至少需用 30条精子运动轨迹(最好是 50条)。如果需要识别某些精子亚群(如有关过度激活的研究),则所需轨迹数宜增加到 200条。
三、统计方法
线性回归分析对于确定两种测量方法之间的一致性几乎没有什么用处,用相关系数( r)及其有关的显著性水平来表示两组读数之间的相关性也毫无意义。因为一个具有显著意义的 r值仅仅代表配对数据的点明显接近于一条直线,而对于该直线的斜率(slope)和截距(in-tercept)并未提供任何信息。因此自然无法获得关于两组读数之间实际关系的信息。例如,倘若斜率不是 1.0,那么这两种测量方法就不是在 1∶1的基础上相关。在极端情况下,倘若斜率为零,那么此统计结果实际上证明了两组数值完全不相关。同样,如果截距显著大于或小于 0,则这两种测量方法亦不理想。
我们真正需要知道的是两种方法之间的差异是否基本上为 0,或是否在同一方向上存在系统差异。正、负平均差可反映这种差异,应用配对 t检验即可最简便地分析上述差异与原始数据相比配对数据间的平均差别是否具有显著性意义。
然而很容易产生这样一种情况,虽然平均差别接近于 0,而在 0 的两侧(正的或负的差异)实际差别的分布范围却很广。比较理想的是我们需要知道这些变异的范围,可由平均数差的标准差计算得到。标准差乘以适当的 t值(从 t值表上在 P = 0.05,配对数据的自由度n-1处取 t值),则平均差 ± t值就得到这种差异的 95% 范围,即 t0.05× s± t0.05。换言之,对于 95% 的分析结果而言,这两种测量方法之间的差异,将落在 95% 的可信限范围。
显然,理想的平均差应是 0,但要确定可接受的 95% 可信限比较困难。在大多数生物学研究中,相对于测定值的 5% 变异范围是足够的,从而两组数据将各有 95% 的可能性在 10%的范围内。但对于精子浓度来说,变异范围甚大,故必须用相对于两组数据平均值的百分数来表达。很明显,一个 ±10×106/mL 差异对于 20×106/mL 标本要比对于 100× 106/mL 标本有更大的意义。
本方法的适用性已由 Bland 和 Altman 从理论上加以证实,并应用到 CellsoftCASA 系统的评估中。然而,当老方法与新方法之间的差别十分明显时,利用这两种方法的平均值来计算变异百分比会得出错误的结果,因此,在这种情况下,只能使用被认为可靠、可接受的老方法的值。
四、"真实"的概念
许多临床医生以及许多临床研究人员习惯于将实验室获得的结果当做绝对真实的数据,而忽视了与生物学测量有关 的 抽 样 误 差 及(或)方 法 误 差。例 如:将 精 子 浓 度 为19×106/mL的男子归类为精子数减少者,而将精子浓度为 21× 106/mL 的另一男子归类为精子数正常者显然是荒唐的,其实两者均落在正常精子浓度的 10% 的误差范围内。多年来人们已经承认,标准精液分析方法容易产生较大的方法学上的误差和潜在的观察者偏倚。人们普遍认为电脑化的 CASA 系统必然是准确和精密的,遗憾的是大量的评估表明,这种推测是错误的,有待进一步证实,使之更臻完善。
由于电脑在计数上有很高的精确性,所以报告结果时倾向于把数据精确到小数点后若干位,而与测量和分析方法本身的准确性无关。如果结果取自其他显示器,如刻度盘显示器,那么我们会乐于接受这样一个事实:即读数易产生错误,并对合理的位数表示满意。而以下的事实则是与这种虚假精确度的观念相违背的:所测量的精子运动特征应以带一位小数的值表示而由此获得的前向运动精子数的比率应以整数百分数表示。