1 关于低质量证据的正确理解

1.1  低质量证据是指证据体的质量“低”,其中也可能包含若干高质量的原始研究

指南的新定义要求推荐意见必须基于系统评价的证据[1]。该定义表明,对于某一具体的临床问题,指南应尽可能全面检索和收集符合纳入标准的所有原始研究(primary study),并进行严格评价、综合和分析后基于证据综合(evidence synthesize)得出结论。因不同研究者针对同一临床问题所开展的研究,可能因设计和实施存在差异而产生不同,甚至矛盾的结果。若仅基于单个研究进行临床实践,可能作出有偏倚甚至弊大于利的临床决策[5]。因此,本文所说的证据,特指系统检索后能够回答某一临床问题的所有符合标准的研究,其被视为一个整体,称为“证据体或证据群(body of evidence)”,通常采用GRADE分级系统评估其质量。

在GRADE分级系统中,证据质量(quality of evidence)被定义为“对观察值的真实性有多大把握”[4]。对于某一具体临床问题,当研究被系统检索和汇总后,可基于5个降级因素和3个升级因素将证据体质量分为高、中、低、极低4个等级(表1)[6-7]

表1 GRADE分级系统中证据质量与推荐强度的含义[4,6]




图1 应用GRADE分级系统评估某一临床问题中不同结局指标的证据体质量[7]


在进行证据分级时还需考虑研究结果的不精确性、不一致性和间接性,以及发表偏倚等[7-8]。以“瑞德西韦能否有效治疗COVID-19”为例,1篇发表于Lancet Respir Med 的系统评价最终纳入9篇随机对照试验研究进行分析[9],其中部分单个研究的质量很高或偏倚风险很低[10-11]。但汇总分析结果显示,因研究总体估计效应的精确度显著不足,对于接受通气治疗的住院患者,瑞德西韦能否降低病死率仍存在较大的不确定性(对应GRADE分级系统中的C级证据)。

1.2 低质量证据也是当前可得的最佳证据




同样,2018年Lancet 发表的《埃博拉病毒病患者支持治疗的循证指南》[16],在系统检索文献的基础上,结合与埃博拉病毒病相似的其他疾病证据(如休克、霍乱、败血症和其他严重腹泻疾病),指南制订小组共形成了8条推荐意见,其中3条基于低质量证据,4条基于中等质量证据,仅1条基于高质量证据。

1.3 低质量证据在证据谱中占主要比例

相关研究基于GRADE分级系统分析了已发表指南和系统评价中的证据质量,笔者检索了MEDLINE数据库,对其进行初步汇总。检索策略为(“systematic review*”[Title] OR “meta-analys*”[Title] OR “meta analys*”[Title] OR “guideline*”[Title] OR “recommendation*”[Title]) AND (“certainty”[Title] OR “confidence”[Title] OR (“evidence”[Title] AND (“quality”[Title] OR “level”[Title] OR “levels*”[Title] OR “underlying”[Title] OR “strength”[Title] OR “behind”[Title])))。检索时间为建库至2024年4月30日,共获取22篇相关研究[17-38]。结果显示,低(C级)和极低(D级)质量证据在证据谱中占主要比例(图2)。


图2 临床实践指南和系统评价中不同证据质量的比例



表2 各领域临床实践指南和系统评价中不同证据质量的比例[17-38]


1.4 低质量证据与高质量指南之间并无直接关系

在指南制订的过程中,医务人员普遍存在一个误区,即如果大部分推荐意见的支持证据都是低质量的,是否会对指南质量产生影响。事实上,指南质量的高低与其纳入的证据质量并无直接关系[14]。目前国际上公认的指南方法学质量评价工具AGREE Ⅱ(appraisal of guidelines research and evaluation Ⅱ)和指南报告质量评价工具RIGHT(reporting items for practice guidelines in healthcare)[39-40],以及2022年推出的指南科学性、透明性和适用性评级工具STAR(scientific,transparent and applicable rankings tools for clinical practice guidelines)[41],均无评价标准要求指南必须纳入高质量的研究证据,即指南纳入证据质量的高低与指南本身的质量不相关。


2 基于低质量证据形成推荐意见的方法

国内外不同指南制订机构就如何基于证据质量(包括低质量证据)进行推荐给出了相应的方法和建议(表3)[1,44-48]。其中,基于GRADE研发的EtD(evidence to decision)框架,因其科学的设计、透明的流程和清晰的表述,成为包括诸多国际组织在内的指南制订者形成推荐意见时参考的主要依据[49]

表3 主要指南制订手册关于从证据到推荐的一般要求和对低质量证据的考虑


2.1 正确判断证据质量





GRADE将结局指标分为三类:关键(critical)、重要而非关键(important but not critical)、重要性有限(limited importance)[50]




2.2 准确把握指南中强、弱推荐的含义



2.3 基于低或极低质量证据形成强推荐的情况


表4 GRADE分级系统中基于低或极低质量证据形成强推荐的5种情况[20,56]



2.4 证据质量是影响推荐意见的重要因素,但不是唯一因素


2.5 低质量证据或弱推荐对未来临床研究开展具有重要启示



3 小结



