心理动力疗法符合循证医学:使用最新标准的系统回顾
Falk Leichsenring, Patrick Luyten, Mark J Hilsenroth, Allan Abbass, Jacques P Barber, John R Keefe, Frank Leweke, Sven Rabung, Christiane Steinert
Lancet Psychiatry 2015; 2: 648–60
译者:袁帅
共9603字
心理动力疗法(PDT)是一个涵盖性概念,指的是以解释-支持性连续体为基础的治疗方法,在临床实践中经常使用。任何形式的心理治疗都应有充分的证据支持。PDT的疗效研究长期以来一直被忽视。在这篇综述中,我们描述了疗效证明的方法学要求,并总结了使用PDT治疗精神健康障碍的证据。在指定优效性、非劣效性和等效性试验的要求后,我们使用以下标准进行了系统搜索:PDT的随机对照试验;使用治疗手册或类似手册的指南;使用可靠有效的诊断和结果测量方法;接受特定心理问题的治疗的成年人。我们确定了64项随机对照试验,这些试验为PDT在常见精神健康障碍方面的疗效提供了证据。足够有力地检验与既定治疗方法等效的研究并未发现疗效存在显著差异。这些结果得到了多项荟萃分析的证实,表明PDT与已确定疗效的治疗方法一样有效。对于某些精神健康障碍,如强迫障碍和创伤后应激障碍,需要进行更多随机对照试验。此外,还需要更多足够有力的等效性试验。
序言
心理治疗可有效治疗多种精神障碍、症状和问题。任何形式的心理治疗都应有充分的证据支持。心理动力疗法是一个涵盖性概念,指以解释-支持性连续体为基础的治疗。通过解释性干预,可以增强对愿望、情感、客体关系或防御机制的洞察力。支持性干预包括建立治疗联盟、设定目标或加强心理社会能力,如现实测试或冲动控制。使用更具支持性或更具解释性(增强洞察力)的干预措施是根据患者的需求量身定制的。有一系列心理动力疗法指南,它们在关注支持性或表达性元素的程度上有所不同。
在这篇回顾中,我们讨论了确定心理治疗有效性的方法和统计要求。我们区分了测试优效性、非劣效性和等效性。我们特别关注后者,因为测试等效性尚未在心理治疗研究中得到广泛应用。尽管研究经常声称已经证明了结果的等效性,但它们往往不符合这样做的要求。我们将这些考虑因素特别应用于临床实践中经常使用的PDT,以更新和扩展PDT在特定精神障碍中的证据(面板1)。这些考虑因素适用于任何心理治疗或药物治疗。
确定疗效的方法:证据等级
大多数人认为随机对照试验(RCT)是黄金标准,但RCT方法既有优点也有缺点。例如,一项随机对照疗效研究会最大化与所应用治疗相关的内部效度,但可能会牺牲外部效度,即临床实践中对现实条件的普遍性。相比之下,疗效研究调查常规临床护理中干预的效果,因此具有较高的外部效度,但可能会牺牲内部效度。因此,疗效和疗效研究针对的是不同的研究问题。对于已在RCT中评估过的治疗方法,需要进行研究以调查其在现实条件下的疗效。
在RCT中,一种治疗方法可能会与不同的对照条件进行比较,例如无治疗、安慰剂、常规治疗、替代治疗或已知疗效的治疗。最严格的疗效测试是将新疗法与已证实有效的治疗方法进行比较,因为这种研究设计控制了特定和非特定(或共同)因素。
与等待名单情况(waiting list condition)(无治疗)的治疗比较仅控制了疾病的自然过程,而与另一种心理治疗、安慰剂或常规治疗的比较则控制了所有类型心理治疗的共同因素(例如,治疗联盟、期望、动机、一般支持和关注)。这意味着不同的研究设计和比较条件与不同的研究问题相关(即,在控制自然过程、共同因素或共同和特定因素时,治疗是否有效?)。此外,一种治疗方法可能被认为优于、不劣于或等同于另一种治疗方法或条件。因此,区分优效性、等效性和非劣效性测试非常重要。
优效性
要使一种治疗方法优于另一种治疗方法,治疗组的结果必须具有统计学显著性,优于对照治疗组。但是,统计学显著性只是显示优效性的必要条件,而非充分条件。此外,还必须考虑组间效应大小形式的差异大小(例如,Cohen提出的不同测量方法,或需要治疗的人数[NNT]、被试工作特征[ROC]曲线下面积[AUC]或成功率差异[SRD])。由于多种原因,不建议使用比值比来衡量效应大小。差异大小很重要,因为结果的微小差异可能具有统计学显著性,但并不具有临床显著性。
为了证明优效性,通常使用双侧差异检验。例如,要通过α=0.05的双侧检验检测出功效为0.80的治疗之间d=0.5的中等差异,每组需要64名患者(表1)。
表
等效性
等效性试验用于表明新疗法的结果不比既定疗法更好也不比既定疗法更差。如果使用传统的双侧差异检验来检验结果的等效性或非劣效性,则结论通常是错误的,因为双侧检验不考虑等效性边际。等效性边际(–ΔE, ΔE)定义了一个值范围,在这些值范围内,功效足够接近,可以被视为等效。实际上,边际是人们愿意接受的最大临床可接受差异。此外,不显著的结果仅意味着不能排除等效性,这与证明等效性不同。更合适的等效性检验是双侧单侧检验(TOST)程序(面板2)。如果经验发现的差异的CI在等效边界内(表1),则结果是等效的。所需的样本量和统计功效直接取决于等效边界的大小。传统的双侧检验和等效性检验(TOST)经常产生不一致的结果。
非劣效性
非劣效性(NI)试验检验以下假设:试验治疗的疗效不比已确定疗效的治疗低ΔNI。如果差异的(1–2α) × 100% CI的下限高于–ΔNI,则非劣效性假设将在显著性水平α下被接受。为了检验非劣效性,建议在α=0.025处进行单侧检验。非劣效性试验基于以下假设:试验治疗在与疗效无关的结果(例如副作用或成本)上优于标准治疗。非劣效性试验指南最近已发布。关于非劣效性边际,他们建议测试干预和活性对照之间的差异应小于活性对照和安慰剂之间差异的50%。此外,测试干预和活性对照之间的响应率差异不应超过5%。但是,非劣效性试验指南不包括确定样本量或功效分析的数据或建议。表1列出了证明非劣效性所需的每组样本量,功效为0.80,适用于各种非劣效性边际。对于5%或更小的差异,每组需要1579名患者(p1=p2=0.5)。在心理治疗和药物治疗研究中,很难获得这种规模的样本。对于非劣效性试验,需要更务实的解决方案或中间步骤。等效性和非劣效性试验依赖于以下假设:与安慰剂或其他治疗相比,活性对照的优效性已事先确定,并将在试验期间保持,并且试验与先前显示活性对照优于安慰剂或其他治疗的试验足够相似。特别是,患者人群和治疗特征必须与之前的试验一致。
等效性和非劣效性试验审查指南
回顾
最近,提出了审查等效性和非劣效性试验的建议。对于PDT与已确定疗效的治疗方法的比较,我们遵循这些建议,(1)先验地定义等效范围,(2)考虑样本量和统计功效,(3)在得出等效性或非劣效性的结论时使用直接语言而不是间接语言(诸如“没有统计差异”之类的措辞可能在事实上正确地描述研究结果,但关于等效性的结论应直接描述为“不劣于”或“同样有效”)。此外,(4)我们寻找可能导致低估或高估治疗间差异的可能偏差(即患者、测量值或治疗与确定活性对照药疗效的试验中的偏差)。为了满足这些标准,我们(1)初步采纳了Chambless和Hollon提出的“中等”治疗间差异作为等效性边界的建议和(2)检查了纳入研究的统计能力是否足以证明等效性,如果应用了TOST程序的逻辑。因此,如果数据分析基于每种情况下至少n=70名患者,使用中等效应大小d=0.5作为等效边际,对两个单侧检验(TOST,表1)的显著性水平α=0.05,则我们暂时认为RCT具有足够的功效(≥0.80),可以显示(均值)活性(active)心理治疗(例如PDT)与既定治疗的等效性。
荟萃分析
一些个别研究可能不符合上述功效标准。通过使用荟萃分析汇总一系列研究,可以获得高于个别研究的统计功效。在荟萃分析中,统计功效取决于纳入的研究数量、每项研究的患者数量以及研究之间的异质性程度。Hedges和Pigott提出了一种适用于小、中、大异质性水平的惯例。该惯例是将研究间方差设置为研究内方差的0.33、0.67或1.0倍。对于小、中、大异质性水平,假设每组有25名患者,仅需分别进行四、五和六项研究即可通过随机效应模型的双侧检验检测到中等效应大小d=0.5,功效为0.80或以上,α=0.05(单侧检验需要三、四和五项研究)。对于此计算,我们使用了Hedges和Pigott以及Borenstein及其同事提供的公式。对于较小的差异d=0.2,双侧检验所需的研究数量分别为21、27和32,而单侧检验所需的研究数量分别为17、21和25。
PDT的实证证据
我们确定了17项研究,这些研究未包含在我们已发表的关于特定精神障碍的PDT系统综述中。我们将更新的标准应用于此次搜索中确定的64项RCT。结果是指各自疾病的目标症状(例如,抑郁障碍中的抑郁),或合并症症状(例如,焦虑障碍中的抑郁),或各自研究中评估的社会和人格功能。在大多数RCT中,研究了短期至中期(8-40次疗程)PDT(表2)。几项研究还包括长期(12-36个月)PDT。
表2:针对特定精神障碍的手动引导PDT随机对照研究
抑郁障碍
在几项RCT中,PDT优于等待名单对照条件或替代疗法,可改善抑郁障碍(表2)。对于产妇抑郁障碍患者22和乳腺癌患者,PDT也优于常规治疗。互联网引导的心理动力自助优于互联网提供的结构化支持。 此外,在重度抑郁障碍中,PDT联合药物治疗优于单独药物治疗或联合支持疗法。一项小型试点研究的结果显示,与常规治疗相比,PDT具有较大的效果,但该研究不足以进行优效性试验,差异未达到统计学意义(表2)。
关于CBT或药物治疗等既定治疗方法的比较,两项研究的功效足以检验其等效性或非劣效性。在这些RCT中未发现结果的显著差异。但是,第一项研究采用了传统的双侧检验,而不是TOST程序。另一项RCT测试了非劣势。在这项RCT中,PDT与CBT相比的非劣势并未显示缓解率,但显示了治疗后抑郁的持续测量。然而,从临床角度来看,缓解率的差异(PDT为21%,CBT为24%)很小。几项RCT的结果显示,PDT与已知疗效的治疗在结果上没有差异,但如果应用每组至少70名患者的标准,这些研究不足以证明等效性。由于相对较少研究的荟萃分析比单个研究具有更高的统计功效,因此值得注意的是,几项荟萃分析的结果显示,单个PDT对抑郁障碍有效,与其他既定治疗方法没有差异。
复杂性哀伤(Complicated grief)
两项RCT证明了PDT对复杂性哀伤的疗效。 在这些研究中,PDT优于等待名单情况(waiting list condition)或支持性治疗。
焦虑障碍
几项RCT的结果为PDT在治疗焦虑障碍方面的疗效提供了证据(表2)。对于惊恐障碍,PDT优于放松应用(applied relaxation)。在一项关于惊恐障碍中PDT与CBT的RCT中,未发现缓解率有显著差异,但该研究的效力不足以证明其等效性。对于社交焦虑障碍,PDT优于可信的安慰剂或与CBT一样有效。最近的RCT结果表明,PDT优于等待名单情况(waiting list condition),并且在所有结果(社交焦虑、一般精神病理学和防御机制)中与CBT一样有效。成功率超过50%,并且在3个月和12个月的随访中保持稳定。与CBT相比,作者报告称该研究的效力足以检测到中等差异。在一项大型多中心RCT中,PDT和CBT均优于等待名单情况(waiting list condition)。在反应率和抑郁减轻方面,PDT和CBT之间没有发现差异。CBT在缓解率、自我报告的社交焦虑和人际问题方面表现出统计学上显著更好的结果,但这些差异很小,低于预先定义为具有临床意义的阈值。此外,在治疗结束后6、12和24个月,任何结果测量的长期效果均无差异。虽然最初设计为一项优越性研究,以检测结果中的细微差异,但如果应用上述提出的功效标准,则该研究的功效足以测试等效性。
对于广泛性焦虑障碍,一项研究的结果显示,在主要结果测量(汉密尔顿焦虑量表)中,PDT和CBT之间没有显著差异,但该研究的等效性试验能力不足。次要测量(例如担忧和抑郁)中,CBT取得了统计学上显着更好的结果。治疗效果在治疗结束12个月后保持稳定。在另一项RCT中,互联网引导的心理动力自助被证明优于广泛性焦虑障碍的等待名单情况(waiting list condition)。与互联网引导的CBT相比没有差异,但这项研究的效力不足以证明等效性(表2)。
对于包含各种焦虑障碍类别的混合样本,在7个月的随访中,短期PDT优于长期PDT(并且与以解决方案为重点的疗法一样有效),在恢复方面。在患有抑郁障碍或焦虑障碍或两者兼有的混合样本中,PDT优于常规治疗(药物治疗)。
在治疗社交焦虑障碍和惊恐障碍时,PDT加药物治疗的结合被证明优于单独药物治疗。对于惊恐障碍,PDT联合药物治疗的缓解率和复发预防率优于单独药物治疗。
在最近的荟萃分析中,PDT优于焦虑障碍的非活性对照条件。PDT与其他真正的治疗方法之间没有差异。 对于这项荟萃分析,作者报告称,无论异质性程度如何,在终止时PDT和替代积极治疗之间的大和中等效应大小都可以以大约1.00的功率检测到。
躯体形式障碍或躯体症状障碍
有大量证据表明PDT对躯体形式障碍有效,现在在DSM-5中称为躯体症状障碍(表2)。RCT证据可用于肠易激综合征、功能性消化不良、和躯体形式疼痛障碍。在这些RCT中,PDT均优于常规治疗或支持疗法。此外,荟萃分析的结果显示PDT对躯体障碍患者有效。饮食失调、神经性贪食症研究的结果表明PDT优于CBT和营养咨询。另外两项研究的结果表明PDT和CBT在主要结果指标(暴食发作和呕吐)上没有差异,但这些研究没有足够的证据证明其等效性(表2)。在次要指标中发现了有利于CBT的差异。在另一项RCT中,CBT优于PDT,但该研究存在争议,因为PDT是手动的,而不是以症状为重点的。
两项研究的结果为神经性厌食症的PDT提供了证据。一项RCT比较了手动引导的PDT、增强型CBT和常规优化治疗在神经性厌食症治疗中的作用。治疗结束时,所有治疗均有显著改善,主要结果指标(体重指数,BMI)无差异。然而,在12个月的随访中,PDT在恢复率方面明显优于常规优化治疗,而增强型CBT并没有明显优势。PDT的恢复率为35%,增强型CBT的恢复率为19%,常规优化治疗的恢复率为13%。这项研究有足够的证据证明等效性(表2)。在一项暴食症研究中,PDT优于等待名单控制条件,并且与CBT一样有效。两项饮食失调研究没有足够的证据证明与积极治疗等效(表2)。 与常规治疗和候补名单相比,这些研究具有足够的效力以显示优越性。
人格障碍
两项荟萃分析的结果表明PDT在治疗人格障碍方面有效。
C型人格障碍
两项RCT报告了PDT在C群人格障碍中的证据与CBT相比,结果没有差异。这些研究没有足够的效力来证明等效性(表2)。另一项RCT的结果表明,在治疗回避型人格障碍方面,CBT比等待名单情况和PDT更有效。该研究因可能存在的偏见而引起争议,例如,是否使用了针对特定疾病的操作指南的真正PDT版本。
B型人格障碍
几项RCT的结果表明,边缘性人格障碍可通过PDT成功治疗。Bateman和Fonagy表明PDT(基于心智化的治疗,MBT)优于日间治疗。在第二项RCT中,Bateman和Fonagy表明MBT优于操作指南引导的结构化临床管理。MBT在自我报告和临床显著问题方面表现优异,例如自杀企图和住院。Clarkin及其同事将两种类型的PDT(移情聚焦疗法[TFP]和支持性心理动力疗法[SPT])与辩证行为疗法(DBT)进行了比较。在几个结果测量中,三种治疗方法之间没有差异,但在反思功能和依恋的改善方面,TFP优于DBT。只有TFP和SPT与愤怒和冲动的改善有关,只有TFP与易怒、言语和直接攻击的变化有关。TFP在12项结果测量中的10项中产生了显著改善,DBT在12项测量中的5项中产生了显著改善,SPT在12项测量中的6项中产生了显著改善。另一项RCT证实了TFP的疗效,该研究显示TFP优于经验丰富的社区治疗师的治疗。Gregory及其同事
79报告称,对于同时发生酒精使用障碍的边缘患者,PDT(解构疗法)优于常规治疗。另一项RCT将PDT(即以移情为中心的心理治疗,TFP)与以图式为中心的治疗(SFT)进行了比较。作者报告了两种治疗方法在统计和临床上均有显著改善。然而,据报道,SFT在几项结果测量中优于TFP。此外,TFP的退出率明显更高。人们对本研究中使用的方法论,尤其是对TFP治疗完整性的担忧已经发表。将PDT与另一种积极治疗进行比较的两项研究没有足够的能力来显示等效性,但两项研究都报告了PDT或SFT至少在某些指标上的优越性。
人格障碍患者的异质性样本
在两项RCT中,PDT优于等待名单控制条件或最低限度接触条件,适用于具有异质性人格障碍的样本。另一项RCT的结果显示PDT和简短支持疗法之间的结果没有差异。然而,其中两项没有足够的能力来检测PDT和积极比较之间可能存在的差异。在一项有足够效力的研究中,手动引导的PDT与社区提供的PDT一样有效。
物质相关障碍
对于阿片类药物依赖,两项RCT的结果为PDT在几个结果(例如,工作天数、吸毒、非法收入、抑郁和一般精神症状)中的有效性提供了证据。在Woody及其同事的早期研究中,PDT和CBT均优于药物咨询(标准治疗)。PDT和CBT之间没有发现差异,但研究的效力不足以测试等效性。在Woody及其同事的后续研究中,PDT优于药物咨询。因此,PDT被证明对阿片类药物成瘾有效。相比之下,据报道,PDT和CBT都不如可卡因依赖的个人药物咨询。
强迫障碍
在唯一一项已发表的关于强迫障碍PDT的RCT中,PDT联合药物治疗并不优于单纯药物治疗。
精神病服务的高使用者
对于精神病服务的高使用者来说,PDT优于常规治疗。样本主要包括患有抑郁障碍和焦虑障碍的患者。
关系困扰:婚姻治疗
在个人和关系功能方面,PDT和行为夫妻治疗之间没有发现显着差异。在这方面,这两种治疗方法都优于等待名单对照组。6个月的随访中仍保持了效果。在4年的随访中,行为条件下离婚的夫妇明显多于PDT中的夫妇(38% vs 3%)。这项研究有足够的能力来显示优越性,但不是等效的。
复杂精神障碍的长期心理动力学心理治疗
在几项荟萃分析中,长期心理动力学心理治疗(LTPP)被定义为至少进行50次疗程或持续至少1年,对于复杂精神障碍患者(定义为慢性精神障碍、人格障碍或多种共病障碍),其治疗效果优于短期或强度较低的治疗形式。在改善目标问题、一般精神症状、人格和社会功能方面表现出优势。这些研究的结果与剂量效应关系数据一致,这表明对于许多患有慢性精神障碍或人格障碍的患者来说,短期心理治疗是不够的。对于这些患者,长期治疗似乎更有效。本荟萃分析中使用的统计分析和比较条件已经过审查和批评。一些出版物已经解决了这些问题。如果仅包括主动比较条件,考虑以前未包括的研究并分析组间效应大小,则荟萃分析结果得到证实。因此,在复杂的精神障碍中,LTPP被证明优于较短或强度较低的治疗。类似地,我们预计其他形式的长期心理治疗在复杂的精神障碍中优于这些治疗的较短形式。例如,用于边缘性人格障碍的DBT或SFT也是长期治疗。
讨论
PDT在临床实践中经常使用。然而,功效研究在PDT中长期被忽视。一些心理动力治疗师和研究人员仍然担心将RCT的方法应用于PDT。一些心理动力治疗师和研究人员仍不确定RCT在PDT中的临床应用。例如,对无意识冲突或过程的研究对PDT研究提出了独特的挑战。然而,可以研究以可观察到的改善表现形式出现的PDT结果。关于治疗手册化的问题,使用治疗手册的现有RCT表明,心理动力疗法的复杂人际过程可以手册化(表2)——不应将治疗手册误认为是食谱。目前的手册允许治疗师行为具有广泛的灵活性。即使是长期的PDT也可以由手册指导,正如Bateman和Fonagy、Clarkin及其同事、和Vinnars及其同事的RCT所示。此外,PDT研究的方法学质量与CBT研究相当,这表明RCT方法可以充分应用于PDT和CBT。
近年来,PDT的疗效研究有所增加,其疗效的证据也开始积累。我们的系统回顾结果表明,有大量证据表明PDT在抑郁、焦虑、躯体形式障碍、饮食、物质相关和人格障碍方面有效。这一证据水平与最近的Cochrane报告一致,该报告发现PDT对常见精神障碍有效。在后续评估中发现PDT的效果保持稳定或增强。
尽管越来越多的证据表明PDT可用于治疗精神健康障碍,但也存在一些局限性。根据本综述中提出的最新纳入标准,64项PDT研究中只有6项具有足够的效力来证明其与既定治疗方法等效。然而,将CBT与既定治疗方法进行比较的研究并没有更高的效力:在26项比较心理治疗与药物治疗的研究中,只有两项研究每组至少包括70名患者。在心理治疗研究领域,明确测试本综述中定义的等效性的RCT仍然极为罕见。在本综述的64项RCT中,没有一项被概念化为等效性试验。我们在一般文献中发现的唯一一项等效性研究探讨了CBT治疗健康焦虑的成本效益。然而,在医学研究中,等效性和非劣效性研究的数量和质量有所提高。
在六项研究中,只有一项研究的PDT效果不如有效治疗,而这些研究的效力足以满足我们在此应用的标准。在这项研究中,PDT和CBT在治疗可卡因依赖方面均不如个人药物咨询。在那些足以检验等效性的研究中,未发现PDT和CBT之间的疗效存在显著差异。此外,微小差异的临床意义值得怀疑。无论是在大规模个体研究还是在荟萃分析中,比较真正的疗法之间的PDT的组间效应大小通常都较小。这些荟萃分析的结果使人们更加确信真正的治疗之间没有差异,因为荟萃分析比个体研究具有更大的统计能力。如果未来的研究证实,在常见精神障碍中,不同形式的真正的心理治疗在结果上没有实质性差异,那么下一个问题就是哪些患者从哪种治疗中受益更多。
本综述中研究的PDT的治疗完整性非常重要。治疗完整性被定义为治疗按预期进行的程度,是心理治疗研究中的一个关键因素。治疗的完整性通常得不到充分解决,这已在包括CBT在内的所有形式的心理治疗中得到证实,因为CBT的研究比其他方法更多。此外,遵守治疗模式与干预或结果的有效实施之间的关系是异质性的。目前尚不清楚MBT或DBT等治疗方案中的哪些干预措施与改善有关。然而,在几项研究中,心理动力学干预与结果之间存在显着关系。
这些研究为PDT提供了另一种证据,即治疗结果与心理动力学干预有关。此外,有证据表明,心理动力学相关介质(如核心冲突和洞察力)的变化与治疗结果有显著相关性。
本综述纳入的64项RCT使用了不同的PDT方法。然而,从实证角度来看,这些方法有多大差异尚不清楚。研究表明,治疗焦虑障碍和抑郁障碍的方法彼此一致,重叠性较大。因此,开发用于常见精神障碍的心理动力学治疗的统一或跨诊断方案是可能的,并且可能成为未来研究和实践的重要目标。
在这篇综述中,我们使用了严格的标准来评估PDT证据。最近的一项有缺陷的荟萃分析表明,需要制定如此严格的标准。该分析声称要检验所谓的渡渡鸟假说,即真正的治疗之间没有疗效差异。这项荟萃分析的结果表明,PDT不如CBT。但是,PDT与CBT的比较是基于选定的研究样本,因为只包括了三项PDT研究。在这些研究中,没有一项可以被视为真正的PDT的代表。在第一项研究中,没有使用治疗手册,治疗师也没有接受过研究培训。在第二项研究中,只为亚综合征抑郁障碍患者提供了两次加一次治疗。第三项研究的结果显示,PDT和CBT之间的治疗完整性存在差异,这使该研究的内部效度和结构效度受到质疑。此外,Marcus及其同事省略了几项比较真正的PDT和CBT的RCT。其中包括几项关于抑郁障碍、焦虑障碍、创伤后应激障碍、饮食失调、物质滥用障碍、和人格障碍的研究。总共有22项比较PDT和CBT的RCT未被纳入这项荟萃分析—也就是说,遗漏的相关研究数量几乎是纳入的相关研究数量的八倍。2014年也发表了新的相关研究。总之,Marcus及其同事报告的结果与最近的几项评论和荟萃分析不一致。Marcus及其同事报告称,在将CBT与其他治疗方法进行比较时,主要结果的组间效应大小为0.16。根据既定惯例,0.16的组间效应大小是一个最小差异,其临床意义尚不清楚。这种微小的差异与渡渡鸟假说基本一致。另一项最近的网络荟萃分析,通过统计推断比较了不同的治疗方法,报告称PDT优于无治疗,但与药丸和心理安慰剂并无差异,且不如CBT。这项荟萃分析的结果还显示出几个严重的局限性,例如PDT研究数量很少,这些研究已在其他地方讨论过。仍有一些悬而未决的问题需要对PDT进行进一步研究:需要新的RCT,特别是对于强迫障碍和创伤后应激障碍等疾病,目前只有一个相对较旧的RCT。需要更充分的等效性试验。未来对PDT的研究不仅应测量症状或DSM标准,还应测量更针对PDT的指标。未来的研究还应检查是否只有通过PDT才能获得特定的收益。例如,Levy及其同事比较了PDT和DBT在反射功能和依恋方面的改善,证明了PDT的附加价值。为了进一步改进PDT,未来的研究应解决变化机制。还应研究“什么对谁有效”的问题。