文献阅读丨全球生物等效性协调倡议 (GBHI):第五届国际 EUFEPS/AAPS 会议报告(2023年)
作者:我心悠扬的
全球生物等效性协调倡议 (GBHI):第五届国际 EUFEPS/AAPS 会议报告(2023年)
M. Mehta ,B. Schug b,HH Blume c d,G. Beuerle ,W. Jiang ,J. Koenig f,P. Paixao g,N. Tampal ,Y.-C. Tsang h,J. Walstab ,R. Wedemeyer b,J. Welink i
引用 https://doi.org/10.1016/j.ejps.2023.106566
摘要
全球生物等效性协调倡议 (GBHI)系列会议于 2015 年由欧洲药学联合会 (EUFEPS) 发起。迄今为止,所有 GBHI 会议均与美国药学科学家协会 (AAPS) 联合举办。从第三次研讨会开始,美国食品药品监督管理局 (FDA) 就作为共同赞助商加入其中,以支持全球协调生物等效性 (BE) 评估的监管建议。
在第五届GBHI会议上,对以下BE主题进行了深入讨论,并得出以下主要结论:
(1)在特定情况下对 BE 评估的统计考虑,涵盖高变异性药物 (HVD) 产品的扩展方法、两阶段自适应设计以及支持 BE 的建模和模拟机会:尽管到目前为止,自适应设计等特殊 BE 研究概念在实践中并不常用,但大多数研讨会参与者都赞成更频繁地应用此类方法。与此相关的监管条件需要进一步具体化和地区间协调。此外,建模和模拟被认为是一种有前途且不断发展的方法,也适用于 BE 开发计划。
(2) BE 试验中餐后与空腹条件下的对比:仿制药之间的 BE 只有在空腹给药后才能确认,但在餐后条件下无法确认,这一发现似乎更像是例外,而不是常态。显然,BCS IV 类化合物在这种情况下最成问题。关键辅料(如表面活性剂或 pH 调节剂)的差异可能是空腹和餐后条件下相互作用敏感性不同的相关原因。因此,应避免仿制药的成分出现这种偏差。此外,比较不同剂型(如胶囊和片剂)来确认 BE 通常可能很困难,尤其是在餐后状态下。
(3) 局部作用于皮肤的药物产品的 BE 评估:已全面讨论了体外试验作为临床疗效研究的替代方法的适用性和潜在益处。除了已经成熟的体外释放和渗透试验外,还提出了其他技术,例如拉曼光谱或真皮开放流微灌注。这些方法的验证具有挑战性,尽管前几年已经取得了重大进展,但在完全被接受用于监管目的之前,还需要进行更多研究。
(4) 窄治疗指数(NTI) 药物的 BE 评估:监管机构在更严格的 BE 接受范围的必要性、将峰值和总药物暴露量纳入 BE 评估的建议以及更严格的标准以及比较 NTI 药物产品相关的受试者内变异性的重要性等方面存在分歧。会议提出并讨论了支持和反对不同方法的论点,但在实现协调之前需要进一步考虑。
监管机构和来自工业界和学术界的科学家之间高度互动的会议和广泛的交流,在开放的BE问题上取得了有益的进展,并支持了科学驱动的协调目标。
图解摘要
关键词
自适应设计,生物等效性,进食/禁食,高度变异的药物,本地行动,本地应用
治疗指数较窄的药物,重复设计,扩展,外用产品
1.引言
本报告总结了 2022 年 9 月 28 日至 29 日在荷兰阿姆斯特丹举行的第五届全球生物等效性协调倡议 (GBHI) 会议上对生物等效性(BE) 问题的讨论,并为协调 BE 评估标准迈出了新的一步。GBHI 系列国际会议促进了来自监管机构、学术界和工业界的制药科学家对观点的公开讨论。特定的研讨会形式为学术界和工业界的科学家提供了积极参与监管过程的机会,他们展示了被认为与解决未决问题相关的实验结果。该倡议通过提供科学交流平台,已经为全球数据交换和更协调的 BE 评估做出了重大贡献(Blume 等人,2021 年;Chen 等人,2018 年,2019;Mehta 等人,2020 年)。因此,会议旨在为国际人用药品注册技术要求协调会(ICH)等官方协调进程做出科学贡献。
自 2019 年举行的上一次 GBHI 会议以来,ICH 下制定的首个协调 BE 指南,即速释 (IR) 固体口服剂型生物等效性指南草案 M13A,于 2022 年 12 月获得批准(ICH,2022a)。早期 GBHI 会议上讨论的几个主题,包括空腹和/或进食条件下口服 IR 药物的 BE、前体药物和系统前提取的化合物(要测量的部分:母体与代谢物)、在 BE 评估中排除药代动力学(PK) 数据,这些都及时地支持了 M13A 的开发。
对于 2022 年 GBHI 会议,国际科学规划委员会由来自学术界、工业界、合同研究组织的代表以及欧洲卫生当局和美国食品药品管理局 (US-FDA) 的专家组成,他们选定了以下 BE 主题,这些主题根据当前的科学水平存在或值得为之努力实现现实的协调:(1) 特定情况下 BE 评估的统计考虑,涵盖 a) 两阶段、自适应和重复设计和 b) 在 BE 评估中使用建模和模拟的可能性,(2) BE 试验中的进食与空腹条件:现状和新见解 (3) 局部应用于皮肤的局部作用药物产品的 BE 评估,以及 (4) 窄治疗指数药物 (NTI) 的 BE 评估。
参与者就之前 GBHI 研讨会上已经讨论过的某些主题进行了热烈的交流和重新评估——但尚未对所有悬而未决的问题做出最终结论,例如 IR 固体口服剂型在进食和空腹状态下进行 BE 研究的必要性以及高变异性药物 (HVD) 产品 BE 评估的统计问题。此外,还深入讨论了包括PK 建模方法和外用药物产品和 NTI 的 BE 评估在内的新主题。除了并支持会谈中的讨论,还通过让观众有机会通过在线投票工具回答每个会议的具体问题,捕捉了不同观点的代表性图景。这些调查结果显示在补充表中。
本报告总结了演讲和讨论,强调了协调的建议,并指出了讨论主题上尚未解决的分歧。
2. BE 主题
2.1.特定情况下 BE 评估的统计学考虑
2.1.1.高变异性药物(HVD)产品的扩展方法
监管机构一直在努力寻找替代统计解决方案,以克服与 HVD 产品BE评估相关的生物统计学挑战,这涉及在应用传统 BE 统计方法时样本量过大。根据定义,HVD 产品在PK 参数曲线下面积 (AUC) 和/或最大浓度 (C max ) 方面具有估计的受试者内变异性 (WSV) ≥30% (Midha 等人,2005 年;Shah 等人,1996 年)。HVD 通常预期具有较宽的治疗指数,即参考产品1尽管在关键试验中个体内药代动力学差异很大,但该药物仍被证明是安全有效的。大多数 HVD 属于 BCS II 类(=低水溶性-高肠道通透性)或 BCS IV 类(=低水溶性-低肠道通透性)。此类化合物的典型特征包括广泛的首过效应、低生物利用度和高亲脂性,导致血浆浓度低,最终导致 WSV 高(总结为Davit 等人,2012 年)。为满足传统的 BE 接受范围(几何平均比率 (GMR) 的 90% 置信区间 (CI) 为 80.00–125.00%),需要较大的样本量,这会带来伦理和经济问题。
为了保持HVD产品BE研究的合理样本量,允许“扩大”BE限值的缩放方法通常被监管机构接受,但到目前为止,世界各地接受的方法仍然存在差异。
针对 HVD 产品的不同扩展方法已在第二届 GBHI 会议上进行了讨论(Chen 等人,2019 年) 并被重新审视和补充了新的分析和观点。
2.1.1.1.监管建议
关于 HVD 产品 BE 评估的建议此前已有描述(Chen 等人,2019 年) 并总结如下:
缩放方法通常涉及对参考产品的 WSV 进行估计,因此,采用(半)重复设计的 BE 研究,其中至少将参考产品给予受试者一次以上,即可以应用三期(即部分重复)或四期(即完全重复)交叉方案。尽管美国 FDA、欧洲药品管理局 (EMA) 和加拿大卫生部 (HC) 采取“缩放平均生物等效性”方法,并允许从显示的 30% WSV 开始缩放,但他们推荐的缩放方法并不统一(表 1)。
表 1.高度变异药品的生物等效性标准比较。
空单元格 | 美国食品药品监督管理局 | EMA | HC |
AUC 的推荐标准 | 混合 (ABE 或 RSABE) | ABE | 混合 (ABE 或 ABEL) |
C max的推荐标准 | 混合 (ABE 或 RSABE) | 混合 (ABE 或 ABEL) | PEC |
缩放因子(调节常数) | 0.25 | 0.294 | 0.294 |
上限 BE | 不 | 50% CV | 54.7% CV |
AUC 和 C max的 PEC :GMR 包含在 [0.8, 1.25] 中 | 是的 | 是的 | 是的 |
ABE,平均生物等效性;ABEL,平均生物等效性扩展极限;AUC,曲线下面积;BE,生物等效性;Cmax,最大浓度;CV,变异系数;EMA,欧洲药品管理局;GMR,几何平均比率;HC,加拿大卫生部;PEC,点估计约束;RSABE,参考尺度平均生物等效性;US-FDA,美国食品药品管理局(EMA,2010年;加拿大卫生部,2018 年;美国 FDA,2021 年)。
这三个机构都对 GMR 定义了一个点估计约束 (PEC),该约束应在 80.00–125.00% 之间。但是,允许缩放的 PK 参数和缩放方法不同:美国 FDA 建议缩放 AUC 和 C max 。EMA 仅对 C max应用缩放方法,而对于 AUC,需要应用传统的平均 BE 评估。HC 建议仅对 AUC 进行缩放,而对于 C max仅应用 PEC(EMA,2010年;加拿大卫生部,2018 年;美国 FDA,2021 年)。
美国 FDA 制定了“参考缩放平均生物等效性” (RSABE) 方法,其中 BE 接受限度根据参考产品的 WSV 缩放。在这种情况下,将特定 BE 研究中观察到的参考产品的 WSV 与临界值 0.294(对应于约 30% 的 WSV)进行比较,高于该临界值则使用参考缩放。美国 FDA 建议将 0.25 作为缩放因子(监管常数)。BE 限度可以扩大到何种程度尚未定义(美国 FDA,2021 年)。
相比之下,如果确定的参考 WSV ≥30%,EMA 和 HC 使用“具有扩展限度的平均生物等效性”(ABEL)。因此,扩展限度基于 BE 研究中观察到的 WSV;根据 EMA,它们可以扩展到最大 69.84–143.19%(“上限”与 50% WSV 有关),或根据 HC,它们可以扩展到最大 66.7–150.0%(“上限”与 57.4% WSV 有关)。调节常数设置为 0.294(EMA,2010年;加拿大卫生部,2018 年)。
2.1.1.2.邀请投稿和讨论
对消费者风险(I 型错误)的新见解以及对不同 BE 缩放方法的相关性的评估
尽管不同监管机构的统计模型有所不同,但所使用的缩放方法普遍担心的是,I 型错误率会膨胀至参考产品的 25%(对于美国 FDA)或 30% WSV(对于 EMA 和 HC):如果某种药品被错误地归类为 HVD 产品,则当使用缩放方法而不是正确的平均 BE 方法时,通过 BE 的机会会增加,从而导致 I 型错误膨胀(=消费者风险增加)。
对美国 FDA 过去几年批准的仿制 HVD 产品应用三家机构(FDA、EMA、HC)的 BE 标准进行分析表明,尽管三家机构在应用缩放的 PK 参数方面存在差异,但三家机构在通过大多数 BE 试验方面是一致的。美国 FDA 的通过率最高,EMA 的通过率最低。三家机构在通过 BE 结果方面观察到的差异主要是由是否对 AUC 应用缩放引起的,而不是由所用缩放方法的差异引起的。
根据美国 FDA 的另一项分析,对于n = 24 的样本量,与 EMA 或 HC 使用的 ABEL 方法相比,应用美国 FDA 的 RSABE 方法时,参考产品的 WSV(最大消费者风险)的相应截止值(25% 或 30%)的 I 型错误率较低,同时由于将 RSABE 应用于 AUC 和 C max ,因此保持了更高的研究功效。然而,这一结论受到了听众的质疑,他们认为,使用 RSABE 标准,在现实生活中,对于n = 24的样本量,消费者风险可能接近 13% 左右,对于更大的样本量,风险甚至更高(Schütz 等人,2022 年). 之前曾报告过类似的 I 类错误估计值,EMA 程序为 7-8%,US-FDA 方法为 13-18%(例如,Muñoz 等人,2016 年)。FDA 澄清说,美国 FDA 方法所报告的 1 型错误率并非其真正的消费者风险,因为在评估美国 FDA 标准 (RSABE) 的 1 型错误率时,模拟没有区分参考产品的总体参数受试者内标准差 (σWR) 和观察到的样本估计值 sWR。
US-FDA 建议 EMA 和 HC 可以采用 US-FDA 的方法,应用 Howe 近似值将不确定性纳入观察到的样本估计 s WR中(即使用基于卡方分布的 s WR的 90% CI的上限)。这将降低 I 型错误率,同时保持与当前 ABEL 标准几乎相同的功效。对于 US-FDA,提议实施与 EMA 和 HC 类似的缩放上限。但是,是否需要对参考 WSV 进行约束(超过该约束则不建议扩大 BE 限值)仍存在争议。反对“封顶”的主要论点是,如果变化性很大,GMR 的 80.00–125.00% 的 PEC 将成为主导属性,因此,封顶可能起着次要作用。
有听众认为,通过经验迭代调整 α 的方法可以在某些条件下将消费者风险维持在 ≤5% 的期望水平(Molins 等人,2017 年;奥卡尼亚和穆尼奥斯,2019 年)。会议进一步提到,只有固定扩大限度的“平均生物等效性”才能始终将消费者风险保持在≤5%,但这一概念在讨论中没有进一步阐述(详情请参阅Schütz 等人,2022 年)。
尽管美国 FDA 建议对 Cmax和 AUC 进行缩放,但在 EMA 方法中,仅允许对 Cmax进行缩放(EMA,2010年;美国 FDA,2021 年)EMA 的科学原理如下:通常,C max比 AUC 更具可变性,因此,对于此参数,更需要解决如何处理高可变性的问题。此外,AUC 通常是更相关的功效参数,这导致决定不允许扩大 AUC 的 BE 限值。相反,FDA 的方法是基于这样的原理:PK 参数的高可变性本身并不值得使用缩放方法,因为这些药物通常在广泛的治疗范围内有效且安全。
2.1.1.3结论与建议
总的来说,希望找到一种最佳的协调策略,可以提高不同机构之间的一致批准率,最大限度地减少与历史批准产品的不一致性,同时降低消费者风险。
在一项调查中,当被问及他们的偏好时(见补充表),参与者在 RSABE 还是 ABEL 是首选统计方法的问题上意见分歧。绝大多数与会者倾向于将缩放程序也应用于 AUC,显然支持 HVD 需要具有广泛治疗范围的概念。将扩大范围应用于 AUC 将是提高 US-FDA、HC 和 EMA 之间一致率的重要一步。大多数会议参与者认为,监管机构应对用于 HVD 产品 BE 评估的方法给出明确的建议。一些参与者建议,有关缩放方法和应允许缩放的 PK 参数的建议可纳入产品特定指南 (PSG)。该提案将允许采用科学的 BE 方法,考虑某种药物或药物类别的药理学方面以及终点的临床相关性。
值得注意的是,HVD 产品研究的统计评估主题将在 ICH M13 速释固体口服剂型生物等效性指南制定的第 3 层级中得到解决(ICH,2022a),预计将于 2024 年启动。
2.1.2.两阶段自适应设计
在 BE 试验中,当无法可靠估计药品个体内变异性或产品间实际差异时,可以考虑采用两阶段自适应设计。两阶段试验的总体概念是根据在同一试验中确定的变异性调整最终样本量,这可能比在单独的试点研究中进行变异性评估更可取——从科学角度来看,也考虑到经济和伦理方面。一般而言,与试点试验和关键试验的常见组合相比,这种方法除了其他好处外,还可以减少样本量。
2.1.2.1.监管建议
两阶段设计方法,包括自适应设计和成组顺序设计,一般为监管机构所接受,至少为 EMA、HC 和 US-FDA 所接受(EMA,2010年;加拿大卫生部,2018 年;美国 FDA,2019 年)。在统计方法的选择方面,只要总体 I 类错误能够得到适当控制,各机构似乎可以灵活应对 (EMA,2010年;加拿大卫生部,2018 年;美国 FDA,2019 年).已经使用了群体顺序研究和自适应研究,其中几种设计已经发表,例如(福格尔桑,2014;Maurer 等人,2018 年;奥布莱恩和弗莱明,1979 年;波科克,1977 年;Potvin 等人,2008 年)。
2.1.2.2.邀请投稿和讨论
了解两阶段设计以及评估和调整 I 类错误率的新方法
两阶段设计为研究提供了更大的灵活性,从而带来了伦理、行政和经济方面的好处。然而,不慎重地使用两阶段方法可能会增加消费者的风险。所有指南都普遍要求对 I 类错误进行适当的控制,然而,对于呈现这一特征的可接受方法并没有普遍的定义。
美国 FDA 公布了1996 年 1 月至 2020 年 12 月仿制药申请中采用两阶段设计的 BE 研究的调查结果:在此期间,只有 14 份申请采用两阶段设计方法提交,突显出这种可能性的使用有限。三分之二(64%,N = 9)的研究使用了 Potvin 方法 C,其次是成组序贯设计(22%,N = 3)和 Potvin 方法 B(7%,N = 1),此外还有一项设计有缺陷的试验(7%)。总体而言,10 种药品的研究被评估为可接受。
为了更好地直观地展示 Potvin 方法中 I 型错误膨胀的概率,美国 FDA 开发了一种工具,可帮助申请人和监管机构评估自适应设计研究中 I 型错误膨胀。对于 BE 设计空间(点估计、受试者内变异性和第 1 阶段的初始样本量),I 型错误膨胀被分为以下区域:“容忍区”(I 型错误 ≤ 0.05)、“可忽略区”(> 0.05–0.052)和“不利区”(> 0.052)。结果表明,“不利区”覆盖了 BE 设计空间的一小部分,与这三种方法的初始样本量较低(20 或更少)且变异性低于 30% 有关。但是,随着目标 GMR 进一步偏离 1(例如从 0.95 到 0.90),其大小会大幅增加。在评估上述仿制药产品的 BE 研究时,没有一项研究落入“不利区域”,只有两项研究落入“可忽略区域”(Jiang 等人,2021 年)。
此外,还介绍了一些侧重于 alpha 调整和平行设计研究的自适应设计新方法。一般来说,模拟被用来研究自适应设计(如 BE 中的两阶段设计)的 I 类错误控制。然而,随着重复方法的发展,基于逆正态组合的交叉设计(如 Maurer 方法)也开始出现。Maurer 等人,2018 年),不再需要模拟。这些“精确”方法严格控制 I 类错误,即基于分析证明。它们提供了高度的灵活性:可以应用各种无效标准,并且可以定义第二阶段的最小/最大样本量。
对于采用平行设计的研究,目前还没有这种“精确”的方法,因为第一阶段的组大小不均等和异质性使得开发变得困难,到目前为止还没有解决方案。不过,对于交叉设计,可以免费使用软件工具,以便对试验中适用场景的 I 类错误进行必要的彻底调查(例如 Power2Stage)。
2.1.2.3结论与建议
尽管监管指南中描述了两阶段适应性设计方法,但该方法并不常用。不幸的是,欧洲指南中对两阶段设计的描述含糊不清,导致申办方对欧洲此类研究感到厌倦。
虽然没有特别讨论两阶段 BE 研究的首选方法,但会议参与者普遍赞成此类研究。与会者一致认为,应更频繁地使用两阶段设计进行 BE 评估,因为它具有道德和经济优势,例如样本量预计会减少,尤其是在第一阶段宣布 BE 的可能性很大的情况下。大约三分之二的调查参与者(见补充表)也支持在讨论两阶段设计时接受模拟。应该强调的是,使用模拟并非易事,因为它存在固有的局限性,即不可能穷尽设计中点估计、变异性和样本量的所有可能组合。
2.2“建模和模拟”支持BE的机会
BE 评估侧重于非房室指标,例如 Cmax和 AUC。这些 PK 参数受许多因素的影响,例如产品差异、研究设计和研究执行。数学模型要么从生理角度描述 PK 暴露(基于生理学的 PK [PBPK] 模型),要么是通过数据拟合开发的经验方法(半机械和群体 PK [PopPK] 模型)。PBPK 模型非常复杂,涉及许多系统和药物相关参数,即使在没有体内数据的情况下,也可以采用“自下而上”的方法来预测体内PK 反应。然而,PBPK 建模技术也可以考虑“自上而下”或“由中而外”的方法,通过结合来自不同来源(体内、体外甚至计算机模拟)的一些数据拟合。这与基本上基于临床数据构建的 PopPK 模型形成了鲜明对比。建模和模拟不同产品或给药途径的可能性将取决于是否可以假定用作输入的体外数据代表体内输入过程(Tsamandouras 等人,2015 年)。
对于仿制药产品开发,建模和模拟方法的机会包括支持 BE 评估以应对招募变化、大样本量或伦理问题(例如,患者研究、长期研究或存在安全问题的研究),以及作为豁免额外 BE 研究的基础(例如,IR 产品的进食条件、与质子泵抑制剂共同给药、某些情况下的 BCS 豁免)。此外,通过利用虚拟 BE 模拟,建模方法可能有助于规避不必要/不敏感的临床终点 (CE) 研究,并支持仿制药批准的体外方法,例如,对于局部作用的药物产品。
相比之下,目前新药产品模型信息药物开发(MIDD)的“建模和仿真”监管应用主要包括评估特定人群的替代给药方案或剂量调整以告知产品标签(例如,在给药途径之间切换、上调/下调滴定、长期使用、肾/肝功能不全)和体外体内相关(IVIVC)模型来支持多规格和生产制造变化。
然而,美国食品药品监督管理局和其他监管机构正在投资探索该领域的专业知识。讨论了现状,包括具体的例子以及建模和模拟方法如何支持 BE 的未来方向。
2.2.1.监管建议
EMA 使用“建模和模拟”来支持 BE(模型整合证据)的经验有限,主要是因为缺乏可在国家层面讨论的此类案例的中央清单。BE 试验中的挑战可能是考虑采用建模方法的原因,欧盟内部会根据具体情况进行处理。从 EMA 的角度来看,使用基于模型的 BE 原则上是可行的,尽管人们承认使用模型存在方法学挑战,并应在提交之前通过科学建议或资格程序予以解决(EMA,2020 年根据对监管决策的影响,EMA 通常将模型分为“低”、“中”和“高”三种类型,其中,用 PK 模型替代试验的 BE 证据显然属于“高”类(欧洲药品管理局,2011 年)。到目前为止,EMA 尚未收到任何基于模型的 BE 的批准申请,因此尚未制定政策。现有的指南侧重于报告此类研究的结果(欧洲药品管理局,2007年)、IVIVC 用于缓释制剂,重点关注创新产品/缓释产品的开发(欧洲药品管理局,2014) 或药物间相互作用 (欧洲药品管理局,2012)。新的EMA方法工作组(MWP)将利用跨学科的专业知识。
美国 FDA 在“建模和模拟”专业知识建设方面主要体现在几份已发布的 PSG 中,这些 PSG 实施了被认为对建模非常重要的额外措施,以及大量研究项目和补助金,例如,用于长效注射剂和局部作用药物产品的建模和模拟。美国 FDA 的定量方法和建模多学科小组致力于通过科学研究和维护建模知识库来支持监管政策。它通过举办常规仿制药和计量药理学集群会议,通过科学交流进一步促进全球监管建议的协调。最终目标是虚拟 BE,即将模型整合证据作为仿制药审批的关键信息(Zhao 等人,2019 年)。然而,到目前为止,该机构还没有制定足够的模型性能的接受标准。对于没有具体指导的复杂产品,鼓励申请人在 ANDA 前计划中寻求科学建议(美国 FDA,2022b)。
2.2.2.邀请投稿及讨论
所举的例子表明,使用建模方法促进仿制药开发的潜力。进一步的例子还强调,建模可以提供对试验结果的相关洞察,包括对复杂情况的支持,例如缺失数据发生率极高的情况以及对比较试验的不确定结果或产品特性差异的风险评估。
2.2.2.1. BE 的模型整合证据:例如双氯芬酸钠外用凝胶,1%
关于“建模和模拟”在支持仿制药开发方面的效用的最近一个例子是,美国 FDA 于 2019 年批准了一种仿制双氯芬酸钠外用凝胶(1%),用于治疗膝关节骨关节炎患者(Tsakalozou 等人,2021 年对于双氯芬酸半固体制剂,美国FDA推荐的BE方法通常包括健康个体的PK-BE试验加上患者的比较CE-BE试验(美国 FDA,2018a)。为了代替比较 CE BE 试验,申请人开发了一种皮肤 PBPK 模型,该模型表征双氯芬酸在血浆中的全身暴露与皮肤和滑液中的局部暴露之间的关系,以展示两种药物在作用部位的 BE。申请人在 ANDA 前科学建议计划中获得了该机构对预期方法的反馈。使用来自 11 种皮肤病产品的文献数据对该模型进行验证,结果表明,该模型能够恰当地捕捉具有不同物理化学性质和 PK 特性的化合物的局部和全身生物利用度。经过该机构对模型的改进,该模型被认为适合虚拟确定药物在作用部位的暴露,支持该药物批准代替比较 CE BE 试验。这是美国 FDA 批准仿制药的首个案例,其中 PBPK 模型结合 PK BE 试验支持对外用产品的等效性评估,并有助于避免比较 CE BE 试验。由于比较 CE BE 试验被认为是检测仿制药和参比产品之间配方差异最不敏感的方法,因此鼓励申请人使用本例中描述的替代方法(Tsakalozou 等人,2021 年)。
2.2.2.2.建立模型以减轻开展长期临床终点等效性研究的负担:以左炔诺孕酮宫内节育系统为例
由于用于避孕的宫内节育系统 (IUS)(例如含左炔诺孕酮(LNG) 的 IUS)将药物局部输送到子宫(作用部位),因此传统的基于 PK 的 BE 方法不足以证明等效性。此外,IUS 的五年申请期使完全药物释放的 BE 评估具有挑战性,因为如此长的试验对于仿制药开发来说是不可行的。因此,美国 FDA 采用建模和模拟方法将推荐的体内/体外临床研究从 5 年缩短到 1 年。模拟结果显示,如果 1 年后残留 LNG 量的 90% CI 在 95.00–105.26% 的 BE 限度内,则可确保 5 年后残留 LNG 量在常规 BE 范围 80.00–125.00% (Sharan 等人,2022 年因此,根据 LNG IUS 的现行 PSG,BE 可能基于第 12 个月的 LNG 残留量,以及比较的物理化学和机械性能以及5 年内的可比体外药物释放情况(美国 FDA,2020b)。
2.2.2.3.基于模型的 BE 相关 PK 指标评估:以哌甲酯缓释制剂为例
对于哌甲酯,血浆暴露量和临床效果的密切关系使我们能够开发一个数学模型,该模型可以预测不同缓释产品配方变化引起的 PK 和PD变化。虚拟 BE 模拟结果表明,部分 AUC (pAUC) 参数比传统的 Cmax和 AUC 测量值更能敏感地检测两种配方之间的临床相关差异(Kimko 等人,2012 年)因此,美国 FDA 采纳了该建议,在哌甲酯的 PSG 中额外评估三个定义的 pAUC 指标(美国 FDA,2018b)。
2.2.2.4.建模在制定溶出度规范的实际应用中
为了说明建模在免除额外的 BE 研究或证明观察到的溶出曲线差异方面的潜力,介绍了其在制定生物不等效性风险评估的溶出规范中的潜在用途。一种常见的方法是使用从新药申请提交和/或文献中获得的静脉数据和/或吸收 PK数据来验证 PBPK 模型。随后使用 PBPK 模型来定义溶出曲线差异的可接受限度和支持规范。通常,预测不同配方或批次的 PK 数据可以提供有价值的数据来获得模型可信度。虽然在体内性能等效的情况下可以证明体外差异是合理的(侧批次的概念),但体内差异的出现可能涉及实施基于模型的方法,例如 IVIVC 和/或 PBPK。IVIVC 已经很成熟(可用的监管框架,包括验证),但 PBPK 可能提供更多机会(也可以在可用数据之外进行推断)。
2.2.3结论与建议
“建模和模拟”被认为是 BE 开发计划中一种有前途且不断发展的方法,监管机构正在积累该领域的专业知识。目前,监管机构尚未建立模型资格的验收标准,这可能会促进此类方法的开发和使用。大多数会议参与者(75%,见补充表)赞成鼓励基于模型的复杂仿制药产品 BE 决策。鼓励仿制药申请人提出虚拟 BE 方法,并通过科学建议与监管机构讨论这些方法。建模方法对于实现仿制药开发的现代化必不可少。
2022 年 11 月,ICH 管理委员会批准了新的 ICH M15 指南《基于模型的药物开发一般原则》(会后说明)。这项新指南有望协调文档标准、模型开发、分析中使用的数据、模型评估及其应用(ICH,2022b)。
2.3. BE 试验中的进食与禁食条件:现状和新见解
对于 IR 口服剂型,是否应在空腹和进食给药后都要求进行 BE 评估?这个问题已在之前的 GBHI 会议上进行了调查和讨论(Blume 等人,2021 年;Chen 等人,2018 年)。然而,一些基本方面仍未得到解决,仍在等待基于实验证据的进一步协调,例如(Blume 等人,2021 年):
不同口服剂型(例如片剂与胶囊或口腔分散片/口腔崩解片)之间胃肠道 (GI) 性能的可比性和差异性, 化合物的药代动力学特征对于崩解/溶解变化引起的食物影响至关重要(或平衡影响), 空腹和进食状态之间的生理差异:食物在胃中混合的影响、胃排空的变化、胃停留和身体压力。
本次会议的目的是分享与此相关的实验证据,并讨论进一步协调现有法规的选择。
2.3.1.监管建议以及 GBHI-1 和 GBHI-4 之后我们的立场是什么?
虽然在大多数情况下 EMA 仅要求在一种给药条件下(通常是空腹)进行 BE 评估,但美国 FDA 通常建议在空腹和进食状态下进行 BE 研究(EMA,2010年;美国 FDA,2021 年)。根据欧洲指南,应考虑参考产品标签中建议的给药条件,对速释制剂进行 BE 研究。只有具有“特定配方特征”的药品,如微乳剂或固体分散体,才需要在空腹和进食状态下进行研究(EMA,2010年)。这种方法已被许多其他监管机构接受,例如澳大利亚、巴西、加拿大、日本、马来西亚、俄罗斯和泰国。此外,EMA 和美国 FDA 还为那些建议 BE 研究条件偏离正常情况的药品制定了 PSG。
总体而言,在空腹条件下进行的研究比在进食条件下进行的研究更能敏感地检测出配方差异(德罗莎,2019)。然而,实验数据表明,某些赋形剂在进食和禁食状态下对药物崩解的影响可能不同。因此,这种赋形剂-食物相互作用被认为是禁食和进食条件下BE结果不同的潜在原因。崩解延迟(在进食状态下)可能导致吸收开始延迟和/或吸收部位药物浓度降低,从而导致峰值和/或总暴露量出现偏差(Blume 等人,2021 年)。
美国FDA的一项调查表明,含有BCS IV类药物的药品在空腹和进食条件下的BE研究结果明显不同。这一发现与早期的结论一致,即高溶解性药物化合物(BCS I类和III类)对食物的影响不太敏感(Blume 等人,2021 年;德罗莎,2019)然而,这种敏感性是否仅与药物本身有关,还是也取决于药物产品的配方特性,仍存在不确定性。
因此,本次会议讨论的主要目标是确定配方因素和辅料特性,这些因素和特性可能会对进食和禁食状态下药物吸收的速度和程度产生不同的影响。此外,会议还讨论了哪些胃肠道生理学方面可能会对速释制剂的体内药物释放性能产生影响。最后,应严格检查药物化合物的 PK 特性,以确定它们在多大程度上使药物产品对胃肠道崩解和/或溶解的变化更敏感或更不敏感。
2.3.2.邀请投稿及讨论
2.3.2.1.禁食和进食后服用速释药物后胃肠道生理学的变化
食物摄入会导致胃肠道生理条件发生相关变化,这可能会影响药物化合物的全身暴露和 PK 曲线。关键参数包括胃肠道转运时间、可用性/体积、成分、pH、粘度、腔内液体的表面张力以及流体动力学和胃/肠蠕动。这些参数与全身暴露的相关性取决于药物化合物和药物制剂的性质,例如,如果溶解度是药物吸收的限制因素,腔内液体的可用性和成分将非常重要。
服用速释药物时,胃部状况至关重要。在此背景下,讨论了进食后通常需要多长时间才能再次达到禁食状态。空腹服用药物的常见建议是在进餐前 1 小时或进餐后 2 小时服用,这是不够的——无论是在标准的高脂肪、高热量餐后,还是在 400-500 kcal 的中等餐后。进食大餐后,需要六个小时或更长时间才能再次达到禁食状态。即使在空腹服用药物和水的情况下,也会引发胃生理学的某些变化,即体积和 pH 值增加,而温度会降低。但是,这些变化将在约 30 分钟内消失(Koziolek 等人,2019 年)。
胃液的分泌和胃肠道液体的成分在很大程度上受进食食物类型(即脂肪、碳水化合物和质地的含量)以及同时摄入的液体的影响。在这种情况下,重要的是要考虑到水与胃内的粘稠食糜混合得不好,但水可以沿着胃壁运输并在小肠中更快地排空,这种现象有时被称为“胃路”。
因此,如果药物在进食胃中崩解或溶解出现偏差,溶解速度更快的药物化合物可能会与同时吞咽的水一起通过“胃路”更早排空,因此可能比被食糜包裹的药物吸收得更快。因此,“胃路”效应是进食状态下服用药物后血浆中药物浓度变化的主要原因——差异取决于剂型在胃内的初始定位(Koziolek 等人,2016 年;Schick 等人,2019 年)。
一项研究比较了含乙酰水杨酸(ASA ) 的快速崩解溶解片 (FDDT)与常规 ASA 片 (RT) 的 PK 特性,证明了“胃路”效应的实际意义。30 名健康受试者进食后服用两种产品,与 RT 相比,FDDT 的达峰浓度时间 (tmax)明显更短,Cmax明显更高,而两种情况下的总暴露量 (AUC) 相似。此外,还在空腹状态下(RT 仅进食)研究了 FDDT,在这些条件下观察到Cmax增加,而Tmax仅缩短到可以忽略不计。使用特定的生物相关溶出度测试设备 (GastroDuo) 获得的体外数据表明,FDDT 的药物释放更快,胃排空改善,而 RT 的胃排空不完全。因此,与 RT 相比,进食条件下 FDDT 的Tmax更早,这可能与“胃路”效应有关,这种效应是由 FDDT 中 ASA 的快速释放引起的(Schick 等人,2020 年)。
腔内pH是另一个影响全身暴露的生理参数,特别是对于具有pH依赖性溶解特性的药物化合物而言。尽管在空腹和进食状态下测得的pH值覆盖相似的范围,但由于胃停留时间和肠道运输时间延长,进食后药物溶解时间更长。因此,餐后摄入弱碱性化合物可能会提高口服生物利用度。在这方面,还应考虑到肠液的成分会在空腹和进食状态下发生变化,特别是进食后胆汁盐、磷脂和胆固醇的浓度会增加,这可能会影响所施用药物化合物的溶解度(Koziolek 等人,2019 年)。
2.3.2.2.口服速释药物在空腹和进食状态下的不同表现
总体而言,胃肠道生理学的所有变化对于具有缓释特性的药物产品比对于速释药物产品更为重要。然而,这些变化也可能导致速释固体口服剂型的崩解和药物释放出现差异,从而对两种药物的生物利用度产生不同的影响。
一项针对四种含咖啡因的 IR 固体口服剂型(一种薄膜包衣片和三种硬胶囊)的研究表明了这一点,这些剂型在药典条件下均能在体外快速释放药物,15 分钟内几乎 100% 溶解。然而,在体内,发现不同药物的初始崩解和吸收开始时间(以唾液中咖啡因的出现来确定)不同,在进食状态下差异更为明显。在这种情况下,禁食和进食状态下的不同条件,即胃肠道中的温度、流体动力学和机械应力,显然是影响产品崩解(和溶解)的重要因素(Sager 等人,2019 年)。
结论是,禁食和进食条件可能对某些固体口服剂型(例如片剂与胶囊)的崩解和/或释放产生不同的影响。由于这种偏差可能会影响药物的生物利用度,因此禁食给药后显示的 BE 可能无法推断到进食状态,反之亦然。
2.3.2.3.空腹和进食状态下 BE体外测试的可预测性
考虑到基于 BCS 的生物等效性豁免概念,体外溶出度比较试验预测空腹状态下的 BE 的相关性已经得到充分证实 (ICH,2021 年)。然而,正如 2019 年上届 GBHI 会议上所讨论的那样(Blume 等人,2021 年),这并不总是能保证两种药物产品在进食状态下的BE,特别是当只有一种药物产品中含有具有胶凝特性的赋形剂(例如交联羧甲基纤维素钠)或可膨胀填充剂(例如微晶纤维素)时(Zaheer 和 Langguth,2018 年,2019)。在体内实验中,摄入液体食物后,也观察到药片崩解延迟,这是由于药片表面沉淀了一层蛋白质膜(Abrahamsson 等人,2004 年),但在相同的研究条件下,不同药片之间这种现象应该不会有差异。
已经提出了其他全面的体外比较方法,例如使用生物相关胃肠道转移 (BioGIT) 模型,这是一种三室体外装置,可模拟药物从胃部通过小肠上部转移的过程。该模型可用于评估剂量和配方对早期暴露于低溶解度药物化合物的影响(Kourentas 等人,2018 年)。
由于食物摄入后的生理参数非常复杂且多变,需要进一步开发用于评估胃内崩解/溶解、胃肠道转移过程和小肠上部药物溶解的体外方法。此外,计算机模拟方法可能有望预测进食/禁食比较以进行 BE 评估(Wagner 等人,2021 年)。
2.3.2.4.新的膳食趋势:可能对胃肠道功能产生影响
尽管主要与 BE 评估无关(在所有研究期间都使用标准化膳食),而与定义药物产品的最佳给药条件更相关,但讨论的另一个有趣的方面集中在不同类型的食物如何影响胃肠道功能,从而影响口服药物产品的体内性能的问题上。
食品加工和添加剂可能会对胃肠道环境产生深远影响,因此可能对药物的体内性能至关重要。超加工食品的消费量正在增加,这些食品含有大量添加剂,如乳化剂(表面活性剂)、糖、防腐剂、稳定剂(Monteiro 等人,2011 年),并且在一项涉及 33,342 名参与者的大型队列研究中,与肠易激综合征的发生有关(Schnabel 等人,2018 年)这一发现并不令人惊讶,因为许多食品添加剂,如糖、盐、乳化剂和有机溶剂,都会诱发或与肠道通透性增加有关(勒纳和马蒂亚斯,2015 年)。
这只是一个例子,凸显了饮食习惯改变对胃肠道生理的影响,最终可能导致口服药物在体内的性能改变。目前尚未系统地研究这是否也会导致与配方相关的食物相互作用差异,可能需要未来的科学研究。
2.3.3结论与建议
一项针对仿制速释产品开发计划的调查(204 份申请中的 82 种药品)证实了是否应建议对所有速释药品进行空腹和进食状态下的 BE 评估这一问题的适用性和相关性:在所有案例中,只有 8.3% 的案例在空腹条件下显示的 BE 无法在进食后得到确认。大多数失败案例(17 份申请中的 8 种产品)涉及 BCS 类 IV 化合物(Blume 等人,2021 年;德罗莎,2019)。需要注意的是,未确认 BE 并不一定意味着该药品具有生物等效性。因此,可能需要令人信服的科学论据来支持要求对所有 IR 药品进行空腹和进食状态下的 BE 研究的监管概念。
讨论表明,应制定一个关于进食和空腹研究必要性的决策树。在这种情况下,申请人需要证明任何省略进食研究的理由,考虑到所涉及的风险,例如由于存在潜在相互作用的赋形剂(如表面活性剂或 pH 调节剂),以及剂型的一般特性。似乎建议药品在这些赋形剂中不应有质量偏差,并且应表现出定量(非常)相似的成分。
在会议调查中,一半的受访者报告称,他们曾遇到过药物在空腹条件下生物等效但在进食条件下不等效的情况。其中,一半的人声称他们只知道胶囊在进食条件下不具有生物等效性的情况。此外,在这次调查中,尚不清楚不具有生物等效性的药物是否确实具有生物等效性,或者只是没有证明生物等效性(例如,由于样本量不足)。
人们普遍认为,只有胃内的情况对IR 固体口服剂型的体内性能至关重要,因为药物崩解和药物释放在胃排空之前就终止了。然而,进食后情况可能并非如此,因此导致不同药物(例如硬胶囊和片剂)的行为可能不同。鉴于这些假设,空腹研究的 BE 结论可能无法推断到进食状态下给药后的情况。因此,对于此类不同的口服剂型,可能需要在进食后进行额外的 BE 研究。
就药物的生物制药和药代动力学特性而言,溶解性差似乎至关重要,尤其是 BCS IV 类化合物。对于空腹和进食给药之间的这种差异,吸收(非常)缓慢的化合物是否不那么关键还需要进一步阐明。此外,pH 依赖性溶解度可能至关重要,特别是在不同盐具有不同的溶解度 pH 依赖性或使用不同的 pH 调节赋形剂的情况下。
在审查 GBHI 会议后不久发布的 ICH M13A 指导原则草案时,可以考虑本次会议和之前的 GBHI 会议的讨论和结果,这些会议还涵盖了空腹和/或进食条件下口服速释药物的 BE 主题(ICH,2022a)。
最后,会议建议监管机构应制定 PSG,针对不符合总体监管建议的具体情况制定单独的处理方法。
2.4.局部作用药物在皮肤上的BE评估
局部作用的外用药物产品允许将药物化合物定向应用于皮肤的特定区域,包括各种剂型,从简单的溶液到复杂的配方和递送系统。与全身作用的药物产品不同,全身 PK研究通常不依赖于确定这些局部作用产品的等效性,因为全身药物暴露通常不能反映作用部位的暴露。因此,从历史上看,比较 CE BE 研究通常用于证明外用产品的等效性,尽管它们存在样本量大、成本高、工作量大、对潜在产品相关差异的灵敏度低等缺点(莱昂伯格,2008;Miranda 等人,2018a;Novakovic 等人,2019 年)这会对外用仿制药的供应产生负面影响。
因此,开发合适的药效学 (PD) 或基于局部 PK 的等效性评估方法是十分有必要的。除了局部皮质类固醇制剂的血管收缩剂测定外,以前验证 PD 终点的方法效果并不好。相反,研究皮肤局部 PK 的替代体外方法和体内方法目前正在成为科学活动的前沿,预计将逐步纳入局部作用外用药物等效性评估的监管建议中(Miranda 等人,2018a,2018b)。
然而,由于疾病种类繁多、疾病部位分布在皮肤的不同层而导致的作用部位不同、应用部位本身的疾病和时间相关变化以及配方特性的多样性,这些都给开发和验证产品表征的替代方法带来了困难。
在此背景下,讨论了完全放弃任何类型的基于体外释放和体外渗透测试 (IVRT/IVPT) 的体内研究,并阐述了充分验证这些方法的挑战。此外,还评估了包括拉曼光谱和真皮开放流微灌注 (dOFM) 在内的有前景的表征局部应用后局部 PK 的方法是否适合进行等效性评估。
2.4.1.监管建议
EMA 和美国 FDA 关于局部作用外用产品等效性评估的监管建议草案原则上是可比的。评估局部仿制药等效性的“黄金标准”方法仍然依赖于比较 CE BE 研究(Miranda 等人,2018b)。
对于溶液、悬浮液或单相凝胶等简单配方,质量等效性可能就足够了,因此可以免除体内BE 研究(EMA,2018 年;美国 FDA,2011 年,2020 年)。
迄今为止,唯一一个将 PD 终点用于局部皮质类固醇等效性评估的例子是所谓的血管收缩试验。这是一种在健康人类受试者中进行的 PD 试验,依赖于皮质类固醇的疗效相关血管收缩特性和由此产生的皮肤变白效应,并被包括 EMA 和美国 FDA 在内的多个国际监管机构接受(EMA,2018 年;美国 FDA,2022 年预测)。
根据对美国 FDA 截至 2022 年 8 月发布的所有局部作用外用皮肤科产品的 PSG 的审查,提出了以下 BE 建议:PD 或比较 CE BE 研究(56%)、体外或 PD/CE BE 研究(23%)、豁免或 PD/CE BE 研究(16%)以及基于 PK/其他(5%)。尽管在大多数情况下要求进行 PD 或 CE BE 研究来证明治疗等效性,但这表明美国 FDA 越来越多地接受基于替代表征的 BE 方法代替 CE BE 研究。
对于欧洲,目前尚不清楚包括体外方法在内的替代 BE 评估方法的接受程度。尽管如此,存在多个案例,其中等效性至少部分地通过使用IVPT 等体外评估得到证明,这表明欧洲对体外BE 方法的接受度也在增加(Miranda 等人,2018b)。2018年,EMA发布了局部应用和局部作用外用产品质量和等效性指南草案,以征询相关利益相关方的意见和反馈。原则上,该指南认为仅有质量等效性是不够的,还需要进行比较渗透动力学和 PD 研究才能得出治疗等效性的结论。然而,所需的方法还应考虑配方的复杂性,对于简单配方,也可以考虑基于质量等效性的接受。本指南应用于制定和证明特定于外用产品的 BE 方案,并描述体外(如 IVPT)和体内模型(如胶带剥离、PK 研究、PD 研究,包括皮质类固醇的血管收缩试验)如何替代 CE 研究。根据该草案,这些替代方法仅可支持具有相同应用模式的药品的治疗等效性主张,且对患者的不等效性风险极小(没有治疗指数较窄的药物、没有在常规 BE 中不能视为等效的全身毒性、没有未知的作用途径)(EMA,2018 年)。会议透露,下一版指南显然将会发生重大变化。
尽管大多数监管机构(包括欧洲、美国、加拿大和澳大利亚的监管机构)原则上都要求证明外用仿制药具有治疗等效性,但巴西监管机构 ANVISA 却强烈依赖外用仿制药的体外信息(对于没有全身作用的药物、相同数量的相同辅料以及相同的物理/化学/微观结构和微生物参数)(Miranda 等人,2018b)。生物豁免中只有一个例外,最近才被引入到新指南中:局部皮质类固醇的生物等效性必须使用血管收缩试验进行体内评估(ANVISA,2022 年)。
2.4.2.邀请投稿与讨论
2.4.2.1.基于特性的方法是建立外用产品等效性的临床数据的有力替代方法
近年来,美国 FDA 发起的研究推动了基于表征的体外方法的发展。美国 FDA 的模块化表征 BE 方法通常包括非活性成分的定性(Q1)和定量(Q2)相同性、物理化学/结构(Q3)相似性(美国 FDA,2022 年) 和 IVRT (美国 FDA,2022 年)、根据配方的复杂程度,IVPT 或其他生物相关性能测试(美国 FDA,2022c),少数产品可能还需进行体内系统性 PK 研究以确定 BE(例如,PSG多塞平乳膏美国 FDA,2022a)。
作为复杂半固体外用产品的代表性示例,介绍了基于表征的外用阿昔洛韦乳膏BE 方法的开发(FDA 奖 U01-FD005223):对不同国家批准的不同参考产品进行表征表明,流变学和 IVRT 数据对配方变化非常敏感。此外,IVPT 数据表明,生物利用度(基于 IVPT 比较中的通量值比较)与物理化学特性/微观结构(Q3)相关。这些结果导致了当前的 PSG 草案,其中基于表征的方法(包括 Q1/Q2 相同性、Q3 相似性、IVRT 和 IVPT)已在选项 I 中实施,用于 BE 评估(体外选项),作为选项 II(比较 CE BE 研究)的替代方案(美国 FDA,2016 年)。但是,基于较小的数据基础,含有利多卡因和普鲁卡因的产品也呈现出了类似的结果。
2.4.2.2.等效性评估的体外方法:IVRT、IVPT
EMA 的 IVRT 和 IVPT 指南草案提供了测试方案(EMA,2018 年)。
IVRT 使用不限制药物释放速率的惰性膜来评估扩散池装置中药物从产品中释放的速率和程度。该测试不模拟体内性能,但释放速率代表了药物产品的一个关键质量属性。EMA 和 USP 第 1724 章定义的 IVRT 测试条件有很大不同,例如,在供体室中的样品量、温度、要释放的药物化合物量和等效性接受限度方面,即测试和参考斜率的 90% CI 比率根据 EMA 应在 90–111% 之间,根据 USP 应在 75–133.3% 之间。
需要指出的是,需要在考虑已获批准的局部仿制药以及相应的局部参比产品的基础上,根据底层理论假设对测试过程中释放的药物化合物的预期分数和 90–111% 的 CI 进行审查。由于半固体剂型表现出内在的变异性,因此建议对仿制药应用更合理的等效性标准(Miranda 等人,2020 年;Pleguezuelos-Villa 等人,2019)。
对于 IVPT,使用以成人离体皮肤为膜的扩散池装置来测量药物化合物通过皮肤的渗透速率和程度。此外,对于 IVPT,EMA 和 US-FDA(阿昔洛韦指南草案)的建议存在差异,例如在持续时间、供体室中的样品量、样品量和等效性验收标准方面。EMA 定义的常规 BE 限度为 80–125%,如果在低强度和扩散受限的药物产品中观察到高 WSV,并且有临床依据,则可能扩大到最大值 69.84–143.19%。根据 US-FDA,参考内变异性用于确定是否应用平均 BE(限度为 80.00–125.00%)或缩放平均 BE 分析(EMA,2018 年;美国 FDA,2016 年)。
一个特别令人担忧的领域是人类皮肤固有的变异性,以及这种变异性在进行 IVPT 进行 BE 测试时可能带来的挑战。在迄今为止最大规模的 IVPT 数据分析中,回顾性分析了从 112 名女性捐赠者身上切除的 2400 个皮肤样本。在研究中,个体间变异达 37.6%,但不如个体内变异高(38.3%≤CV≤115.7%)(Meidan 和 Roper,2008 年)。在此背景下,讨论了所需的皮肤捐献者数量和每个皮肤样本的重复次数,并考虑到在不同地区采购人体组织的困难,必须予以考虑。而 EMA 规定皮肤样本数量不应少于 12 个,每个捐献者至少有 2 个重复样本(EMA,2018 年)。在阿昔洛韦指南草案中描述的 IVPT 检测中,未指定供体的数量,但每个供体至少应评估 4 次重复(美国 FDA,2016 年),其他提及皮肤吸收研究的指导原则指出,应研究至少 4 名供体的 8 个重复样本(经合组织,2019 年)。
有人指出,可能需要进一步讨论适用的可接受限度和统计方法。此外,可能需要讨论要使用的皮肤部位,因为指南中没有具体说明这一点,尽管皮肤特征(如身体不同部位的表皮厚度)存在很大差异。这可能导致 IVPT 结果出现很大的差异。为了克服样本量有限的问题(主要是由于组织数量有限),可以使用建模方法将数据外推到更大的虚拟样本量(见第 2.2 节) 被建议。
到目前为止,只有少数申请人将 IVPT 作为其 BE 计划的一部分。总体而言,参与者一致认为,目前提出的体外测试等效性标准(采用口服产品的标准)是武断的,没有科学依据,这凸显了科学家、行业和监管机构之间需要进行更多的数据交换。此外,参与者强调,体外测试的协调是非常有必要的。
2.4.2.3.基于皮肤-PK 的方法:拉曼光谱和开放流微灌注作为有前途的 BE 方法
评估局部作用的外用药物在体内的等效性具有挑战性,因为测量和比较皮肤中的药物浓度存在技术困难。然而,表征靶器官皮肤内 PK 的方法可能是证明皮肤 BE 最准确和最灵敏的方法。目前讨论的方法在进行药物化合物量化的皮肤层方面有所不同。
例如,用胶带进行微创胶带剥离仅适用于评估角质层中的药物浓度(Escobar-Chávez 等人,2008 年)。然而,尽管被纳入EMA指南(EMA,2018 年),由于难以证明可重复性,该方法仍未完全被接受;因此,如果要定期应用该方法,则需要进行更多研究来克服障碍(Miranda 等人,2018a)。
共聚焦拉曼光谱是一种非侵入性方法,用于评估上表皮的药物浓度。该方法基于单色激光照射样品后的非弹性光散射。由此产生的拉曼光谱包含有关药物产品的分子组成、结构和相互作用的信息。因此,前提条件是具有拉曼活性的可极化分子。评估需要考虑到无法测量绝对浓度(Caspers 等人,2001 年;Miranda 等人,2018a)。美国 FDA 发起的几项研究项目目前采用的是捐献者的皮肤样本,结果表明拉曼光谱是一种很有前途的基于皮肤 PK 的 BE 评估技术:例如,对于不同国家批准的外用阿昔洛韦乳膏的不同参考产品,可以证明拉曼光谱数据与 IVPT 结果的一致性(FDA 奖 U01-FD005226)。总体而言,多种分子的初步体外数据表明,使用该技术可以比较皮肤 PK。由于该方法完全是非侵入性的,因此该应用被认为是可取的,但未来的工作范围需要侧重于方法验证策略。
DOFM 是一种先进的侵入式连续真皮采样技术,其中探针放置在真皮中,并由真皮间质液连续灌注,该灌注液在最长 48 小时的规定时间内收集。与微透析技术不同,微透析技术中样品和真皮液由半透膜隔开,而在 dOFM 中,样品与间质液直接接触(Anderson 等人,1991 年;Bodenlenz 等人,2017 年这种用于评估真皮中药物浓度的连续皮肤采样方法使得能够对同一受试者的局部测试产品与其参考产品进行头对头比较。
可以使用 dOFM 在健康受试者或患者的真皮中监测从小的亲脂性分子到大的抗体的各种药物化合物(Bodenlenz 等人,2016 年,2012,2017;Dragatin 等人,2016 年)。为了限制结果的变异性,使用 dOFM 对临床试验进行严格标准化至关重要,例如,在探针插入、尽量减少创伤形成、剂量应用、探针深度和流速方面。
F. Sinner 及其同事在与美国 FDA 合作开展的近 10 年的多项临床研究中证明了该方法适用于 BE 评估:例如,在一项对 20 名健康受试者进行的研究中,受试者使用了两种已知不等效的外用阿昔洛韦乳膏制剂,dOFM 采样持续 36 小时,每位受试者使用 12 个探针。该研究未能显示两种不同制剂的 BE,但显示了药物产品自身的 BE,表明该方法对亲水性化合物阿昔洛韦具有灵敏度(Bodenlenz 等人,2017 年)。同样,在一项类似设计的 dOFM 研究中,20 名健康受试者分别使用外用利多卡因/普鲁卡因乳膏和获批仿制药,结果显示 BE 不仅针对产品本身,还针对上市仿制药。因此,结果表明该方法可能也适用于评估含有中等亲脂性化合物(如利多卡因和普鲁卡因)的药物产品的 BE(Tiffner 等人,2020 年)。
总之,皮肤连续采样技术(例如 dOFM)在过去十年中取得了进展。它们已证明具有足够的灵敏度和稳定性,可以在使用合理数量的受试者的多项临床研究中评估两种不同类别外用药物的 BE。作为一种监管方法实施的主要挑战之一可能是受试者的负担以及需要进行试点研究以验证关键研究参数,包括应用剂量、应用时间和浓度范围。事实上,迄今为止,高度复杂的实际要求将此类方法的应用限制在少数高度专业化的实验室中,并且迄今为止阻碍了广泛使用,而广泛使用是全球采用标准程序的必要条件。
2.4.3结论与建议
为了促进高质量、价格合理的外用产品仿制药的普及,需要采用稳健的 BE 方法,而无需耗费大量时间和资源的比较 CE BE 研究。与体外或 PK BE 研究相比,比较 CE 等效性研究的判别力较低,这是共识。然而,结论是,在某些情况下,体外研究可能过度判别,并且检测到的差异可能与临床无关。在调查中,超过一半的受访者知道仿制药申请要求免除 CE BE 研究:在这些情况下,一半的申请人成功了,另一半最终要求进行 CE BE 研究。
据报道,有几种替代方法可能允许更直接、更具成本效益和更可靠的 BE 评估。人们一致认为,体外测试 IVRT 和 IVPT 被监管机构普遍接受。从技术角度来看,验证建议和允许放弃任何体内研究的标准需要协调一致。
讨论进一步表明,迄今为止,在 PD 方法中,局部皮质类固醇制剂的血管收缩试验是完全被接受的方法,但尚未阐明其他 PD 评估候选方法。
有前景的体内BE 方法侧重于评估目标器官内的 PK。显然,拉曼光谱法在定期实施之前必须进一步优化。另一方面,dOFM 的验证取得了重大进展,一系列研究证明了检测产品相关差异的潜力。然而,在实验室转移方面可能需要付出更多努力才能实现普遍应用。
目前,美国 FDA 的 PSG 已采用模块化方法,即药物化合物/药物产品特性、体外技术结果以及根据化合物和适应症可能要求的额外体内数据。这种方法被认为足以应对广泛的疾病及其在目标器官皮肤内的定位。
总体而言,必须通过科学家、行业和监管机构之间更密集的数据交换来克服体外测试的显著差异监管标准和任意的 BE 标准,从而促进基于科学的决策。
2.5窄治疗指数药物的BE评价
目前尚无适用于窄治疗指数 (NTI) 药物的全球监管定义,通常需要逐案决定,在某些情况下需要通过 PSG 做出决定。通常,这些化合物的治疗/有效剂量与毒性剂量 (TD50/ED50) 之间的比率很小。因此,对于 NTI 药物(有时也称为“临界剂量药物”),剂量和随之而来的血浆浓度的微小差异可能会导致治疗反应不足或出现不良反应,因此需要个体剂量滴定,通常还需要治疗药物监测。NTI 药物的典型例子包括维生素 K 拮抗剂、地高辛/洋地黄毒苷和一些抗癫痫药物(Gozzo 等人,2022 年)。
为了应对血浆浓度差异可能带来的无效性和不良反应,许多监管机构为含有 NTI 药物的产品制定了比常规 BE 限值(测试与参考 GMR 的 90% CI)80.00–125.00% 更严格的 BE 标准。然而,较窄的接受范围以及需要应用的 PK 参数并不统一。
介绍了欧洲、美国和日本对含有 NTI 药物的产品进行 BE 评估的监管建议,并提出了统计评估 BE 的可能替代方法。此外,从行业角度讨论了开发可负担得起的仿制 NTI 药物产品所面临的挑战。
2.5.1.监管建议
美国 FDA、EMA 和日本监管机构 PMDA 采用的 BE 标准总结如下表 2。
表2.窄治疗指数药物产品的生物等效性标准比较。
空单元格 | 美国食品药品监督管理局 | EMA | PMDA |
研究设计 | 完全重复,4 交叉 | 2 交叉 | 2 交叉 |
AUC 的批准标准 | RSABE 加上未缩放的平均 BE 限值 (80.00–125.00%) 加上 变异性比较:受试者个体内 SD 与参考值之比的 90% CI 上限≤2.5 | 90.00–111.11% | 80.00–125.00% |
C max的批准标准 | 同上 | 80.00–125.00% 如果 Cmax特别重要:90.00–111.11% | 80.00–125.00% |
AUC 和 C max的 PEC | 不 | 不 | GMR 包含在 [0.9, 1.11] |
AUC,曲线下面积;BE,生物等效性;Cmax,最大浓度;EMA,欧洲药品管理局;GMR,几何平均比;PEC,点估计约束;PMDA,药品和医疗器械管理局;RSABE,参考尺度平均生物等效性;SD,标准差;US-FDA,美国食品药品监督管理局(EMA,2010年;PMDA,2020b;美国 FDA,2021 年)。
根据 EMA 的说法,将药物视为 NTI 药物的标准尚未得到适当定义,必须根据临床考虑逐案作出决定。由于欧洲法规允许不同的市场授权程序,特别是国家程序是可能的,因此成员国之间对药品的评估甚至可能有所不同。对于某些药品,例如含有左旋甲状腺素或环孢素的药品,可以使用 PSG(EMA,2022 年)。AUC 的 BE 接受区间应收紧至 90.00–111.11%,如果 Cmax特别重要,例如对于安全性或有效性,则收紧的接受限度也应适用于此参数(EMA,2010年)。
美国 FDA 有一个跨学科工作组,根据以下考虑因素对 NTI 药品进行分类:Yu 等人(2015 年)。NTI 药品的 BE 测定结果反映在其各自的 PSG 中。一般而言,美国 FDA 建议使用四向、完全重复、交叉设计研究的缩放方法,其中可以计算测试和参比产品的 WSV。在大多数情况下,NTI 药品的特点是 WSV 低到中等。两个参数 AUC 和 C max的 BE 限度均根据参比产品的确定 WSV 进行缩放(RSABE,另见第 2.1.1.1 节)。仿制药应同时通过参考标定限度和未标定平均 BE 限度 80.00–125.00%(主要 BE 标准)。通过应用未标定 BE 标准,定义标定有效停止在 WSV 为 21.42% 时,最大接受范围为 80.00–125.00%。此外,测试和参比产品的 WSV 应具有可比性,即测试与参比产品的受试者内标准差比率的 90% CI 的上限应≤2.5(次要 BE 标准)(美国 FDA,2021 年;Yu 等,2015 年)。
在日本,PMDA 指南中提供了不同强度口服固体剂型 BE 研究的 NTI 药物清单(PMDA,2020a)。NTI 药品的 BE 要求适用于 AUC 和 C max,尽管指南中没有明确说明(PMDA,2020b) 是结合两种适用于 IR 产品的 BE 标准得出的,即:测试与参考 GMR 的 90% CI 应在常规 BE 接受范围 80.00–125.00% 内。此外,还定义了 PEC,即测试与参考 GMR 的估计值应在 90.00–111.11% 范围内。但是,强烈建议申请人使用该机构的面对面咨询服务来讨论他们打算采用的 BE 方法。
2.5.2.邀请投稿和讨论
2.5.2.1. NTI 药物的现行 BE 标准
经过咨询委员会的早期讨论,美国 FDA 制定并引入了基于参考产品的 WSV 观察值和变异性比较的 BE 标准来收紧接受范围的概念(Yu 等,2015 年)。由于临床上担心测试产品的 WSV 与参比产品相比有所增加,因此系统暴露量变化较大可能会增加治疗失败和/或不良反应的可能性,因此认为变异性比较是相关的。模拟结果还表明,如果 GMR 接近 1 (,则仅将缩放 BE 限值的主要标准加上 80.00–125.00% 的上限不足以使测试和参比之间 WSV 差异较大(σWT / σWR = 2)的BE 研究失败Jiang 等,2015 年)。既定的 RSABE 标准(监管常数 σW0为0.10 且 Δ 为“1/0.9”)意味着在参考 WSV 为 10% 时,接受限度为 90.00–111.11%,这与其他机构常见的加严接受范围相当。实施的缩放和比较变异性方法涉及完全重复设计。这被认为具有额外的好处,因为有人讨论过,在 WSV 大于 10% 的情况下,固定的加严限度过于保守,导致样本量过大或功效有限。包括 100% 的 CI 的附加标准被拒绝,因为这会不合理地损害功效。也就是说,如果点估计值与 100% 的偏差可以忽略不计,则更大的样本量会降低功效,并且违反直觉地导致试验受到惩罚。
在一项临床研究中,10 名健康受试者在三个不同的研究日内服用了 NTI 药物华法林,两种对映体(R 和 S 华法林)的 WSV 范围为 3.7 至 19.1% (AUC) 和 2.5 至 16.2% (C max )。对通过引导 1000 次临床数据重复获得的 WSV 分布进行了两次 BE 测试,主要标准(均值比较)的通过率为 95-97%,次要标准(WSV 比较)的通过率为 84-87%。WSV 比较的通过率低于 NTI 药物与自身测试的预期;然而,考虑到 10 名受试者的小样本量(与通常应用的样本量n = 24 左右相比),这似乎是合理的。WSV 比较被认为可以进一步确保 BE(Jayachandran 等人,2019 年)。
EMA 标准的一个主要缺点是,在 WSV 较大的情况下,研究效力较低:美国 FDA 的 RSABE 标准(无 80.00–125.00% 上限)确保在将参考产品与其自身或相同的仿制药进行比较时,通过率接近 100%。相比之下,在更严格的平均 BE 限值 90.00–111.11%(EMA)下,当参考产品的 WSV 增加时,通过率会显著下降,如果 WSV 接近 25%,统计效力将低于 30%(Jiang 等,2015 年),因此该类药品的BE研究需要较大的样本量,增加了仿制药研发的负担。
2.5.2.2. NTI 药品 BE 评价的替代策略
关于美国 FDA 的方法,有人批评其所应用的 BE 标准是分解标准,并且 BE 变异性的可接受范围值得商榷。因此,有人提出了一种简单的 90% 置信区域方法(即聚合标准),其中为测试和参考的平均值差异以及测试与参考变异性的比率构建了一个 90% 置信区域。如果组合指标的 90% CI 完全在该 BE 接受区域内,则认为是 BE。与美国 FDA 的方法类似,建议采用完全重复的交叉设计来评估参考和测试产品的 WSV。
关于欧洲的方法,有人指出,由于 NTI 药物产品的 WSV 通常较低,所谓的仿制药漂移可能会带来更多问题,从而要求更严格的验收标准。然而,人们认识到,如果 WSV 增加,样本量非常大,例如对于他克莫司、秋水仙碱、环孢素或左旋甲状腺素。因此,提出了一种改进的统计方法,有助于协调 EMA 和美国 FDA 的 BE 标准。在建议的 BE 策略中,例如使用半重复、三向交叉研究设计,根据确定的参比产品的 WSV 缩小 80.00–125.00% 的 BE 验收范围,类似于针对 HVD 产品描述的概念(见第 2.1.1.1 节)。如果 WSV <30%,则接受范围会缩小,如果 WSV <13.93%,则接受范围会降至 90–111%。正如他克莫司和秋水仙碱等 NTI 药物所证明的那样,其预测的 WSV 为 20–30%,与当前的 EMA 方法相比,所提出的方法涉及的样本量较小,但安全性不会降低(Paixão 等,2022a)。然而,人们认识到,这种方法也与 I 类错误 (<7%) 的增加有关(Paixão 等人,2022b)。
2.5.2.3.仿制NTI药物在全球开发中的挑战——行业视角
从行业角度来看,挑战在于缺乏使用明确标准对 NTI 药物进行定义,因此缺乏普遍接受的 NTI 药物清单或不同国家存在不同的清单,以及缺乏统一的 NTI 药物 BE 标准。关于定义 NTI 药物标准,尤其是在监管层面,正在进行广泛的辩论,低至中等 WSV(≤30%)已被提议作为一项标准。由于 NTI 药物产品建议的变化以及最新清单或 PSG 的可用性延迟,仿制药的开发变得更加复杂。此外,不同机构关于 NTI 药物产品 BE 证明的建议可能表现出相似之处,但差异很小甚至根本不同。可以粗略地分为使用缩放方法的国家(美国和中国)、采用结合标准接受范围和 PEC 的方法的国家(日本)以及对 AUC 和有时 C max施加严格但恒定限制的国家(欧洲和加拿大)。
此外,应用收紧的 90.00–111.11% BE 接受限度(尤其是对于在特定应用中观察到中等至高 WSV 的 NTI 药物产品)会导致所需样本量过大,而这不再适合进行比较 BE 研究。比较在特定应用中 WSV 中等至高的 NTI 药物产品(例如含有他克莫司和环孢素的药物)所需的样本量,发现与美国 FDA 的缩放方法相比,使用固定较窄限度的 EMA 方法可能需要更大的样本量(Paixão 等,2022a)。
因此,提出了以下建议,以促进开发价格合理、质量上乘的 NTI 药物仿制药:定义 NTI 药物标准、及时提供 NTI 药物清单或 PSG,并使用协调的 BE 缩放方法对 AUC 和 C max 进行评估。
2.5.3结论与建议
由于开发价格合理的 NTI 仿制药产品尤其具有挑战性,因此统一定义和监管 BE 建议是促进这一进程的关键。统一的主要目标是定义 NTI 药物的明确标准并实施科学合理的 BE 方法,从而为 BE 研究提供合理的样本量。
讨论中指出,将 BE 限度缩小到 90.00–111.11% 的“一刀切”方法是武断的,没有科学依据,而且往往不是最佳选择。相反,缩放 BE 方法一般不会面临实质性的反对,尽管除了不同的演示之外,并没有详细讨论该程序的细节。调查的大多数受访者(补充表)认为,没有 WSV 比较的建议缩放方法由(Paixão 等,2022a) 是 EMA 和美国 FDA 标准之间的良好折衷。进一步的讨论集中在是否应将缩小的 BE 限值应用于 PK 参数 AUC 和 C max,大多数受访者赞成 EMA 方法,根据参数的临床意义要求更严格的 BE 限值。调查的受访者对测试和参考产品之间进行 WSV 比较的必要性意见不一。前面提到,WSV 的比较没有意义,特别是如果它很低(Endrenyi 和 Tothfalusi,2013 年)。反对这一建议的一个有力论据是,如果跳过 WSV 比较,复杂的完全重复研究设计将不再必要。因此,测试和参考配方之间的变异性比较是否必要仍有争议。
正如 HVD 产品所述,NTI 药物产品研究的统计评估主题将在 ICH M13 速释固体口服剂型生物等效性指南制定的第 3 层中解决(ICH,2022a) 预计将于 2024 年启动。此次会议的深入科学讨论将有助于指导 ICH M13 专家工作组内的重点协调工作。
3.总体结论与展望
全球生物等效性协调倡议 (GBHI) 的主要目标是促进 BE 评估领域的科学驱动建议。实现这一目标的先决条件是定义未决问题和待解决的问题、开展科学研究以及在相关利益相关者(包括学术界、行业和监管机构)之间交流科学发现。从这个角度来看,GBHI 会议将继续提供一个科学平台,使科学家、行业和监管机构之间能够进行公开交流,从而促进制定和协调科学合理的建议,并最终促进高质量、负担得起的仿制药的开发。
目前预计 ICH M13 计划将在协调 BE 准则和标准方面取得相关进展。在 ICH 之前,GBHI 会议提供了对基础科学方法的深入了解,并有助于确定科学需求,这些需求仍然存在,需要在制定监管标准之前进行澄清。
最近的会议有助于确定特定统计方法领域的未决问题,涵盖 HVD 产品、自适应设计和建模/模拟方法、涉及进食/禁食状态的研究建议、NTI 药物和外用产品。本次会议上讨论的许多主题,特别是 HVD 产品、自适应设计和 NTI 药物的统计方法都是及时的,并将支持 ICH M13C(第 3 级主题)的开发,该主题预计将于 2024 年开始。
需要持续的科学努力和进步来进一步支持国际科学协调进程。
PS:时间已经记不起岁月的不堪,春夏秋冬也唤不醒沉睡的躯壳。