通信作者:宋尔卫教授
【引用本文】宋尔卫,尚桐锐,陈 凯. 人工智能在临床肿瘤领域中应用现状和基础建设问题[J]. 中国实用外科杂志,2021,41(11):1206-1208.
人工智能在临床肿瘤领域中应用现状和
基础建设问题
宋尔卫,尚桐锐,陈 凯
中国实用外科杂志,2021,41(11):1206-1208
近年来,人工智能技术发展突飞猛进,全球各国都将其上升到国家战略层面加以重视。人工智能在临床肿瘤领域更是已经有了广泛的应用。根据人工智能与常规人类所能达到的能力水平的相对差异,可将人工智能划分为Ⅰ类人工智能(与人类能力水平相近)和Ⅱ类人工智能(超越人类能力水平)。此外,人工智能在临床肿瘤领域应用的关键性基础建设问题,包括数据与隐私问题、法律与监管问题等。
基金项目:国家自然科学基金(No.81621004,No.81720108029,No.81930081, No.91940305);广东省自然科学基金(No.2020B1212060018,No.2020B1212030004);生物岛临床创新研究项目(No.2018GZR0201004);广州市科技计划项目(No.201803040015,No.202102010221,No.20212200003)
作者单位:中山大学孙逸仙纪念医院 逸仙乳腺肿瘤中心,广东广州510120
通信作者:宋尔卫,E-mail:songerwei02@mail.sysu.edu.cn
1 人工智能在临床肿瘤领域的应用现状
当前,学术界对肿瘤的发生、发展机制的认识仍不全面。肿瘤的个体差异性以及肿瘤的瘤内异质性均为临床肿瘤学的诊断与分期以及精准治疗方案的选择带来较大挑战。近年来,恶性肿瘤的疾病负担在全球范围内增长迅速CONCORD-3数据显示,中国、日本和美国的整体恶性肿瘤的5年生存率分别为36.0%、57.4%和64.0%[1]。因此,为更好地服务于临床肿瘤的早筛、早诊、精准分型、治疗选择、预后预测和智能随访,进一步提升我国恶性肿瘤病人的治疗效果,如何引入人工智能这一全新的“战术武器”,是摆在每一位临床肿瘤医务工作者面前的极具挑战的难题[2]。 近年来,全球各国将人工智能的发展上升到国家战略层面加以重视。在政策和资本的快速加持下,人工智能的发展突飞猛进,在包括医疗领域的各行各业的发展如火如荼。目前,人工智能在国内外的临床肿瘤学领域已经有了广泛的应用。Transpara是一个经过临床验证的人工智能深度学习决策支持系统,该系统可应用于乳腺癌乳房X线筛查的智能自动检测[3],帮助放射科医生更快、更早地识别潜在的乳腺癌,已经获得了美国食品和药物监督管理局(FDA)510(k)的批准。Veolity是一个肺结节筛查平台,可以识别CT图像中大小在4~30 mm之间的实性肺结节的特征,自动标记并提示结节区域,并且可以同步显示当前和既往的CT图像,便于后续对比。目前,监管部门批准的应用于临床肿瘤领域的人工智能水平基本可以达到或接近人类的水平,具有减少人类重复劳动的工程学价值。
然而,由于目前对肿瘤发病机制的认识仍不甚清晰,人工智能在临床肿瘤领域的应用仍然面临巨大挑战。IBM Watson Oncology(WFO)是基于人工智能技术开发的临床决策支持系统,通过提供按优先级排序的个性化循证治疗建议,帮助肿瘤医生做出治疗决策,并被证明能够提供与多学科专家治疗协作组(MDT)专家一致的建议[4]。有研究结果表明,在印度一家综合癌症治疗中心的638例乳腺癌中,WFO和MDT的决策一致性高达93%[5]。然而,作为医疗人工智能领域的探路者,IBM Watson的前景因与MD Anderson合作的中止而愈发黯淡。究其原因,是由于WFO被曝出经常给出错误的癌症治疗建议,例如建议一例已经大出血的癌症病人服用有可能会再次导致出血的药物,因此大大降低了医生对其的信任度。但IBM Watson医疗团队的项目并非全军覆没,如Watson For Genomics系统目前已经在多个基因实验室中进行应用,该系统可自动对病人的基因测序结果进行解读[6],生成相关可选用的药物清单以及潜在符合的临床试验清单,以满足对肿瘤病人精准诊疗的需求。
对比人工智能与人类的能力水平,不难发现,人工智能可划分为Ⅰ类和Ⅱ类人工智能。(1)将能力水平与人类相近的人工智能定义为Ⅰ类人工智能,例如乳腺癌钼靶筛查人工智能系统[7],肺癌CT检测人工智能系统[8]等。(2)将能力水平超越人类,甚至实现人类无法达到的效果的人工智能定义为Ⅱ类人工智能,如Saltz等[9]研究发现,人工智能模型可以自动识别肿瘤组织切片图像中的肿瘤浸润淋巴细胞(TILs)的空间分布情况,并进一步发现其在13种不同的癌症中具有预后指示作用。显而易见,这是病理学家很难完成的工作,但对临床决策却具有十分重要的意义。又如,一个基于18F-氟脱氧葡萄糖正电子发射型计算机断层显像(18F-FDG-PET-CT)影像信号的深度学习模型可以预测非小细胞肺癌病人的EGFR突变状态,从而选择更精准的治疗方案[10]。就目前而言,Ⅰ类人工智能的研究成功率较高,美国FDA和中国国家药品监督管理局(NMPA)批准的人工智能也大多属于Ⅰ类,因此获得了资本和市场的更多青睐,从而发展迅速。Ⅰ类人工智能的广泛应用具有较强的工程学意义,与之相比,超越人类能力的Ⅱ类人工智能有更强的科学性和创新性,同时也存在更高的探索风险。目前暂无获得监管部门批准并获得广泛共识认可的Ⅱ类人工智能产品问世,资本和市场也因此在这方面的投资更为谨慎。笔者呼吁,对于Ⅱ类人工智能项目,由于其难度高、失败风险高、市场和资本投入更为谨慎的特点,更需要国家层面的支持。加大对Ⅱ类人工智能研究领域的政策支持力度,将有利于推进我国人工智能发展进入新的局面。需要注意的是,此处提及的Ⅰ、Ⅱ类人工智能,与目前NMPA的《医疗器械分类目录》当中的管理类别定义不同,后者主要是按照医疗器械对人体危害的风险程度而制定不同的监管措施。
2 人工智能在临床医疗应用中需要解决的关键基础问题
虽然当前人工智能在临床肿瘤领域的应用方兴未艾,但仍然需要临床医生深刻认识到其仍有许多关键的基础建设问题及挑战急需解决[11]。人工智能发展的四大核心要素包括:数据、算法、算力和场景。人工智能在临床肿瘤学的应用过程中,数据和应用场景往往高度依赖于临床医疗机构提出的科学问题,以及提供的相关数据。因此,高质量数据的管理及相关法律法规的指引问题[12]是需要讨论的另一个重点。 2.1 数据与隐私问题 医疗人工智能的训练和学习需要海量且高质量的医疗数据支撑。随着病人数据的数量及维度的不断增加,数据的存储、预处理和分析等方面面临巨大挑战。目前,绝大多数医疗机构产生的大量的医疗原始数据均未经清洗,且相关的硬件储存条件也无法用于支撑高带宽的数据传输、数据共享和人工智能平台的研发。高质量的数据清洗与标注、结构化的数据存储以及专业化的硬件或软件平台维护均需要高成本的资金投入。此外,为训练出更具有广泛适用性的人工智能,多个机构之间进行的数据共享交互验证[13]对数据平台的共享效率和隐私保护能力提出了更高的要求[14]。特别是在数据使用权利和义务方面,医疗机构之间、医疗机构与第三方算法开发团队之间的数据分享是否应当遵循某些规范、原则,需要更多的国家顶层设计指导[15]。2021-06-10,我国通过了《中华人民共和国数据安全法》,标志着我国对数据安全与数据隐私问题的重视进入了新的时代[16],该法虽然对数据保护和个人信息进行了规定,但专门针对医疗领域的部分仍然稀缺。数据安全和隐私保护责任的界定和分配,是当前亟待解决的问题。除了法律保障外,一些数据管控技术可能可以在短期内更有效地解决当下问题,例如联邦学习技术可以在原始数据不离开医院的前提下,利用算法的分发技术实现模型的训练与验证,最大程度地保障数据安全并促进数据分享[17]。又如区块链技术,可以实现去中心化的分布式结构的数据管理[18],使数据协作共享网络更具公正性,有利于进一步加强各方的数据协作。另外,Joachim Schultze提出了一种去中心化的机器学习方法Swarm Learning(SL)[19],将边缘计算和基于区块链的对等网络结合用以实现全球不同医疗机构之间医疗数据的整合,使具有完全数据安全性的全球数据协作成为可能,是未来医疗数据隐私问题的研究新方向。
2.2 法律监管问题 2017年8月发布的新版《医疗器械分类目录》规定,若人工智能诊断软件通过算法提供诊断建议,仅有辅助诊断功能,不直接给出诊断结论,则按二类医疗器械申报;如果对病变部位进行自动识别,并提供明确诊断提示,则其风险级别相对较高,需按照第三类医疗器械管理。按本文前述定义,目前获批的Ⅰ类人工智能产品(能力水平与人类相当)主要的临床应用是辅助临床医生进行诊断治疗。关于其能否“取代”临床医师独立做出诊断,目前仍然是讨论的热点问题。这一问题最终的走向将很大程度上决定人工智能将以何种程度重塑医学诊疗过程。可以设想,应用人工智能技术的医疗活动将会涉及多个主体,包括算法开发人员、软硬件平台供应商、医疗机构等。当基于人工智能的计算结果应用到临床诊疗过程中时,如出现偏差或错误进而导致病人的健康或者权益受到损害时,相关的责任如何在各个主体层面进行划分,目前仍未见清晰的法规指引。因此就目前而言,人工智能产品仅作为临床诊疗活动中“人类”的辅助工具,而不能“取代”人类医生进行独立诊疗活动。
此外,医患双方对人工智能的信任程度,将很大程度上决定人工智能在临床诊断活动中的角色和地位。2021-06-28,世界卫生组织发布《医疗卫生中人工智能使用的伦理和管治》指南确定了“确保透明度和可解释性”作为医疗人工智能应用的六项核心原则之一。数据和人工智能算法的透明度及可解释性是目前影响医患双方对人工智能产品的信任的最主要原因。欧盟《通用数据保护条例》中规定公司有义务向欧盟管理机构提供个别算法决策详细解释或关于算法如何决策的一般信息[20],公民有权接受算法决策的解释[21]。然而,部分准确性和预测性能较为优越的算法模型,如深度神经网络模型等,其算法的透明度和可解释性欠佳,若为加强透明度及可解释性而换用为其他算法模型,则可能会降低人工智能产品的效能。因此,如何综合考虑算法模型的性能、模型的可解释性与透明度、公众的知情权和开发团队的知识产权保护,是医疗人工智能应用监管的重要问题。
参考文献
(在框内滑动手指即可浏览)
[1] Allemani C, Matsuda T,Carlo VD, et al. Global surveillance of trends in cancer survival 2000-14 (CONCORD-3): analysis of individual records for 37 513 025 patients diagnosed with one of 18 cancers from 322 population-based registries in 71 countries[J]. Lancet, 2018, 391(10125): 1023-1075.
[2] 曹晖,顾佳毅. 人工智能医疗给外科医生带来的挑战、机遇与思考[J]. 中国实用外科杂志, 2018, 38(1): 28-33.
[3] Alejandro RR,Elizabeth K, Jan-Jurre M, et al. Detection of breast cancer with mammography: effect of an artificial intelligence support system[J]. Radiology, 2019, 290(3):305-314.
[4] 段明月, 叶玉琴, 张乐, 等. 人工智能制定乳腺癌术后治疗方案与相关指南一致性研究[J]. 中国实用外科杂志, 2019, 39(9): 964-967.
[5] Somashekhar SP,Sepúlveda M-J,Puglielli S,et al. Watson for Oncology and breast cancer treatment recommendations: agreement with an expert multidisciplinary tumor board[J]. Ann Oncol, 2018, 29(2):418-423.
[6] Unknown. Oncologists Partner with Watson on Genomics[J]. Cancer Discov, 2015, 5(8):788-788.
[7] William L, Rahman DA, Bryan H, et al. Robust breast cancer detection in mammography and digital breast tomosynthesis using an annotation-efficient deep learning approach[J]. Nat Med, 2021, 27(2):244-249.
[8] Lu MT, Raghu VK, Mayrhofer T, et al. Deep learning using chest radiographs to identify high-risk smokers for lung cancer screening computed tomography: development and validation of a prediction model[J]. Ann Intern Med, 2020,173(9):704-713.
[9] Saltz J, Gupta R, Hou L, et al. Spatial Organization and Molecular Correlation of Tumor-Infiltrating Lymphocytes Using Deep Learning on Pathology Images[J]. Cell Rep, 2018, 23(1): 181-193.e7.
[10] Non-invasive decision support for NSCLC treatment using PET/CT radiomics[J]. Nat Commun, 2020, 11(1):5228.
[11] Mehta MC, Katz IT, Jha AK. Transforming Global Health with AI[J]. N Engl J Med,2020,382(9):791-793.
[12] Shaffer L. WHO wants to bring order to health data[J]. Nat Med, 2020, 26(1):2-3.
[13] Benjamin HK, Alexandru AG, Ahmed H, et al. Transparency and reproducibility in artificial intelligence[J]. Nature, 2020, 586(7829):E14-E16.
[14] Telenti A, Jiang X. Treating medical data as a durable asset[J]. Nat Genet, 2020,52:1005-1010.
[15] Mello MM,Wang CJ. Ethics and governance for digital disease surveillance[J]. Science, 2020, 368(6494):951-954.
[16] Price WN, Cohen IG. Privacy in the age of medical big data[J]. Nat Med, 2019, 25(1): 37-43.
[17] Li XX,Gu YF,Dvornek N,et al. Multi-site fMRI analysis using privacy-preserving federated learning and domain adaptation: ABIDE results[J]. Med Imag Anal, 2020, 65:101765.
[18] Rajkomar A,Hardt M, Howell MD, et al. Ensuring Fairness in Machine Learning to Advance Health Equity[J]. Ann Intern Med, 2018,169(12):866-872.
[19] Warnat-Herresthal S,Schultze H,Shastry KL, et al. Swarm Learning for decentralized and confidential clinical machine learning[J]. Nature, 2021,594(7862):265-270.
[20] McCall B. What does the GDPR mean for the medical community?[J]. Lancet, 2018, 391(10127):1249-1250.
[21] He J,Baxter SL,Xu J, et al. The practical implementation of artificial intelligence technologies in medicine[J]. Nat Med, 2019, 25(1):30-36.
(2021-10-07 收稿)
本文为《中国实用外科杂志》原创文章。其他媒体、网站、公众号等如需转载本文,请联系本刊编辑部获得授权,并在文题下醒目位置注明“原文刊发于《中国实用外科杂志》,卷(期):起止页码”。谢谢合作!