综述回顾 丨AI在临床试验(Clinical Trials)中的应用进展
导 语
通常将单一新药推向市场至少要花费10-15年的开发周期和高达15-20亿美元的费用,而这漫长过程的后半段时间则主要是临床试验(Clinical trials)。因此,临床试验的失败不仅会导致临床试验的投资失败,同时也会使临床试验前的投资也化为泡影,一次临床试验失败的损失高达4-14亿美元。
通常10种进入临床试验的化合物只有1种能进入市场(1/10),而究其失败的原因,主要有两个方面:
(1)患者队列选择和招募技术不达标;
(2)临床试验期间对患者的监测不力;
那么面对如此高的失败率,目前在医疗行业迅速发展的技术能否另辟蹊径,助力药物临床试验了?本文介绍的这篇综述文章就着重介绍人工智能(AI)如何重塑临床试验设计的关键步骤,以提高临床试验成功率。
内容概要
研究题目:Artificial Intelligence for Clinical Trial Design
发表杂志:Trends Pharmacol Sci(IF:11.523)
在线日期:2019.07.16
作者信息: Stefan Harrer,1,* Pratik Shah,2 Bhavna Antony,3 and Jianying Hu 4
研究单位:
1.IBM Research, IBM Research Australia Lab
2.Massachusetts Institute of Technology, Media Lab
3.IBM Research, IBM Research Australia Lab
4.IBM Research, IBM T.J. Watson Research Center
1 . AI 可以将反向摩尔定律 (Eroom’s Law )转化为摩尔定律( Moore’s Law)
(1) 药物研发的流程
将一种新药推向市场需要长达15年的时间,平均研发总支出为15-20亿美元,大约一半的投资用于临床试验。化合物进入临床试验阶段的成功概率因阶段而异,导致进入临床试验的10种化合物中只有一种才能得到FDA批准。临床试验的高失败率是药物开发周期漫长和效率低下的一个主要原因,该问题也是普遍存在的。所有II期化合物中不到 1/3 进入第三阶段,超过1/3 的III期化合物未能获得批准。因为这些关键点直到研发周期的下半场才出现 - 如最复杂的III期试验承担了整体试验成本的约60% - 每次失败的临床试验造成的损失大约为0.8-1.4亿美元,甚至使得所有的研发投资变成竹篮打水一场。
图1.新药研发周期。将一种新药推向市场需要长达15年的时间,平均研发总支出为15-2亿美元(B)。大约一半的投资用于临床试验,III期试验是最复杂和最昂贵的。化合物进入临床试验阶段的成功概率因阶段而异,导致进入临床试验的10种化合物中只有一种进入FDA批准的情况。高临床试验失败率是药物开发周期普遍存在效率低下的一个主要原因。
(2)临床试验失败的两个关键因素1)患者队列选择和招募机制未达标准;
2)缺乏应对试运行复杂性的技术基础设施 - 特别是在其后期阶段 - 缺乏可靠和有效的依从性控制,患者监测和临床终点检测系统。
AI有可能协助克服上述两个关键问题,机器学习(ML),特别是深度学习(DL)能够自动找到大型数据集中的意义模式,如文本、语音或图像。自然语言处理(NLP)可以理解和关联书面或口头语言以及人机界面(HMI)的内容,允许计算机和人类之间的自然信息交换。这些功能可用于关联大型和多样化数据集,如电子健康记录(EHR)、医学文献和试验数据库,以便在试验开始前改进患者队列选择和招募机制 ,以及在此期间自动和连续监测患者。试验,从而允许改进的依从性控制,并产生更可靠和有效的终点评估。
图2. 将AI引入临床试验设计的主要方法。三个核心设计主题 - 队列组成、患者招募和患者监测(排名第一) - 基于患者关于适合性,资格,注册授权和动机的特征,以及包括终点检测,依从性控制和患者的试验特征保留(第二行)。各种设计方法(第三行)用于实现目标功能(第四行)。这些功能通过三种主要AI技术的单独组合实现:机器/深度学习,推理和人机界面(第五行),每种技术分析一组特定的患者和功能特定数据源(第六行)。这些实施对研究结果的相对改善由主要结果方面(第七行)下方的彩条代码中的水平线的长度表示。每个基于AI的研究设计应用程序都直接依赖于它可以利用的数据的质量和数量,因此面临着相同的基本挑战(底行)。缩写:EMR,电子病历。
2AI在患者队列选择和招募机制中的作用
(1)患者选择
每项临床试验对参与者的要求都不同,包括纳入标准(病史、疾病阶段、待测药物靶向的特定亚型)、适合性,动机(激励机制)和授权等。在一定的招募期限内按照严格标准招募足够符合标准的患者是一项重大挑战,也是试验延迟的首要原因:86%的试验未达到入组时间表,并且接近三分之一的III期试验因患者招募原因而失败。患者招募占整个试验持续时间的1/3,III期试验占药物通过所有试验阶段的总费用的60%,因为该阶段需要的患者队列最大。由于患者招募问题在III期临床试验中出现32%的失败率,说明了患者招募是临床试验设计中最严重的缺点之一。AI和ML驱动的系统可以帮助改善患者队列组成并为患者招募提供帮助。
(2)队列组成“临床试验浓缩” : 临床试验通常不是为了证明一般人群的随机样本中治疗的有效性,而是旨在前瞻性地选择一个群体的子集,其中药物的作用(如果有的话)可以更容易证明的策略。招募大量合适的患者并不能保证试验成功,但是招募不合适的患者会增加其失败的可能性。
适合性的评估: 在理想的世界中,使用患者特异性诊断基因组到暴露组分析来确定药物靶标的生物标记物是否在患者谱中充分强烈地表达。尽管可以从这种方法中受益的试验构成了所有试验中相对较小的一部分,但它们也往往是最昂贵的试验 - 特别是在使用医学成像技术时。因此,尽管在实践中可能没有全面的“原型”,并且可能需要针对临床开发中的大多数疗法鉴定有效的生物标志物,但是在适用的情况下仍应考虑生物标志物测试。
NLP和计算机视觉算法应用: 复杂的分析方法对于将原始数据与电子病历(EMR)和其他患者数据(分散在不同位置,所有者和格式之间 - 从手写纸质副本到数字医学图像)组合到表面生物标记物(表明可能是终点)是必要的。更有效地测量,从而识别和表征适当的患者亚群。这为NLP和计算机视觉算法提供了独特的机会,例如光学字符识别(OCR)自动阅读和编译这些证据。此外,由于其体积、速度、准确性和多样性,在EMR数据的情况下,将来自不同来源和格式的数据作为单个相干数据集进行处理以进行全面分析尤其具有挑战性。AI模型的数据源不可知性使其成为EMR数据协调的独特工具,这是设计临床试验浓缩和生物标记物发现工具的关键。
临床前化合物发现,化合物 - 靶标测试和定义用于临床试验的先导化合物可以通过使用基于AI 生成和预测,ML和推理技术来辅助。这可以允许选择在临床试验期间具有较高成功机会的候选对象,并且在他们进入临床阶段之前消除那些具有较高失败可能性的候选对象。
AI模型和方法也可用于通过食品和药物管理局(FDA)确定的以下一种或多种方法来增强患者队列选择:(i)通过减少群体异质性,(ii)选择更可能的患者具有可测量的临床终点,也称为“预后富集”,以及(iii)通过识别更能够响应治疗的人群,也称为“预测性富集” 。
(3)协助招募
通常研究对象自己难以理解和评估自己参与临床试验资格,从这个大型非结构化数据源手动提取有意义的信息是一项重大任务,给医生和患者带来了沉重的处理负担。几种AI技术可以在EMR草堆中自动找到针头提供可行的帮助:1)NLP 可用于从各种结构化和非结构化数据类型中理解书面和口头语言;2)ML,特别是深层强化学习使系统能够学习并将关于分析输出质量的反馈整合到适应的底层算法中。
使用这些AI技术或其子集的辅助系统可用于自动分析EMR和临床试验资格数据库,找到特定患者之间的匹配和招募试验,并向医生和患者推荐这些匹配. 这种基于AI的临床试验匹配系统已经得到了证明,也证实了它们在实际使用案例中的价值。由于这些系统的AI性质,任何增加的未来功能和改进的性能主要取决于分析模型开发和试验研究现场验证工作可访问的数据的质量和数量。
NLP和OCRAI和ML技术以主动挖掘公共可用的web内容,例如数字试验数据库、试验公告和社交媒体,以自动识别相关性试验和特定患者之间的潜在匹配。通过协助患者进行传统的手动网络搜索,这样的系统可以使患者更快地了解感兴趣的试验,并允许他们主动与临床医生接触,以进一步评估资格和适用性。实际上,成功地证明了采用社交媒体组件的第一个招募计划。人工智能的整合将有可能大大提高未来的数字注册计划的覆盖面、效率和影响。
3.AI在临床试验患者管理中的应用 :患者依从性控制、终点检测和保留
成功招募到符合要求的研究对象后,还需要确保研究对象留在试验中,在整个试验过程中遵守试验程序和规则,并且有效且可靠地收集用于监测受试药物影响的所有数据点。只有15%的临床试验没有患者丢失,临床试验的平均丢失为30%。由于缺乏对试验方案的遵守而导致研究对象,需要额外的招募工作,这导致试验延迟和大量额外费用。AI技术与可穿戴技术相结合,为开发此类节能、移动、实时和个性化的患者监护系统提供了新方法。
(1)疾病日志为了符合依从性标准,患者需要详细记录他们的药物摄入量以及与其身体功能,药物反应和日常方案相关的各种其他数据点。这可能是一项压倒性和繁琐的任务,导致平均40%的患者在进入临床试验150天后变得不依从。可穿戴传感器和视频监控可用于自动和连续地收集患者数据,从而使患者免于此任务。然后可以使用ML和特别是DL模型实时分析这些数据,以检测和记录相关事件(图2).这种方法允许生成疾病日志,这些疾病日记可以作为依从性或缺乏的证据,并且 - 由于需要手动输入最少或无需人工输入 - 还将比当前患者驱动的自我监测方法更可靠,更有效地收集终点检测的数据点。
(2)丢失风险预测
AI和ML方法也可用于动态预测特定患者丢失的风险,换句话说,检测患者行为的开始,表明患者可能遇到遵守研究方案的问题)。传感器和分析模型的选择具有高度疾病特异性,需要成为临床研究设计的一部分。
(3)可穿戴传感器的引入
使用DL进行图像和视频中的对象识别,以及分析来自可穿戴传感器的时间序列数据,最近开始测试和探索AI辅助患者监测系统的首次研究或成功完成。具有医疗级健康感知功能的商用可穿戴设备的出现,以及用于在此类移动平台上运行高级DL模型的补充软件生态系统,将允许更多样化的传感器组合进行各种调查疾病在之前的一项研究中。
(4)DL算法的优势
DL算法具有独特的定位,可满足这些要求,从而将精准医学带入神经病学领域。定制开发移动处理器和编码环境的最新进展允许DL模型在感测点附近或在感测点运行。这将可穿戴设备从纯信息存储和传输设备转变为信息消化和分析设备 - 称之为认知传感(cognitive sensing )的新概念。可穿戴设备通过连接到人体的移动系统测量生物特征参数,并将收集的数据存储在设备上或将其发送到云端进行离线分析。随着可穿戴革命的展开,可以同时监测快速增加的参数类型,从而无法存储和传输未经过滤的传感器数据。在需要数据存储或传输出现之前,有必要在感测点直接分析,换句话说,实时地连续关联,上下内容和过滤原始数据的算法。DL模型与传感器数据预处理和管理系统相结合,可以完成这项任务。
图3.认知传感器。数据由可穿戴传感器测量,并通过运行AI模型的移动处理器在感测点实时分析。然后将分析结果存储在本地日志,云中或两者的组合中。
这种可穿戴、自主操作、永远在线的认知传感器的架构(图3)包括以下系统组件:
(i)最小占位面积的生物传感器;
(ii)能够在本地运行DL模型的低功率移动处理器;
(iii)拥有闭环接口;
(iv)即时且主动地发送事件日记记录特定疾病发作的信息,并与佩戴者或护理人员进行交互,以获得患者支持,指导和干预。
事件日记因此可以利用当地内存单元,远程云存储库或两者的混合版本。已经证明或正在开发处于技术成熟度不同阶段的各种可穿戴生物传感器和执行器平台。(表格1).
大多数这些传感器类型测量的主要数据类型是时间序列数据。虽然DL传统上专注于使用深度卷积神经网络分析图像数据,但最近的研究表明,定制设计的神经网络模型也非常适合分析复杂的时间序列流。为了在传感点连续实时运行DL算法,需要超低功耗的移动处理器。在过去3年中开发新型AI硬件和AI软件技术的进步已经使得这种AI定制的移动处理解决方案的若干版本现在可用于实际使用。这些解决方案可分为三种常规类型:
(i)需要定制开发的AI编码环境的定制开发硬件,例如IBM的TrueNorth芯片,(ii)与标准AI编程工具兼容的定制开发硬件,如Qualcomm的Snapdragon芯片系列和Intel的Movidius处理器;
(iii)可以使用标准AI编码平台编程的传统移动处理器,例如Apple Watch,带有A12仿生芯片的Apple XS iPhone系列,以及各种其他智能手机。
(5)应用举例:神经系统药物研发
神经疾病在药物开发中扮演着特殊的角色:神经病学试验是心血管,精神病学和肿瘤学试验中表现最差的四种试验类型之一。在神经学试验中监测患者的依从性控制和终点检测是极具挑战性的。通常,神经系统疾病急性发作的性质使患者无法自我监测,控制其行为或保持事件记录。例如,经历癫痫发作的癫痫患者根本无法自我报告该事件。经历长时间抑郁发作的患者可能决定不服用药物,也不会报告这种偏离试验方案的情况。即使是经验丰富的医生或独立观察员进行的第三方监测也不能在大多数神经系统疾病中进行可靠的事件记录。
这种并发症的原因主要是神经系统疾病通常倾向于高度个体化,换句话说,它们在个体患者中看起来不同,甚至对于特定患者,其表现往往会随着时间而改变。这使得神经障碍的诊断和治疗成为特别具有挑战性的努力:对于相同的疾病,一个患者的诊断概况可能不适用于另一个患者,并且即使对于相同的患者,诊断模式也可能随时间而变化。这可以防止遵循基于规则的一刀切的诊断和治疗途径。一个技术平台可以被训练以持续分析和解释个体患者随着时间累积的患者数据,并自动调整疾病表达和治疗反应的变化,以允许从这些异质数据中学习。最近的人工智能硬件和软件开发表明,人工智能和可穿戴传感器可以结合起来实现这种自动,实时,患者监控和分析技术。
基于上述技术中的一些,第一个认知感应应用已经出现在应用神经科学领域,用于监测和解释癫痫和精神障碍,深部脑刺激,脑机接口和大脑活动中的大脑活动,诊断和预测性预防。
4.总结和未来前景在过去的5年中,现代AI技术已经发展到成熟水平,使他们能够在现实条件下工作,以协助人类决策者进行计算机视觉,导航,以及某些医疗和医疗保健环境,但制药和医疗保健仍然是最受监管和风险规避的行业之一。
(1)逐个击破:改变既定流程的创新创新是一项艰巨的任务,需要逐步实施和实施。虽然AI有可能影响从临床试验设计的众多缓解,但任何旨在同时解决所有问题的AI都不可能实现。相反,数据科学家和医学科学家应共同定义可实现的用例,其中将易于理解的AI工具应用于临床试验设计的特定子任务,以最大限度地提高整体试验性能。这种AI技术首先需要与其旨在补充或替代的现有技术一起进行测试,并且必须以可解释、符合道德、可重复和可扩展的方式展示和评估附加值 。遵循这种方法,AI可以被纳入临床试验生态系统一步一步,加快试验速度,同时希望降低失败率和研发成本。
(2)数据利用,尤其是失败临床试验数据的利用
此外,已完成的试验已积累了一组数据,其中包含有关试验设计特征与试验性能之间相关性的大量信息。这包括来自失败的临床试验的数据。这些大型和非结构化数据集预定由AI技术进行分析。洞察力可用于训练未来改进的试验设计,也可用于研究已经试验过的药物对药物再利用的合并症的潜在相关性。然而,特别是失败的 试验数据往往是一个被忽视的资产。
值得注意的是,任何此类步骤对制药研发效率的可衡量影响 - 即使现在成功实施,在统计数据出现延迟5 - 8年之后才会显示在统计数据中。此外,除持续成本外,还会有额外的研发费用;换句话说,从所需的投资角度来看,事情会变得更糟,然后才会变得更好。写 在 后 面
该篇文章中描述的AI技术提供了真实的实用性;然而,特别是在可解释性方面,这些技术必须成熟,以便更广泛地纳入医疗保健和生命科学应用。虽然这些发展正在全面展开,但我们需要承认,通过AI改变药物开发周期的机会对所涉及的所有学科负有重大责任,并且要求通过严格的研发工作来确定任何创新的价值和可靠性。这种探索性研究试验阶段可能无法以任何理由被绕过,因为任何违反研究方案或不合理期望的预先设定将不可避免地破坏信任并最终导致AI在临床领域应用的失败。
就像仅仅改变临床试验设计不会将制药研发周期的效率从衰退转变为增长一样,AI也不是一个神奇的子弹,它不会使临床试验的成功率在一夜之间飙升,重塑临床试验设计和使用AI技术这两者都是需要我们重点关注的。
该篇文章中内容较多,如需原文,请在公众号回复 “AI和临床试验” 获取。参考文献:
1. Harrer S, Shah P, Antony B, et al. Artificial Intelligence for Clinical Trial Design[J]. Trends Pharmacol Sci, 2019.
备注:文中数据图也均来自该篇文章中。既往精彩文章回顾
介入心脏病学中的人工智能革命 丨算法与专家对瞬时无波比冠状动脉压力线回拉数据解读的较量Nature 丨 机器学习结合cf-DNA液体活检助力癌症早期诊断基于血液生物标志物的机器算法在上皮性卵巢癌术前诊断和预后预测中的应用心电图 丨筛选慢性肾脏病患者高钾血症的深度学习模型的开发和验证女性关注 丨 深度学习在宫颈癌筛查中的应用IF 244.585分神刊综述解读 丨 人工智能在癌症成像中的临床挑战和应用Nature Medicine 丨 医疗大数据时代的隐私综述回顾 丨人工智能和上消化道内镜检查:现状和未来前景Gut 丨 基于深度学习的计算机辅助诊断在早期食管癌评估中的应用女性关注 丨 放射科医师在有或无AI辅助支持下基于X线摄片检测乳腺癌表现的比较前沿总结 丨 人工智能在医学图像中的五大应用案例转载申明:
本文系WX公众号 医学AI社 编辑 翔瑜 整理写作,如需转载,请识别上图右侧二维码与我们取得联系同意,或者邮箱“Med_AI@outlook.com”联系。未经同意,请勿转载!
本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。
如果侵犯了你的权益请来信告知我们删除。邮箱:dacesmiling@qq.com