动脉网:人工智能如何寻找新冠特效药,看这两家企业硬核突破

经过长达一个月的鏖战,新冠疫情逐渐得到了控制。2月18日,新增治愈首次超过新增确诊。此后现存确诊人数开始逐日下降,到2月27日下午,现存确诊人数已经降低到了43284人,较上一日再降2413人。

 

老药新用是本次抗疫的主力军。很多抗病毒药物都被证明对新冠肺炎有一定的治疗效果。但是毕竟这些药物不是针对新冠肺炎研发,很难凭借一己之力扭转局势。而进行针对新冠病毒的新药研发,似乎又过于漫长。

 

老药效果有限,新药进度缓慢。在这两难的局面下,人工智能与新药研发的结合,似乎找到了通往答案的又一种选项。

 

老药新用治疗新冠肺炎,虽然有效却达不到特效药级别

 

2020年1月25日,由蒋华良院士、饶子和院士领衔,中科院上海药物研究所和上海科技大学联合研究团队发现一批可能对新型肺炎有治疗作用的老药和中药。联合团队快速表达了2019-nCoV水解酶(Mpro)并获得了高分辨率晶体结构,随后继续利用虚拟筛选和酶学测试相结合的策略,重点针对已上市药物以及自建的“高成药性化合物数据库”和“药用植物来源化合物成分数据库”进行了药物筛选,发现了30多种可能对新冠病毒肺炎治疗有效的药物、活性天然产物和中药。

 

discovery

部分机构做出可能对治疗新冠肺炎有效的药物预测(中成药相关未列入)

 

这项工作成果是首批被筛选出可能对新冠病毒肺炎有效的药物。30多种药物中,包括了12种抗HIV药物、2种抗RSV药物、1种抗人巨噬病毒药物、1种抗精神分裂症药物,1种免疫抑制剂以及其他一些药物和活性天然产物。

 

在首批药物披露之后,陆续有国内外的研究团队披露了自己的分析结果。药物类型也主要集中在抗病毒药物方面。在研究中发现的几种药物,比如李兰娟院士团队提出的阿比多尔、武汉病毒所提出的磷酸氯喹等,都在经过临床实践之后,进入了最新公布的《新型冠状病毒诊疗方案(试行第六版)》。

 

airdrug

《新型冠状病毒肺炎诊疗方案(试行第六版)》中推荐的抗病毒药物

 

老药在临床实践中体现了自己的价值,但同时也不断有声音提醒,这些药物虽然对新冠肺炎的治疗有一定的帮助,但仍不是专门针对新冠病毒的药物。在2月18日举行的发布会上,钟南山院士专门就磷酸氯喹的临床使用发表了自己的看法。他表示虽然在临床上有疗效,但还是达不到特效药的级别。

 

目前为止披露的研究机构大多使用的都是传统的方法,通过体外实验或者人工分析去寻找针对新冠病毒的特效药。在如今的新药研发领域,虽然很多传统的方法仍然是研究中的金标准,但是同时也有很多新技术开始加速新药研发,尤其是人工智能技术的介入,让新药研发过程中处理数据的能力发生了质的飞跃。那么在本次新冠肺炎特效药的搜寻中,人工智能技术又能起到怎样的作用?

 

实际上在老药的搜寻方面,就已经有企业用到了人工智能技术。位于英国的AI+新药研发企业BenevolentAI就使用自己的人工智能技术找到了巴瑞替尼可能对新冠病毒有抑制作用。

 

本土的药物研发企业也在积极寻找有效的治疗方法,比如中国AI制药领域的头部企业、最近正在募集新一轮融资的晶泰科技,和去年完成天使轮融资、专注于机器+专家双引擎药物研发模式的望石智慧,就以不一样的思路切入研究并分享了成果,为抗击疫情做出了自己的贡献。

 

晶泰科技:从病毒的致病机制与分子结构出发的老药新筛,并加速安全高效、抗耐药的创新药研发

 

对晶泰科技来说,AI模型+物理思维的深度结合才能同时满足药物研发速度与精确度的要求,而面对疫情最直接有效的药物筛选策略,是以云端超算支持物理化学算法搭建病毒模型,再从结构出发,通过AI加速寻找到有抗病毒活性的FDA已批准的上市药物。

 

晶泰科技的优势是具备领先的量子物理药物模拟算法、人工智能药物发现平台,并有横跨多个云平台的超算资源作为有力支撑,能够在短时间内完成大量高精度的药物模拟计算。在新冠病毒数据尚不充足的情况下,晶泰科技可以从仅有的少量信息出发,从分子机理层面研究病毒的关键结构与感染机理,从而寻找阻断感染、治疗肺炎的有效途径。

 

1月20日,NCBI首次公布了新型冠状病毒的基因序列,这为构造病毒的蛋白结构模型提供了基础。而从结构出发的药物筛选与设计是以计算为基础的筛选方法中准确性、成功率更高的方法。当天,晶泰科技成立新冠研究小组,基于基因序列,以非典型性肺炎病毒的同源蛋白晶体结构为基础,对新冠病毒SARS-CoV-2上的关键蛋白搭建三维结构模型,包括影响病毒复制过程的3CLpro和PLpro,以及与感染患者密切相关的Spike蛋白受体结合区。

 

2月2日,晶泰科技将这些高精度模型与大量的计算数据、研究结果发布在自媒体与公司网站上,数日内被下载上千次。这些模型对研究病毒分子机理、设计与筛选提供了基础。随着研究的推进,晶泰科技仍在不时更新可供同行下载的分享内容。

 

基于这些模型,晶泰科技通过分子动力学模拟,发现病毒Spike蛋白与人体内ACE2受体蛋白可以稳定结合,且有较强的亲和力。晶泰科技的首席科学家张佩宇博士告诉我们,这一点从计算层面验证了新型冠状病毒具有较强的传播力与人际传播的可能性。基于该计算方法,判定未来同类病毒的人际传播风险的分子层面量化模型评估或可在一天内完成,可以帮助疫情一线研究者快速、多维预测疾病威胁。

 

在药物研发的策略选择上,晶泰科技在老药新用筛选与新药从头设计两个方向同时推进着。老药新用与传统的新药研发相比,推进快,耗时短,药物的稳定性和安全性已经通过多重实验验证。尤其是在针对突发传染性疾病疫情的时候,该策略的优点更加突出。在老药新用的靶点选择的过程中,晶泰科技决定聚焦病毒上的3CLpro、PLpro和RdRp这三个参与病毒复制与转录的重要蛋白靶点。

 

张佩宇介绍说,这三个靶点也是抑制非典(SARS)病毒与中东呼吸综合征(MERS)病毒的良好靶点,并且由于他们存在于病毒而不是人体上,相对不容易造成严重的副作用。晶泰科技通过其自主开发的人工智能药物虚拟筛选平台ID4(Intelligent Digital Drug Discovery and Development),对已获FDA批准的2900多个药物分子和超过10000个中药成分分子进行了筛选,共得到了183个对这两个靶点有潜在抑制作用的候选分子。2月5日,晶泰科技又通过高精度的活性预测和结构评估,将搜索范围缩小到FDA上市药中排名最高的38个分子。

 

“这一候选列表中的药物还需要进一步的体外细胞实验与动物模型去验证活性。出于科学严谨性,我们仅对同行公布了我们的筛选结果。”张佩宇介绍,目前,晶泰科技已经购买实验蛋白,正对老药新筛的候选分子进行生物化学实验验证。

 

然而老药新用的办法有它自身难以克服的局限性。这些药物并非针对冠状病毒而设计开发,疗效往往差强人意,另外也可能在治疗新适应症时由于活性问题导致剂量增加,而给患者带来难以接受的副作用。例如最近报道的洛匹那韦/利托那韦(克力芝)和阿比尔多的临床疗效均不理想。而新药研发时间周期更长,研究窗口却很短。张佩宇坦言,SARS 与MERS至今没有开发出有效的药物和疫苗,其中一大原因是,在药物研究进入临床之前,疫情已经消退,无法找到足够的患者入组完成临床试验。晶泰科技希望通过其人工智能研发平台,通过与其他药企合作加速新药的开发,开发安全高效并具有潜在广谱抗冠状病毒性质的抗新冠药物,在人类与冠状病毒的长期战役中发挥效力。

 

在新药从头设计上,晶泰科技选择了冠状病毒上的Spike蛋白及其他关键蛋白作为自己的突破点,它们被公认是开发抗病毒药物有吸引力的靶点。

 

冠状病毒的Spike蛋白简称S蛋白,其与人体ACE2受体蛋白的结合是新冠病毒感染人体细胞的关键。在SARS病毒和MERS病毒中,S蛋白也行使着类似的作用。目前在研的疫苗产品中有很多都以S蛋白为基础。另外在多肽和小分子药物研发方面,如果能阻断S蛋白与ACE2蛋白之间的结合,也能阻止新冠病毒感染人体细胞,从而达到治疗效果。

 

值得一提的是,2月21日,中国科学院微生物研究所共享了新冠病毒S蛋白受体结合区域和ACE2形成复合物的2.5埃分辨率晶体结构。晶泰科技将自己分子动力学模拟优化后的同源模型结构与该晶体结构进行了对比,发现重合度很高,并且准确预测了关键残基部位的构象和氢键结合模式。而晶泰科技的相关结果早在2月2日就已经发布,比实验方法快了接近3个星期,对小分子、疫苗和抗体开发等具有类似的指导意义。

 

在计算模拟了S蛋白和ACE2蛋白之间的相互作用之后,晶泰科技接下来进一步研究了S蛋白和ACE2的表位,也就是这两个蛋白直接接触的位点,来揭示关键的多肽片段和氨基酸残基。同时还用自由能微扰方法预测评估了表位上的氨基酸如果发生突变,会对病毒的传染性、致病性有怎样的影响。这一论文的预印本刚刚已在ChemRxiv网站上发表。

 

自由能微扰计算(FEP)是评估药物小分子和靶点结合强度的一种高精度算法,是学界公认计算亲和力最严谨的方法之一,需要的计算量也很大。晶泰科技在这一方法的基础上开发独有的XFEP计算,通过结合AI算法的加速和优化,效率和针对性都有进一步提升。“我们当时为这个项目抽调了很多资源,甚至还暂停了一个其他方向的研发项目来推进这个事情。后续我们还可以做更多的计算,甚至把表位里的每个氨基酸都突变一遍。如果未来再遇到类似的疫情,我们预期可以在一天之内完成对所有关键突变的扫描。这样就可以提早了解病毒可能发生的变异对其传染性和致病性的影响,”张佩宇说。

 

通过全面的蛋白突变分析,晶泰希望能提早预知病毒可能的突变情况,并在此基础上筛选出活性、毒性和关键物理化学性质最理想的候选,开发安全高效、能够应对病毒耐药性变异和具有潜在广谱抗病毒性质的药物。要让药物兼顾如此之多的方面,可能只有人工智能技术才能但此重任。

 

“人工智能最大的优势,是可以显著扩大新药的搜索范围,以几百万个有潜在活性的分子骨架作为筛选起点”,张佩宇表示,以AI+计算化学结合,综合考虑多种关键性质给候选分子打分,可以一步步接近最理想、最有希望研发成功的化合物。“我们在合作的新药发现项目中以这一方法筛选出的活性分子,都在细胞模型中得到了很好的验证,并且显著缩短了研发时间。我们希望这一技术能在将来的抗病毒药物研发中有所应用。”

 

表位分析的部分主要通过计算物理、计算化学的方式来拿到这些结构,而针对表位推荐抗体或多肽,就要用到更多人工智能的方法了。比如在疫苗研发方面,什么样的抗原能与MHC(主要组织相容性复合体,其蛋白产物就是HLA抗原)分子之间有更好的相互作用,就可以使用AI的方式去预测。

 

在抗体药物研发方面,AI可以根据抗体文库中获取的信息进行建模,然后进一步进行亲和力的计算,帮助提高抗体的活性。传统方法提高抗体的活性会选择使用随机突变的方法,成功率比较低。AI建模可以帮助发现最有利的突变位点,再通过定点突变直接将药物的活性提高。

 

在本次疫情的相关研究中,晶泰科技已经与多家研究机构、药企建立合作,开始进行下一步的工作,同时也在加速多个药企的新冠相关的研发项目。晶泰科技已经订购了自己分析出的小分子的样品和实验用蛋白,正着手与具备P3评级的合作单位开展进一步的细胞实验和动物实验。

 

2月17日下午,国务院应对新型冠状病毒感染肺炎疫情联防联控机制的新闻发布会上,明确了磷酸氯喹在治疗新冠肺炎临床试验中展现出的治疗效果。随后在2月19日发布的《新型冠状病毒肺炎诊疗方案(试行第六版)》中,磷酸氯喹就已经作为抗病毒治疗的可选方案之一被纳入。

 

而在这些消息出现之前,晶泰科技已经与众生药业开展了合作,成立氯喹研究攻关小组,通过自己的药物模拟技术基础对氯喹治疗新冠肺炎的分子机理进行了研究。2月18日,在国家相关机构刚刚宣布氯喹疗效之后,晶泰科技就发布了自己的研究结果。

 

晶泰科技利用分子层面的模拟和计算对氯喹可能的作用机制进行了分子动力学模拟,尝试解析氯喹治疗新冠肺炎的的基本机理和有效结合模式,再结合目前的文献报道,列出了氯喹治疗新冠肺炎的四种可能机理。其中,晶泰科技提出“氯喹通过PLpro抑制新冠病毒的转录和翻译过程”的新的可能机理,并对已有的“氯喹通过干扰ACE2的末端糖基化来削弱病毒与受体的结合”的假说使用计算和模拟的手段加以验证。晶泰科技目前已经与众生药业开展合作,加速推进实验验证。

 

张佩宇说,“AI模型结合量子物理、计算化学的药物模拟技术在这次疫情响应的初期发挥了关键的作用,帮助我们提高了预测的速度、精确度和筛选的广度,为研发决策提供支持,让我们可以在接下来的研究中把有限的实验资源用在刀刃上。”此前,晶泰科技的晶型预测、药物固相设计与筛选技术已经为包括辉瑞在内的几十家药企提供服务,并在AI驱动药物发现与设计领域的合作中取得里程碑进展。这次紧急的研发任务也让这支团队积累了更多抗压经验,在较短的时间内完成了大量多维度的研究工作。

 

望石智慧:在靶向已知病毒RNA聚合酶核苷类化合物中快速寻找COVID-19特效抑制剂

 

从老药新用到靶向病毒RNA聚合酶核苷类化合物抑制COVID-19潜在应用的再发现,望石智慧团队自1月中下旬起经历了一次策略选择上的头脑风暴。

 

“在1月中下旬新冠感染人群开始呈现蔓延态势的时候,我们团队就开始并持续关注此次疫情,尤其关注抗击新冠药物相关的信息更新。大家也在不断思考,作为一家AI赋能的药物研发公司,我们能做点什么?”望石智慧的药化总监张宏波博士介绍说,老药新用挖掘成为他们首先想到的切入点。但随着新冠病毒的基因序列、3CL水解酶的晶体结构等更多信息的陆续公开,望石智慧希望运用自身基于AI的知识图谱和分子设计预测技术平台优势,从快速寻找COVID-19特效抑制剂的角度着手,寻找针对新冠肺炎的特效药。

 

与此同时,国家药品监督管理局(NMPA)加急批准了多款药物的新冠肺炎临床试验,其中瑞德西韦被寄予较多希望。于是望石智慧很快把自己的研究目标锁定到基于瑞德西韦的进一步挖掘上。

 

瑞德西韦的作用机制是靶向抑制埃博拉病毒的RdRp蛋白(一种RNA聚合酶)。在疫情后续大规模爆发后,瑞德西韦通过同情用药治疗了美国第一位被确诊的患者,一时名声大振,目前已经在国内开展了两项有关新冠病毒肺炎的临床试验,分别针对轻中症患者和重症患者,招募患者共计760人。

 

望石智慧认为在已知药物中,瑞德西韦最有可能成为针对新冠病毒的特效药。首先,瑞德西韦母药是一种模拟核苷酸分子底物与病毒RNA聚合酶发生竞争性结合的抗病毒抑制剂,而RNA聚合酶识别生物体的核苷酸分子底物结构在所有生物体都具有特定性,从底物的特定性角度上来说,瑞德西韦应该是一种广谱抗病毒药。这一点从吉利德开发瑞德西韦的历程已经得到验证,其最早是针对丙肝开发,后转向抗埃博拉病毒的临床试验,并在2019年Nature Communication上报道其针对中东呼吸综合征和SARS同样有较好的药效。其次,基因序列对比显示新冠状病毒与SARS具有高度的同源性,望石智慧对比了SARS和新冠病毒中表达RdRp蛋白的基因序列之后,发现二者的重合度达到了96%。最后,瑞德西韦已经在人体完成了III期临床实验(最终由于针对埃博拉病毒疗效上差于抗体药物未上市),安全性和计量关系得到过验证。

 

尽管我们非常期望瑞德西韦能够在短时间内成为抗击新冠病毒的特效武器,但从创新靶向药物开发的科学严谨性、流程规范性、复杂性和成药性上考量,或许还有更“完美”的(类)核苷分子值得被发现。

 

张宏波博士表示,发现更接近“完美”的抗新冠病毒核苷类分子有一个已知的化学空间可以利用,而且在其中得到高效的新冠病毒抑制剂的概率是极大的。这个化学空间就是目前为止我们人类针对各种病毒RNA聚合酶开发的核苷类抑制剂,这些分子既能保证化合物的合成可及性,又能保证化学空间上与瑞德西韦母药分子的相似性。

 

基于上述出发点,望石智慧紧急成立了抗击新冠项目组,知识图谱团队和药物分子设计团队同时开展工作。

 

望石智慧的知识图谱团队用“RNA polymerase inhibitor ”和 “nucleoside”为关键词搜索得到了新化合物相关专利五十余篇(包含Gilead开发GS-5734相关专利),并利用望石智慧基于AI技术的知识图谱平台结合人工标注对其中的化合物进行了快速提取和结构化处理,共获得超过1400个化合物,这些分子进一步的处理包括前药基团的去除和糖基末端磷酸化处理。“我们在过去一年中下苦功夫积累的知识图谱,在此时就派上了用场。这个知识图谱让我们具有了快速结构化处理数据的能力,让我们能以最快的速度获得并分析出一些以往研究过的有潜在价值的分子。”张宏波说。

 

同时,药物分子设计团队在2019年解析的SARS病毒RdRp蛋白结构的基础上,引入了新冠病毒基因序列中的一些突变,从而快速构建了新冠病毒RdRp蛋白的构象模型。这在中国工程院院士刘昌孝撰写的《认识新冠病毒(SARS-CoV-2),思考抗病毒药物研发策略》文章中也有被提及。

 

蛋白模型准备完毕后,望石智慧药物分子设计团队使用基于深度学习的预测模型和计算化学技术,对结构化提取的分子进行了快速的预测和分析,发现了数十个潜在对SARS-CoV-2病毒RNA聚合酶具有抑制作用的核苷母核分子。

 

AI技术在专利分子的结构化提取中成功的扮演了加速器的作用。如果用人工的方式处理,经验丰富的研究人员可能都需要在一个分子上花费1-2分钟的时间。而经过深度学习的AI平台,提取一个分子的平均时间只需要几秒至十几秒的时间,而基于深度学习的药物分子预测模型与计算化学手段的结合也同时提高了虚拟筛选的准确性。从确定项目研究方向到完成初步研究,望石智慧只用了不到一周的时间。

 

在2月6日和7日,望石智慧在自媒体平台上发布了自己的研究结果,并且将已公开专利中(部分)涵盖的RNA聚合酶核苷类抑制剂中的累计超过1400个化合物的可编辑结构化数据及数十余个具有潜在抑制SARS-CoV-2病毒的药物分子全部无偿地分享了出来。目前该数据已获多家学术机构及药企客户认可,累计下载近两千次。

 

“疫情出现后,我们迅速成立了新冠项目研究小组,中美两地,不同省市的团队成员们只用了几天时间,远程协作,共同配合完成了这个项目。同时,我们第一时间将这些处理后的数据和所有研究成果都全部分享了出去,希望有更多正在做疫情项目的科研团队能看到,并直接用上这批最新结构好的数据,不用做重复工作。我们希望能通过这样的方式为抵御冠状病毒的基础研究尽微薄之力。”张宏波说。

 

望石智慧的脚步也并未就此停止。2020年2月中旬,望石智慧与中国医学科学院北京协和医学院药物研究所达成了战略合作,双方将共同研发针对此次疫情的新冠病毒RNA聚合酶抑制剂。此次合作结合了望石智慧在药物知识挖掘、优势骨架发现与选择、分子生成与设计、性质预测等领域的技术优势,以及协和药物研究所在新药研发前期及临床开发的成药性评估方面的丰富经验,为尽早开发出抗新冠病毒的特效药物贡献力量。

 

在研究中前行,为未来的疫情预先做好准备

 

无论是疫苗还是新药,完成临床前相关研究才只是迈出了第一步,后续需要经过漫长的临床试验证明安全性和有效性之后,才能最终获批上市。对于像本次新冠病毒肺炎这样发展迅速的疫情,一直有人质疑现在开始从分子研发新药是否只是资源的浪费。

 

首先,对于AI+新药企业来说,研究本来就是自己发展中的一部分。本次疫情中处理的数据将会被这些企业沉淀下来,成为自己结构化数据中的一部分,在未来发展的某个阶段可能还会再有用处。同时这种事件紧任务重的突发事件,也正是他们训练自己团队和算法的好机会。

 

除此之外,两家企业也坦露了自己对未来的担忧。

 

张佩宇认为,这次疫情是对中国药物研发行业快速响应能力的最直接的考验,也暴露了行业在传染性疾病研究方面积累的薄弱。“冠状病毒家族已经产生了七种可传人的变种,下一次爆发可能只是时间问题。相信在这次疫情之后,中国制药行业的关注点会从少数几个重磅靶点扩展到更广泛的疾病研究范围。以长远为计,开发更具针对性的广谱抗病毒药物,才能从根本上制约类似疫情未来可能带来的危害。同时,我们也看到,疾病的迅速传播与疾病的研究也越来越不只局限在国境线之内。应对这类突发的公关卫生事件需要全球科学家的共同努力与合作。”

 

张宏波对此事的考虑则更加着眼于未来:“李兰娟院士的一句话让我印象深刻,她说我们针对这种病毒的基础研究,要持续的去做,而且要扎实的去做。只有这样,当下一次疫情再来的时候,我们才能有更充分的准备。所以虽然药物研发需要的时间会很长,但是为了未来考虑,我们认为我们的工作还是非常有必要。”

 

在我们与其他研发型企业对话时,也获得了相同的答案。目前的努力可能在本次疫情上发挥不出自己的作用。但是在更远的未来,如果疫情卷土重来,或是又有更棘手的冠状病毒出现,这些研究将成为基石,帮助我们在未来可能发生的疫情中,占据更大的优势。

 

(本文转载自动脉网,作者郝翰,望石智慧获授权转载。)

原文链接:人工智能如何寻找新冠特效药,看这两家企业硬核突破 | 科技战疫

 

最新动态

2020-03-03 16:25