药物研发小分子毒性预测软件总结

Predictive Toxicology - Programs

Expert Systems

  • DEREK Expert system for the prediction of toxicity (genotoxicity, carcinogenicity, skin sensitization, ...)
  • METAPC Windows based Metabolism and Biodegradation Expert System
  • METEOR Expert system for the prediction of metabolic transformations
  • OncoLogic Rule based expert system for the prediction of carcinogenicity

Data Driven Systems

  • lazar Open source inductive database for the prediction of chemical toxicity
  • MC4PC Windows based Structure-Activity Relationship (SAR) automated expert system
  • PASS predicts 900 pharmacological effects, mechanisms of action, mutagenicity, carcinogenicity, teratogenicity and embryotoxicity.
  • TOPKAT Quantitative Structure Toxicity Relationship (QSTR) models for assessing various measures of toxicity

Computational Chemistry Programs

  • DRAGON is an application for the calculation of molecular descriptors
  • JOELib A Java based cheminformatics (computational chemistry) library (open source)
  • OpenBabel A cross-platform program and library designed to interconvert between many file formats used in molecular modeling and computational chemistry (open source)

Statistical and Data Mining Tools

  • R is a free software environment for statistical computing and graphics
  • SIMCA Software for Multivariate Data Analysis and modeling
  • WEKA is a collection of machine learning algorithms for data mining tasks (open source)



Derek软件通过Lhasa毒理学专家大量阅读历年发表的文献知识、毒理学数据库以及用户分享的实验数据,结合多年的毒理学经验,分析和总结出结构-毒性关系、物种差异和理化性质-毒性关系等方面的新的毒理知识规则,再通过专家的仔细推理,对预测化合物在知识库中所匹配的警示结构给予相关评论和建议,以及清晰展示验证数据、原始文献和示例化合物,并对预测化合物在特定种属、特定毒性终点下给出总的毒性风险等级等详细信息(如下图所示)。



Derek特性和优点

降低研发风险
通过识别潜在较高风险的毒性化合物,从而降低研发风险,能有效节约时间和成本。Derek可以根据Lhasa数据库和您自己的数据库快速对单个或者批量化合物进行毒性预测。

覆盖广泛的化学结构空间
Derek的警示结构规则是根据公开数据、私有数据和监管机构数据(包括FDA数据)总结的。超过30%的致突变性警示结构规则是来源于私有数据。用户也可以将自己的数据添加到Derek中,使得针对您化学结构空间的预测变得更准确。您的数据添加到知识库中是被认可的,监管机构也是用同样的方法来优化预测模型。

ICH M7指导原则认可
Derek的预测结果受到执行ICH M7指导原则的监管机构的认可。ICH M7原则建议使用两种预测方法对杂质的遗传毒性进行预测,一种基于专家知识规则,一种基于统计学模型。对化合物同时进行Derek和Sarah的预测即能满足该指导原则。

快速毒理评估
Derek能快速对未知化合物的毒性进行单个或批量的预测。

提供阴性预测
当化合物没有出现引起细菌体外致突变性的警示结构时,Derek会给出阴性预测结果,而不是超出预测范围(“out of domain”),从而确保用户的待测化合物都在预测范围内(Williams et al. 2016)。

皮肤致敏性预测
Derek提供一个近邻模型,用于预测出现皮肤致敏性警示结构的化合物的EC3值,从而帮助您评估皮肤致敏性风险(Macmillan et al. 2016)。

透明的预测
预测结果清晰地展示,包含您化合物警示结构相关的支持证据和结构样式。同时还包含数据总结的专家评论,验证评论,预测毒性的机理,以及构效关系的解释,这样使得用户毒理专家能很方便地对结果进行审核(Barber et al. 2015)。

基于最新毒理数据总结的毒理规则
所有的警示结构都是由Lhasa内部的毒理学专家团队总结的。Lhasa致力于研发方面的投入,确保了警示结构规则能基于最新的毒理知识进行定期更新。

一个界面,多种预测
在Nexus平台下使用Derek时,您也可以直接用到Lhasa的其他工具,包括Meteor Nexus,Sarah Nexus和Vitic Nexus,可以有效提高您的工作效率。

定制化报告
Derek包含一个可以生成多种文件格式(.doc, .pdf, .xlsx或者.sdf)的报告框架。报告模板完全可以由用户自己定制,确保您能在合适的时间生成合适的信息。

自动进行ICH M7分类

通过Derek和Sarah的预测,以及所有相关的实验数据(来自Carcinogenicity Potency Database和Lhasa验证的Ames数据),软件会给出一个用户可编辑的ICH M7分类。

Derek用途:

满足ICH M7指导原则针对杂质的致突变性风险控制:与Sarah Nexus联用,能满足该指导原则对杂质采用计算毒理学评估方法替代细菌致突变试验的要求,并自动提供杂质等级分类。

虚拟筛选:早期利用Derek进行高通量筛选,以有效排除具有潜在毒性的候选药物,降低药物开发风险、节约研发成本。

候选药物分子的结构优化:针对高亮显示的潜在毒性基团进行重新设计或优化。

化妆品的致敏性安全评估:通过预测出现皮肤致敏性警示结构的化合物EC3值,评估皮肤致敏性风险。


Sarah采用的层级网络模型,不仅可以搜索匹配片段,还可以通过使用与目标化合物结构最相似的结构来优化结果。此方法保留那些可能具有更高毒性的片段,片段可以是各种大小,并且允许结构重叠,确保更高的预测精确度。Sarah总的预测结果来源每个假设片段对于阳性和阴性的贡献的总和,突出显示模型认为有意义的片段来实现预测结果的结构解释,给出的结果也会包含非常详细的信息,包括定义的毒性终点、应用域、相关示例化合物等(如下图所示)



Sarah特性和优点

ICH M7指导原则认可
Sarah的预测结果能被执行ICH M7指导原则的监管机构认可。软件中M7预测能够让您同时使用Sarah和Derek对杂质的致突变性进行基于专家知识规则和基于统计学模型的预测,使得操作非常简便快捷。

快速地致突变性评价
Sarah能够极其快速地进行单个或多个的化合物致突变性预测。

可扩展的化合物预测空间
“Out of Domain”代表超过模型的预测能力,出现这种预测结果往往无法做进一步判断,使得毒理专家无法做出准确合理的决策。Sarah海量的、并且高质量的训练集能够保证最大程度地涵盖化学结构空间,尽量避免出现超出模型预测范围的情况。同时用户可以加入自己私有的训练集,极大地拓展了可预测的化学结构空间。

极高的预测准确性
Sarah已经经过大量的准确性验证,包括在私有未公开的数据集中进行验证,已经被证实有极佳的性能和准确度(Barber et al.2015)。

可靠的数据来源
Sarah是构建在海量的高质量数据上的,其后台数据是经过Lhasa的毒理专家审批的、高度可信的,并且去除了不一致性数据。因此您可以完全相信Sarah后台的可靠性和准确性。

高透明度的预测
Sarah的预测结果被清晰地展示,并且给出该预测的置信度打分。可能引起致突变性的怀疑片段被清晰地列出来,并且包含该片段的示例化合物按照与查询化合物的结构相似性进行排序展示。这样高透明度的预测能够更好地支持专家综合评判和审批。

丰富的支持信息
为了辅助专家审评,Sarah还包含了一些额外的数据,包括菌株信息,以及一些没有包含在模型和参考文献中的相似化合物。这个额外的信息无论是单个化合物预测,还是批量预测,或者批量验证中都有。

预测参数控制
Sarah已经有一套默认的预测参数,从而控制预测的敏感性和特异性,这套参数已经被证实是有极好的平衡性,可以用于满足ICH M7指导原则。当然,用户可以自行修改预测参数选项以满足特定的需求。

一个界面,多种预测
过Nexus用户可以在同一个界面下,方便和其它工具进行联用,比如代谢预测工具Meteor Nexus、毒理数据库Vitic Nexus以及基于专家知识规则的毒性预测工具Derek,很好地提高了用户效率。

定制化报告
Sarah整合一套先进的报告生成框架,您可以将结果导出成.doc, .pdf, .xlsx或者.sdf的文件格式。用户可以自定义报告模板,确保您再正确的时间展示合适的信息。

自动杂质等级分类

通过Nexus的Derek和Sarah联合预测可以直接得出ICH M7的杂质致突变性风险等级分类。同时可以获得相关的预测细节及预测的支持信息包括相似化合物的毒理实验信息、相关文献、推理过程等等。


要求药物化学家会做毒性评估,是强人所难么?

克里克学院新闻资讯2016-11-30576

缘起
前不久,辉瑞制药曾经的领军人物Michael Rafferty在JMC上强烈吐槽,说如今的大部分药物化学家更像是合成专家,而不是药物设计者,不考虑ADMET性质,不懂如何在药物研发前期进行毒性风险的判断!此文一发,引爆了整个药物化学圈子,引发了各种激烈的讨论。

讲真,小编觉得很多事都不能一概而论,为什么药物化学家不能或者不愿在药物研发的前期多考虑ADMET性质,多规避研发风险,这里面真正的困难是什么?有没有好的解决方案?借这个问题,小编正好也跟大伙儿好好聊一聊药物设计流程中的毒性预测这些事~

新药研发与毒性评估
我们都知道,新药研发的道路漫长艰险,伴随着极高的失败率,要成为一个药物分子需要符合的条件相当苛刻,可谓是百万里挑一!不仅需要对靶标有良好的活性(Potency)、良好的安全性(Safety),如果是口服药还要有良好的肠道吸收(Absorbtion)、体内分布(Distrubition)、代谢(Metabolism)、排除(Excretion)以及PK/PD性质。能同时满足所有条件的分子真是凤毛麟角,有些分子结构上的细微差别就能决定是否成药。


如上图,幸运的话我们能找到各项平衡的一个点—一个药物,当然大部分情况下我们会碰到如下的情况:我们起始时选择的化学骨架存在某种天然缺陷,无论我们如何努力都无法找到这样一个幸运的平衡点!So sad!


有太多因素会导致药物研发失败,在药物研发界可谓是:成药的分子都是相似的(满足各种苛刻的条件),失败的分子各有各的失败。很多工作都对此进行了总结,比如一下的两个工作:


分析359个处于临床三期和95个NDA/BLA(NDA 代表临床结束进行新药申请的的分子、BLA代表生物制品药物许可申请的大分子)失败的分子,其失败因素统计。[1]


a. 2005年到2010年行业项目的平均成功率和AZ的项目成功率;[2]
b. 项目失败的原因统计;

大伙儿看到了吗?药物研发终止的主要原因包括有效性、安全性、PK/PD以及商业原因。刨去商业原因不说,在整个药物研发过程中,药物是否有足够的有效性和安全性是导致失败的最主要原因,而在临床前和临床一期、二期中,安全性的问题尤为突出!所以我们才说,在药物设计初期,如果能最大程度的避免候选化合物的潜在毒性风险,就能极大的降低后期的失败概率!

道理都懂,可为什么很难做到呢?

回到推文开头Michael Rafferty的吐槽,其实业内都知道,作为药物化学工作者,前期目标还是设计一个活性较高的分子,而对化合物的毒性评估需要长时间的积累,以及对很多失败案例的总结,通常需要多年资深的药物化学家才能做得到,而对于刚入行的人来说,实在强人所难啊!

CADD与毒性评估
毒性评估如此重要,但大部分药物化学家却又不具备这方面的专业能力和经验,这个巨大的矛盾到底怎么解决呢?

我们不要忘记了,如今可是信息化的时代,人脑不及之处,不是还有计算机吗?实际上现在通过计算机辅助的方法已经可以很好的进行化合物多种属性的预测,包括化合物的毒性,只是关注这个领域的药物化学家还是太少了!

以拜耳医药为例,在去年就发表了一篇文章(Computational Chemistry in the Pharmaceutical Industry: From Childhood to Adolescence)详细描述了CADD(计算机辅助药物设计)方法在拜耳医药研发流程中的应用,并且统计了CADD方法的准确性:


总结现在的CADD技术在ADMET预测方面的准确性,红色代表准确性较低,绿色代表能很好的预测。

如何借助CADD方法对ADMET尤其是毒性进行高准确性的预测和评估呢?要回答这个问题,小编先带大伙儿来看看下面这个图:在各种因为毒性而失败的项目中,具体是由哪些毒性而引起的:


图表为AZ 2005年-2010年五年间因为化合物毒性而终止的项目统计

从图表中可以看出,心脏毒性、肝脏毒性、肌肉与骨骼毒性、基因毒性、呼吸道毒性、肾脏毒性、中枢系统毒性等等都会导致化合物失败。而心脏毒性无论在临床前还是临床时都是导致失败的重要原因之一!

我们以HERG通道毒性为例,它是导致心脏毒性的主要因素。在临床前做一个体外HERG毒性试验需要花费2万美金,如果是在动物体内试验则需要花费10万美金。不便宜啊!但如果我们在刻苦做实验之前,能把以前的实验结果好好总结一下,也能发现一些重要的规律:大部分的HERG通道抑制剂都包含一个碱性的氮原子,并且通常由一段柔性的linker和芳香性或疏水性基团连接。比如下图的几个化合物,都是典型的HERG通道阻断剂:



像上面提到的拜耳医药,已经对HERG通道抑制剂的预测提炼出了较为准确的模型,以药效团模型为例,可以筛选出84.9%的阳性化合物,同时又仅有3%的假阳性概率,这个准确性完全可以用于药物设计了![4]



针对HERG通道毒性风险评估,我们可以人工地总结归纳,也可以依靠计算机模型给出较为准确的预测。既然如此,为什么毒性评估在药物研发的前期还是很难被执行呢?

原因很简单,化合物毒性太复杂!除了心脏毒性,还有肝脏毒性、肾脏毒性、基因毒性等诸多的毒性终点,我们不可能每一种都自己总结出来,然后再牢牢地记在心里面吧?这里面还有很多相联和交叉,已经是系统级别的复杂度了!如果没有给力的工具来辅助,你让药物化学家怎么玩得转?

化合物毒性预测系统
幸运的是,现在已经有一些有用的化合物毒性预测系统,可以对多种毒性同时做出合理的预测,从实现方法上可以分为两大类:
一、 基于规则的专家预测系统(Expert Rule-Based)。这种方法是基于后台的毒理知识数据库进行预测,也就是说,已经有人帮你把所有能获取的毒理知识和实验发现都总结好,并提炼出了其中的规律,就像是模拟人类的毒理专家对化合物结构和某个毒性终点之间的关联判断一样。比如,上面HERG通道毒性的例子:


在一款叫Derek的毒性预测软件中,通过预测可以获得该化合物高亮出的部分(被称为毒效团或者预警结构)可能引起HERG的毒性风险。

使用者还可以看到其预警结构的详细细节:



这种基于规则的专家预测系统,优点是结果报告很容易理解和分析,并且可以根据它提供的证据来指导化合物的优化。缺点是没有定量信息。

二、 基于机器学习算法的预测模型(QSAR模型)。这种方法基于已有的毒理数据通过机器学习算法进行预测,可以获得其毒性强弱的定性和定量信息。


上图为化合物的HERG pIC50及对CYP2C9 和CYP2D6的抑制强度。

这种方法的缺点是我们面对一个黑盒系统,只能拿到预测结果,却无从知晓得出该结果的确切原因。

这两类方法各有优缺点,小编觉得可以根据不同目的、不同需求来选择,或者可以联合起来使用。有这些强大的工具在手,就算没有深厚的毒理知识,我们也可以在药物设计的过程中加入毒性的准确评估和预判。君子生非异也,善假于物也!

假物与不假物的差别有多大?我们来看看Roche在早期的一篇文章中提到的他们通过引入计算机预测模型,对早期的化合物进行致突变性筛选(致突变性可能会导致致癌性,从而导致后期药物失败)从而降低后期失败风险的例子[3]:


通过在早期进行计算机模型筛选,大大降低了后期检测出致突变剂的概率。

说到致突变性,这个可是厉害的角色,它往往意味着引发基因突变而导致癌症的潜力哦!实验上一般用AMES实验来验证,烧钱不说,周期还很长。如果是API(主要药用成分)肯定要实验验证,严格把控风险。但是如果是药物生产过程中的杂质呢?有些杂质比如某些反应的副产物,往往难以去除,如果有致突变性风险咋办?

其实,法律法规早就有相关规定,这个法规叫ICH M7-(Assessment and Control of DNA Reactive (Mutagenic) Impurities in Pharmaceuticals to Limit Potential Carcinogenic Risk Finalised Guideline)[6]. 大家以为这个很容易,但往往却让药品申报的童鞋们伤透脑筋,因为有些杂质含量低也不好提纯,还有些情况下,潜在的杂质实在太多,根本无法一一做实验验证。那可怎么办才好?既然Roche可以用计算机模型来降低致突变性风险,那在审批中可不可以用呢?没错!法规指导原则中竟然支持用计算机模型来取代AMES实验!请看下面法规的原文:



当然了,提交审批需要更谨慎些,要求用两种不同方法的模型来预测,一种是小编在上文介绍过的基于规则的专家系统,另一种也是上文介绍过的基于统计学模型的(QSAR)!小伙伴们都震惊了吧?所以千万不要小看CADD方法,比如对致突变性的预测,Derek预测的准确性可以达到85%以上!并且是FDA、EMA推荐使用的软件,其使用者还包括中国的CDE(药品审评中心)。

CADD与化合物优化
当我们能对毒性可以从容地预测和评估的时候,就意味着我们也能针对毒性的基团对化合物进行降低毒性的优化!这听上去是不是很妙?

还是用HERG毒性的例子,既然我们知道了碱性的氮原子是引起毒性的主要原因,那么我们就可以通过引入其它基团来降低N的碱性(降低碱性氮的Pka)。然而,需要重点注意的是,引入某个原子改善某个性质后,其它的性质也随之改变。比如在碱性氮旁边引入羟基能显著的降低HERG结合,但是同时也降低了亲脂性。但是引入F也能降低HERG结合,但却增加了亲脂性[5]。



其实,原子或基团的属性,以及分子间相互作用,本身就是一个复杂的体系。与毒性预测的实现很类似,计算机可以通过大量的总结提炼,以及各种训练模型,来帮助我们预测和分析每个新原子或基团引入后可能造成什么样的活性改变,这也是我们只依靠人脑很难考虑周全的地方!

总之,小编认为,CADD的发展,对推动药物设计会起到越来越重要的作用!曾经的药物化学家拼的都是个人经验,如今以及未来的药物化学家,还要拼对CADD工具的掌握和使用!而这些工具的背后,都有大量先验知识和数据来做强力的支撑。得数据者,得天下!不想被吐槽为只会做合成的话,就拿起CADD的利器,做一名新时代高技能的药化研究者吧!


[1] Michael Hay, Clinical development success rates for investigational drugs, nature biotechnology;
[2] David Cook, Lessons learned from the fate of AstraZeneca’s drug pipeline: a five-dimensional framework, NATURE REVIEWS | DRUG DISCOVERY;
[3] Müller et al, Computational Toxicology (ed. S Ekins) pp 545-579 2007;
[4] X Yao, D L Anderson, Predicting QT prolongation in humans during early drug development using hERG inhibition and an anaesthetized guinea-pig model.
[5] cambridgemedchemconsulting.com

编辑于 2019-08-21 14:34