比GDSC和CCLE全的药物数据库

比GDSC和CCLE全的药物数据库iGMDR:整合药物遗传资源,指导癌症治疗和研究今天给大家介绍一个癌症治疗和研究中会用到的药物遗传相关的数据库iGMDR,这个数据库由浙江大学医

大家好,欢迎来到IT知识分享网。

iGMDR:整合药物遗传资源,指导癌症治疗和研究

今天给大家介绍一个癌症治疗和研究中会用到的药物遗传相关的数据库iGMDR,这个数据库由浙江大学医学院陈翔博士等主导开发,为了给大家介绍这个数据库,小编还进入主页(https://igmdr.modellab.cn/search.php)了解了一下功能和用法,也将在本文进行介绍,现在来一起看看吧。

比GDSC和CCLE全的药物数据库

(ref:iGMDR网页)

数据库开发目的|

1.没有整合的癌症相关的药物基因组数据

2.各个孤立的药物基因组数据库没有统一的标准化模型

iGMDR数据库概览|

作者收集了体外和体内模型,临床研究,肿瘤细胞株的药敏试验获得了超过154,000个模型(图1A)。这些模型涵盖了基因组、表观基因组、转录组和蛋白质组数据。通过对基因组的全基因组/外显子组测序(WGS/WES),获得拷贝数变异(CNV)、单核苷酸变异(SNV)和结构变异(SV)等信息。对表观基因组进行亚硫酸氢盐全基因组测序和甲基阵列,获得DNA甲基化的信息。转录组进行RNA测序(RNA-seq)和芯片获得基因表达(EXP)和剪接变异(SPV)的信息。蛋白质组进行反相蛋白阵列(RPPA)和液相色谱-质谱,获得蛋白信息表达数据(EXP)。

之后对所有获得的模型进行了标准化数据提取,包括特征类型、基因符号、药物名称、组织类型、癌症类型和模型描述,从而生成了30个组织中144种癌症类型,包括1040种对应药物和对应4420个基因共12类模型

数据库提供了以下信息,关于药物,包括化学成分、结构、目标,信号通路,和分类,以及关于基因,包括功能描述, 正常组织的基因表达,功能,和信号通路有关的信息。设计了一个具有相关公共资源交互性的在线web service (图1B)。

比GDSC和CCLE全的药物数据库

(图1,药物基因学模型数据集成与应用流程图)

iGMDR参考数据库来源|

>>>In vivo

作者整合了来自NCCN, FDA, AACR,(http://cancerres.aacrjournals.org/), American Society of ClinicalOncology (ASCO, (https://am.asco.org/), ClinicalTrails.gov (https://clinicaltrials.gov/), and European Society for Medical Oncology (ESMO,https://www.esmo.org/)的数据,同时根据关键词“检生物标志物/癌症/肿瘤/药物”检索pubmed获得近5年25000余篇文献,最终得到药物遗传相关研究的6000篇文献。

>>>In vitro

细胞系的药物敏感性测试结果。

>>> Logic models and single models

根据逻辑‘与,或,非‘获取药物反应机制。

>>> Annotation of drugs

采用OncoTree (http://oncotree.mskcc.org) 标准化癌症名称和相关组织类型。并可以与DrugBank和PubChem等公共数据库交互。从GDSC、CTRP和CCLE收集药物治疗相关的信号通路。从PubChem上整合药物分类信息收集和化合物(小分子药物)的结构信息。

>>>Annotation of genes

收集的所有描述药物反应的遗传模型都涉及相关基因,包括常见的致癌基因和肿瘤抑制基因,以及参与癌症发病机制的信号转导基因。这些基因的基本信息来自MyGene应用接口(API)。利用OMIM数据库(http://www.omim.org)将疾病信息与相关基因进行关联,PharmGKB获取基因相关药物反应信息。Gene Ontology (GO)和Pathway (KEGG, Reactome, Wikipathways等)进行基因相关功能和基因相关信号通路注释。

iGMDR与现有数据库比较|

如下表1,CCLE和GDSC是两个之前较为熟知关于癌症药物遗传相关数据库,但是缺乏整合数据。CCLE数据库检测了1000个癌细胞系中24种药物的药物反应,GDSC检测了1065个癌细胞系中266种药物的药物反应。数据量还是很广泛的,但是在不同的模型信息来源中,测试的细胞系和药物类型都有很多不同,在癌症类型和药物的命名上也有很多不同。PreMedKB是疾病相关知识数据库,该数据库中语义网络的概念只能表达其中两个(如癌症基因、特征-癌症或药物基因)之间的关系。因此,用户很难直接获得模型,需要在语义网络中进行人工筛选。

比GDSC和CCLE全的药物数据库

iGMDR数据库数据统计|

iGMDR数据库包含30个组织中144种癌症类型的154,146个遗传模型,与1040种药物和4420个基因相关。根据不同来源将这些模型分为体内类和体外类,相关特征事件主要分为12类。为了更好的理解该数据库的数据构成,于是基于遗传模型的数量进行了统计。如图2A所示,大部分模型为体外模型(94.72%),只有5.28%来自体内模型。在12种主要的特征事件类型中,模型数量最多的前6种类型为突变(MUT;63.80%),复制数变异(CNV;24.51%),表达式(实验;3.91%),单核苷酸变异(SNV;2.87%),细胞系(LN;2.12%),未定义基因状态(UDEF;1.86%),而其他类型只代表模型的很小的百分比(总的0.93%)(图2 b)。

列表顶端的大多数药物都是小分子(图2C),因为小分子药物仍然是癌症治疗的主要手段,并且经常用于癌细胞的检测。如图2D所示,排名最高的包括原癌基因(EGFR, ERBB2, BRAF, ABL1, KRAS, KIT, PIK3CA, TP53,PTEN, and CREBBP和肿瘤抑制基因(TP53,PTEN, and CREBBP这两种基因在大多数癌症的发生和发展过程中都起着关键作用。

比GDSC和CCLE全的药物数据库

(图2,iGMDR中模型的统计)

iGMDR数据库检索|

应该很多朋友作为用户,对于这个部分的介绍还是很期待的。页面检索部分,对于这些搜索,我们提供了两种方法:搜索项的下拉菜单或手动输入关键字。下拉菜单可以有效的提示用户输入信息是否存在,方便用户直接查询。在这里,我们分别以AKT1(基因)和PK-11195(药物)为例来说明iGMDR的使用。通过搜索药物和基因,用户会被引导到AKT1基因或药物PK-11195的profile页面,反馈的数据会以不同的可视化方式显示出来药物展示包括PK-11195的属性信息,PK-11195的相关反应模型,这些模型的组织起源分布,模型相关基因的功能和信号通路富集。具体来说,PK-11195的属性信息包括化学成分、结构、分类、目标、信号通路以及相关的外部数据库为用户显示模型相关基因与这些基因相关的药物之间的药物-基因关系网络,根据关联模型的个数,表示其关系强度。

基因图谱描述了AKT1的基本信息,包括概述的基因功能、基因类别和相关的外部信息。与akt1相关的反应模型,AKT1参与的功能和信号通路,AKT1基因在正常组织中的表达分布,AKT1相关模型的组织起源分布,AKT1相关的抗癌药物,以及这些药物相关靶点和信号通路的富集。根据相关模型的数量构建药物基因网络,寻找与基因相关的药物及其相关基因。

提供了各种数据类型的分类浏览,包括数据集、组织类型、癌症类型、特定药物、特定基因(见底部导航栏https:// igmdr.modellab.cn),访问zenodo.org下载原始数据库表,API还为其他工具提供对象数据,通过基因符号或药物名称可以分析或访问遗传不同渠道的模型。

iGMDR数据库其他应用|

1.Design of new panels for cancer care

如何根据患者的临床测序分析有效预测抗癌药物的治疗结果是很多研究人员关注的重点,这里可以使用收集的预测模型来设计新的临床测序数据来预测抗癌药物的疗效。例如,在丝裂原活化蛋白(MAP)激酶信号通路中,增殖和存活可能通过下游基因突变而被激活。BRAF是MAP激酶信号级联的中心中介,主要通过MEK的磷酸化和激活发挥作用,MEK参与了多种癌症的发病机制,包括黑色素瘤、非小细胞肺癌、结直肠癌、甲状腺乳头状癌和卵巢癌。而AZD6244 (selumetinib)是一种高效的MEK抑制剂,在一些BRAF突变患者中出现肿瘤耐药情况。通过比较所有的细胞系,研究人员发现有BRAF突变的细胞系[MUT(BRAF)]与野生型细胞株相比,AZD6244模型具有更高的药敏性(HyperG检验,P < 0.01),而NF2突变[MUT(NF2) to AZD6244模型]的细胞株药敏性显著降低(P < 0.001)(图3A)。当将这两个独立的模型结合时,我们发现更多细胞系的药敏预测结果与实际检测结果一致(图3A-C)。结合模型[MUT(BRAF) &:MUT(NF2)的预测结果AZD6244模型使单模型的灵敏度提高了近50%,特异性达到98.2%(图3D)。这两个特征的结合可以有效增强药物反应的预测效果。

比GDSC和CCLE全的药物数据库

(图3,BRAF和NF2的合理结合提高了抗肿瘤药物AZD6244的预测效率)

2.Linking drug targets and pathway activation to effective therapy

根据iGMDR收集的模型相关抗癌药物的药物靶点和靶向信号通路,可以扩展模型数据的使用。目前,许多抗癌药物被用于检测重要的癌症相关信号转导基因。PI3K-AKTMTOR通路可能通过生长因子与相应的受体酪氨酸激酶结合而被激活或者通过激活PIK3CA/PIK3R1的突变,AKT1, TSC1,和MTOR复合物,或被磷酸酶和紧张素同源物(PTEN)抑制Dactolisib作为双抑制剂抑制MTOR和PI3K,并被研究作为一种可能的抗癌治疗。然而,正如模型所预测的那样,这些基因的变异将影响抗癌药物的效力,甚至产生耐药性(图4A)。这在许多情况下是正确的,当一个基因突变时,单一的抗癌治疗往往导致耐药性。令人振奋的是,基于药物相关模型的网络,我们发现不同的抗癌药物在网络中作用于宿主的药物相关基因(图4B)。这些抗癌药物的结合可能会设计新的策略来提高药物敏感性和治疗效果(图4C)。有研究证实mTOR抑制剂(everolimus)联合曲妥珠单抗可通过过度激活逆转晚期乳腺癌患者曲妥珠单抗耐药her2阳性。PTEN缺乏导致的PI3K-AKT-MTOR通路曲妥珠单抗被批准用于her2阳性乳腺癌的临床应用,其作用机制是与RTK (Erb-b2受体)结合,并减缓细胞复制。此外,依维莫司和达托立斯在临床试验中也显示出协同作用。

比GDSC和CCLE全的药物数据库

(图4,药物靶点和通路信息,以增加治疗选择)

综上所述,该数据库收集的抗癌药物模型可以识别出与同一种癌症相关的不同抗癌药物组合,利用药物相关基因-药物网络来发现最有效的药理学途径。

3.Tissue specificity of drug sensitivity

由于不同癌症的组织特异性,不同组织的肿瘤对同一种药物的反应可能非常不同。目前癌症发病机制的组织特异性已经从多个角度进行了分析,但尚未在抗癌药物的遗传模型水平上进行分析。在这里,通过收集的模型,作者观察到不同组织类型的遗传模型和药物敏感性存在巨大差异(图5)。不同药物对所有癌症的敏感性是非常不同的(图5A)。一些测试药物非常具体,只对个别癌症有效,而有些药物几乎覆盖所有癌细胞(图5B)。例如,PD-0对源自大肠和皮肤的癌症更有效,而panobinostat对几乎所有来源于组织的癌症都有效(图5B)。每个组织来源的癌症对各种药物表现出不同的反应模式。皮肤组织比其他组织来源的癌症更敏感(图5B)。

比GDSC和CCLE全的药物数据库

(图5,不同组织中抗癌药物针对的遗传依赖)

写在最后|

所以看到这里,你是不是也想探索一下这个数据库呢?

iGMDR is freely accessible at https://igmdr.modellab.cn and is intended for academic purposes only.

比GDSC和CCLE全的药物数据库

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/79220.html

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信