大家好,欢迎来到IT知识分享网。
基于ADMET数据的拓扑数据分析是一种结合了拓扑数据分析(TDA)和药物ADMET性质预测的方法。拓扑数据分析(TDA)是一种新兴的数据科学方法,通过数学工具如持续同调、Mapper算法等来探索数据的形状和结构[2][8]。这种方法能够有效地捕捉高维数据空间中的拓扑信息,并提供直观的数据可视化[1][5]。
在药物研发中,ADMET是指吸收(Absorption)、分布(Distribution)、代谢(Metabolism)、排泄(Excretion)和毒性(Toxicity),这些参数对于评估化合物的成药性至关重要[19][23]。近年来,利用计算方法预测药物的ADMET性质引起了广泛关注,这一方法的基本思想是根据已知分子的ADMET性质数据,通过机器学习和模式识别方法建立计算预测模型[16]。
结合拓扑数据分析与ADMET数据,可以进一步提高对复杂化学数据的理解和处理能力。例如,使用拓扑数据分析工具如Mapper算法,可以将非图数据转化为图数据,然后用数学工具描述图的拓扑结构信息[2][12]。这种结合方式不仅有助于揭示化合物分子内部复杂的拓扑关系,还能提升对ADMET性质的预测精度。
具体来说,可以采用以下步骤进行基于ADMET数据的拓扑数据分析:
- 数据收集与预处理:首先收集大量的化合物分子描述符数据,包括分子量、脂水分配系数、氢键供体数量等[17][24]。然后,通过主成分分析确定主要分子参数,并选取对ADMET性质有显著影响的特征变量[21]。
- 构建拓扑模型:利用拓扑数据分析工具如Mapper算法,将化合物分子描述符数据转化为拓扑图。选择合适的filter函数和设置适当的resolution和overlap参数,以确保拓扑图能够准确反映分子结构的复杂性[12]。
- 拓扑特征提取:从拓扑图中提取关键的拓扑特征,如Betti曲线、持久同调群等,这些特征可以反映分子结构的高阶相互作用和本质信息[4][7]。
- ADMET性质预测:将提取的拓扑特征作为输入,结合现有的ADMET预测模型进行训练和验证。可以使用逻辑回归、朴素贝叶斯和梯度提升决策树等机器学习方法来构建分类器,实现对ADMET性质的有效预测[17][25]。
- 结果分析与优化:通过对比不同拓扑特征对ADMET性质预测的影响,优化模型参数和拓扑分析方法,提高预测准确率和可解释性[9][14]。
总之,基于ADMET数据的拓扑数据分析结合了拓扑数据分析的强大功能和药物ADMET性质预测的实际需求,为深入理解化合物分子结构与ADMET性质之间的关系提供了新的视角和方法。
拓扑数据分析(TDA)在药物ADMET性质预测中的最新应用案例是什么?
拓扑数据分析(TDA)在药物ADMET性质预测中的最新应用案例尚未明确提及。然而,有关药物ADMET性质预测的最新进展包括ADMETlab 3.0平台的全面升级,该平台通过构建基于深度学习模型的预测工具,显著提升了对吸收、分布、代谢和毒性属性的预测准确性[31]。此外,研究者还利用深度学习框架准确预测了药物对心脏离子通道的阻滞效应,并推出了CToxPred工具[30]。
如何使用Mapper算法处理大规模化合物分子数据以提高ADMET性质预测的准确性?
要使用Mapper算法处理大规模化合物分子数据以提高ADMET性质预测的准确性,可以参考以下步骤和方法:
- 构建大规模化合物数据库:首先需要收集大量的化合物数据,并构建一个包含这些化合物的数据库。这可以通过使用现有的ADMET数据库或通过生成新的化合物来实现。例如,ADMETlab平台提供了目前最大最全面的药物ADMET数据库[33]。
- 特征提取与机器学习模型训练:利用AI技术提取化合物的相关结构特征,并评估多个ADMET参数间的关系和趋势。这些特征可以用于训练机器学习模型,如多任务深度表征化(GCNN)和随机森林(RF)等[36]。此外,还可以结合HASTEN工具进行大规模数据处理,以提高筛选效率[35]。
- 优化预测模型:通过不断优化预测模型的性能和可靠性,可以进一步提高ADMET性质预测的准确性。例如,可以采用交叉验证方法来评估模型的性能,并根据结果调整模型参数[36]。
- 使用先进的预测软件:可以使用专业的ADMET预测软件,如Meteor Nexus,它通过深入研究生物转化字典中的生物转化开始点来评估代谢物的可能性[39]。此外,还可以使用gTPP预测模型,该模型在预测ADME性质方面表现优异[38]。
- 结合多种预测方法:为了提高预测的准确性,可以结合多种预测方法。例如,可以同时使用单任务GCNN、多任务GCNN以及RF进行性能比较,并选择最佳的方法[36]。
- 利用大规模化学数据集:可以利用大规模化学数据集,如ChemData和ChemPref-10K等,来训练和测试预测模型。这些数据集可以帮助模型更好地理解化合物的特性,并提高预测的准确性[40]。
- 持续更新和扩展数据集:为了保持预测模型的准确性和可靠性,需要不断更新和扩展数据集。这可以通过添加新的化合物数据和改进预测模型来实现[33]。
在基于ADMET数据的拓扑数据分析中,哪些机器学习方法最有效于提高预测模型的准确率和可解释性?
在基于ADMET数据的拓扑数据分析中,提高预测模型的准确率和可解释性可以通过多种机器学习方法实现。首先,选择合适的机器学习算法是提高准确率的关键[47]。例如,逻辑回归、朴素贝叶斯和梯度提升决策树(GBDT)等经典机器学习模型被用于构建预测模型,并通过超参数优化来提升模型性能[17]。
为了提高模型的可解释性,可以采用不同的方法。线性模型、决策树和规则列表等简单模型具有较高的可解释性[50][52][53]。此外,事后可解释性技术如特征重要性和部分依赖性图也可以用于解释黑盒模型的决策过程[51][52][55]。
集成学习方法如加权投票和堆叠(stacking)也是提高预测准确性的有效手段。这些方法通过结合多个基模型的预测结果来生成最终的预测,从而提高整体的准确率[49]。
在实际应用中,可以结合这些方法来构建一个既准确又可解释的机器学习模型。例如,使用GBDT模型进行建模,并结合特征重要性分析来解释模型的决策过程[17]。此外,还可以通过微调模型参数和使用评分指标来进一步提升模型的预测精度[48]。
总结来说,有效的机器学习方法包括:
- 选择适合的机器学习算法,如逻辑回归、朴素贝叶斯、梯度提升决策树等。
- 使用集成学习方法,如加权投票和堆叠。
- 结合简单模型和事后可解释性技术来提高模型的可解释性。
针对ADMET性质预测,有哪些新兴的拓扑特征提取技术或工具被提出?
针对ADMET性质预测,近年来有多种新兴的拓扑特征提取技术或工具被提出。以下是一些主要的技术和工具:
- 基于图神经网络(GNN)的方法:
- Wu等人构建了MoleculeNet框架,涵盖了不同的数据集拆分、特征构建和网络模型,并针对各种ADMET性质数据库进行训练和测试,证明了GNN模型在预测小分子性质方面的有效性[75]。Feinberg等人提出的PotentialNet模型考虑了距离因素,提升了预测性能。后续研究中,他们进一步改进了模型,采用多任务训练,同时预测31项ADMET性质,取得了更好的效果[75]。
- 深度学习方法:
- 支持向量回归(SVR)用于解决药物吸收预测时输入和输出之间的非线性问题[17]。支持向量机(SVM)分别建立适用于小分子化合物的预测模型,用于人体小肠吸收、血脑屏障透过等多个ADMET相关的性质[17]。
- 集成学习方法:
- 使用逻辑回归、朴素贝叶斯和梯度提升决策树的集成学习方法来预测ADMET性质[17]。
- 神经网络分析工具:
- Confidence Analysis 评估人工神经网络集成模型中各个神经网络之间的一致性,并显示了正票数分布下的观察误差率和不确定性分布[58]。ADMET Risk™ Filters 则用于快速评估药品分子潜在的毒性风险,通过计算化合物在世界药物指数(WDI)子集上的属性值来预测其吸收、CYP、毒性等风险,并根据阈值设定对每个预测进行加权评分[58]。
- 其他计算工具:
- LOGP程序(ALOGPS)用于评估ADMET模型和化合物物理化学性质预测准确性和适用性[79]。ADMET Modeler™ Module 提供多种建模方法,包括Kohonen自组织映射、人工神经网络集成、支持向量机集成、核偏最小二乘法和多元线性回归等[58]。
如何评估和优化基于ADMET数据的拓扑数据分析模型的性能?
评估和优化基于ADMET数据的拓扑数据分析模型的性能需要综合考虑多个方面。以下是详细的步骤和方法:
首先,将数据集分为训练集和测试集两部分。这是模型评估的基础步骤,确保模型在未见过的数据上也能表现良好[86]。
根据实际应用场景选择合适的评估指标。常见的评估指标包括准确率(Accuracy)、精确度(Precision)、召回率(Recall)、F1得分等[90]。这些指标可以帮助我们了解模型在不同任务上的表现。
使用多种内置的评估方法来衡量模型的性能。例如,在PyTorch中,可以使用准确率、混淆矩阵等指标来评估模型的预测结果与真实结果的匹配程度[84]。此外,还可以通过交叉验证等方法来提高评估的可靠性[85]。
通过评估不同模型在测试集上的表现,选择最佳模型并进行调优。调优可以通过调整模型参数、增加或减少神经网络层等方式进行[83]。
对模型在测试集上的泛化性能进行度量,并依据假设检验来推广到全部数据集上的泛化性能[86]。这一步骤确保模型不仅在训练集上表现良好,也能在新的、未知的数据上保持稳定的表现。
根据评估结果,对模型进行优化。优化的方法可以包括特征工程、正则化技术、集成学习等手段[85]。例如,可以通过特征选择来减少不必要的特征,从而提高模型的计算效率和预测精度。
在某些应用场景中,模型的可解释性和稳定性也是重要的评估指标。可以通过可视化技术来解释模型的决策过程,并通过稳定性测试来确保模型在不同数据集上的表现一致[82]。
最后,将优化后的模型应用于实际的药物研发场景中,验证其在真实世界中的表现和效果[87]。这一步骤可以帮助我们更好地理解模型的实际应用价值和潜在问题。
脑图
相关事件
事件名称 |
事件时间 |
事件概述 |
类型 |
拓扑数据分析在机器学习中的应用 |
2023年11月1日 |
拓扑数据分析展现出在刻画复杂高阶相互作用方面的优越性,并有望促进对数据的本质信息的理解。 |
科技创新 |
ADMETlab 3.0的全面升级 |
未明确 |
ADMETlab 3.0成为迄今为止最全面的ADMET属性在线预测平台,有助于准确预测和深入研究新的化合物分子。 |
科技进步 |
拓扑数据分析TDA提供可解释性 |
2018年1月28日 |
拓扑数据分析TDA通过高效的可视化分析,为人工智能黑箱提供可解释性。 |
科技创新 |
化合物ADMET性质预测平台的构建 |
近年来 |
利用机器学习和模式识别方法建立计算预测模型,以预测药物的ADMET性质。 |
科研进展 |
Discovery Studio ADMET结果分析程序发布 |
2022年12月13日 |
Discovery Studio发布了一个以构建好的QSAR模型来估计输入小分子吸收、分布、代谢、排泄、毒性的程序。 |
产品发布 |
利用大规模ADMET机器学习模型预测小分子可开发潜力 |
2023年11月23日 |
通过大规模ADMET预测结果评估化合物成为相关候选药物的潜力,产生bPK分数。 |
科研进展 |
相关组织
组织名称 |
概述 |
类型 |
中科大潘建伟团队 |
该团队在光量子处理器上运行拓扑数据分析(TDA)的工作。 |
教育/研究机构 |
ADMET Predictor (简称AP)平台 |
一个提供ADMET性质预测模型的AI算法平台,涵盖了约175个ADMET性质的预测模型。 |
科技/医药 |
Pred-Skin |
一个Web应用程序,能够预测化学诱导皮肤致敏,是基于ADMET分析的重要参数之一。 |
科技/医疗健康 |
chembl, pubchem, ochem |
提供了用于构建ADMET相关研究数据的数据库和资源。 |
科研/数据库 |
ADMETlab platform |
提供一个用户友好的、免费可用的网页界面,用于系统地评估化学化合物的ADMET属性。 |
科技/医药 |
相关人物
人物名称 |
概述 |
类型 |
顾耀文 |
提出了一种图注意力网络构建药物ADMET预测模型的研究者。 |
研究人员 |
参考资料
1. 走进大数据之拓扑数据分析方法 – 知乎 – 知乎专栏
2. topological data analysis 概述 – 知乎 – 知乎专栏
3. 生成一组简单,可解释的admet规则 – 知乎 – 知乎专栏
4. Bimsa – 公开课
5. 当机器学习遇见拓扑:拓扑数据分析与拓扑深度学习 [2023-11-01]
6. 《拓扑数据分析导论》教学大纲
7. 当机器学习遇见拓扑:拓扑数据分析与拓扑深度学习-csdn博客 [2023-11-03]
8. 拓扑数据分析:一种基于形状的数据科学 – Csdn博客 [2023-12-27]
9. 深度 | 拓扑数据分析tda,有望打破人工智能黑箱的神奇算法-腾讯云开发者社区-腾讯云
10. 为ML带来拓扑学基础,Nature子刊提出拓扑数据分析方法 – 知乎
11. Topological Data Analysis for Neural Network Analysis: A Comprehensive …
12. Topological Data Analysis(TDA) 拓扑数据分析与mapper算法
13. Nucleic. Acids. Res. | 又双叒叕升级了!ADMETlab 3.0——全面升级的药物ADMET预测平台-腾讯云开发者社区-腾讯云
14. 拓扑数据分析TDA,有望打破人工智能黑箱的神奇算法 [2018-01-28]
15. ADMET/PK性质预测与化合物设计软件
16. 化合物ADMET性质预测平台的构建
17. 抗乳腺癌活性化合物ADMET性质预测模型研究
18. 抗乳腺癌活性化合物的ADMET性质预测模型
19. Discovery Studio | ADMET结果分析- 杨志强的博文 [2022-12-13]
20. 10个开放获取的admet预测工具 – 腾讯云
21. 整合的admet数据库(Pkkb)及简单预测规则的构建 – 百度学术
22. ADMETlab 2.0:全面的药代动力学和毒性在线预测平台 | AI新视界
23. 科学网—成药性评价基础篇——Admet简介 – 邴铁军的博文 [2022-09-11]
24. Interpretable-ADMET:一种用于预测和优化ADMET性质的Web服务 – 知乎
25. JMC:利用大规模ADMET机器学习模型预测小分子可开发潜力 [2023-11-23]
26. admetSAR – Database Commons – National Genomics Data Center
27. 基于图注意力网络的药物ADMET分类预测模型构建方法 [作者:顾耀文 · 2021 · 被引用次数:8]
28. Interpretation-ADMElab: ADMET Prediction|ADMET Predictor|QSAR|ADMET …
29. ADMET在药物研发中的重要性 [2024-01-24]
30. Admet: 深度学习在心脏毒性预测领域的应用与挑战 – 知乎 [2023-12-07]
31. Nucleic. Acids. Res. | 又双叒叕升级了!ADMETlab 3.0——全面升级的药物ADMET预测平台 [2024-04-08]
32. 颠覆科研界,Ai助力药物临床前研发!国内企业竞争格局分析 随着人工智能(Ai)技术的飞速发展,其在药物研发领域的应用日益广泛,尤其在临床前研发 … [2024-09-03]
33. Nucleic. Acids. Res. | 又双叒叕升级了!ADMETlab 3.0——全面升级的药物ADMET预测平台 [2024-06-14]
34. 颠覆科研界,AI助力药物临床前研发!国内企业竞争格局分析
35. Hasten 工具: 机器学习加速的亿级分子筛选 – 知乎 [2023-12-06]
36. 多任务深度表征化对admet预测的改进 – 知乎 – 知乎专栏 [2023-10-17]
37. 分子模拟软件Discovery Studio教程 (十五):化合物ADMET性质的预测 – 知乎
38. Future Med Chem|企业级ADME性质早期预测模型的开发与应用
39. Meteor-ADMET性质预测-康昱盛 – cloudscientific.com
40. 覆盖 7 百万问答数据,上海 AI Lab 发布 ChemLLM,专业能力比肩 GPT-4 – 哔哩哔哩 [2024-09-03]
41. J. Med. Chem. | 利用大规模ADMET机器学习模型预测小分子可开发潜力 [2023-11-23]
42. 8个经过证实的方法:提高机器学习模型的准确率-阿里云开发者社区
43. 想提高预测精度?7步教你微调机器学习模型 – 腾讯云开发者社区-腾讯云
44. 机器学习怎样将SVM、神经网络、决策树等多种模型组合,通过加权投票、堆叠(stacking)等方法生成最终预测结果,提高预测的准确性。-CSDN博客 [2024-09-02]
45. 机器学习的可解释性 详尽介绍 – 知乎 – 知乎专栏
46. 机器学习的可解释性 – 知乎 – 知乎专栏
47. 可解释的机器学习 – Interpretable-Machine-Learning
48. 万字长文概览深度学习的可解释性研究 – 知乎 – 知乎专栏
49. 可解释性机器学习( Explainable Artificial Intelligence (XAI) )文献阅读记录(1.1)
50. 6个机器学习可解释性框架! – 腾讯云
51. 深度学习辅助药物发现的研究进展
52. 抗癌候选药物的admet性质预测方法及系统 – X技术网
53. ADMET PREDICTOR™: A Comprehensive Guide to Advanced Computer Programs for Rapid Estimation of ADMET Properties from New Chemical Entities
54. ADMET计算 – 生物信息云 – GitHub Pages
55. Beyond Michael Dewar’s Legacy: Modern Semipirical MO Theory
56. PDF 抗乳腺癌候选药物的ADMET性质的预测研究 – hanspub.org
57. 中大唯信·唯信计算 – Wecomput
58. 一文深度解读模型评估方法 – 知乎 – 知乎专栏
59. 深入理解模型评估:常见指标与方法全面解析 – Baidu
60. Pytorch入门系列11—-模型评估 – 知乎 – 知乎专栏
61. 模型评估指标全解析:如何选择最佳模型并优化性能 – Csdn文库 [2024-09-03]
62. 机器学习模型性能评估方法笔记 – Csdn博客
63. 正式发布 | 数据驱动大分子药物研发策略:数据收集、汇总与分析 – 知乎
64. 简单聊聊模型的性能评估标准 – 知乎 – 知乎专栏
65. 第一三共:内部长达三年的研究,量化数据和ai对药物研发的贡献 – 知乎
66. 深入理解:如何评估机器学习模型的好坏 | 数据学习者官方网站(Datalearner) [2023-10-18]
67. 大语言模型评估全解:评估流程、评估方法及常见问题 – 知乎 [2023-07-17]
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/84106.html