基于深度学习的中药寒热属性预测研究

2024-01-08 12:31张冰冰张晶新王曦廷
世界中医药 2023年21期
关键词:寒性药性化合物

张冰冰 朱 琦 张晶新 芦 煜 王曦廷 卢 涛

(1 北京中医药大学生命科学学院,北京,102401; 2 中国中医科学院中医药信息研究所,北京,100010; 3 中国科学院数学与系统科学研究院,北京,100190)

中药药性理论可溯源自《素问·至真要大论篇》“阳胜则热,阴胜则寒”[1]。药性(温、热、寒、凉、平)是中药药性理论的基本内容,是中药临床应用和方剂配伍的理论依据之一。基于中药药性理论,有学者提出将中药药性化从化学角度定义为能够表征对其进行表征的化学成分或组分[2]。其中,“中药药性味化学”旨在揭示中药药性味相关化学组分并阐明其作用于机体的靶点和趋势[3-4]。窦德强和匡海学[2]提出药性具有非线性加合性,其物质基础具有可拆分、可组合的特点。从中药“性-构”关系探索构建中药性味成分表征体系有助于为现代中药药性理论研究和科学诠释探索一条新的思路。

随着生物信息技术的发展,中药的成分与功效研究方法日益丰富,为揭示中药的药效物质基础提供了新途径[5]。信息技术和生物网络计算等交叉学科也为阐述中药复杂调控机制提供了新方法[6-8]。魏国辉等[9]通过距离度量学习算法度量紫外图谱的相似性,结合机器学习方法构建符合中医药特色的中药寒热药性预测识别模型。吴思媛等[10]应用随机森林方法实现中药寒热药性分类预测。龙伟等[11]应用支持向量机(Support Vector Machine,SVM)于分子描述符构建了中药寒热预测系统,并提出了原子数、氢键受体数等5个化学描述符,用于解释中药寒热药性的化学基础。此外,也有学者借助数据挖掘与机器学习方法,在化合物的大数据中,寻找药物的潜在共性规律,对中药及其化合物的性味归经等属性进行预测和特征分析[12]。深度学习方法在生物医学领域表现出良好的特征提取能力,也可适用于探讨大数据综合属性特征预测等问题。

1 材料与方法

1.1 材料

1.1.1 资料来源 相关数据信息来源:TCMID中药信息数据库(http://www.megabionet.org/tcmid/)、ETCM中药信息数据库(http://www.tcmip.cn/ETCM/index.php/Home/Index/)。数据处理相关工具有:Metascape数据库(https://metascape.org/gp/index.html)、微生信在线平台(https://www.bioinformatics.com.cn/)、RDKit(http://www.rdkit.org/)、DGL-LifeSci、PyTorch(v1.8.1)、Python(v3.10)、Scikit-Learn(v0.23)。

1.1.2 细胞 大鼠肾上腺嗜铬细胞瘤PC-12细胞购自中国医学科学院基础医学研究所细胞资源中心,编号:1101RAT-PUMC000024。使用加入体积分数为10%胎牛血清和1%的青霉素-链霉素双抗的DMEM培养基,置于37 ℃,5% CO2培养箱中培养。

1.1.3 药物 根据加权分数梯度以及上述获得的关键靶点通路确定中药化合物。所选寒性中药化合物分别为脱水穿心莲内酯(Dehydroandrographolide,Deh)、野黄芩苷(Scutellarin,Scu)及常春藤皂苷元(Hederagenin,Hed)均购自上海陶术生物科技有限公司批号分别为155731、228147和130939。

1.1.4 试剂与仪器 低糖/高糖DMEM培养基(批号:C11875500BT)、青-链霉素溶液(货号:15140-122)、0.25%胰蛋白酶-乙二胺四乙酸(货号:25200-072)购自美国Gibco公司;胎牛血清(批号:04-001-1A)、Dulbecco′s磷酸盐缓冲液(批号:02-023-1A)购自以色列Biological Industries公司;细胞增殖-毒性测试试剂盒(北京兰博利德生物科技有限公司,货号:CK001-500T);AnaeroPack厌氧产气系统(MGC公司,日本,型号:C-1);CO2细胞培养箱(Thermo科技有限公司,美国,型号:311);倒置显微镜(Nikon公司,日本,型号:TE2000-U);多功能酶标仪(Bio-Tek仪器有限公司,美国,型号:ELX800型);旋涡振荡器(上海靳澜仪器制造有限公司,型号:JI-D);细胞培养皿(Coring公司,美国,型号:430166);96孔板(Coring公司,美国,型号:3599)。

1.2方法

1.2.1 数据收集与预处理 使用中药数据库(Traditional Chinese Medicine Integrated Database,TCMID)获取中药及化合物信息[13];并使用学者提出的中药性味归经及中药化合物综合数据集构建样本集[12]。首先,构建中药化合物分子图表征算法,将化合物SMILES表示编码为基于分子图论的高阶矩阵。使用RDKit将化合物表示的SMILES文件格式转换为Mol文件格式。使用RDKit与DGL计算库,计算分子的邻接矩阵、原子特征等,并生成分子图表示。使用RDKit,计算分子的分子指纹、分子描述符等。随后,使用随机函数并设置随机数种子,将研究样本集随机划分为训练集(80%)与测试集(20%)。

1.2.2 图卷积神经网络与机器学习模型的构建 构建了图卷积神经网络(Graph Convolutional Network,GCN)模型用于预测中药化合物的寒热属性的工作流程。见图1。该流程为数据表示法使数据归一,再进行模型构建。首先,形成化合物分子的原子邻接矩阵。随后,初始化原子特征向量。使用Numpy进行矩阵运算操作,生成分子的图表征编码。基于PyTorch深度学习框架构建图卷积神经网络模型。网络结构主要包括初始化分子图嵌入层(Graph Embedding)、图卷积层(Graph Convolutional Layer)、信息读出层(Readout Layer)及全连接预测层(Fully Connection Layer)。分子图嵌入层以初始化分子邻接矩阵和原子嵌入特征矩阵为输入并进行矩阵乘法运算,随后通过全连接层将分子图嵌入信息映射为60维度的特征向量。预测层使用使用两层全连接层,隐藏层神经元个数为256。全连接层最后使用Sigmoid函数,损失函数使用torch.nn.BCELoss。模型训练阶段,设置随机数种子,并对数据进行随机打散,将数据加载为小批次样本,批次规模为128个样本。初始化学习率设置为0.001,使用批标准化(Batch Normlization)和添加丢失层(Drop-out Layer)来提升模型性能并防止模型过拟合。此外,基于Scikit-Learn构建了K-近邻(K-Nearest Neighbour,KNN)、决策树(Decision Tree,DT)、随机森林(Random forest,RF)、SVM机器学习模型,作为对照模型。研究中,某一成分的寒热属性标签来源于其所属中药,故不同寒热属性的中药,可能具有某一相同成分。因此,本研究将化合物成分的寒热属性预测定义为多标签分类任务。

图1 图卷积神经网络模型寒热属性预测工作流程

1.2.4 寒热属性化合物生物学潜在机制探究 作为案例研究,选取典型的寒性中药(大黄、黄芩、金银花、地骨皮、穿心莲)和温热性中药(附子、刺五加、厚朴、山茱萸、丁香)。并使用寒热分子GCN预测模型对寒热中药的成分进行筛选。寒(热)分类预测概率高于80%的定义为重点寒(热)属性化合物。设置预测概率即加权分数0.8为阈值,使用ETCM数据库收集化合物靶点[15]。进一步,整理出“寒性热性化合物-靶点”数据对,分别将寒性与热性中药化合物靶点集合作为查询列表,使用Metascape数据库[16],物种设置为“H.sapiens”,设置P<0.01进行基因本体(Gene Ontology,GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析。分别选取top 20通路绘制富集气泡,借助微生信在线平台进行可视化处理。

1.2.5 梯度寒性中药成分筛选 在加权分数阈值>0.7的基础上,划分为1.0~0.9高概率、0.9~0.8中概率和0.8~0.7低概率,3个区间确定3个寒性中药成分。保证相邻差值不小于0.05不大于0.15,同时确保化合物可以获得。

1.2.6 细胞实验

1.2.6.1 分组与模型制备 取出PC-12细胞,重复培养传代2~3次后待其铺满培养瓶壁形成单层致密细胞,后胰蛋白酶消化收集细胞,用于后续实验。将细胞分为空白对照组(Ctl组),空白模型组(Mod组)和模型给药组。空白对照组用高糖DMEM培养基培养,不施加任何处理因素;空白模型组进行氧糖剥夺再灌注(Oxygen Glucose Deprivation/Reperfusion,OGD/R)。将长势良好的PC-12细胞更换为低糖DMEM培养基置于厌氧培养系统中,低糖低氧培养16 h,后更换为高糖DMEM培养基,复糖复氧3 h后观察细胞形态,较造模前细胞形态呈细丝状贴壁生长细胞即造模成功。模型给药组即在造模成功的基础上,以3种药物给药浓度均为(5、25、50、100 μmol/L),孵育24 h。该组分别记为Mod+5组、Mod+25组、Mod+50组、Mod+100组。

1.2.6.2 细胞增殖与毒性实验测定细胞活力 取对数生长期PC-12细胞,以3×103个/孔的密度接种至96孔板中,每孔100 μL细胞悬液,每组4个复孔。放至37 ℃、5%CO2培养箱中继续培养2 d后,进行氧糖剥夺再灌注造模后给药24 h,加入10 μL细胞增殖-毒性测试试剂,孵育90 min,于多功能酶标仪450 nm测定OD吸光值。

1.3 统计学方法 采用GraphPad Prism 5.0统计软件进行数据分析,组间采用单因素方差分析,以P<0.05为差异有统计学意义。

2 结果

2.1 中药寒热属性分析 本研究从TCMID中共收集了中药646味,中药成分10 053个。中药的寒热属性统计分析,属于温性中药223个(34.5%),热性中药18个(2.8%),寒性中药223个(34.5%),凉性中药40个(6.2%),平性中药142个(22.0%)(图2A)。此外,对于中药成分属于温性中药成分4 011个(39.9%),热性中药成分412个(4.1%),寒性中药成分3 327个(33.1%),凉性中药成分503个(5.0%),平性中药成分1 860个(18.5%)(图2B)。

图2 中药及其成分寒热属性分析

2.2 模型性能评价 结果显示,基于GCN的中药化合物寒热属性预测模型的准确率为82.12%、精确率为69.19%、召回率为50.51%、F值为0.58、AUC值为0.76。与之相对,RF模型在召回率为54.50%与F1值为0.60,SVM模型在精确率为69.03%。见表1。

表1 中药化合物寒热属性预测模型性能比较

2.3 寒热代表性成分靶点及通路分析 预测概率阈值为0.8时,得到寒性分子靶点295个及热性分子靶点118个。KEGG富集结果显示,寒性化合物靶点相关富集通路共442条,主要富集通路:尼古丁成瘾(Nicotine Addiction)、血脂与动脉粥样硬化(Lipid and Atherosclerosis)、安非他明成瘾(Amphetamine Addiction)、类固醇激素生物合成(Steroid Hormone Biosynthesis。见图3A。热性化合物靶点相关富集通路共665条主要富集通路:柠檬酸循环(Citrate Cycle)、阿尔茨海默病(Alzheimer Disease)、致病性大肠杆菌感染(Pathogenic Escherichia Coli Infection)、胰液分泌(Pancreatic Secretion)。见图3B。

图3 寒热化合物KEGG富集通路气泡图

GO分析结果,寒性化合物参与的生物学过程(Biological Processes,BP)相关条目1 455条,涉及膜电位调节(Regulation of Embrane Potential)、细胞对有机环化合物的反应(Cellular Response to Organic Cyclic Compound)、单原子离子跨膜运输(Monoatomic Ion Transmembrane Transport);细胞组分(Cellular Components,CC)相关条目129条,涉及离子通道络合物(Ion Channel Complex)、突触膜(Synaptic Membrane);分子功能(Molecular Functions,MF)相关条目264条,涉及神经递质受体活性(Neurotransmitter Receptor Activity)等。见图4A。热性化合物BP相关条目761条,涉及激素应答(Response to Hormone)、三羧酸循环(Tricarboxylic Acid Cycle),MF相关条目109条,涉及类固醇结合蛋白(Steroid Binding)、氧化还原酶(Oxidoreductase Activity)。见图4B。

图4 寒热化合物GO富集通路条形图

2.4 梯度寒性中药成分对低糖低氧损伤PC-12细胞的保护作用 选择的梯度寒性中药化合物,Deh为高概率寒性中药化合物,Suc为中概率寒性中药化合物,Hed为低概率寒性中药化合物。见表2。与空白对照组比较。见图5A。Deh浓度在100 μmol/L时细胞活力小于50%,显示出较强的细胞杀伤作用,差异有统计学意义(P<0.000 1)。见图5B。Suc在100 μmol/L时细胞活力在70%,较Deh细胞杀伤作用减弱,差异有统计学意义(P<0.000 1)。与空白对照组比较,Hed浓度在50 μmol/L时细胞活力在83%,细胞杀伤作用最弱,差异有统计学意义(P<0.000 1)。并且与空白模型组比较,Hed浓度在25 μmol/L时,显示出细胞保护作用,差异有统计学意义(P<0.000 1)。见图5C。

表2 基于深度学习计算模型的典型寒性中药化合物及加权分数

图5 梯度寒性中药成分对低糖低氧损伤PC-12细胞活力的影响(n=4)

3 讨论

近年来,中药寒热药性研究日益深入。多组学技术,如基因组学、蛋白组学、代谢组学推动药性认识由“宏观”转入“微观”[17];为深入探究中药寒热药性的内在作用机制。基于基因组学方法,学者隋峰等[17]通过寒(热)性中药成分诱导TRPV1和TRPM8 mRNA表达调控变化,发现寒(热)性中药成分可对相反的病理变化具有逆转作用。学者周炜炜等[19]运用蛋白组学的方法发现寒(热)性中药单体成分显著调节UCP1表达。学者陶欣等[20]观察6种寒(热)性中药对小鼠脂质和能量代谢的影响情况,探索得到寒热属性中药对生物机体响应情况。深度学习(尤其图神经网络)在计算生物学领域为计算分子的诸多属性提供了新的可解释性学习新途径[21-22]。大数据与深度学习特征提取的方法,成为在化合物的大数据中寻找寒热属性的潜在共性规律的方法之一[23-24]。已有研究表明,中药药性味与相关化学成分的结构之间也存在一定的关联关系[25-26]。

本研究基于中药药性“性-构”学说,应用图卷积神经网络实现了中药化合物分子的寒热属性预测。模型实现了中药化合物的分子图嵌入编码,以表征化合物和中药的计算编码,其可以从中药化合物寒热属性中,学习同一药性化合物所表达的共性向量权重规律。GCN与传统机器学习模型比较仍在模型性能上仍具有一定的差异,综合各个指标表现较优。构建中药化合物分子表征与属性计算模型,可为观察组分化合物配伍的性味归经属性预测提供借鉴。

其次,本研究基于中药化合物结构以中药寒热属性角度预测进行了“性-构-效”富集分析,发现寒性中药成分在成瘾性戒断相关通路富集效果显著。有研究表明,苦菜(性寒凉)可通过改变神经递质含量改善尼古丁戒断症状[27]。据此可推断寒性中药的戒断作用可能与寒性成分结构相关。以此作为案例分析,为中药寒热药性作用机制研究提供新的方向。许多疾病机制研究中药物作用首先是基于药物对细胞增殖与毒性的检验。有实验研究发现,脱水穿心莲内酯是性寒中药穿心莲提取物的有效成分之一,主要为抗菌消炎等活性,其如中医学中清热解毒[28]。常春藤皂苷元广泛分布于性温的威灵仙和性寒的金银花等药用植物中[29]。已有研究表明,其可通过降低三酰甘油的含量来保护细胞正常生理活动[30]。而三酰甘油的降低与动脉粥样硬化相关[31]。通过单味中药探究药物对人体寒热变化机制复杂,且仍不明晰。因此可以通过中药成分寒热属性加权的角度,来进一步探究明晰寒热属性程度不同的中药对细胞保护作用机制,本研究初步发现中药成分寒性概率值越小即寒性程度越低对细胞的保护作用越显著。

本研究鉴于当前模型专注于化合物结构拓扑信息,后续可采用更为丰富的生物活性实验数据等信息,以拓展中药化合物表征生物信息的丰度,从而提升计算模型的准确性和生物机制解释性。根据预测结果为进一步发现潜在生物信息提供了新的助力。

利益冲突声明:无。

猜你喜欢
寒性药性化合物
碳及其化合物题型点击
碳及其化合物题型点击
白萝卜与中药同食,会解掉药性吗?
例析高考中的铁及其化合物
寒性体质者试试艾叶坐垫
测一测 你是“热性体质”还是“寒性体质”
半夏的化学成分及其药性、毒性研究进展
不同炮制和煎煮时间对大黄沉降药性的影响研究
如何区分食物的五性
改进细菌群体趋药性算法在可用输电能力计算中的应用