基于文献计量学的国内糖尿病有关LncRNA研究可视化分析*

2022-08-03 07:26林燕英
海峡科学 2022年6期
关键词:发文图谱编码

林燕英 陈 刚

(1.福建省医学科学研究院,福建 福州 350001;2.福建省立医院内分泌科,福建 福州 350001)

长链非编码RNA(LncRNA)是一组长度超过200个核苷酸且没有蛋白质编码潜力的非编码RNA,最初被认为是没有生物学意义的转录“噪音”。然而,近年的分子生物学研究显示,LncRNA可以从多个层面调控基因的表达水平,主要包括表观遗传学调控、转录调控、转录后调控三个层面。LncRNA参与许多生理过程,如细胞周期调节、细胞凋亡、肿瘤的迁移及代谢等[1]。糖尿病是最常见的一种代谢紊乱,越来越多的证据表明,LncRNA在糖尿病及其并发症中发挥关键作用,并有望成为糖尿病新的诊断标志物和治疗靶点[1]。LncRNA是近年来糖尿病研究领域的一大热点,但目前尚缺乏专业的文献计量工具对糖尿病有关LncRNA的研究现状和趋势进行系统分析。引文空间(CiteSpace)软件是一款科学文献计量和知识网络分析的可视化工具[2],通过丰富的知识图谱直观展示特定领域的研究状况和相关热点,近年来已广泛应用于探索各学科发展趋势。本研究利用CiteSpace软件,对糖尿病有关LncRNA的历年中文文献进行知识图谱绘制和分析,梳理国内该领域研究的发展脉络,探讨研究热点和学术前沿,以期为潜在的研究人员和机构提供借鉴。

1 资料与方法

1.1 数据来源

以中国知网中文总库为检索数据库,在“高级检索”界面,检索策略为主题=“长链非编码RNA”或“LncRNA”或“长非编码RNA”与“糖尿病”,检索时间范围设定为2021年12月31日之前。共获得符合检索条件的文献363篇,剔除重复文献及综述、meta分析、期刊索引、资讯类和明显不相关文献,最终共260篇文献纳入研究。

1.2 方法

应用CiteSpace V5.8.R3软件对糖尿病上述文献进行数据梳理和可视化分析。CiteSpace相关参数设置:时间范围为2013—2021年,时间切片为1年,分别以作者、机构、关键词为节点,绘制相应的知识图谱。以软件生成的作者共现图展示该领域的主要作者及作者间的合作情况,以关键词共现图展示研究热点,以关键词突现图展示研究前沿。

2 结果

2.1 时间分布

在260篇文献中,最早的一篇发布于2013年。2013—2021年的文献量依次为2、3、5、15、26、35、59、44、71篇,仅2020年文献量有所回落,2021年又明显升高,总体呈逐年增高趋势。

2.2 作者、机构分布和合作情况

图1显示,N(节点)=200,E(连线)=240,表明这260篇文献来自200位作者,这些作者间共有240次合作。其中,发文量最多的作者为孙艳,共发表5篇;其次是张政,发表4篇;发表3篇的有乔程、易红、李爱玲、王敏和孙倩;其他作者发文量为1~2篇。根据普赖斯定律,高产作者最低发文量=最高产作者发文量平方根的0.749倍[3],计算得到本研究高产作者最低发文量为3篇,则有7位作者满足这一条件,为高产作者。高产作者总发文量为24篇,占文献总数的9.2%。各团队节点间未见明显连线,可见团队间缺乏合作,分散性大。260篇文献共来自119个研究机构,其中发文2篇的机构有8个,包括中国医科大学附属第一医院肾内科、华南理工大学医学院等,其他机构都仅发文1篇,机构间有61次合作。

图1 糖尿病有关LncRNA研究作者共现图谱

2.3 关键词的构成和变迁

2.3.1 高频关键词

图2显示,N(节点)=246,E(连线)=419,表明260篇文献共有246个关键词,这些关键词间有419次共现。除了本研究的检索主题长链非编码RNA和糖尿病之外,排名前二十的高频关键词依次为糖尿病肾病、2型糖尿病、细胞凋亡、炎症、mRNA、糖尿病视网膜病变、基因芯片、细胞增殖、MALAT1、妊娠期糖尿病、生物信息学分析、肾小球系膜细胞、高糖、非编码RNA、足细胞、纤维化、基因表达、氧化应激、1型糖尿病、MEG3。可见,不同类型的糖尿病、糖尿病并发症、疾病机制、基因筛查、LncRNA部分家族成员等是该领域的研究热点。

图2 糖尿病有关LncRNA研究的关键词共现图谱

2.3.2 突现关键词

不同时区的突现关键词(即引用量激增的关键词)见图3。

图3 糖尿病有关LncRNA研究的关键词突现图谱

2014—2016年的突现关键词为胰岛素合成和分泌、基因芯片、胰腺十二指肠同源盒-1(pancreatic duodenal homology box 1,PDX-1)、LncRNA MAFA;2016—2018年为肾小球系膜细胞、纤维化、1型糖尿病、信号通路、微小RNA、生物标记物等;2018—2019年为生物信息学分析、冠心病、LncRNA Dlx6-as1;2019—2021年则为炎症、吸烟、竞争性内源RNA(competing endogenous RNAs,ceRNA)、非编码RNA、核因子κB (nuclear factor kappa-B,NF-κB)、爱帕琳受体(APLNR)、LncRNA Arid2-IR,近年的这些突现关键词代表当前国内在该领域的研究前沿。

3 讨论

3.1 历年走势

早在1991年,国际上就有LncRNA的相关报道[4],但直到2007年[5]之后,其热度才开始居高不下。在国内,LncRNA研究起步较晚,中国知网第一篇有关LncRNA的文献发布于2007年[6],而第一篇糖尿病有关LncRNA的文献则发布于2013年[7]。本文计量分析结果显示,该领域文献量总体呈逐年上升趋势,2013—2015年发展比较缓慢,文献量均为个位数;2016—2019年增长相对加快,稳步上升;2020年文献量有所回落,考虑与当年突发新冠肺炎疫情吸引了研究者的部分注意力,使研究力量在研究课题间重新分配有关;2021年又重新回归上升趋势。随着我国社会的老龄化,作为老年人重要的常见病之一,糖尿病的相关研究也将得到持续关注,糖尿病有关LncRNA的研究在未来几年有望得到进一步发展,该领域文献量将继续保持增长趋势。

3.2 作者和机构分布

文献计量结果显示,国内糖尿病有关LncRNA领域的研究者不多,只有200人左右,其中发文量3篇以上的高产作者很少,仅有7位;其中孙艳、张政、易红、李爱玲等形成的团队在该领域的研究成果较多,但各作者团队间缺乏合作,分散性很大。文献的来源机构众多,以医学院校附属医院的下属科室为主,每个机构都仅有1~2篇的发文量,机构间虽有61次合作,但大多是两两单次合作,未形成多边、频繁、紧密的机构间合作。科研的发展不仅需要相关领域的研究者有开阔的横向视野,也需要其在确定科研方向之后潜心深耕,纵向挖掘,才能在该领域形成更多的高产作者及核心作者群;同时,在作者之间、研究团队之间、研究机构之间需加强交流和合作,破除学术壁垒,形成科研合力,才能创造出更多跨团队、跨机构、多中心的高质量科研成果。

3.3 研究热点

研究热点指在某一时间段内有内在联系、数量相对较多的一组文献所探讨的学术或专题[8]。关键词是对论文主题的高度概括,共现关键词可代表某一时期的研究热点[9-10]。本文结果显示,国内糖尿病有关LncRNA领域历年的研究热点,除了本研究的检索主题长链非编码RNA和糖尿病之外,主要涵盖以下几个方面:①不同类型的糖尿病(主要包括2型糖尿病、妊娠期糖尿病、1型糖尿病);②糖尿病并发症(主要包括糖尿病肾病、糖尿病视网膜病变);③疾病机制(主要包括细胞凋亡、炎症、细胞增殖、高糖、纤维化、氧化应激等);④LncRNA部分家族成员(主要包括MALAT 1和MEG 3);⑤基因筛查(主要包括基因表达、基因芯片等);⑥生物信息学分析。比如,在被引量最高的文献中,张传寿等[11]用小鼠LncRNA表达谱芯片检测糖尿病db/db小鼠和db/m对照小鼠心肌中LncRNA的表达,并用荧光定量PCR鉴定6个在糖尿病性心肌中高表达的代表性LncRNA。结果显示,LncRNA AK014842和BF607975在糖尿病性心肌和糖尿病性心肌纤维化细胞模型中一致上调表达。这些研究热点反映了糖尿病有关LncRNA领域的研究现状,即研究者主要着力于探讨LncRNA在糖尿病及其并发症中的表达,某些LncRNA家族成员在糖尿病及其并发症发病或治疗中的作用机制及其作为生物标志物在临床诊断中的意义。

3.4 研究前沿

研究前沿是指某一时间内某个领域中涌现的具有发展潜力的研究方向和科学研究中最先进、最新的研究主题[13]。某个领域一段时间内的研究前沿可以通过突现关键词来反映,突现关键词指的是在这段时间内被频繁引用的某些词汇[10]。文献计量结果显示,随着糖尿病有关LncRNA研究的深入,研究主题越来越多元化,并出现了一些被引量突然激增的关键词。早期仅出现少量的突现关键词,涉及胰腺生理和小部分LncRNA家族成员;中期突现关键词数量明显增多,涉及不同类型糖尿病及并发症、疾病机制、更多的LncRNA家族成员、生物信息学分析等;近年的突现关键词得到进一步丰富,除了涉及基因筛查、机制、LncRNA家族成员等之外,还增加了危险因素、基因功能调控网络等方面的主题,这些主题是目前国内糖尿病有关LncRNA的研究前沿。比如,在近年引用量较高的文献中,林晓等[14]报道黄芪三七合剂治疗后的小鼠肾功能得到一定程度的恢复,炎症因子表达呈现剂量依赖性下降,LncRNA Arid2-IR和NF-κB及其下游分子的表达下调,表明黄芪三七合剂可有效减轻糖尿病肾病小鼠的肾炎症反应,其机制可能与调节Arid2-IR/NF-κB信号轴有关。该文获得较多的关注和引用,可能与其涉及炎症、NF-κB、LncRNA Arid2-IR等多个前沿主题有关。根据知识图谱突现关键词的发展势头,可以看出前沿主题热度不减,并将受到该领域学者的持续关注和重视。

综上所述,本文利用CiteSpace对国内糖尿病有关LncRNA的研究脉络进行了系统梳理,通过知识图谱直观展示该领域研究的年度走势、作者及机构分布、研究热点和前沿主题,以帮助研究人员和机构洞察该领域的发展趋势,发现更有价值和潜力的研究方向,为后续研究课题的构思和设计提供一定的参考。

由于本文仅搜集中国知网总库收录的中文文献,可能遗漏该数据库未收录的小部分中文文献;同时,未纳入国内外发布的外文文献,暂未对糖尿病有关LncRNA的国际研究动态和趋势进行分析,尚无法掌握该领域的研究全貌。有待后续进一步搜集国内外文献资料,对该领域的研究现状和趋势做更全面的文献计量学分析,为研究者提供更有价值的借鉴和指引。

猜你喜欢
发文图谱编码
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
绘一张成长图谱
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
Genome and healthcare
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
杂草图谱