基于CiteSpace II的国际太赫兹技术知识图谱研究

2012-09-25 11:04刘桂锋杨国立
图书情报研究 2012年3期
关键词:赫兹图谱可视化

刘桂锋 杨国立

(江苏大学科技信息研究所 镇江 212013)

·情报分析·

基于CiteSpace II的国际太赫兹技术知识图谱研究

刘桂锋 杨国立

(江苏大学科技信息研究所 镇江 212013)

利用CiteSpace软件信息可视化方法,对1990-2010年间来自Web of Science (SCIE)数据库的太赫兹技术领域研究的文献数据进行统计和可视化分析。绘制该领域的机构分布、学科分布、期刊共被引、作者共被引、文献共被引和关键词的可视化图谱。揭示该领域的领军人物、知识基础和研究前沿,为科研用户快速了解学科领域研究全景图提供重要参考。

信息可视化 太赫兹 CiteSpace 知识图谱 研究前沿

1 引言

CiteSpace II是美国Drexel大学陈超美博士用Java语言开发出来的知识图谱可视化分析工具,陈超美对科学知识图谱理论与方法做出了奠基性贡献[1-3]。近年来,国内外掀起了运用可视化科学知识图谱方法来把握学科研究前沿和知识基础发展动态[4]的浪潮。国外相关研究主要集中在某一学科主题的可视化研究[5-6];而在国内,陈悦的《悄然兴起的科学知识图谱》[7]一文以及刘则渊的《科学知识图谱:方法与应用》[8]一书对科学知识图谱的研究起了重要的推动作用。CiteSpace II的研究文献在2007年[9]出现后,国内对CiteSpace II可视化知识图谱的研究进入高速发展期。

太赫兹技术是当前科学界的一个前沿研究领域,2004年被美国技术评论评选为“21世纪改变未来世界十大技术”之一。本文主要利用国际科学计量学的最新研究手段之一——科学知识图谱,来展示和解读太赫兹技术领域的知识特征。

2 数据与方法

以科学引文索引SCIE数据库为数据源,检索策略为:Topic = (terahertz OR THz) AND Year Published= (1990-2010) AND Document Types=(ARTICLE OR PROCEEDINGS PAPER OR REVIEW),共检索到结果10 344条,引文数据242 972条。采用CiteSpace II软件 ,选定路径搜索(pathfinder)算法,设定时间跨度为1年,主题词来源选择标题、摘要和关键词,绘制机构分布、学科分布、期刊共被引、作者共被引、文献共被引和关键词共现的网络可视化图谱。

3 太赫兹技术领域的知识图谱

3.1 机构分布

图1 太赫兹技术文献的机构知识图谱

图1为利用CiteSpace网络节点确定为机构(Institution),选择适当阈值生成的机构知识图谱,共出现258个机构及70条机构连线。机构分布比较分散,很多机构为孤立的点,说明大多数是本国或本区域的机构合作。图1中引人注目的是俄罗斯科学院(Russian Acad Sci)以433篇排在首位,中国科学院(Chinese Acad Sci)以291篇列第二位,日本大阪大学(Osaka Univ)以276篇排在第三位,日本东北大学(Tohoku Univ)以195篇排在第四位,美国伦斯勒理工学院(Rensselaer Polytech Inst)以190篇列第五位。其它发表论文数量较高的还有日本的东京大学(Univ Tokyo)和日本理化研究所(RIKEN),美国的加州理工学院(CALTECH)、俄克拉荷马州立大学(Oklahoma State Univ)、麻省理工学院(MIT)、加州大学圣塔巴巴拉分校(Univ Calif Santa Barbara)、加州大学伯克利分校(Univ Calif Berkeley)、莱斯大学(Rice Univ)和密歇根大学(Univ Michigan)。排在前二十位的还有德国科隆大学(Univ Cologne)和法国蒙彼利埃第二大学(Univ Montpellier 2)。

中国研究机构中,除了第2位的中科院,第19位的首都师范大学外,其它的还有:天津大学、台湾国立交通大学、浙江大学、南京大学、华中科技大学和台湾国立清华大学等。

3.2 学科分布

图2 太赫兹技术文献的学科知识图谱

通过CiteSpace Ⅱ处理1990-2010年的题录数据,选择适当的阈值,将学科主题作为网络节点,绘制太赫兹技术所涉及的学科领域图谱,有61个节点,79条连接线,如图2所示。图谱中主要有8个较明显的聚类,物理学科以6 903篇占据压倒性优势。按照论文数量的大小,依次为光学2 616篇、工程1 959篇、化学652篇、材料科学645篇、仪器仪表375篇、纳米科学与技术347篇、光谱学293篇。从学科分布来看,太赫兹技术早期比较集中在物理、光学、工程学科,随着太赫兹技术光谱和成像应用的发展,逐渐向化学、材料、纳米等学科过渡。

3.3 期刊分布

图3 太赫兹技术文献的核心期刊共被引知识图谱

利用CiteSpace Ⅱ对所下载的全部文献进行期刊共引分析,得到如图3所示的期刊共被引可视化网络图谱,共有95个节点,598条连线。太赫兹技术领域共被引频次高于1 000的期刊有19种,其中9种的共被引频次高于2 000次,排在前5位的是物理和光学类期刊,分别是APPL PHYS LETT、PHYS REV LETT、PHYS REV B、J APPL PHYS和OPT LETT。而以中心度排在前5位的是J AM CHEM SOC、APPL PHYS LETT、PHYS REV LETT、PHYS REV B和J CHEM PHYS,与期刊共被引频次排在前5位的有所不同,三种物理类期刊一致,而两种化学类、或物理化学类期刊不同。

3.4 作者共被引分析

图4 太赫兹技术文献的作者共被引知识图谱

选择网络节点为作者,得到如图4所示的作者共被引可视化网络图谱,共有402个节点,512条连线。太赫兹技术领域单篇文献共引频次高于50次的作者有10位,1位(XC Zhang)来自美国,1位(EH Linfield)来自英国,2位(G Winnewisser和H Kurz)来自德国,其余6位来自日本。其中日本大阪大学的M Tonouchi和美国伦斯勒理工学院的张希成(XC Zhang)的文献共引频次远远高于其他作者,并且M Tonouchi还有1篇在2007年发表在Nature Photonics的文献(共被引频次为31次);张希成还有2篇,分别是在2009年发表在Phys Rev Lett的文献(共被引频次为29次)和在1991年发表在Appl Phys Lett的文献(共被引频次为17次),也说明了他们在太赫兹技术领域的重要地位,是学科领域的领军人物。

中国作者中,单篇文献共引频次较高的有:中科院上海微系统与信息技术研究所的曹俊成(Phys. Rev. B, 2003, 67: 085309;Appl Phys Lett, 2008, 92: 221105),天津大学太赫兹研究中心的张伟力(Opt. Express, 2008, 16: 1786),原中国科学院上海冶金研究所(上海微系统与信息技术研究所)现上海交通大学的雷啸霖(J Appl Phys, 1998, 84: 1396),中科院物理研究所的汪力(J. Opt. Soc. Am. B, 2006, 23: 1174),首都师范大学物理系的张岩(Opt Commun, 2009, 282: 4683)和张存林(Phys Lett, 2006, 359: 728),西安理工大学应用物理系的施卫(Solid-State Electronics, 2006, 50: 1128),以及天津大学太赫兹研究中心的田震(Appl Phys Lett, 2010, 96: 071114)等。

3.5 文献共被引分析

图5 太赫兹技术领域的文献共被引知识图谱

利用CiteSpace软件,网络节点选择参考文献,以论文标题、摘要和关键词(包括描述词和标识符)作为前沿术语来源,调节相应的阈值,得到太赫兹技术领域研究论文的文献共被引知识图谱(图5)。网络由272个节点、1 073条共被引连线组成。通过文献共被引分析识别太赫兹技术领域的知识基础和研究前沿。图5大致呈现了两个主要聚类,聚类1可看作是知识基础(冷色调,2000年之前),聚类2是研究前沿(暖色调,2000年之后)。为了验证上述文献,在Google学术搜索中重新搜索,得到被引频次(搜索日期:2012年1月9日)。表1为共被引网络中被引频次排名前12位的文献。

表1 共被引网络中被引频次排名前12 位的文献

聚类1主要由以下文献构成:

文献1的作者GRISCHKOWSKY是超快激光和太赫兹技术(太赫兹波天线产生、光电导取样探测等技术)的奠基人之一,因发明“太赫兹时域频谱技术”,被国际学术界誉为“太赫兹时域频谱之父”。其在1990年的“Far-infrared time-domain spectroscopy with terahertz beams of dielectrics and semiconductors”文章中,使用太赫兹时域光谱的方法,测量了0.2-2.0THz频段结晶蓝宝石、石英、半导体硅、砷化镓和锗的吸收系数和色散信息,发现锗的实验值与简单Drude理论模拟值一致,归结为自由载流子效应。

文献4的作者HU BB 在1995年“Imaging with terahertz waves”的论文中提出逐点扫描式太赫兹时域光谱成像技术,首次实现“太赫兹光成像”。

文献7的作者SMITH PR在1988年“Subpicosecond photoconducting dipole antennas”的论文中提出用光电导天线产生太赫兹波。

文献8的作者AUSTON DH在20世纪90年代利用低温生长砷化镓(GaAs)技术将光导开关推向了一个全新的阶段,为光电导开关的发展做出了开创性贡献,因此又称为“Auston开关”。其在1984年的“Picosecond photoconducting Hertzian dipoles”文献中将两个光电导开关对称的放在一块介质的两个表面,辐射源是光电导开关中的瞬时电流,相干探测通过对重复入射的电磁脉冲进行采样实现。这个实验是太赫兹光电子学开始的标志。

文献9的作者MITTLEMAN DM在1996的“T-ray imaging”论文中介绍了太赫兹实时成像技术及其商业应用。

文献10的作者FAIST J于1994年在年贝尔实验室研制出世界上第一个III-V族材料(GaInAs/AlInAs) 的量子级联激光器。

文献11的作者ZHANG XC 是世界范围内最早从事太赫兹科学与技术研究的带头人,美国乃至全世界太赫兹领域内的顶级专家,在太赫兹成像和生物-医学应用、超快光子学、光电子学领域内取得了杰出成就。其在1990年的“Generation of femtosecond electromagnetic pulses from semiconductor surfaces”文献中用半导体表面场效应产生太赫兹波。

文献12的作者NAHATA A 于2007年研制出首款太赫兹带通滤波器,突破“太赫兹空白隙”。其在1996年的“A wideband coherent terahertz spectroscopy system using optical rectification and electro-optic sampling”论文中用光整流产生太赫兹脉冲和电光取样技术来探测太赫兹辐射。

从以上几篇经典文献来看,早期研究集中在太赫兹波产生、太赫兹波探测和太赫兹成像技术。

聚类2主要是由暖色节点组成的聚类,代表了该领域近10 年的研究前沿:

文献2的作者KOHLER R于2002年研制成功世界上第一台太赫兹量子级联激光器。这一重要研究成果立即引起了世界科学家广泛的兴趣,从在Google scholar中的总被引频次可见一斑。

文献3的作者FERGUSON B在2002年的“Materials for terahertz science and technology”一文中综述了太赫兹技术研究的最新进展,包括太赫兹系统(太赫兹源和太赫兹探测)和太赫兹光谱及成像应用。

文献5的作者TONOUCHI M 2007年的综述“Cutting-edge terahertz technology”在短短四年时间里在Google scholar中被引频次达到700多次,在2012年1月10日的Web of Science中被引频次达到600多次。该文不仅从太赫兹源、太赫兹探测、太赫兹光谱成像应用等方面(生物医药学、半导体、安全、信息通讯、地球与空间科学、基础科学等)进行总结,并且还对未来8年的发展趋势进行预测。

文献6的作者SIEGEL PH 2002年的综述“Terahertz technology”被引频次也很高。

总之,2000年之后的经典文献,除了文献2之外,其它均为综述文献。

3.6 研究热点分析

图6 太赫兹技术文献的关键词共现图谱

出现频次较高的关键词可以用于确定太赫兹技术研究的热点领域和重要主题。网络节点为关键词,选择合适的阈值,得到太赫兹技术文献的关键词共现图谱,如图6所示,共有152个节点,305条连线。图中每个圆形节点代表关键词节点,节点的大小代表该关键词出现的频次,节点越大表明这个关键词出现的频次越多。节点之间的连线代表两个关键词共同出现的次数,连线越粗表明共现次数越多。从图6中可以看出,太赫兹技术领域共现频次高于100的关键词有60个,太赫兹(terahertz)是笔者在WOS中的检索词,因此出现的频次很高,位居第四位。其它频次位于前十位的分别是:太赫兹辐射的产生方法(generation)、太赫兹光谱系统(spectroscopy)、太赫兹辐射(radiation)、太赫兹脉冲(pulses)、太赫兹时域光谱(time-domain spectroscopy)、太赫兹激发(emission)、太赫兹动力学(dynamics)、砷化镓晶体(GaAs)、太赫兹激光器(laser)等。根据关键词频次变化率,软件从主题词中探测到太赫兹技术领域研究前沿的3个突现词分别是:pulses、GaAs和dynamics。在知识图谱中,按中间中心度从大到小依次排列为:GaAs、pulses、spectroscopy、dynamics、generation、conductivity、laser、absorption等关键词,这些词都出现上世纪90年代,反映出它们一直是研究热点。新世纪以来涌现的热点词有:terahertz laser spectroscopy(2000)、semiconductor superlattices(2000)、magnetic-field(2002)、water(2004)、InAs(2004)、field-effect transistors(2005)、wave-guides(2007)、metamaterials(2008)和iii-v semiconductors(2009)等。

从图6可见,太赫兹技术研究主要涵盖五个知识群:

知识群1#,太赫兹系统:包括除太赫兹发射器和探测器之外的各种物理器件的整体装置。如各种激光器(飞秒激光器、自由电子激光器、量子级联激光器),波导器件,延迟线、锁相放大器等。其中量子级联激光器成为本领域的研究热点。图中相关的关键词有:laser、silicon、devices、systems、wave-guides、femtosecond laser、quantum wells、terahertz heterostructure lasers 等。

知识群2#,太赫兹波产生:包括传统的光子学技术和电子学技术两种方法。光子学方法有光电导方法(光电导半导体、天线),光整流效应(非线性介质,ZnTe),以及最近发展的空气等离子体中的四波混频整流效应。电子学方法有反向波振荡器、耿氏振荡器、布洛赫振荡器等。图中相关的关键词有:generation、optical rectification、emission、GaAs、semiconductors、crystals、oscillations、temperature-grown GaAs、thz radiation、antennas、bloch oscillations、mixer等。

知识群3#,太赫兹波探测:脉冲太赫兹信号探测最常用的两种方法:光电导取样和自由空间的电光取样;连续太赫兹信号的探测有肖特基二极管、场效应晶体管等。图中相关的关键词有:field、metamaterials、field-effect transistors、electro-optic sampling等。

知识群4#,太赫兹光谱,包括各种类型的光谱以及在生命医学、通讯雷达、安全监测、化学材料、航空航天等方面应用。图中相关的关键词有:spectroscopy、time-domain spectroscopy、terahertz spectroscopy等。

知识群5#,太赫兹成像,包括太赫兹实时成像、太赫兹层析成像、太赫兹近场成像、太赫兹连续波成像等,遗憾的是本知识群在关键词中没有明显显示。

4 结论

本文利用最新信息可视化技术CiteSpace II软件绘制了太赫兹技术领域的一系列知识图谱,客观展示了该领域的研究力量分布(机构分布、学科分布),共被引期刊,相关的领军人物、经典文献以及知识基础和研究前沿,得出以下结论:

(1)俄罗斯科学院、中国科学院、大阪大学、东北大学、伦斯勒理工学院等是目前太赫兹技术的主要研究机构;国内研究机构中,还有首都师范大学、天津大学、浙江大学、南京大学等。

(2)物理、光学、工程学科、化学和材料是太赫兹技术研究所隶属的主要学科领域。

(3)GRISCHKOWSKY D、TONOUCHI M、ZHANG XC等是目前最重要的研究者,国内主要有曹俊成、张伟力、汪力、张存林等。

(4)太赫兹技术研究的文献主要分布在APPL PHYS LETT、PHYS REV LETT、PHYS REV B、J APPL PHYS和OPT LETT五种物理类的期刊。

(5)太赫兹技术领域的知识基础构成体现在90年代的一组奠基性文献,有太赫兹时域光谱、太赫兹成像、电光取样探测等;研究前沿体现在新世纪以来的重要综述文献。

(6)太赫兹技术研究主要涵盖了五个知识群: 太赫兹系统、太赫兹波产生、太赫兹波探测、太赫兹光谱和太赫兹成像。

从以上分析可知,我国太赫兹技术研究,虽起步较晚,近年来发展很快,论文数量可观,出现了很多研究机构和科研人员,但是论文质量不高,没有重大原创性科研成果,跟随性研究比较多。因此相关研究人员,应及时分析和把握前沿热点,在国际舞台上站稳脚跟。

[1] Chen C. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature[J]. Journal of the American Society for Information Science and Technology, 2006, 57(3): 359-377.

[2] Chen C. Searching for intellectual turning points: Progressive knowledge domain visualization[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(Suppl 1): 5303-5310.

[3] Chen C. Information visualization: Beyond the horizon[M]. London: Springer-Verlag London Limited, 2004.

[4] 陈超美,陈 悦,侯剑华,等. CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化[J]. 情报学报,2009, 28(3): 401-421.

[5] Niazi M, Hussain A. Agent-based computing from multi-agent systems to agent-based models: a visual survey[J]. Scientometrics, 2011, 86(2): 1-21.

[6] Zhao R, Wang J. Visualizing the research on pervasive and ubiquitous computing[J]. Scientometrics, 2011, 86(3): 593-612.

[7] 陈 悦,刘则渊. 悄然兴起的科学知识图谱[J]. 科学学研究, 2005, 23(2): 149-154.

[8] 刘则渊,陈 悦,侯海燕, 等. 科学知识图谱: 方法与应用[M]. 北京:人民出版社, 2008.

[9] 张兆锋,张志平,乔晓东,等. 信息可视化在科技文献深度挖掘中的应用[J]. 情报学报, 2007, 26(3): 408-414.

ACiteSpace-II-basedStudyofKnowledgeMappingofTerahertzTechnology

Liu Guifeng, Yang Guoli

Institute of Science and Technology Information of Jiangsu University, Zhenjiang 212013, China

Based on a statistical analysis of the articles on terahertz technology from the Web of Science (SCIE) in the 1990- 2010 period with the visualization tool of CiteSpace II, the present paper draws the visualized knowledge mapping including the distribution of institutes and disciplines, journal co-citation, author co-citation, document co-citation and co-word keywords in the field of terahertz technology. It also identifies the key scholars, the intellectual base and the hot issues in this field. Our findings may help researchers to gain a panorama of the research in their disciplines quickly.

visualization of information; terahertz; CiteSpace; knowledge mapping; research front

G353; G301

刘桂锋,男,1980年生,博士,馆员,研究方向为图书馆信息服务、情报分析,发表论文6篇;杨国立,男,1979年生,硕士,馆员,研究方向为科学计量学,发表论文6篇。

猜你喜欢
赫兹图谱可视化
基于CiteSpace的足三里穴研究可视化分析
思维可视化
绘一张成长图谱
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
基于双频联合处理的太赫兹InISAR成像方法
太赫兹低频段随机粗糙金属板散射特性研究
太赫兹信息超材料与超表面
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱