中文知识库建设还得加把劲

2017-11-30 12:30袁岚峰
环球时报 2017-11-30
关键词:知识库词条百科

袁岚峰

笔者常用论文、专利等指标,来论证中国科技水平比一般人想象的高。但是论文、专利反映的是前沿研究水平,人们平时接触更多的科技内容,还是来自教材、网页等知识库。在这方面,中文跟英文的差距不小。

以我讲过课的物理化学为例,国内的教材虽然已经有许多种,但还没有一种比得上牛津大学PeterAtkins教授的名著。Atkins教授可以说把一生都贡献给了这套教材,不断修订再版。在内容的准确性、内容的逻辑关联、解释的易理解性等方面,都可以看出雕琢的精心程度。而中文教材即使内容很丰富,往往也缺乏条理,令学生迷失在大量的记忆之中,或者缺乏解释,让学生感觉这些理论好像天上掉下来的,又或者思路过于剑走偏锋。广而言之,在整个自然科学领域,优秀的中文教材都太少,远低于在前沿研究重要论文中中国学者所占的比例。

再来看网页方面。由于工作的关系,我对网络知识库用得比大多数人都更频繁。我的基本印象是,在这方面中文跟英文的差距比教材方面还大。

举一个最近的例子。计算机科学中最重要的未解之谜是“P对NP问题”。我看了维基百科,感觉大有收获。这个词条内容十分丰富,像一篇井井有条的论文,任何人看完以后都可以对这个问题获得相当深入的了解。而看国内百科,相比之下就写得差远了,东一榔头西一棒槌,许多重要的东西没写,不重要的东西倒写进去了,不少表述很模糊,甚至还有一些错误。读者看完这个词条,只能知道几个术语,但对这些术语的内涵还是所知甚少,甚至可能被误导。

客观地说,国内百科以及广而言之的中文网络知识库,已经对社会做出了相当大的贡献。我在这里想强调的是,差距客观存在,而且我们现在有条件、有能力去改进,我们应该去改进。▲

(作者是中科大合肥微尺度物质科学国家实验室副研究员)

猜你喜欢
知识库词条百科
利用简单的公式快速分隔中英文词条
乐乐“画”百科
我国机构知识库内容质量服务探讨
相关度排序的知识库检索排序方法研究
探索百科
超有趣的互动百科
基于Lucene搜索引擎的研究
位置与方向测试题