《中国科学院》北京国家技术转移中心项目简介(新兴信息产业)

2014-01-31 23:08
中国科技信息 2014年5期
关键词:海量中国科学院

项目概况

随着处理器从单核到多核、众核的技术变迁,互联网海量数据的涌现和各个领域对更高效、更复杂计算需求的牵引,并行计算正成为可见未来的潮流和趋势。

高效并行算法和并行软件实现方法是实验室的核心技术能力,并居于国内领先水平。本项目将基于已有的高性能数学库、PRIS求解器、并行数据压缩查询软件Para Mid Query和可视化软件包Explorer等4项成果,经过充分调研,面向市场需求,集成研制高性能并行软件包。该软件产品将主要面向国内高性能计算市场,同时兼顾海量数据处理和并行可视化等非数值计算市场。其主要特点或竞争力在于:

1、采用高效并行算法和高效并行软件实现方法以获得高性能;

2、面向多核/众核处理器、GPGPU等新型处理部件;

3、具有自主知识产权,能根据用户需求进行定制开发,同时充分满足国防等特定领域需求。

技术创新点

本项目产品的主要竞争产品为国外商业软件,如和高性能并行数学库对应的Intel MKL和AMD ACML数学库,和PRIS高效求解器对应的FLUENT、VIP软件等。和此类软件相比,本项目研制产品的主要优势在于:

高性价比。大多数国外并行计算软件均采用按并行规模(CPU核数)的定价方式,价格极其昂贵。以FLUENT软件为例,其单核串行版本市场价格约50万元,大规模并行版本(如256核)价格近千万元。

高性能。实验室在高效并行算法与高效并行软件实现方法领域均居于国内领先水平,并行数学库、PRIS求解器等软件性能均相当或优于国外同类产品,并已在业内获得认可;

自主知识产权。商业软件通常无法完全满足用户需求,但又无法根据需求进行定制开发。现实中有大量用户存在此类需求。同时在国防等特定应用领域,自主知识产权软件将获得更多支持。

产学研合作状况

高性能数学库已应用于日本日立公司(横向)、总参某研究所(横向)、计算所龙芯(核高基)等多家单位,十余年累计经费近两千万元。

PRIS求解器在大庆油田、胜利油田、中海油等多家公司得到应用,累计课题经费近500万元。同时高效并行求解大型偏微分方程组的核心技术已在国家气象局、北京应用物理与计算数学研究所等多家单位应用,并初步形成通用解法器。

Para Mid Query已应用于国家审计总署和清华大学,可推广至需对海量数据进行快速压缩查询的多个领域。

Explorer可视化系统应用于中海油、中石油、中国科学院超算中心、上海交通大学化学系等多家单位。

项目主要应用范围

本项目主要面向高性能计算市场,同时兼顾海量数据处理市场。

1、高性能计算市场前景;

2、并行软件和并行计算技术的市场需求。

2 Once DI数据集成中间件

项目概况

Once DI是中国科学院所属单位开发的用于大型企业或组织进行数据集成的中间件,提供针对数据库、XML文件、Excel文件、普通文件系统等各种异构数据源的提取、转换、传输和存储服务,通过数据源、渠道适配器,数据处理插件以及完备的API保证了灵活性和可扩张性,通过友好的用户界面保证了应用和部署的方便性,通过控制中心实现对全局部署的监控、管理和调度。

技术创新点

数据集成中间件Once DI主要应用于构建数据仓库,应用系统的数据迁移,多个应用系统的数据合并,多个应用系统之间的数据同步,应用系统之间的数据交换等方面。例如在大型企业内部各级数据逐级上报合并或者不同部门之间的数据交换和同步,电子政务系统中政府各个部门之间的数据交换,不同机构之间的数据同步和交换。

OnceDI的部署应用有两种模式,独立服务器模式和基于控制中心的管理模式。独立服务器模式主要应用与参与数据共享和交换的节点分属于不同的机构组织,在参与数据共享和交换的节点安装数据代理服务器,每个代理服务器都是独立、自治的,不受其他节点管理,服务器和本地数据源进行数据抽取、转换和存储,通过可靠传输渠道实现各个服务器之间的数据交换。基于控制中心的管理模式主要应用与一个大型企业或者机构组织内部,可以实现全局统一的管理、监控和调度。这种模式下控制中心管理所有分布部署的数据代理服务器,提供全局数据视图,定制各个数据代理服务器之间数据传输,流程等,并提供监控调度的功能。

项目主要应用范围

数据集成,主要是指基于企业分散的信息系统的业务数据进行再集中、再统一管理的过程,是一个渐进的过程,只要有新的、不同的数据产生,就不断有数据集成的步骤需要执行。企业经过多年的信息化发展,凌乱、重复、歧义的数据接踵而至,数据集成需求日渐迫切。

从系统部署、业务范围、实施成熟性,数据集成主要分三种架构。一种是单个系统数据集成架构、一种是企业统一数据集成架构、一种是机构之间数据集成架构。

单个系统数据集成架构,是国内目前主要采用的架构,主要是以数据仓库系统为代表提供服务而兴建的数据集成平台,面向企业内部如ERP、财务、OA等多个业务操作系统,集成企业所有基础明细数据,转换成统一标准,按星型结构存储,面向市场经营分析、客户行为分析等多个特有主题进行商务智能体现。这种单个系统数据集成应用架构的主要特点是多对一的架构、复杂的转换条件、TB级的数据量处理与加载,数据存储结构特殊,星型结构、多维立方体并存,数据加载层级清晰。

对于企业统一数据集成架构,组织结构较复杂的大型企业、政府机构比较偏爱,因为此类单位具有业务结构相对独立、数据权力尤为敏感、数据接口复杂等特征,更需要多个部门一起协商来建立一个统一的数据中心平台,来解决部门之间频繁的数据交换的需求。同时业务独立、层级管理的组织结构决定了内部数据交互的复杂性。概括来说此类应用属于多对多的架构、数据交换频繁、要有独立的数据交换存储池、数据接口,另外数据类型繁多。

机构之间的数据集成架构多应用于跨企业、跨机构、多个单位围绕某项或几项业务进行的业务活动,或由一个第三方机构来进行协调这些企业、机构之间的数据交换、制定统一数据标准,从而形成一个多机构之间的数据集成平台。

3 Agi Visual实时数据库和智能分析工具集

项目概况

Agi Visual的定位是从生产控制现场海量数据中实时获取有价值的信息,并将获得的信息通过以人为中心的协同决策,应用于指导生产、优化工艺过程及操作参数,对促进流程企业的安全运行、节能降耗和增产挖潜都具有重要意义。Agi Visual提供直观的图形化的数据和信息和交互式的数据挖掘,以业务人员非常熟悉的业务指标形式,通过表格和多种分析图形等展现方式,瞬间直观的反映给相关人员,从多种观察角度围绕业务指标,对数据进行深入、实时、动态的剖析,用来帮助数据分析人员、管理人员和决策人员洞察数据变化、发现规律,为科学决策提供辅助支持。

技术创新点

Agi Visual是由底层平台、信息处理以及界面配置组成。

底层平台提供与第三方数据源的集成,提供实时数据库、内存数据库等的数据访问服务。

信息处理通过统计分析服务、指标计算引擎、时间管理引擎以及事件通知服务,是一个业务指标与数据仓库数据进行映射关联的桥梁,是用户以业务指标方式直接访问底层数据的中间环节。

最终用户开发提供录入组态工具集,使得用户利用组态工具,构建信息模型,建立数据实体,完成数据库视图组态,以报表、图形等方式展现给用户。

Agi Visual关键技术水平达到与国外产品同类水平

产学研合作状况目前,Agi Alarm已经成功应用于多个企业,涵盖石化、冶金、电力、智能建筑、啤酒等行业在多个工程项目中得到了应用,并形成了多个面向行业的解决方案应用于国家核心工程项目,如国家电网,卫星载荷监测、CRH3型高速列车故障专家诊断应用等。

项目主要应用范围

从行业分布上,分布式实时数据库应用的重头主要是石化、电力和钢铁三大行业。特别是在当前国家经济结构调整的背景下,许多国家政策和行业规划都利好于市场的扩展,如国家“十大行业振兴规划”中的石化、钢铁、有色等行业振兴规划;国家电网投资万亿构建“智能电网”的建设等等。另外交通、航空、水利、环保及证券金融等新兴市场的发展也在推动我国实时数据库行业的进一步发展。特别是,随着物联网技术的发展,“感知中国”、“智慧地球”等一系列概念和应用的深化,为分布式实时数据库应用开辟了新的应用领域。

投资规模:1000万元

技术指标

支持遵循SQL92标准的关系数据库系统,包括Oracle、SQL Server、DB2以及KingbaseES、DM等国产数据库系统的集成;支持主流的数据采集与传输协议。

遵循国家或行业相关标准,包括RFID、GPRS、蓝牙、传感器网络、OPC、DDS等开放技术标准和规范。

经济指标

实现分布式实时数据库和智能分析工具集的产 品化,达到可批量化生产。

项目执行期内在石化、物流等重点行业中至少实现2个行业的规模化应用,并实现至少在10家企业的实际应用。

项目执行期实现相关销售收入不少于3000万元。

在国内同类产品中达到较高的市场占有率。

4 汽车工业设计(CAE)云服务平台

项目概况

汽车工业设计(CAE)云服务平台是由中国科学院超级计算中心结合自身资源优势,自主研发的基于超级计算机和机群并行计算的CAE计算服务平台,适应大规模并行计算的新型高精度和高效率计算应用,能够实现对复杂工程/产品的实时和真三维仿真。

市场化前景

我国的汽车工业迅猛发展,对仿真的计算需求越来越大。仿真技术极大降低了新车开发期的时间和费用汽车设计企业遇到的困境:高昂的工业计算方面的商业软件费用;高性能计算平台搭建的周期过长;后期维护所需高昂的财力和人力投入;自身计算资源无法有效利用,造成不足或闲置。

汽车工业设计(CAE)云服务平台将为国内广大汽车设计行业提供优质的服务平台,拉动国内汽车设计行业的快速发展。预计带动行业产值35亿元。

预期效果

投资规模200万元。在超级云计算服务平台的基础上,结合汽车工业计算的特点,搭建汽车工业云计算平台,为企业的工程师和科研人员服务。主要技术特点:1)以SaaS服务模式,提升仿真软件在云中心的易用性。2)提升虚拟机性能,实现动态资源调度。3)提升海量访问的处理能力,实现海量作业、海量数据的合理分配调度。4)倡导绿色计算方法,得到更高能耗比。5)整合云端和云中心提供的处理能力,由云端来提供部分可视化处理。项目概况:

汽车工业设计(CAE)云服务平台是由中国科学院超级计算中心结合自身资源优势,自主研发的基于超级计算机和机群并行计算的CAE计算服务平台,适应大规模并行计算的新型高精度和高效率计算应用,能够实现对复杂工程/产品的实时和真三维仿真。

5 基于语义理解的古代建筑动画辅助生成系统

项目概况

在国家科技支撑项目“古代建筑虚拟修复及WEB表现技术研究”(2006-2008)的支持下,自主研究和开发了古建动画全过程计算机辅助自动生成技术,完成了“基于语义理解的古代建筑动画辅助生成系统”,于2010年1月通过验收。该技术以动画形式再现古建筑搭建的全过程,即从用户对古建结构的描述开始,系统自动一步一步地最终生成一个动画片,反映用户所期望的古建筑从无到有的搭建过程。系统不仅能生成制式建筑,还可以基于实测数据自动生成真实古建的三维模型。系统动态计算所需木制部件的类型和数目,对每个部件的安装顺序进行推理,自动计算其尺寸、位置和方向,动态生成各种榫卯三维模型,最终动画可以以VRML三维虚拟现实和三维动画视频两种方式展示。在实现技术上,首次将国际语义网络(Semantic Web)技术和标准用于构造古建知识库,其中木架结构组成知识用本体语言OWL DL表达,而三维计算则用规则语言SWRL实现,并用语义网络推理机进行自动推理。

项目应用

本项目可以应用到博物馆、科研机构或高校应用于展览、科研、科普和教学。

项目意义

实现的系统受到了国家文物局、故宫博物院、清华大学建筑学院、湖南省博物馆等单位古建专家的高度好评,认为这项技术是原创的,对于古建科普知识普及、古建基础知识教学、人工智能理论和技术教学、和仿古建筑辅助设计都有非常重要的实用价值。

6 数字内容智能云处理和云搜索技术

项目概况

在网络融合的趋势下,数字内容作为信息的重要载体,呈现出海量化、网络化、多终端传输的发展趋势。人类的信息获取模式从单一的“被动观看”向与“主动查看”协同的模式过度,获取信息成为人们每天工作和生活得重要组成部分。传统的基于人工标注的数字内容处理和检索方式无法满足海量信息发展的需要,如何实现对海量数字内容的信息发现与浏览成为迫切的需求,尤其是智能化编目和融合文本、语音、图像的智能检索技术是产业发展的重要突破点。

技术创新性

“数字内容智能云处理和云搜索”技术基于自动化所模式识别方向研究积累,结合云计算技术和媒体业发展需求研发的面向海量数字内容的综合解决方案,包括“数字内容智能化编目”系统和“数字内容智能化搜索”两大系统。目前,国内外能够全面提供该类服务的企业尚未形成规模,谷歌和百度等主要提供基于文本的检索、VideoSurf提供的是基于图像帧的视频检索。

“数字内容智能云处理和云搜索”技术综合利用研究所语音识别、图像识别和字符识别三大核心技术,提供对以视音频为主要载体的数字内容的加工处理和检索服务。实现对海量数字内容高效率的节目打点、广告抽取、节目分类和编目,并提供基于内容的智能搜索。项目集成了自动化所数字内容技术与系统研究中心和模式识别国家重点实验室的语音识别、图像识别和字符识别等三大核心技术,历时近3年研发而成,并已在应用单位进行了1年多的大规模测试和实际应用。

项目应用

可为文化、广电、安全、电信等行业提供高效率、低成本的数字内容智能化信息处理解决方案。

猜你喜欢
海量中国科学院
中国科学院野外台站档案工作回顾
一种傅里叶域海量数据高速谱聚类方法
“我是一个平凡的人”——中国科学院院士王方定的长寿经
中国科学院院士
——李振声
构建高速海量视频智慧云联网平台
祝贺戴永久编委当选中国科学院院
海量快递垃圾正在“围城”——“绿色快递”势在必行
“海量+”:大学生品格提升的浸润方——以高职艺术设计专业为例
一个图形所蕴含的“海量”巧题
一种海量卫星导航轨迹点地图匹配方法