基于用户反馈机制的超级计算CAE云平台计费模型设计

2015-10-11 08:59马亿旿池鹏陈磊梁小林蔡立军
中南大学学报(自然科学版) 2015年10期
关键词:计费插件算法

马亿旿,池鹏,陈磊,梁小林,蔡立军



基于用户反馈机制的超级计算CAE云平台计费模型设计

马亿旿1,池鹏1,陈磊2,梁小林2,蔡立军2

(1. 湖南大学国家超级计算长沙中心,湖南长沙,410082;2. 湖南大学信息科学与工程学院,湖南长沙,410082)

针对传统CAE云平台中计费算法未考虑用户行为与反馈等缺陷以及传统计费模型的模式单一、无法支撑差异化服务、业务灵活性差等缺点,建立一种插件式的超级计算CAE云平台计费模型,提出一种基于用户反馈机制的计费算法。插件式计费模型以服务为基本单位,通过插件的形式为用户的服务提供不同的计费方案,从而解决了传统计费模型的模式单一、灵活性差等缺陷,增强超级计算CAE云平台的业务动态性。基于用户反馈的计费算法能够根据用户的历史行为和反馈情况,动态调整用户的计费参数,实现了根据用户的活跃度和重要性来减少服务费用的目的,保证了服务质量,提升了用户体验。

超级计算;CAE;云计算;计费模型

CAE(computer aided engineering,计算机辅助工程)软件能够快速模拟产品的整个生产和使用过程,大大缩短产品研发和调试的周期,节约企业成本。企业对大型CAE软件的需求越来越强烈[1],CAE软件仿真已成为工业设计领域的核心、数字化制造的关键。然而,复杂、繁琐的计算需求使得普通计算机不能完成。超级计算机是计算机中功能最强、运算速度最快、存储容量最大的一类计算机,通常拥有万核级以上的CPU PB(Peta Byte,拍字节)级以上的内存、万兆级以上局域网络、大量的其他资源。超级计算机能够提高超快的计算速度(可比普通计算机快几千倍),轻松地与CAE软件进行协调。利用并行计算模块高效运行CAE软件中需要大量计算内容(大规模计算),大大缩短了 CAE仿真计算的时间,减小了CAE仿真的周期,节约CAE仿真成本[2]。大型CAE软件价格昂贵,一套软件可达几十万至几百万元,普通企业根本无力承受。此外,CAE软件操作复杂,需要专业的培训,需要大量的人力和财力资源。利用超级计算机的计算能力搭建通用的工业仿真设计云平台(简称超级计算CAE云平台)已经成为研究热点。国家超级计算长沙中心利用“天河一号”超级计算机,搭建了一套CAE云平台,通过Web的方式为用户提供公共的云服务。用户只要按需付费便能使用到CAE资源。计费系统[3−4]是云服务商提供服务的价值度量、用户按需使用服务的报酬策略[5−6],是超级计算CAE云平台的核心组成部分。根据用户差异化服务需求和个性化的计费模式,需要能够适应各种计费方案的综合计费模型。因此,设计一种综合的计费模型是超级计算CAE云平台的关键任务。计费系统存在如下问题:1) 计费模式单一,灵活性和扩展性差;2) 无法支持差异化服务,不能适应云市场的发展;3) 重复计费和遗漏计费问题;4) 没有考虑用户的使用情况和用户行为。目前,计费系统的重点大都集中在计费模型和计费规则上[7−8]。陈红 等[9]讨论了按次和包月等多种简单计费规则的异同,并以此为基础提出了云服务收费、监管和运行的相关流程及说明。Elmroth等[10]提出了一种自动进行资源缩放的作业调度机制,将用户对作业运行的最大时间以及费用的上限作为作业调度以及资源分配的参考指标。Barbera等[11−12]依据用户对计算资源和基础设施的消耗设计了云环境下的账务和计费架构。张波等[4]提出通过基于租借实例的 Pay-Per-Use 计费模型,该计费模型按照用户使用的资源数量和资源种类进行差异化计费。Mao等[13−14]通过动态调整作业的预算时间和工作负载量来计算费用,利用VM实例的启动和关闭时间计算作业的费用。亚马逊EC2通过计算实例、数据传输、存储以及其他增值服务来进行计费[15−16]。他们都没有考虑用户的QOS、服务等级和用户行为。为此,本文作者针对云服务需要的多种差异化计费策略共存的特性,建立一种插件式的云计费模型,采用插件式模式,以服务为最小计量单位,对每种资源进行不同定价,根据用户的差异化需求制定不同的收费策略。其次,针对传统计费规则中没有考虑用户行为和服务等级的特点,提出一种基于用户反馈机制的计费算法。将用户历史行为和服务评价作为计费因子,动态调整用户的计费策略,以达到调节服务质量和提升用户体验的效果。

1 基于插件式统一计费模型

基于插件式的统一计费模型是依托超级计算CAE云平台而构建的,首先需要明确计费模型在超级计算CAE云平台的整体设计中的地位和作用,其次理解插件式计费模型的设计目标和体系结构,最后明确插件式计费模型所解决的关键问题和核心作用。

1.1 超级计算CAE云平台总体设计

超级计算CAE云平台的总体设计如图1所示,主要由表现层、应用层、ESB总线层、中间件层和HPC层构成。表现层为用户提供个性化的界面定制、安全的权限管理和USBKEY功能认证等个性需求;应用层为用户提供各种CAE软件仿真计算,用户可以按需进行CAE仿真并可以在线进行前后处理。此外,用户还可以得到各种作业统计和报表功能;ESB总线层即服务构件装配与复杂业务流程处理系统对用户的各种服务构件在协议解藕的基础上进行统一封装,形成与其他系统集成与通信的接口;中间件层主要是屏蔽Windows集群和Linux集群(天河1号超级计算机)之间的差异,根据用户的服务和目标集群生成不同的指令或脚本,提交目标集群执行,并获取中间结果和最终结果;HPC层的功能是利用Windows集群和Linux集群(天河1号超级计算机)中安装的各种CAE大型商业行业应用软件,执行用户提交的结构力学、流体力学、电磁学等多种有限元分析与计算,通过集群内的调度软件来进行大规模分布式计算作业,并回传给用户相应的计算结果。

图1 超级计算CAE云平台总体设计图

插件式统一计费模型贯穿在超级计算CAE云平台的各个层中,为用户使用服务提供价值度量。在表现层中,用户根据需要进行界面、权限、安全等功能的定制,以功能为基本单位与计费模型进行交互;在应用层,用户提交各种类型的CAE作业(ansys,abaqus和ly-dyna等),计费模型将按照用户使用资源的类型和资源进行计费;在ESB层,将提供各种应用接口并产生应用流量,计费模型可以按接口或流量以包年、包月、次数等多种方式进行计费;在中间件层,用户将以作业的方式调用HPC层的各种资源,因此,“作业”作为基本单位为计费模型提供基本业务数据;在HPC层,用户使用各种计算资源(CPU、内存、硬盘、CAE软件等)与计费模型进行相应交互。因此,计费模型将面临各个层次、各种功能的计费需求,需要灵活可配置的计费方式。

1.2 插件式计费模型设计

针对超级计算CAE云平台具有计费功能多、动态组合性强、计费方式多变等特性,设计一种基于插件式的统一计费模型。该模型能够利用插件式思想,根据动态功能轻松扩展相应的新计费模式,快捷方便地解决了传统计费模型存在的计费模式单一、扩展性差、计费方式死板固定等缺点。

用户扣费过程图见图2。由图2可知用户使用服务到按需付费可归结为服务、定量/定价和计费3个过程,因此,插件式计费模型将超级计算CAE云平台归结为3部分:服务、用户和用户计费规则库。首先,将超级计算CAE云平台的所有功能进行归结和划分,形成多种可供用户订购或使用的服务,这些服务是平台的核心、用户按需付费的根本。服务可以根据业务或用户需求动态进行变动和添加。其次,计费模型将统一监管平台的所有用户(正式、商业用户等)。用户的添加、变动、删除及计费规则的制定都将由计费模型管理。每个用户在添加成功时,将自动配置默认的计费规则,默认规则可由系统管理员动态设置。最后,管理员可以根据用户使用的服务为每个用户制定相应的计费规则,包括按月、按年、按次数等。此外,针对新加业务的需求,系统管理员可以动态地添加一些补充计费规则(如折扣、奖励、优惠等)。其具体的架构如图3所示。

图2 用户扣费过程

图3 插件式计费模型架构

针对传统计费系统中存在的计费规则单一问题,插件式计费模型通过将平台的所有服务进行归结,以服务为计费的最小单位,根据服务为用户提供多种计费规则的方式。管理员可根据用户订购的不同服务制定不同的计费方案,大大提高了用户计费的灵活性,强化了用户体验,方便了系统管理。此外,针对传统计费系统中无法进行差异化服务的缺点,本文的计费模型能够利用新增业务和配置用户相应计费规则的方式,轻松实现,大大增加了系统的可扩展性。针对重复或遗漏计费问题,插件式计费模型通过设置默认计费方案来解决遗漏计费问题,通过动态配置用户计费规则的方式可手工查询和避免重复计费问题。

2 基用户行为和反馈的计费算法

针对传统计费算法未考虑用户历史情况和用户行为的问题,本文针对超级计算CAE云平台中的各种CAE服务,提出一种基于用户反馈机制的计费算法。该算法能够结合用户的历史使用情况和用户反馈信息动态调整计费因子,达到减少资源单价、提升用户体验、扩大用户效应等效果。此外,通过该算法还能够观测出用户的历史使用情况,大大减少了管理者的管理成本。

2.1 相关定义

超级计算CAE云平台的核心任务是为普通用户或者商业用户提供按需、全面的CAE云平台。CAE作业是超级计算CAE云平台的主要功能。针对传统CAE云平台未考虑用户行为和反馈的缺点,提出一种基于用户反馈的超级计算CAE云平台计费算法,其相关定义如下。

定义1(事件) 事件是指用户提交的各种CAE作业的执行状态,包括作业提交、作业等待、作业上传、作业失败、作业成功等多个状态。计费算法根据作业状态来判断用户任务的完成情况以及作业计费开始和结束时间。超级计算CAE云平台作业事件状态转换如图4所示。

图4 作业事件状态转换图

定义2(作业等待时间wait) 作业等待时间wait是指用户任务从作业提交状态到作业运行状态的时间,也就是作业排队等待的时间。该时间表示云平台为用户任务准备相应资源的时间。设running为作业开始运行的时间,commit为作业提交的时间,则

wait=running−commit(1)

定义3(作业执行时间run) 作业执行时间run是指用户任务从作业执行状态到终结状态的时间。终结状态包括作业成功和作业失败。该时间表示用户作业的真实处理时间,是用户任务处理过程的体现,是用户计费的重要依据。设down为作业终结状态是时间,running为作业运行时间,则有

run=down−running(2)

定义4(作业时间work) 作业时间work是指用户作业成提交状态到完成状态的时间。是用户任务的整个执行过程的度量,是平台计算速度和性能的体现,由work表示。

work=wait+run=down−commit(3)

由上述公式可知:用户(>0)行为因子定义为用户的所有任务(,>0)的消费金额与所有用户消费金额的比值。若所有用户的消费金额小于常数,则将按常数计算。的取值由系统管理员根据市场需求决定。

2.2 算法流程

基于用户反馈机制的计费算法主要是在传统算法的基础上加入用户反馈因子和用户行为因子这2个参数,将用户的历史行为和用户反馈信息结合到计费系统中,增加用户的行为对系统的影响,提升用户体验,加大用户使用力度。其算法的具体流程如图5所示。

图5 基于用户反馈的计费算法流程图

由图5可知基于用户反馈的超级计算CAE计费算法主要由4步组成。

步骤1:用户根据自身需求,填写相应参数,提交CAE任务。用户选择不同的CAE任务,将提交不同的参数如CPU数量、GPU数量、内存数量、License数量、预计时间等。CAE云平台将根据用户提交的参数进行预先判断,利用配置的计费算法,结合用户历史行为和反馈因子初步计算本次任务所需费用。

步骤2:根据步骤1中计算的预付费用与用户自身余额进行比较,判断用户的本次作业是否可以执行。若用户余额不足,则将跳转到对应的费用支付页面进行支付,然后再次进行判断验证;若用户充足,则提交到CAE云平台进行排队计算。

步骤3:当用户提交到CAE云平时,记录作业提交时间;根据云平台的资源情况和作业预估的资源情况进行判断,若云平台有充足的资源可以使用,则正式进行作业处理,并记录相应的开始处理时间和结束时间;否则,排队等待其他作业释放资源。

步骤4:根据正式的计算时间和使用资源情况(CPU,GPU,License和内存),利用基于用户反馈的计费算法计算最终用户费用。若费用充足,则扣除费用允许用户下一步操作;否则,跳转到充值页面进行充值,充值完成后重新进入步骤4。

3 超算CAE云平台计费模型验证

3.1 计费系统设计

超级计算CAE云平台是依托于天河一号的CAE云平台,其主要目的是为工程机械领域的用户或企业提供一个简单、方便、快捷的按需付费CAE仿真平台。该平台采用开源java技术进行研发,使用大型数据库软件oracle 11g进行数据支撑,大大提升了平台的性能和用户体验。计费模型作为超级计算CAE云平台的核心功能部分,其贯穿平台整体设计的各个层次,发挥中非常重要的作用。基于用户反馈机制的计费算法和其计费模型的具体设计图6所示。

图6 计费系统架构设计

计费模型作为CAE云平台的核心功能,需要最高的安全等级和最强的安全防卫。因此,平台将计费系统安置在安全性和协调性最强的中间件系统中,其他各层要想使用计费模型,都必须通过web service的方式进行接口调用,从而最终达到安全计费和信任计费的目标。平台的计费系统由计费功能接口和计费轮询系统2个子系统组成。

计费功能接口主要负责对外的各种计费功能与平台统一数据库的交互,保证计费功能的安全性和可信性。功能接口子系统利用通用的Tuscany组件作为业务管理容器,提供了一个面向服务的核心架构以支持简单快速地开发和运行面向服务的应用程序,方便为平台的各层提供各种计费接口。

计费轮询子系统采用SSh通道结合轮询模式负责监控和管理各种CAE任务与天河平台的对接和相关计费功能(主要包括对作业的自动扣费以及作业运行失败的可用余额自动恢复等功能)。此外,轮询子系统还负责定期进行计费错误的检验和计费逻辑的校验,保障平台异常情况的正确处理,提升计费系统的整体健壮性。计费轮询系统的具体结构如图7所示。

图7 计费轮询子系统架构设计

计费轮询子系统采用Quartz作业时钟调度器,定时触发Spring容器中的任务调度和异常检查命令。中间件根据各种命令生成相应的作业调度或异常检查指令,上传给“天河”超级计算平台进行执行。

3.2 案例验证

超级计算CAE云平台建立了插件式的计费模型。该模型以服务为基本单位,根据用户属性动态地为每个用户的不同服务配置不同的计费策略,实现云服务中计费方案的灵活多变。目前,超算CAE云平台已经完成按小时、按月、包年、按资源数量、自定特色计费方案与用户行为和反馈计费方案等多种计费方案的集成,表1所示为一些典型计费方案。

表1 插件式计费模型典型计费方案表

基于用户反馈的计费算法根据用户的任务情况,分析、记录任务的运行时间(elapsed time)、使用CPU数量(processor)、内存数量、GPU数量、Licence数量等,并综合分析用户的历史作业行为和用户反馈因子,从而进行对应任务的费用计算。

表2所示为系统各种资源的单价和计费参数,用户反馈计费算法根据计费参数和用户历史行为和反馈,利用相应的计费算法(式(13)),对用户任务的费用进行计算。文中对6个用户利用按小时、资源、用户反馈这3种计费方案,以abaqus服务为例,验证“用户反馈”计算方案的计费效果。在试验中用户1,3和5进行4 h任务,且用户满意度一般;用户2,4和6为5 h任务,用户满意度较好。表3所示为6个用户的计费配置表,图8所示为用户使用abaqus服务的计费费用率对比结果。

表2 系统资源计费参数

表3 用户abaqus计费方案表

图8 abaqus服务计费费用率对比图

从图8可以看出:无论用户任务处理结果是否达到用户效果,按小时计费和传统按资源计费,其费用率即单位时间内的计费金额是固定不变的。用户反馈方案考虑了用户的任务情况和用户的反馈结果,根据用户的评价相应地动态改变用户的计费费用率,提升了用户的体验。

4 结论

1) 插件式的计费模型以服务的最小单位,利用插件的方式为每个用户的服务配置不同的计费方案和算法,大大增强了系统的灵活性,解决了传统计费模型模式单一、灵活性差、无法提供差异化服务的缺陷。

2) 基于用户反馈的计费算法,结合用户的历史行为和使用反馈,根据用户的平台使用活跃程度、自身重要性以及用户反馈情况进行动态计算,动态地生成计费方案,大大提升了用户的体验感,为超算CAE平台提供了更强的人性化和健壮性。

3) 基于用户反馈的计费算法和插件式计费模型都依托于超算CAE云平台。通过灵活的计费模型和动态的计费算法,提升了整个超速CAE云平台的用户体验,加强了超速CAE云平台的服务特色,加快了市场化速度。插件式计费模型还存在一些不足,如:计费模型和业务逻辑分离必然造成系统性能下降;计费模型的灵活性增强了管理的维护难度;用户反馈的计费算法存在用户恶意攻击的漏洞。在下一步研究中,将改进上述缺点,并将一些进化算法与计费方案结合,以形成更加智能化的计费算法。

[1] 岳中第, 刘彬, 高光波. 先进数字化制造中的工程分析及其应用[J]. 航空制造技术, 2005(6): 65−70. YUE Zhongdi, LIU Bin, GAO Guangbo. Engineering analysis and its applications in advanced digital manufacturing[J]. Aeronautical Manufacturing Technology, 2005(6): 65−70.

[2] Saleh R A, Gallivan K A, Chang M C, et al. Parallel circuit simulation on supercomputers[J]. Proceedings of the IEEE, 1989, 77(12): 1915−1931.

[3] XIAO Yanping, LIN Chuang, JIANG Yixin, et al. Reputation- based QoS provisioning in cloud computing via Dirichlet multinomial model[C]//Communications (ICC), 2010 IEEE International Conference Cape Town, South Atrica: IEEE, 2010: 1−5.

[4] 张波, 沈苏彬. 移动互联网动态接入计费机制研究[J]. 南京邮电大学学报(自然科学版), 2011, 31(1): 90−95. ZHANG Bo, SUN Subin. Study the mechanism of dynamic mobile internet access charging[J]. Nanjing University of Posts and Telecommunications (Natural Science), 2011, 31(1): 90−95.

[5] 徐健. 计费系统负载模型的研究与应用[J]. 计算机工程, 2013, 39(6): 82−84, 90. XU Jian. Research and application of the billing system load model[J]. Computer Engineering, 2013, 39(6): 82−84, 90.

[6] Mihoob A, Molina-Jimenez C, Shrivastava S. A case for consumer–centric resource accounting models[C]//Cloud Computing (CLOUD), 2010 IEEE 3rd International Conference on IEEE. Miami, FL, USA, 2010: 506−512.

[7] Park K W, Han J, Chung J W, et al. THEMIS:A mutually verifiable billing system for the cloud computing environment[J]. IEEE Transactions on Services Computing, 2013, 6(3): 300−313.

[8] Barmouta A, Buyya R. Gridbank: A grid accounting services architecture (gasa) for distributed systems sharing and integration[C]//Parallel and Distributed Processing Symposium. Washington D C, USA: IEEE, 2003: 8.

[9] 陈红, 任怡, 刘晓建. 云计算平台下计费机制研究[J]. 计算机科学, 2011, 38(8): 48−52. CHEN Hong, REN Yi, LIU Xiaojian. Research billing mechanisms cloud computing platform[J]. Computer Science, 2011, 38(8): 48−52.

[10] Elmroth E, Marquez F G, Henriksson D, et al. Accounting and billing for federated cloud infrastructures[C]//Grid and Cooperative Computing, Eighth International Conference. Lanzhou, China: IEEE, 2009: 268−275.

[11] Barbera R, Giorgio E, Hwang S, et al. Gustav: A lightweight approach to CPU accounting in distributed systems[C]//P2P, Parallel, Grid, Cloud and Internet Computing (3PGCIC). Fukuoka, Japan: IEEE, 2010: 24−29.

[12] Yuan Q, Liu Z, Peng J, et al. A leasing instances based billing model for cloud computing[M]//Advances in Grid and Pervasive Computing. Heidelberg, Berlin: Springer, 2011: 33−41.

[13] Mao M, Li J, Humphrey M. Cloud autoscaling with deadline and budget constraints[C]//Proceedings of the 2010 11th IEEE/ACM International Conference on Grid Computing (GRID).Brussels, Belgaria, 2010: 41−48.

[14] Sterling T, Stark D. A high-performance computing forecast: Partly cloudy[J]. Computing in Science & Engineering, 2009, 11(4): 42−49.

[15] Rodriguez D Z, Rosa R L, Bressan G. A billing system model for voice call service in cellular networks based on voice quality[C]//Consumer Electronics (ISCE), 17th International Symposium. Hsinchu, Taiwan. Hsinchu: IEEE, 2013: 89−90.

[16] YU Hongyong, WANG Deshuai. Applied technology in a composite and definable SaaS billing mechanism supporting optimized utilization of resource[J]. Advanced Materials Research, 2014, 859: 438−443.

Design of charging model using supercomputing CAE cloud platform of user feedback mechanism

MA Yiwu1, CHI Peng1, CHEN Lei2, LIANG Xiaolin2, CAI Lijun2

(1. National Supercomputing Center in Changsha, Hunan University, Changsha 410082, China; 2. College of Electrical and Information Engineering, Hunan University, Changsha 410082, China)

As the traditional charging model of CAE cloud platform has many shortcomings, such as user behavior and feedback are not considered, the single charging model can not support differentiated services, and it has poor business flexibility, a charging model was proposed based on plug-in in the supercomputer CAE cloud platform and a charging algorithm was put forward based on user feedback mechanism. The plug-in accounting model regards service as a basic unit, and provides different charging solutions for user’s service by a form of plug-in unit, which makes it easy to solve those problems, and to some extent, it strengthens the characteristic of the strong business dynamics of supercomputer CAE cloud platform. The charging algorithm can dynamically adjust the user's charging parameters according to the historical behavior and feedback of user mechanism, and reduce service costs by the activity and the importance of user, which enhances the quality of services and user experience.

supercomputer; CAE; cloud computing; charging model

10.11817/j.issn.1672-7207.2015.10.023

TP391.9

A

1672−7207(2015)10−3718−08

2014−11−22;

2015−01−19

国家科技支撑计划项目(2012BAH09B02);长沙市科技计划重大专项(K1204006-11-1)(Project (2012BAH09B02) supported by the National Key Technology Support Program;Project (K1204006-11-1) supported by Science and Technology Plan Major Projects of Changsha)

池鹏,工程师,从事高性能计算与云计算研究;E-mail:chipeng@189.cn

(编辑 陈灿华)

猜你喜欢
计费插件算法
5G网络独立组网中融合计费方案的研究
基于云计算和微服务架构的高速公路计费系统
生活中的分段计费
自编插件完善App Inventor与乐高机器人通信
Travellng thg World Full—time for Rree
基于OSGi的军用指挥软件插件机制研究
进位加法的两种算法
基于jQUerY的自定义插件开发
一种改进的整周模糊度去相关算法
一种基于L-M算法的RANSAC图像拼接算法