基于AWS读者满意度分析的云数字图书馆成本效用研究

2012-02-15 22:23马晓亭兰州商学院信息工程学院网络中心兰州730020
图书馆理论与实践 2012年7期
关键词:实例管理员亚马逊

马晓亭,陈 臣(兰州商学院.信息工程学院;.网络中心,兰州 730020)

1 引言

从2006年起,亚马逊公司就开始了云计算技术的研究和以Web 服务方式为客户提供基于云基础设施的网络服务(AWS)。AWS 大幅度降低了客户的IT 运营成本和管理规模,避免了云基础设施的前期建设投入与运营维护,同时,可以通过与亚马逊公司签署云服务合同的形式快速获得安全、高效、可靠、经济、低碳、可扩展的云服务。

根据客户云服务需求和客户地域分布特点,亚马逊公司目前已经在世界8个地区建立了云数据中心,分别为美国东部(北弗吉尼亚)、美国西部(俄勒冈州)、美国西部(北加州)、欧盟(爱尔兰)、亚太地区(新加坡)、亚太地区(东京)、南美洲(圣保罗)、政府云计算服务,为客户提供覆盖全球的云计算基础设施服务。AWS 拥有规模庞大的云基础设施和安全、可靠、经济、全面的云服务,其强大的云计算、云存储能力和按需付费的经营管理模式,为云计算环境下数字图书馆的建设和运营提供了成熟的技术与管理模式保障,能够为读者提供安全、高效、满意、经济的云个性化阅读服务。因此,基于亚马逊公司AWS的云图书馆建设研究,具有较高的现实意义与实践价值。[1]

2 亚马逊AWS 服务的内容与特点

亚马逊AWS为客户提供了一个高度安全、可靠、经济、可扩展的云基础设施服务平台。分布于世界不同地区的8个云数据中心,可根据客户地域分布状况、云应用特点、云服务需求、客户IT 应用实际提供有针对性的云应用服务,相比传统的用户IT 自服务模式,具有安全、高效、便捷、可控、经济、低碳的优势。

2.1 亚马逊AWS 服务的内容

经过多年的AWS 研究与商业运营,亚马逊AWS将云技术服务与客户云需求紧密结合,已发展成能满足客户云计算、云存储、云应用二次开发和云服务质量保证的所有云服务过程和内容。亚马逊AWS 服务的内容主要有亚马逊弹性云计算(Amazon EC2)、亚马逊弹性配置(Amazon Elastic Map Reduce)、亚马逊云交付(Amazon Cloud Front)、数据库服务(Database)、简单电子邮件服务(Amazon SES)、亚马逊云监测(Amazon Cloud Watch)、弹性负载平衡(Elastic Load Balancing)等,主要涉及客户对云计算能力的按需动态可控、自动配置云系统参数、简单高效地提供云Web 服务、数据库高效存储与查询服务、云增值服务、确保云服务的安全与高效性等方面的内容。AWS可根据用户云服务安全、效率、可靠性、经济等方面的需求,为客户提供满意的云服务。

随着读者对个性化云阅读需求的不断提升,云计算环境下数字图书馆建设面临许多新的问题和要求。数字化文本传输的传统数字图书馆服务方式已不能满足云时代读者阅读需求,以视频、图像、语音、数字化文本阅读为主的云计算环境下读者云阅读服务,具有高带宽、高传输质量、传输即时性的要求。此外,多媒体阅读、视频会议、博客、论坛、站内E-mail 等个性化云阅读服务成为读者云阅读活动的主要方式。只有及时分析、总结读者云阅读需求与亚马逊AWS服务内容并将二者紧密结合,依据读者需求变化不断更新云阅读服务内容与服务方式,才能建设安全、高效、可靠、经济和读者满意的云数字图书馆。

2.2 亚马逊AWS 服务的特点

亚马逊公司通过建设全球性的大规模云基础设施并对其进行科学管理,较大幅度地降低了云系统建设、运营、维护、升级成本。同时,通过对AWS 服务的弹性化管理和按照客户需求进行云资源分配,降低了客户云服务的租赁成本并提高了投资成本收益率。其次,亚马逊公司拥有技术水平高超的科研、管理技术团队,可以为客户提供满意的云应用二次开发工具和满意的AWS 服务,能够根据用户需求为客户提供满意的、动态的、不断变化的云业务服务。第三,亚马逊AWS 服务具有灵活性、动态性和即时弹性,所提供的覆盖全球的云基础设施,可以保证用户按需动态、即时、快速地获得云服务。

亚马逊AWS 服务具有较高的开放性和灵活性,支持不同的操作系统和编程语言。用户可根据云业务及云应用二次开发需要,选择恰当的云开发平台或编程模型,提高云应用与云二次开发的效率、可靠性、可用性与云系统兼容性。同时,AWS是一个安全、可靠并被业界公认的认证和审计技术平台,采用了高安全标准确保AWS 服务和数据中心的完整性、安全性,符合ISO 27001、PCI -DSS 1 级与SAS 70 II 等安全标准。此外,AWS 根据客户需求制定不同的应用托管、备份和存储、内容交付、虚拟主机、企业IT、数据库云应用等方案,为客户提供安全、高效、智能、自动化的云服务与云应用策略,努力提高AWS 服务的可靠性与易用性。[2]

3 基于亚马逊AWS 服务的云图书馆构建

亚马逊AWS 服务拥有完备的服务内容与服务策略。在基于亚马逊AWS 服务进行云图书馆的构建中,应认真分析数字图书馆现状和读者开展云阅读活动需求,坚持图书馆建设实际和读者云阅读服务需求相结合,选择恰当的AWS 服务来提高读者云阅读满意度和云图书馆运营效率,建设安全、高效、经济、低碳的云数字图书馆。

3.1 基于亚马逊弹性云计算(Amazon EC2)的云图书馆建设

亚马逊弹性云计算是一种Web 服务,可以为用户和数字图书馆云应用开发人员提供弹性的云计算、云存储能力,使用户更简单、经济地使用云资源。云图书馆管理员可以通过亚马逊EC2的简单Web 服务接口,对云服务资源进行有效配置,在保证为云图书馆按需提供充足的云资源前提下提高云资源利用效率,降低云资源租赁成本。

亚马逊EC2为图书馆管理员呈现一个真实的虚拟计算环境,通过AWS的云计算平台和Web 服务接口来提供灵活的云应用平台,以推出各种操作系统的实例,在用户自定义的云应用程序环境中管理用户云系统访问权限。云数字图书馆AWS的解决方案主要包括云应用托管、备份和存储、内容交付、数据库管理、电子图书的借阅和购买、图书馆IT 应用与管理、高性能计算、多媒体阅读托管、搜索引擎、网站和博客等方面的内容。

基于亚马逊弹性云计算的图书馆建设中,要注重云资源弹性分配的可靠性和可控性,确保通过Web 服务API的控制,在几分钟内较大幅度增加或减少云资源分配量。其次,应确保云图书馆管理员拥有完全控制权限,可以随时停止所应用的云实例并保留引导分区上的数据,在需要时可随时通过Web 服务API 重新启动相同的实例,并通过访问控制台输出实例。其次,云图书馆管理员可自由选择所需的云应用实例、操作系统和软件包,选择恰当的内存、CPU、云实例存储空间和引导分区,确保与选择的操作系统和应用程序达到最佳配置,保证云图书馆网络基础设施和云数据中心内运行的云服务具有99.95%的可用性。第三,亚马逊EC2 Web 服务接口通过配置防火墙设置来控制网络访问和云应用实例之间的群体,利用入侵检测系统查找云系统存在的安全隐患及当受到安全威胁时进行报警,并使用工业标准的加密IPsec VPN,确保读者云阅读服务安全。

3.2 亚马逊云交付(Amazon Cloud Front)的应用

亚马逊云交付是一种Web 服务交付方式,它可与其它亚马逊Web 服务内容相结合,通过亚马逊Cloud-Front 缓存传输信息副本到相关边缘服务器,支持云应用开发者与运营商以较低的延迟和较高数据传输速率,按照就近传输原则将服务内容交付最终用户,而不需要签署任何服务协议。

亚马逊Cloud Front 使用特定网络为用户传输静态和流媒体数据,为数据传输自动选择最近与最佳路由,确保终端用户实现数据的最佳传输交付。亚马逊Cloud Front 通过自动优化功能,实现与亚马逊简单存储服务、亚马逊弹性云计算等Web 服务协调工作。

流媒体阅读是读者云个性化服务的一个重要内容,流媒体可以根据读者需求灵活地播放、暂停、后退、快进到媒体文件任何设置点,而无需担心有多少文件已经下载到读者浏览器。云图书馆管理员可在边缘服务器上存储数据量大、需要即时阅读的流媒体数据,并将流视频副本缓存在世界各地的边缘网络服务器,通过简单的API 调用创建一个流媒体调用服务。当用户请求访问流媒体所在的域名服务器时,数据流会自动、高效、经济地传输到终端用户,而云图书馆仅根据读者访问的数据流量支付相应费用。此外,读者还可通过配置流动态比特率,满足用户将一视频流存储为多份不同质量水平的编码视频。

3.3 亚马逊简单数据库(Amazon Simple DB)与亚马逊关系数据库服务(Amazon RDS)

3.3.1 基于亚马逊简单数据库的云图书馆简单数据库构建

亚马逊简单数据库是一个高度易用、灵活、可扩展的非关系数据库,Amazon SimpleDB为用户提供了一个简单的Web 服务接口来创建和存储多个数据集,开发人员可通过Web 服务请求来进行数据存储和查询。由于简单数据库对用户数据进行自动索引,因此用户很容易迅速找到所需信息。当用户需要存储额外数据时,不需要预先定义、改变存储模式和建立新的服务器,仅需要创建新的存储域即可。

云图书馆在数据库建设中,应根据所存储数据的用户特点、数据存储需求及存储效率与经济性选择恰当的存储方式。读者个人博客、论坛、站内BBS 等服务是云阅读服务的重要内容,具有通信即时性要求高、数据传输量小、传输数据误码率低的特点。因此,可利用亚马逊简单数据库高可用性、灵活性、方便、经济和可扩展的特点,建造所需的简单存储服务。此外,Amazon Simple DB 可在后台自动创建和管理分布在世界不同地域服务器上的多个数据副本,确保数据高可用和存储持久性。当图书馆云业务类型变化或者云应用程序更新时,管理员只需要对简单数据库进行设置而不需要重新编写数据库代码,依据所存储的数据量和云服务实际消耗的云资源量收取云服务费用。第三,图书馆在使用中可自由改变数据存储模型,简单数据库将自动为用户创建索引,管理员仅需专注于应用程序的开发而无需担心基础设施的配置、可用性、软件维护、架构、索引管理和性能优化等问题。第四,云图书馆在Amazon SimpleDB 应用中应与其它AWS 服务相结合,利用云网络和云基础设施规模化来提高云阅读应用效率、易用性与云阅读服务价值,确保在较高用户满意度的前提下降低云阅读成本。

3.3.2 基于亚马逊关系数据库服务的图书馆云服务构建

亚马逊的关系数据库服务是一种Web 数据库服务,由亚马逊负责繁重的数据库管理工作,用户可以专注于云应用程序的开发和开展云服务。用户易于在云系统中建立、操作和度量数据库服务,具有较高的成本收益率和数据库服务可控性。

亚马逊RDS 支持用户访问所熟悉的MySQL 或Oracle 数据库,允许用户将原有数据库的代码、应用程序和工具移植到亚马逊RDS 中,由亚马逊RDS 自动对数据库软件打补丁并备份用户数据库,设置还原点支持用户按需要进行数据还原。用户可通过单一的API 调用来最优化分配亚马逊RDS 和调用云计算资源、云存储资源,提高数据库存储的云资源使用效率。此外,亚马逊RDS 通过对MySQL的复制,来提高RDS 数据库的可用性、可靠性和海量数据存储承载能力。

视频、图像、音频、数字文本传输服务是读者云阅读活动数据服务的主要方式,这些数据服务具有安全性、可靠性、检索效率与数据传输质量要求高的特点。此外,云图书馆在初期建设中,核心服务与核心数据均由传统数字图书馆迁移到云计算环境。因此,提高云计算环境对传统数字图书馆数据与服务的兼容性,确保亚马逊RDS 对MySQL 或Oracle 数据库的可管理性是安全、高效、经济、快速建设云图书馆的关键。云图书馆可利用亚马逊RDS 功能,将传统数字图书馆所有可用功能、应用程序、工具和服务迁移到云计算环境,通过运行AWS 管理控制台或Amazon RDS的API 而实现原有MySQL 或Oracle 数据库功能,并利用Amazon RDS 云监测指标进行控制,确保具有较高的云资源利用率。

3.4 亚马逊简单信息通知服务(Amazon SNS)与简单电子邮件服务(Amazon SES)

3.4.1 亚马逊简单信息通知服务(Amazon SNS)在云图书馆的应用

亚马逊SNS是一种Web 信息服务。用户通过定制亚马逊SNS 服务,利用简单的Web 服务接口和基于浏览器的管理控制台,选择HTTP、电子邮件、短信等方式将信息发送到应用程序或个人用户。用户通过租用亚马逊SNS 服务,利用SNS 构建即时、高度可靠和以事件驱动的工作流与信息应用,而不需要复杂的中间件和应用管理。亚马逊SNS 可应用于监控、工作流系统、客户信息即时传送等对时间效用性敏感的数据传递,以及信息更新、移动应用等方面。

云图书馆可以利用亚马逊SNS 实现图书馆辅助管理及创建读者云阅读增值服务。云图书馆管理员可通过AWS 管理控制台,实现基于Web的界面设置和管理亚马逊SNS 访问,利用亚马逊SNS的API 发布特定的主题和消息。例如,当读者与云图书馆成功办理相关业务或者支付相关费用成功时,订单处理系统会通过HTTP 或者短信方式发送信息给用户。云图书馆也可利用SNS 系统实现读者即时视频传输,以及图书馆重要位置的视频监控服务。此外,云图书馆也可利用亚马逊SNS为读者发送时间敏感信息,诸如通知、提醒、读者身份认证等对应用时间有效性要求较高的增值服务。第三,满足读者开展云阅读活动对移动性的较高要求。可利用亚马逊SNS的移动应用程序,为读者提供诸如天气预报、交通、股票、论坛、博客、视频等增值服务,增加读者云增值服务的范围和内容。[3]

3.4.2 基于亚马逊简单电子邮件服务(Amazon SES)的云图书馆E-mail 应用

亚马逊简单电子邮件服务(亚马逊SES)是一个高度可扩展和成本效益的用户电子邮件发送服务。云图书馆通过租用SES 服务,通过SMTP 或一个简单的API 调用,向读者提供基于内容过滤技术、安全扫描且符合SP 标准的电子邮件服务,免去了复杂的运营许可申请与安装、运行第三方的Email 服务,而由亚马逊负责建立和维护内部电子邮件服务解决方案。

云图书馆通过租用亚马逊SES 服务,按照所发送的电子邮件数量和数据传输量支付低廉的费用,降低了Email 服务运营成本。同时,依靠亚马逊成熟的网络基础设施和云数据中心强大的存储能力,将所有已发送的电子邮件存储在多个服务器和云数据中心冗余保存,具有较高的可用性和数据持久保存性。此外,云图书馆还可以将亚马逊简单电子邮件服务与其它AWS 相结合,为用户提供基于电子邮件服务的相关读者云增值服务。

3.5 基于亚马逊云监测(Amazon Cloud Watch)的云图书馆资源监控与管理

亚马逊云监测为用户提供监控AWS 云资源和应用安全与效率保障的Web 服务。通过监测数据为用户提供云资源利用率、云服务经营业绩和云资源需求状况,为用户高效、安全、经济、节能地运营云系统提供理论依据。云监测的内容主要包括CPU 利用率、磁盘读取和写入、网络流量的图形化等方面内容,将监测所得统计数据以图表方式显示并设置报警。同时,云应用开发人员和系统管理员可利用所收集和跟踪的各项指标,保持云系统、应用程序和云业务平稳高效地运行。

亚马逊Cloud Watch为用户提供了一个可靠、可扩展和灵活的监控解决方案。云图书馆管理员通过签署服务协议,可以在几分钟之内开始使用亚马逊Cloud-Watch。管理员通过采用编程方式检索监测数据和查看图表,并依据云业务安全与效率需求设置报警。在云图书馆系统监测过程中,应根据成本效率最优原则监测对云系统运行效率与读者云阅读服务质量影响较大的云基础设施资源与服务项目,并根据云图书馆亚马逊CloudWatch 指标动态添加或删除亚马逊EC2 实例。诸如Amazon EC2 实例、亚马逊EBS卷、弹性负载平衡器和亚马逊RDSDB 实时实例,自动提供这些AWS 资源的CPU 利用率、延迟等数据。此外,云图书馆管理员可以根据需要自定义云监测内容,诸如内存使用量、云资源租赁数量或错误率指标。[4]

3.6 基于亚马逊弹性负载平衡(Elastic Load Balancing)的云图书馆建设

弹性负载平衡系统通过检测云系统基础设施负载量及云设施工作效率,发现云系统在传入应用流量控制及传输路由策略上的问题,自动均衡多个亚马逊EC2 实例的传入应用流量,直到云应用实例安全、高效、可控、经济地工作,确保用户的云应用程序实现更大的容错能力,并自动、无缝地保障整个云系统应用流量的负载平衡。

云图书馆由计算、存储、管理与控制、反馈等多个工作区域组成,单一区域与云系统整体工作性能共同决定了云图书馆可用性与服务质量。因此,云图书馆管理员可以设置一个弹性负载平衡器来负责在某一可用性区域,或多个可用性区域平衡亚马逊EC2 实例传入的应用流量,利用亚马逊弹性负载平衡检测亚马逊EC2 实例的健康程度并自动平衡、调整EC2 实例的应用流量请求与处理能力,控制应用流量流向不健康的云应用实例直至云实例恢复正常。

3.7 基于亚马逊路线53(Amazon Route53)的云图书馆域名服务建设

亚马逊路线53是一个高度可用和可扩展的Web域名系统(DNS)服务,将相关人类可识别的网站域名与机器IP 地址相对应,为云图书馆用户提高可靠和高成本效益的域名服务。亚马逊路线53 服务主要涉及2个方面的内容。首先,协助云图书馆管理员管理云图书馆的二级域名,并在互联网的DNS 电话簿中列出所对应的IP 地址列表,这些列表通常被称为DNS 记录。其次,为云图书馆需要域名查询的用户提供目录援助服务,将需要查询的域名翻译成相应的IP地址。

云图书馆管理员通过简单注册便可使用亚马逊路线53 服务。利用AWS 管理控制台或易于使用的API,管理员可以配置云图书馆的DNS 设置,还可以编程方式将亚马逊路线53的API 融入用户整体Web 应用程序,直接为读者提供低延迟的DNS 查询服务,并自动将查询请求信息发送到最佳的DNS 服务器,得到最快、最准确的DNS 查询结果。此外,管理员可以创建和管理云图书馆的公共DNS 记录与AWS 管理控制台,或生成一个易用的API 并利用AWS 管理员的身份访问和管理域名服务,记录或更改云图书馆DNS 记录。[5]

4 结束语

亚马逊AWS为用户提供了安全、可靠、经济、可扩展的云服务,用户可以根据需要与亚马逊公司签署云服务协议,利用AWS 平台以Web 页面访问方式安全、高效、快速、方便地获得云服务。在基于亚马逊AWS 云服务的数字图书馆构建中,必须仔细分析读者个性化云阅读服务需求,从传统数字图书馆云环境有效迁移、读者阅读可服务性与阅读满意度出发,将读者云阅读需求与亚马逊AWS 服务紧密结合,坚持安全、高效、经济、低碳的建设目标,为读者提供满意的云个性化数字阅读服务。[6]

[1]郭红英.云计算环境下高校图书馆用户服务模式发展研究[J].图书馆理论与实践,2011(2):84-85.

[2]刘鹏.云计算[M].北京:电子工业出版社,2010:36-44.

[3]Amazon.Amazon web services[EB/OL].[2011-11-20].http://aws.amazon.com/.

[4]Amazon.Amazon Elastic Com Pute Cloud(Amazon EC2)[EB/OL].[2011-11-20].http://aws.amazon.eom/eeZ/.

[5]孙培燕,张玉梅.云计算技术在图书馆中的应用[J].情报科学,2011(4):552-554.

[6]孙健,贾晓菁.Google 云计算平台的技术架构及对其成本的影响研究[J].电信科学,2010(1):38-44.

猜你喜欢
实例管理员亚马逊
我是小小午餐管理员
我是图书管理员
我是图书管理员
可疑的管理员
亚马逊雨林在燃烧
亚马逊卖的最好的100款玩具
节俭又“浪费”的亚马逊
完形填空Ⅱ
完形填空Ⅰ