我国生物医学领域高性能计算发展分析与建议

2023-12-24 10:34杨晨柳方安王蕾王茜钱庆
数据与计算发展前沿 2023年6期
关键词:计算资源生物医学算力

杨晨柳,方安,王蕾,王茜,钱庆

中国医学科学院医学信息研究所,北京 100020

引 言

随着人工智能、云计算、物联网、大数据等技术快速发展,数据体量呈指数级增长,密集型计算需求不断增加,高性能计算对科学研究发挥着越来越大的推动作用,已成为科学、社会和经济发展重要的战略工具[1]。高性能计算也被称为超级计算(也称“超算”),主要通过将多台计算机系统的计算资源集中开展并行工作,以处理数据密集型或极端复杂的问题[2]。经过近10 年的快速发展,我国超级计算已达到世界领先水平。2023年6月发布的第61届全球超级计算机TOP500 榜单中,我国共有136 台超级计算机上榜,占比超过总数的1/4[3]。截至2021年,科技部已批准9所国家超级计算中心,支持千余项国家级科学计算和工程项目研究工作[4],帮助攻克对精度和准度要求较高的核心技术难关,成为我国科技、创新、应用发展的重要支撑。截至2022年年底,我国算力总规模达到180EFlops(每秒18,000京次浮点运算次数),位列全球第二[5]。

随着第三代分子测序技术的发展,生物医学数据量快速增长,生物医学数据从PB 组学时代迈入EB多维度大数据时代[6]。生物医学是高性能计算的重要应用领域,海量生物医学数据的汇交整合、归档存储、挖掘分析和应用共享需求迫切。2022 年2 月,工业与信息化部、发展改革委、卫生健康委等9 部门联合印发《“十四五”医药工业发展规划》[7],明确推动医药产业数字化转型,以新一代信息技术赋能医药研发。在新基建、“东数西算”等相关政策的引导下,各领域纷纷加大对算力基础设施的建设布局[8],进一步推动了生物医学和信息技术的创新融合,加快了多重组学、基因工程、临床队列、精准医疗、药物研发等科学研究、应用和发展,有效缩短了创新研发周期,提升了科技创新效率,降低了科技创新成本,为我国实施科技强国战略奠定相关基础。

当前,我国国家超算中心的计算资源主要用于支撑大型、重要科研项目的核心技术攻关[9]。生物医学领域科研、教育机构众多,大量的研究团队存在许多中小规模数据运算需求,此类计算场景对资源灵活性和服务质量的要求相对较低,因此,研究机构基于自身集约型计算服务需求,相继开展高性能计算基础设施建设。本文基于国内外生物医学领域高性能计算平台发展现状,分析当前面临的挑战,并提出发展建议,以期对我国生物医学领域高性能计算建设与完善提供参考。

1 我国生物医学领域高性能计算发展现状

近10 年来,欧美国家在生物医学领域高性能计算的资源建设、数据共享、软件研发、服务优化等方面取得了良好进展。为更好满足生物医学领域个性化、场景化的计算需求,我国研究机构积极开展高性能计算资源建设,但在建设规模、软件资源、人才成果、数据监管等方面与欧美国家仍存在差距。

1.1 尚未形成大规模高性能计算基础设施

欧美国家已建成规模庞大、算力领先的世界级生物医学高性能计算基础设施。美国国立卫生研究院(National Institutes of Health, NIH)Biowulf高性能计算集群始建于1999年,旨在为基因组学、分子和结构生物学、数学和图形分析等提供计算应用支持,截至2023年6月,集群已拥有3,456 个计算节点,理论算力达2.49PFlops(每秒千万亿次浮点运算)[10]。Biowulf也多次入选全球最强大的500 台超级计算机榜单(TOP-500)[3]。欧洲生命科学大数据联盟ELIXIR成立于2013年,通过“枢纽和节点”的模式,创建了一个用于数据收集、存储、注释、验证、传送和使用的安全、可持续的高性能基础设施[11],例如,ELIXIR计算平台集合了联盟成员机构的算力资源,为欧洲生物医学大数据分析和密集型计算提供了基础支撑;ELIXIR 数据平台汇集了联盟成员机构的关键数据,并与文献成果相关联,以推动全欧洲生命科学数据的共享和应用[12]。截至2023 年6 月,ELIXIR 已惠及23 个国家的250多个研究机构[11]。

近些年,我国生物医学高性能计算基础设施快速发展,现已初具规模。中国医学科学院/北京协和医学院[13]、中国科学院北京基因组研究所[14]、首都医科大学天坛医院[15]、四川大学华西医院[16]等机构陆续开展高性能计算集群建设,以满足生物医学数据在不同应用场景下的分析计算需求。其中,建设程度较好的华西医学大数据中心高性能计算集群,截至2023年6月,其计算节点达到103个,整体算力达到1.17PFlops,已支持42 个科研团队,240 多位研究人员开展工作,服务各类研究项目70余个[16]。

相较于美国Biowulf,我国生物医学研究机构的高性能计算集群在整体规模、算力水平等方面仍存在差距,具体情况详见表1。如四川大学华西医学大数据中心高性能计算集群,在整体规模上,其计算节点和处理核心数量与Biowulf 相差数十倍;在计算能力上,其理论算力接近Biowulf 的1/2。从发展模式来看,ELIXIR 利用欧盟组织结构优势,将各个国家研究机构间分散的计算资源集中共享利用,形成具有一定算力规模的高性能计算基础设施;而我国已建设的生物医学高性能计算集群仍处于满足各机构科研项目分析计算需求的独立发展阶段,尚未以合作形式对行业内的计算资源进行有效整合。

表1 美国NIH与国内机构高性能计算集群建设情况(截至2023年6月)Table 1 Construction of High Performance Computing Cluster in NIH and Domestic Institutions(Up to June 2023)

1.2 生物医学研究软件仍主要依赖于国外

为更好满足海量生物医学数据的分析和计算需求,Biowulf和ELIXIR积极开展软件工具资源社区建设,为用户提供了良好的应用服务环境。Biowulf集成了近千款业界普遍认可并广泛使用的生物医学软件,如生物医学文本挖掘工具BioBERT[17]、高通量测序工具abyss[18]、基因序列分析工具Blast[19]等,平台能够针对不同软件工具的运行要求,灵活配置合适的环境模块,支撑科研活动的顺利开展。ELIXIR资源社区整合了bio.tools、BioContainers、OpenEBench、Use-Galaxy.eu等平台的数万款生物医学软件工具[20],为研究人员搭建了有效的软件资源发现、测试和应用环境,以推动欧洲生命科学领域的科技创新与发现。ELIXIR还致力于帮助供应商提升软件质量,为软件工具提供性能测试和运行监控服务;鼓励支持软件研发活动,为最新开发的生物医学软件工具提供永久标识符服务[20]。

随着我国生物医学科技创新发展,科研人员对于应用软件的需求与日俱增,相关研究机构与计算平台也陆续参与到软件工具资源建设中。为支撑科研人员的数据分析与计算需求,中国医学科学院高性能计算平台整合了涵盖基因序列分析工具Blast、RNA测序工具Myrna、分子动力学工具NAMD等上百种普遍使用的国外开源软件列表[21],并已在其平台上完成超过30款软件的部署,为生物医学数据分析计算提供了良好的软件应用环境。为满足精准医学与个性化药物研究需求,中国科学院计算机网络信息中心于2016年开始建设生物医药应用服务社区[22],截至2023年6月,网站已收录了生物信息KaKs、药物设计AutoDock Vina、分子动力学Lammps 等50余种常用软件工具的基本信息,包含6款国产生物信息软件。相较于欧美国家,我国资源社区在软件数量、软件构成、服务形式上均存在差距,详见表2。

表2 生物医学高性能计算与应用服务平台软件资源建设情况(截至2023年6月)Table 2 Software Resources Development of Biomedical High Performance Computing and Application Service Platform(Up to June 2023)

值得关注的是,我国科研人员主要使用的基因编辑工具SnapGene[23]、Benchling[24]以及药物设计工具Schordinger[25]、ChemDraw[26]均来源于国外企业,不仅存在用户授权费用高昂、暂无国产化替代产品的问题,而且一旦上述软件停止提供服务,将直接影响科研业务开展,面临“卡脖子”的困境。此外,Benchling 等软件需通过供应商的云平台在线使用,计算过程中的核心信息易被操控,重要研究成果也面临着泄露风险。近年来,我国生物医学领域积极开展自主可控软件工具的研发,取得了部分成果。例如,国家基因组科学数据中心支持开发的GAAP[27]、KaKs_Calculator[28]、BS-RNA[29]等基因分析工具,能够支持基因簇的拼接组装、捕获蛋白质序列的进化信息、实现RNA 亚硫酸酯测序数据的制图和注释;华大基因研究院开发出的基因比对工具SOAP[30],能够高效处理第二代测序技术产出的巨大数量的短序列。

1.3 计算成果统计和人才培养未形成体系

欧美生物医学高性能计算平台非常关注对相关成果的统计与复合人才的培养。Biowulf和ELIXIR的科研成果统计数据均可追溯至平台创建年份,近10年来,两平台支持发表的研究成果论文数量也呈倍级增长,详见图1。截至2022年年底,Biowulf 共支持发表期刊论文5,113 篇,支持产出新型冠状病毒研究相关的同行评审论文68 篇、预印本论文26 篇[31];ELIXIR 共支持发表期刊论文815 篇,发布了多种指导、应用和实践类手册,支持完成20余项专利申请,其中成果共被引用23,528 次[32]。此外,NIH 和ELIXIR 联盟十分重视高性能计算人才的技能培养,积极为科研人员提供培训课程与实践环境,并举办了多形式多场次的培训活动,详见表3。例如,NIH基于Biowulf提供在线学习、学术研讨和咨询服务,定期解答科研人员计算中的各类问题;ELIXIR提供多种形式教学课程,以及学习资源、软件工具和认证服务。截至2023年6月,ELIXIR培训的科研用户已遍布全球60多个国家[33]。

图1 Biowulf与ELIXIR支持发表期刊论文情况(2012-2022年度)Fig.1 Publication of Journal Papers of Biowulf and ELIXIR Support(2012-2022)

表3 Biowulf与ELIXIR高性能计算培训情况Table 3 High Performance Computing Training of Biowulf and ELIXIR

近几年来,我国生物医学高性能计算平台对产出成果汇总及专业人才培养的重视程度也不断提升。中国医学科学院在其高性能计算平台管理办法中明确标注科研成果及论文对高性能计算平台的引用规范,并要求使用人员按周期提交成果报告,以便于统计汇总产出成果。中国科学院计算机网络信息中心[34]、清华大学生命科学学院[35]等组织开展了多种生物医药与高性能计算培训活动,向科研人员普及生物医药计算平台、应用软件的原理及使用方法等,以及高性能计算在基因测序、潜在药物靶标预测、苗头化合物发现等方面发挥的重要作用。

依托高性能计算资源,欧美生物医学研究在大数据挖掘分析、融合发现等方面取得多项成果,2022 年度,Biowulf 支持发表论文总量相较10 年前增长近4 倍,ELIXIR 相较平台建设初期,支持发表的论文总量增长超过10 倍。我国生物医学领域高性能计算平台尚未明确设立产出成果的发布途径与方式,且多数计算集群建设于最近5 年,各项运行管理机制仍在完善,因此,相关成果统计数据暂未对外发布。此外,相较于欧美国家,国内机构组织开展的生物医学高性能计算培训活动也暂未统计公布。当前,互联网可检索到的国内相关培训活动频次较少,且主要涉及理论知识,尚未形成理论与实践相结合的体系化教学课程。

1.4 计算平台数据安全监管机制尚不完善

欧美国家非常重视对生物医学高性能计算平台数据的安全监管和保障。Biowulf遵循NIH发布的《数据管理和共享政策》[36],提出数据管理基于FAIR 原则(可查找、可访问、可互操作和可重复使用),规定了共享数据时的隐私保护要求,明确了个人信息去标识化、创建数据共享机制、防止信息泄露滥用等实施建议。ELIXIR遵守欧洲生物信息研究所(European Molecular Biology Laboratory-European Bioinformatics Institute, EMBL-EBI)《关于一般数据的保护》[37]政策,提出对数据的保护和人员的监管、数据内外部传输和交互,以及特殊数据的处理要求,设立了数据保护专职岗位,并成立了数据保护委员会,监督政策执行情况。

近两年,我国《数据安全法》《个人信息保护法》相继出台,规定了国家对个人、组织相关数据权益的保护要求[38];国家网信办、工信部也相继印发《网络数据安全管理条例(征求意见稿)》[39]《工业和信息化领域数据安全管理办法(试行)》[40],提出了个人、组织在网络空间合法权益的保障要求及实施方案。当前,我国生物医学高性能计算平台仍主要强调数据访问和使用的安全要求,如中国医学科学院、四川大学华西医院等机构发布的数据管理办法[41],对数据的存储及维护、申请和审批、导出和使用做出了规定,但尚未明确个人信息、隐私数据的安全管理措施。

生物医学数据不可避免涉及一些患者的隐私信息,因此,对数据进行深度挖掘与整合分析时,需确保数据的安全性和保密性,避免数据泄露、数据窃取、数据丢失等安全问题发生。2016年,欧盟发布《通用数据保护条例》(General Data Protection Regulation,GDPR)[42],为欧洲生物医学高性能计算平台用户数据的隐私保护提供了参考借鉴。目前,我国尚未明确出台针对生物医学领域高性能计算数据的监督管理办法,相关计算平台在紧跟国家政策法规要求的同时,也在逐步探索适用于实际应用环境的、体系化的数据安全监管机制。

2 我国生物医学领域高性能计算发展面临的挑战

在生物医学科技创新、海量数据分析挖掘、国家相关政策扶持等需求和背景下,我国生物医学领域高性能计算迎来新一轮的发展机遇,但也面临着诸多挑战。

2.1 高性能计算资源供给与需求不均衡

基于有限的计算能力,满足生物医学领域日益增长的计算需求,成为机构高性能计算平台亟待解决的问题。高性能计算平台能够为科学研究、技术研发、应用支持提供有效的计算资源[43],但其建设运营也面临各种问题。首先,建设费用高,流程复杂,部署周期长。如四川大学华西医院、中国医学科学院高性能集群建设花费分别超过6,000 万元[44]、3,470 万元[45],涉及复杂的建设内容和建设流程,且多数项目需要数月甚至长达一年的建设周期。其次,AI 技术迅猛发展,计算需求快速增长。2022 年11 月,AI模型ChatGPT发布,引发广泛关注。ChatGPT基础架构GPT-3.5 的参数量大约为1,750 亿,计算使用超28.5 万个CPU 和与1 万余个GPU[46]。2023 年3 月,OpenAI 公司推出大模型/大型语言模型的GPT-4[47],对AI算力支撑提出了更高的需求。再者,计算芯片加速更新换代,性能优越但价格高昂。英伟达(NVIDIA)于2017、2020、2022 年陆续发布用于AI 模型训练和推理的V100 GPU、A100 GPU、H100 GPU 芯片,相较于上一代产品,H100 GPU可以将大型语言模型的计算速度提高30倍[48],截至2023年6月,A100和H100 GPU 芯片单价分别达到15 万元[49]和25 万元[50]。目前,我国生物医学领域尚未实现计算、存储、网络、安全等多技术领域均衡发展,部分计算平台存在作业高峰期的持续排队与低谷期的资源闲置的情况[51]。此外,随着服务器性能要求变高,电力等能耗也随之增加[52],还需采取高效的运维方法及可持续的运营机制。因此,亟需对行业内计算资源进行配置优化,提升整体运算效率,实现有限计算能力的高效应用。

2.2 生物医学研究软件研发成效不理想

随着生物医药产业创新体系的迅速发展,作为高性能计算关键环节的应用软件,成为制约发展的重要因素。当前,我国生物医学软件研发经费投入不足,普遍存在重硬件轻软件的情况[53]。例如,我国用于应用软件研发的费用占比不到超算研究经费总额的10%,而美国相应的投入资金约为我国的6倍[54]。其次,我国生物医学软件研发成果不够理想。为推进国产自主应用软件发展,2016年,国家自然科学基金委员会与广东省人民政府联合设立“超级计算科学应用研究专项”,基于“天河二号”超级计算机及应用平台,自主研发涵盖生命医学等8大学科应用软件[55],结果显示,生命医学类软件研发成果量占比4%,仅高于管理类软件。再者,我国生物医学研发技术积累不足,基础相对薄弱,尚未建成生态圈。国家基因组科学数据中心BioCode 收录的软件工具统计结果显示[56],研发数量最高的15家高校与机构中,有14家来自美国和英国,我国仅有清华大学一所高校入围。因此,亟需提升我国生物医学软件自主研发能力,增加国产化软件数量,通过实现相关软件的自主可控,解决核心软件工具高度依赖进口、重要数据存在安全隐患等问题,最大程度保护重要研究成果安全。

2.3 高性能计算专业技术人才储备不足

生物医学领域的高性能计算人才短缺,难以支撑快速增长的应用服务需求。高性能计算具有多学科交叉的特点,面临人才培养难度大、培养周期长、学科人才和资源发展不均衡等问题。美国斯坦福大学[57]、加拿大皇后大学[58]、德国慕尼黑工业大学[59]、英国帝国理工学院[60]等国外高校相继设立生物医学计算专业,旨在培养具备交叉学科背景与技术实践能力、能够解决生物医学大数据建模与挖掘问题的专业人才。当前,我国生物医学领域亟需具备生物医学、并行计算、社会科学等相关素养的复合型人才。例如,研究人员不仅需要掌握基因测序、蛋白质结构预测理论知识,还应熟悉基础的数学计算模型、数值模拟方法等[59],需要具备交叉学科的知识背景和应用能力。同时,我国高校相关人才培养计划和教学课程设置也存在与发展需求不适应、与实践能力不匹配、缺乏高性能计算教育资源等矛盾[61]。国内高校由于条件限制,计算资源多用于科研支撑,未对学生开设高性能计算基础课程,提供真实的运算环境,导致高层次人才匮乏[62]。因此,利用高性能计算技术解决生物医学领域研究与应用问题的同时,还需解决生物医学高性能计算人才培养的问题。

2.4 生物医学计算数据共享仍存在难度

现阶段,我国仍缺乏针对生物医学高性能计算行之有效的数据监管制度,数据所有者对数据安全风险存在顾虑,数据共享使用难度较大。生物医学数据种类繁多,包含组学数据、病历数据、影像数据、药物数据等多种类型[63],广泛应用于临床疾病诊治、医学药物研究和政策制定管理,具有较高的研究、商业和社会价值[64]。就安全管理而言,生物医学数据仍存在保障机制不完善、没有专业的法律法规、数据安全治理不到位、安全技术方案待加强等问题[65]。此外,缺乏激励及确权机制,也不利于生物医学数据的共享和使用。例如,数据权属不清会直接影响数据的流通,可能损害数据所有者的合法权益;数据所有者若无研究或使用需求,也会缺乏数据共享的源动力[66]。不仅如此,相较于其他领域数据,生物医学数据还具有高敏感性、高价值性等特征,数据分析计算过程中,可能存在信息安全隐患、个人隐私泄露、冲击社会公信等安全风险[67],随着技术的发展,数据安全不可控因素将与日俱增。因此,亟需加强生物医学数据共享与合规利用,完善个人信息等敏感数据保护措施,不断提升高性能计算数据监管保障能力。

3 我国生物医学领域高性能计算发展建议

基于上述分析,我国生物医学领域高性能计算发展过程中,仍面临着计算资源供需不均衡、核心软件依赖国外、复合研究人才不足、数据监管机制不健全等问题。因此,围绕资源、技术、人员和标准,建议从以下4 个方面加强生物医学领域高性能计算发展。

3.1 加快推动生物医学领域算网融合发展

积极整合生物医学领域分布各地的高性能计算和网络资源,实现资源的灵活调度、网络的高速互通、服务的配置优化,满足复杂应用场景下不同用户的数据计算需求。一是汇聚跨地域多种生物医学算力资源,加强不同机构间合作,促进计算资源共享,形成广泛的算力协同,支持数据资源的高效流通,降低算力建设成本,缩短研发周期。二是建成全国一体化的生物医学算力网络,建设全光互联的算力网络,实现对高性能计算集群的广泛覆盖,大幅提升行业算力枢纽之间的数据传输效率,为跨区域业务算力的灵活调度提供有效支撑。三是重视不同类型生物医学算力构建,包括通用算力、高性能算力、AI智能算力等,以应用需求为导向,基于生物医学数据多种计算场景,在现有高性能计算资源的基础上,考虑算力资源的管理、调度、分配等,做到智能化、灵活化的供给,避免计算资源闲置浪费,提高资源使用效率,降低运行维护成本。

3.2 鼓励支持生物医学计算软件研发创新

大力支持生物医学高性能计算软件技术研发创新,努力扶持基础性、前瞻性、突破性的生物医学软件开发项目,创建优质的软件开发环境,积极探索国产软件研发的新技术、新思路和新方法。一是鼓励科技创新,增加研发投入,加强政策落实。北京[68]、杭州[69]、深圳[70]等市已相继出台了鼓励基础软件、工业软件等重点领域科技攻关的补助政策,还需积极推进政策执行,开展效果评估,及时发现问题,确保软件研发达到预期效果。二是明确绩效考核激励制度,充分调动研发人员积极性。通过软件成本度量体系[71],保护机构与个人知识产权,激发研发人员创新活力和潜力,提升软件研发效率和质量,增强软件整体研发能力。三是加强生物医学软件工具应用服务及研发环境建设。集合软硬件、设计工具、编译程序、测试数据、文档资料等资源,实现软件开发、联调、测试、验收等各阶段的基础环境保障,积极推进生物医学计算应用软件的国产化替代,加速生物医学领域高性能计算软件产业发展。

3.3 着力加强生物医学研究复合人才培养

加强关注基础医学、生物信息学、应用数学、人工智能等交叉学科背景的高性能计算人才的培养,向生物医学领域研究人员普及高性能计算基础知识,提升其研发和应用能力。一是鼓励高校开设生物医学计算相关专业,在生物医学基础课程体系基础上,合理增加计算数学、应用数学、高性能计算相关课程,积极开展复合型人才培养。二是为高校提供计算教育资源的支持,加大经费投入,通过自建高性能计算资源,以及与共有云平台开展合作等方式,提供能够满足学生实践与应用需求的教学环境。三是积极推动生物医学高性能计算人才交流,积极拓展视野,丰富知识结构,增强技术能力。并通过大赛方式提升高性能计算教育水平,培养具备创新意识、创新想法、创新能力的实践性人才,满足生物医学领域的高性能计算创新研发和应用需求。

3.4 不断推进高性能计算国家行业标准建设

不断推进生物医学高性能计算标准体系建设,加快制定相关标准规范,提供科学化、规范化、系统化方案,保障计算服务安全有序进行。一是建设生物医学领域标准化组织和联盟,促进行业内高性能计算的标准统一、资源共享、优势互补。从技术、运行、应用等方面创建规范性指南,发挥标准规范的指导作用,推动生物医学高性能计算技术标准、系统架构、应用示范发展。二是健全数据权益保护机制,明确生物医学高性能计算数据安全监管职责。通过制定机构高性能计算平台管理办法,规范数据管理流程,清晰数据权责划分,关注个人隐私数据保护,促进数据安全共享与合规利用。三是提升平台与数据安全技术保障能力,基于网络与数据安全法律法规,结合网络安全等级保护2.0要求,通过采取技术隔离手段、划分不同网络区域、提供关键设备冗余、保证通信线路畅通等方式,完善主动免疫防护体系和安全可信计算环境,实现运算过程可测可控,提升数据安全保障能力。

4 结 语

生物医学数据指数级增长以及国家政策的大力支持,带来了数据汇交整合、归档存储、挖掘分析和应用共享等大量计算需求,有效推动了生物医学领域高性能计算的快速发展。本文通过分析国内外生物医学领域高性能计算平台发展现状,发现我国生物医学领域高性能计算发展中存在的问题,明确现阶段生物医学高性能计算发展面临的挑战,并针对性提出推进算网融合发展、鼓励软件研发创新、培养复合型人才、加强标准规范建设等发展建议,以推动生物医学与信息技术的深度融合,满足生物医学数据分析挖掘、模拟计算等需求,有效支撑新技术的研发、应用与服务。

利益冲突声明

所有作者声明不存在利益冲突关系。

猜你喜欢
计算资源生物医学算力
基于网络5.0的重叠网形态算力网络
卫星通信在算力网络中的应用研究
刍议“生物医学作为文化”的研究进路——兼论《作为文化的生物医学》
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
灵长类生物医学前沿探索中的伦理思考
基于SiteAI算力终端的交通态势感知系统
基于模糊规划理论的云计算资源调度研究
改进快速稀疏算法的云计算资源负载均衡
国外生物医学文献获取的技术工具:述评与启示
基于Wi-Fi与Web的云计算资源调度算法研究