暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

『中国信通院』李昂:算力时代背景下的分布式云发展观察与思考

239

2022

全球分布式云大会

- 深 圳 站 -


2022全球分布式云大会·深圳站于12月21日正式召开,全球分布式云联盟携手阿里云、腾讯云、华为云、天翼云、浪潮云等联盟成员,共同打造属于分布式云计算的年终科技盛典,深度总结分布式云计算发展至今取得的科技实践成果,立足深圳、辐射华南、影响全国,以分布式云计算筑牢数字化转型的基石底座,擘画数字化深水区新商业版图!


在12月21日上午举办的“分布式主题报告会”上,中国信通院云计算与大数据研究所分布式云业务负责人 李昂发表了题为《算力时代背景下的分布式云发展观察与思考》的精彩演讲,本文为演讲内容文字实录。



算力时代背景下的分布式算力


2月17日,“东数西算”正式启动,再次将算力基础设施发展推向新高地,京津冀、长三角、粤港澳大湾区、成渝等地启动建设全国一体化算力网络国家枢纽节点,至此“东数西算”8大算力枢纽和10个集群全部落地。


算力经济是全球战略竞争的焦点领域。整体而言,我国算力基础设施规模已位居世界前列,但人均算力尚低;算力需求逐步释放的同时,算力服务的广度和深度仍远远不够,应用场景落地推广难度较大。2020 年我国算力总规模达到 135 EFlops,全球占比约为 31%,保持 55%的高位增长,高于全球增速约 16 个百分点。但是,我国人均算力水平较低,算力服务赋能产业应用的水平有待提高,推动算力服务全面升级和产业数字化转型,利用算力网络形成算力、网络、人工智能、区块链等多要素融合的一体化服务,推动算力经济供给侧改革,激发算力服务的范式创新是当务之急。


算力服务是支撑算力经济水平提升的关键,如电力包括发电、变电、输电、配电和用电一样,算力的组成包括基础设施、资源转化、算力输出、分配算力和应用算力五大部分。如想充分发挥算力的作用、提升算力经济水平,须充分依托算力服务的能力。云计算作为算力服务转化、输出、分配和应用的最关键的技术,推动算力服务水平向标准化、泛在化、普惠化发展。


5G的规模建设和边缘计算的持续部署,驱动数据处理向边端扩散,算力泛在化已成趋势,距离用户不同范围分布着不同规模的算力,呈现云边端三级架构。分布式算力调度管理通过云边端一体化的资源管理、编排调度、运维优化,形成多层级算力资源的统一纳管、智能调度、全局优化等能力,满足数据对算力随需处理的多样化需求,有效盘活算力服务价值。


随着算力走向泛在化,逐步成为社会基础资源,操作系统定义不再局限于面向计算机硬件资源协调和管理,内涵不断拓展,基于云边端一体化的分布式操作系统对分布式算力进行高效管理、统一调度,将成为算力服务发展的新环节、新业态。



分布式算力调度管理当前仍局限在单一算力服务场景,无法满足大规模算力泛在调度需求。当前各界正积极探索分布式算力调度管理在特定场景下的应用,但全局调度能力较弱,难以满足数据对算力随需处理的需求。在云服务中,算力作为一种IaaS资源被使用与管理,单一的云平台调度范围有限,大规模的分布式云算力管理调度将导致云服务质量下降。


分布式算力调度操作系统筹云边端算力资源、融合AI等数智化能力,成为未来发展新业态。基于云边端智的分布式操作系统通过整合泛在接入、网络管理、云边端协同、统一调度、人工智能等能力,构建云边端协同编排系统、面向应用封装基础设施的资源管理能力,实现对各个算力中心的运行数据进行实时监控,打通跨地域、跨层级的算力资源调度能力,对不同业务的算力需求和算力资源进行合理的匹配,对外可以呈现统一算力服务能力。



多方需求

推动云计算向分布式部署模式演进


云计算发展经历了以资源为中心的1.0时代、以应用为中心的2.0时代,正在向算网融合的3.0时代发展。以算网为中心的云计算3.0时代,以优化算力分配,提升数据流通效率为核心诉求,实现算力和网络资源一体化调度,软硬协同一体化发展。


过去十年是云计算突飞猛进的十年,全球云计算市场规模保持增长态势,我国云计算市场从最初的十几亿增长到现在的千亿规模,云计算政策环境日趋完善,企业上云进程进一步加快,云计算技术不断发展成熟,云计算应用从互联网行业向政务、金融、工业、能源、交通、医疗等传统行业加速渗透。


未来,云计算进入普惠发展期。一是随着数字经济的蓬勃发展,云计算将与各行业深度融合,成为企业数字化转型的平台底座。二是5G、物联网规模化部署落地,边缘云建设需求激增,云边协同成为重要趋势。


随着用户对边缘计算、数据安全合规、行业定制、混合多云部署等方面的需求不断增加,国内外研究机构、标准组织和企业提出分布式云概念,并开展标准化定义。中国信通院在《分布式云发展白皮书(2022)》中进一步明确分布式云标准定义:分布式云是一种将云服务按需部署到不同地理位置,提供统一管理能力的云计算模式。


分布式云与当前云计算概念主要区别在于:摒弃了公有云、私有云、混合云、多云等分类,将地理位置作为考量因素,为用户提供不同位置的云资源统一管理平面和统一云服务使用方式。


分布式云与混合云、边缘计算的区别与联系主要体现在以下三个方面:


分布式云增强混合多云一致性管理能力  混合多云环境往往资源异构,不同云之间技术架构、管理工具、服务类别等不一致,用户使用和管理云服务复杂度较大。分布式云强调将中心云服务按需部署到用户指定的位置环境(例如用户本地、第三方资源池等),通过统一管理平面,实现分布式云节点的统一资源管理、统一使用方式。


分布式云拓展边缘计算能力,实现云边一体化  边缘计算系统往往厂商资源异构、接口不一致等,云边协同面临统一管理、应用部署等挑战。分布式云通过统一技术架构和管理平面,在资源、数据、服务、应用、安全、管理等方面实现云边一体,提供更加全局化的弹性算力服务能力。


分布式云实现云服务统一托管治理,降低用户管理运维成本  用户扩展和维护不同地理位置的云资源池需要耗费大量成本和时间,通过分布式云进行统一管理、运维、更新、治理不同地理位置的云基础设施和服务的软硬件版本,降低用户本地管理运维成本,同时充分借助分布式云服务的创新、稳定、可靠等特性,提升用云体验和效率。



分布式云关键技术



1



分布式云的关键技术能力之一是帮助用户实现按需部署基础设施和云服务,覆盖范围从中心(例如集中式数据中心)、区域(区域数据中心、特定业务位置)、边缘(网络边缘、企业数据中心边缘、业务现场边缘等)等不同地理位置。


广域覆盖 分布式云节点具备从中心、区域、边缘地理位置,技术架构的一致性能最大限度减少用户在管理和使用上的复杂性。


弹性扩展 轻量化的云基础设施部署能力实现网络、系统软件、虚拟化等服务软硬件服务的弹性敏捷扩展。


按需部署 能基于不同环境、不同规格的资源池进行部署,支持中大型数据中心、用户本地机房、业务现场等不同环境部署能力。


独立自治 分布式云节点具备自治能力,在网络连接不稳定、断开状态下,能独立提供服务,保障服务的稳定性,保障业务连续性。



2



云原生以应用为中心,向下屏蔽异构分布式的基础设施,提供统一应用运行环境,最大化提升用云成效。在分布式云基础设施之上,基于容器技术的分布式云应用平台推动应用全面治理和服务按需部署。

统一集群连接管理

弹性敏捷地接入和管理各种计算资源,以云原生标准交付容器化应用和云服务,通过统一的K8s接口和标准,简化跨不同环境的资源和工作负载的管理。


统一应用管理调度

应用管理通过配置分发策略,例如为应用关联分发策略、差异化策略等,将容器应用发布到不同地理位置的不同集群,实现多种应用发布和弹性调度能力。


统一服务流量治理

根据用户业务配置,如地理位置、网络质量、时延、资源使用情况等,实现网络互联互通、服务发现、负载均衡、流量统一管控等,提供低时延高质量的服务,保障服务高可用。


分布式云提供对不同位置云节点全局统一管理能力,打破了地理位置、资源异构带来的云服务规格差异、使用差异以及管理差异,实现分布式云在资源、数据、服务、应用、运维、安全等方面统一视角管理。


统一资源管理

在硬件方面,分布式云服务提供商在不同节点采用统一的物理资源类型和架构,降低用户使用复杂度。


统一数据管理

通过数据存储、迁移、同步等方式,保障分布式云节点数据一致性,提升治理能力。


统一服务管理

通过统一的API、SDK、云控制台等管理云服务,使用统一控制面进行服务的部署、更新等,提升用云效率。


统一运维管理

实现不同节点采用相同的运维体系进行管理,中心、区域、边缘提供一致的运营、监控、可靠性SLA等服务。


统一运营管理

用户账号、计量计费等统一管理。


统一安全管理

分布式云统一安全管理,一方面通过物理基础设施、网络安全、数据面/控制面隔离等实现平台侧安全,另一方面通过主机安全、访问控制、防火墙、态势感知等实现安全服务,保障分布式云一体化安全。



3



分布式云全域调度实在在资源、应用、数据、网络等方面协同调度,提升资源利用率,推动算力向泛在分布式发展。


资源调度 资源编排、弹性伸缩、动态分配、业务资源亲和性


应用调度 部署策略(位置、时延、成本等)、特征抽象、自动迁移


数据调度 数据流动、同步、迁移、备份


网络调度 流量请求调度(位置、时延、网络链路等)、流量切换、路由选择


调度监控 资源监控、调度指标监控、状态监控。



分布式云主要挑战


分布式云通过在不同地理位置部署云服务,提供统一使用和管理能力,降低用户用云复杂度,有效满足混合多云和边缘计算需求,所面临的主要挑战主要分为以下几个个方面:


在基础设施方面,区域、边缘等分布式云节点服务部署能力需要提高,相关稳定性与性能需要进一步测试验证。


在应用平台方面,Kubernetes的多集群统一管理仍不成熟,分布式应用管理仍需要探索原生增强方式。


在云边端协同方面,如何有效实现中心云、边缘云资源统一调度,达到最优体验,目前缺少合理调度模型。


在网络方面,边缘云节点网络环境复杂,如何实现云网边一体化仍有待论证。


在安全方面,区域、边缘云节点的引入拓展安全边界,一体化安全能力尚需补足。


此外,分布式云落地场景仍然有限,在工业、互联网等部分场景得到应用,在更多行业的广泛场景应用仍需要不断探索。同时,如何与用户现有IT基础设施和业务进一步融合,仍然需要有效方案。此外,产业和市场对分布式云的价值和定位仍不清晰,对新的分布式云技术和产品持谨慎的态度,如何验证分布式云价值也需要相关举措。


分布式云尚无在特定行业的场景应用、成熟度模型等标准,导致分布式云技术在具体落地时缺乏标准指引和建设成熟度评估,应用成效缺乏有效参考。



中国信通院围绕分布式云开展研究工作


中国信通院云计算与大数据研究所自2018年起开始探索分布式云领域,携手产业界各方,深入探索云边协同“无人区”,持续发布研究成果、编制行业标准,凝聚产业共识,搭建创新平台,伴随产业共同发展。



中国信通院积极推动构建分布式云服务标准体系,并完成分布式云基础设施、分布式云容器平台、分布式云全局管理、分布式云全域调度标准编制。


未来,分布式云标准体系将围绕核心技术和应用场景开展研制工作,核心技术方面,开展分布式云应用治理、智能运维、数据服务、可观测性、安全等方面标准;应用场景方面,开展政务、金融、工业、视频等行业场景方面标准。





-   媒 体 矩 阵   -

文章转载自亚太CDN产业联盟,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论