中新经纬7月3日电 题:企业实施云边架构上云面临哪些问题?


(资料图片仅供参考)

作者 李向辉 腾讯云分布式云负责人

“十四五规划和2035年远景目标纲要”指出,要协同发展云服务与边缘计算服务。近年来,技术的升级使得云边协同向云边端一体化协同演进,驱动计算处理向边端扩散,推动算力多层级、泛在化发展,同时与网络、数据、AI深度融合,构建企业新型IT基础设施“操作系统”,支撑企业进行数字化转型势在必行。因为用户实施云边架构面临着一些问题和核心挑战。

首先是位置的分散性。各行各业都有中心云的服务;其次是场景的多样性,现在有些场景基于IDC(互联网数据中心)部署稳态业务,希望云厂商能够提供弹性资源。工业场景有中心工厂和各地分布在全球或者各个地域的工厂,需要通过中心管控解决各个工厂和生产车间中的IT设备交付和运维。例如车联网企业在做自动驾驶的时候需要将业务发送在边缘车机,通过5G联网在断网的情况下可以保证服务完全稳定运行。

但在这种情况下,中心云IDC甚至边缘场景的能力是不一样的。中心云的弹性能力怎么在IDC使用,边缘的情况下怎么自治,如何应用同样的IDC PaaS(平台即服务)服务治理能力,都是亟待解决的问题。

用户实施云服务的时候往往会建立许多集群。但云服务给客户提供的集群中包括上层应用治理、弹性调度和分布、利用率的提升都需要客户解决。因此,用户希望被提供一种Serverless(无服务器)服务,但建立这样的集群,IDC同样需要建立K8S(编排容器的工具)独立集群。多个集群需要同样的权限管理、应用分发,而且要把不同能力进行对接,用户需要负责K8S版本升级、节点运维等等。那么,资源异构形态的多样就会导致集群形态管理非常复杂,无法实现统一管理,即便通过S集群把这些资源进行统一屏蔽,也无法真正实现客户视角的一朵云统一调度和管理。正常情况下,K8S调度是基于Request(计算机用语),因此,无法做到基于实时负载而进行感知和调度。也无法解决不同优先级的节点以及边缘自治的能力,边缘网络断开等问题。

众所周知,Serverless是基于运维流量触发,IT运行成本是有预算机制的,但经常出现因为业务流量弹性伸缩导致的成本不可控。只有独创的超级节点,提出独特资源包的概念,在这样的资源付费的规格情况下才可以选择云上的任意规格,把预算体系和运维体系进行打通。

业务部门利用AI模型训练为了提升最大性能,需要基于不同GPU型号和数量进行模型调优。但是会出现每个卡和模型都要进行部署和发布,而完成一次部署和发展甚至需要两三周的时间。通过注册节点,所有GPU资源看到的将会是统一卡号、统一资源型号,不需要用户再去针对不同的机型、不同的卡数进行调优,进行部署发布确认,极大地简化部署发布的效率。

总之,云原生分布解决云边架构,整体上还是通过云原生分布式真正实现屏蔽资源、承接应用,就是通过三项核心能力:通过TKE集群实现任意位置、任意形态的统一管理;通过数据服务实现云服务一体机的延伸,把最新特性交付到用户IDC和现场;通过一站式的运维管理中心管理用户应用,让用户真正实现任意基础设施享受云厂商服务的生态。(中新经纬APP)

本文由中新经纬研究院选编,因选编产生的作品中新经纬版权所有,未经书面授权,任何单位及个人不得转载、摘编或以其它方式使用。选编内容涉及的观点仅代表原作者,不代表中新经纬观点。

责任编辑:孙庆阳 实习生 饶奎

推荐内容