在刚刚结束的2022云栖大会龙蜥操作系统峰会上,龙蜥技术委员会主席,阿里云操作系统技术总监杨勇做了《下一代操作系统展望》的主题演讲,以下为演讲实录。
大家上午好!今天由我来汇报一下龙蜥操作系统的未来展望。整体内容将分为社区发展近况、技术布局和研发进展、下一步演进和展望共三部分。
谋定全局发展 升级下一代操作系统原生社区
先介绍一下社区发展近况。龙蜥社区成立之初,就坚持要有一个比较体系化的完整布局。正如图中所示,在国际开源生态的上中下游,形成一个体系化的协同。
首先,在国际上游项目中,社区一直坚持着对开源创新的技术引领。例如,我们近期做的一些云原生存储的工作,已经在 Linux 社区形成了一个事实标准。再如,我们对云上 DPU 硬件的支持,围绕 DPU 的两种网络接口协议接口,RDMA 和 VIRTIO,做出了自己的新型协议站 (SMC-R) 和新的协议规范 (VIRTIO 1.2),其中一部分产出已经被国际社区接受成为下一代标准。
其次,社区的 21 家理事单位和近 250 家合作伙伴,正在通过社区形成操作系统产业的协同分工,并通过社区产品演进迭代的方式,支撑了下游各个厂商的商业模式。通过打造产品生态的方式,把上下游合作联动起来。例如,龙蜥操作系统目前有社区板、商业衍生版和企业定制版,通过共同形成的这样一个社区产品矩阵,能够满足多样化的用户诉求。
提到社区版,这里要重点强调的是,除社区当前的主流版本 Anolis OS 8,我们已经发布了下一代操作系统 Anolis OS 23 的公测版本,计划将于 2023 年发布正式版本。
正是因为有下一代操作系统的规划,我们在过去的一年里,完成了从面向产品研发,到面向原生社区协同,围绕下一代操作系统社区协同研发布局的转变,这个转变有三个方面:
首先,从用户视角看,我们一开始面对的是 CentOS 停服对用户的冲击,抓住了这一机遇,迅速扩大了社区用户体量。与此同时,我们也找到了志同道合的合作伙伴,有更多的厂商加入社区。但我们从未止步于此,我们进一步思考整个计算产业的未来,明确提出了社区长期的使命,把解决企业上云的问题,作为社区进步的重要驱动力,帮助企业更好的迁移上云,用好云。
其次,从产品视角看,我们持续在思考两个问题,一个问题是:龙蜥社区当前打造了一个传统的经典 Linux 发行版,在未来,如何凭借云原生技术,进一步迭代为更好的产品形态?另一个问题是:如何继续引领业界的创新?值得一提的是,龙蜥社区技术委员会,近期公布了下一代操作系统路线图,同时首次发布了ACNS(Anolis Cloud Native Suite)的云原生产品套件。此外,在 CVE 安全漏洞管理的能力上,在坚持政策合规的同时,也在国际上有了进一步的合作和互动。
最后,从社区开发者视角看,我们在持续思考,如何通过分层分类技术路线,去做好操作系统的选型,以及整个开源供应链的构建。龙蜥社区不仅仅是开发者平台,更是一个产品协同平台,这是一个非常庞大且复杂的体系。因此,我们将围绕下一代操作系统升级社区基础设施能力。
基于此,社区技术委员会发布了社区未来三年的产品版本蓝图。
首先,龙蜥操作系统每两年会有一个社区的主版本,每四年会从主版本选择一个作为 LTS 版本,用来做好社区的上下游产品的支撑。在这次发布里,围绕着社区版产品的三年规划,社区下游的衍生版规划正在逐步完善和披露。以社区理事单位统信软件,阿里云的产品为例,它们依托社区的三年规划,也各自发布了下游衍生版本的规划,包括了当前主版本和下一代版本。
其次,我们在技术治理方面推进“技术商业化三步走”的策略。
第一,依托龙蜥社区版本打造一个社区创新技术入口,基于分层分类的技术路线,推动实现社区协同研发。
第二,通过社区这个平台,促进创新技术特性完成孵化,走向成熟,然后将这些技术移植到主流版本。
第三,通过社区产品的规模化使用,让创新技术达到商业化标准,合并到伙伴的商业版本。比如前面提到云原生存储特性,和云原生网络相关特性,我们不但在上游有标准,而且在国内其它互联网公司也有规模化应用。
技术升级 八大技术方向
接下来,讲一下社区下一代操作系统的布局和研发进展。社区今天拥有 49 个 SIG,上百位 Maintainer,上千名开发者。在此规模下,社区如何做到高效的创新和产品的集成交付?实际上,我们明确聚焦了八大技术方向,如上图所示,我们称之为“三横五纵”。
“三横”包括两北一南。北向是经典的操作系统和云原生的两大场景,且今天这两个场景都有着丰富的生态;南向的场景,更多聚焦于硬件生态,我们希望在一个多芯片、多数据中心的未来,能有一个非常好的产品,去容纳这种多样化,并且能够给用户云上云下一致性的体验。
“五纵”的话,更多是覆盖全栈的工作,包括安全可信、编程语言、软硬协同、运维与性能、社区基础设施。比如,前面提到的云原生 DPU 的工作,就需要软硬协同的系统设计:从 DPU 内部遵循的协议规范,再到 DPU 之上运行操作系统软件栈,再到协议应用软件的运行,就是典型的软硬协同创新。
大家可以在《2022龙蜥社区全景白皮书》(关注龙蜥公众号回复关键字“白皮书”获取查看)中看到关于社区八大技术的详细介绍。我们认为未来社区的竞争力就聚焦在这八大方向上,不管是龙蜥操作系统产品的发布,还是社区产品需求管理的需求池,都会围绕这八大技术方向进行组织。由此,龙蜥社区将聚焦八大技术方向,收获更多技术影响力,更丰富的开源产品矩阵、更多外部产业合作、更丰富的硬件生态。
接下来,我们进入下一代操作系统——Anolis OS 23 的话题。在未来技术趋势方面,社区主要是围绕着下一代数据中心的技术趋势、下一代的云原生软件栈的需求、以及软硬协同的技术发展趋势展开。在产品定位方面,社区不但要考虑产业合规性,更要考虑到技术的领先性。我们可以看到,云计算头部厂商都已经发布了下一代操作系统,业内面向下一代数据中心的新技术也在不断涌现。社区的技术路线一定是要具有前瞻性,面向未来的 3-5 年去看,其中非常重要的一点,就是做好开源软件供应链的合规。
接下来我们介绍一下 Anolis OS 23 的产品主特性。首先,是双内核架构,5.10 默认内核和 6.x 创新内核。其中,5.10 内核,是支持下一代数据中心芯片的产品化内核。6.X 内核,是目前技术委员会与社区理事单位未来研发的重点,正在持续的滚动选型中。其次,是面向芯片优化的工具链,面向芯片的工具链优化,是系统性能提升的关键。再次,面向场景优化的周边方案和特性,共同围绕 Anolis OS 23 组成了周边产品矩阵。例如,这里的云原生套件 ACNS 和已经发布的 SiliconFastOS;除此之外,还包括安全可信、软硬协同设计、只读存储和容器存储等。
最后,重点介绍一下龙蜥云原生套件 ACNS。在未来的云原生场景里,充分考虑用户需要什么样的软件栈的情况下,ACNS 的设计起点还是比较高的。例如,云原生套件里面的ACK-D 是 Kubernetes 发行版。此外,龙蜥社区在上游贡献 Kata 3.0,贡献成为了社区的事实标准,并成为龙蜥的最佳实践;还有云原生存储,我们在 Linux 5.19 内核里实现了 EROFS 的主特性,并且已经在社区 5.10、4.19 内核里面都可以支持,配合该主特性,加上 CNCF Nydus 项目,形成一个完整的云原生存储加速方案,并在其它互联网公司也开始实际应用;此外,套件里还包括有镜像分发,面向容器场景优化操作系统 LifseaOS,降低了数据中心的成本,这个技术已经开始惠及到了下游企业市场,形成了企业应用的案例。
未来技术演进与展望
我们不妨设想一下,如果龙蜥云原生套件加上 Anolis OS 23,共同构成未来软件栈的一个演进起点,那么龙蜥社区未来的技术演进会是什么样子?
这里我们简单谈一下,未来可能的技术演进方向。在云-边-端的场景里,业界面临的是整个硬件生态碎片化的局面,这里面的异构计算都是多样化的。操作系统如何在云场景下做好多样化支持的同时,还能向上给应用开发者一个一致性的体验,这是龙蜥操作系统未来 3-5 年奋斗的目标。我们也看到,不论在此刻的云栖大会上,还是彼时的计算业界,应用云原生 Serverless 化是未来的趋势,龙蜥操作系统要服务好这样的场景。
今天,硬件的发展已经进入到一个所谓的“后摩尔时代”,虽然芯片的制程技术还在继续发展(1 纳米),但是整体发展速度在放缓。这对今天的数据中心,带来一个比较大的挑战,也会促使数据中心诞生一些比较新的技术。例如,异构算力的发展、特别是 DPU 技术或者叫 XPU 的发展,以及智能硬件的发展,这些硬件里面,都可能运行一个更小的操作系统,再依托系统的数据,利用资源管理和调度技术,进一步降低数据中心的计算成本。此外,物理资源池化的相关技术,可以不断提升计算密度和可靠性,甚至打破现有物理机的边界。总之,后摩尔时代,我们站在操作系统立场,需要充分考虑智能硬件、资源池化、数据安全和隐私计算,软硬件全栈协同设计与优化等多重发展方向和机会。
最后,演讲结束前预告一下:龙蜥社区马上会成立加速器 SIG,我们会发布加速器方案,希望未来 3 年,我们在这些软硬协同的技术领域有更多的透出。
谢谢大家!(完)
本文为阿里云原创内容,未经允许不得转载。