最近总有人在后台私信问LAXCUS分布式操作系统由来的各种问题,这里拿当时发在CCF的一段回答一下吧。当时的LAXCUS分布式操作系统,如果对比Windows的发展路径,还处于Windows 2.x Windows 3.x的时候,主要是验证分布式环境下各种基础技术问题,比如不稳定物理环境下的系统松耦合架构稳定可靠运行问题,以及分布式编程接口、分布式指令、分布式Shell,还有Linux操作系统兼容的各种问题,下一步,是发展成独立运行在各种硬件设备上的真正的分布式操作系统,把海量的计算机组成一个巨大的算力矩阵,对接人工智能、大数据、科学计算,更好服务云计算、工业互联网、物联网等大算力应用场景。
下面是当时发在CCF上的文字。
过去八年,我们设计开发了 Laxcus分布式操作系统。在设计这套产品时,市场上已经存在着各种分布式存储和计算软件,但是却没有一家能够提供一套功能完整、适合全行业使用的分布式存储和计算的解决方案,这是我们设计这套系统的初衷。更重要的原因是,随着以网络为核心的各种新兴产业的快速发展,数据的存储和计算规模越来越大,越来越趋向多样化,导致数据处理越来越缓慢和复杂。如何解决这个问题,在保证效能的前提下,改变大数据应用现状?针对软硬件的性能特点,通过架构功能一体化设计,进行功能内聚,减少调用层次和处理流程,来提高数据处理效率,以及改进人机界面,来降低开发和运维难度,无疑是一个很好的解决思路。但是这个方案也因为体系化和集成化的缘故,涉及大量基础学科和技术领域,在当时技术条件下,如何设计好这种级别的大型软件,管理规模庞大的计算机集群,并保证系统和其上的分布式应用软件稳定可靠运行方面,有着太多不确定因素,面临着巨大的研发风险。这些风险归纳起来,主要包括以下一些方面:
1.现有条件下,对软硬件基础设施和运营成本的综合考量。
2.分布环境里,系统稳定性和可靠性的问题。
3.数据业务和处理规模可扩展性、可承载能力、适用性的问题。
4.软硬件冗余容错和处理的问题。
5.系统安全的问题。
6.人机接口的设计,包括分布式应用软件的开发、管理、处理流程的问题。。
7.软硬件相互结合和兼容的问题。
8.各个子系统内联整合和技术指标平衡的问题。
此后八年时间里,通过我们持续的研发和系统升级,上述问题已经全部解决,目前Laxcus分布式操作系统的主要特征是:
1. 硬件基础设备定位于PC、移动架构平台,来减少用户采购、运营费用。
2. 系统总体设计成松耦合架构,在此框架下实现多集群、多用户、多任务,和数据业务的可定制、可扩展。
3. 全栈引入虚拟化技术,实现资源复用,降低管理使用成本。
4. 网络通信采用二进制协议和多通道乱序处理,提高数据传输效率。
5. 引入自适应机制和智能感知技术,使集群具备自组织管理和容错处理能力,降低运维成本,努力实现7*24小时无人值守。
6. 依托多集群并行和弱中心化管理,支持从一个集群到数百个集群,从数个CPU到数百万个CPU之间的任务调度,来实现超大规模、可伸缩的分布式存储和计算。
7. 数据底层采用混合存储方案,满足即时存取需要,支持OLTP和OLAP两种业务。
8. 数据处理融入SQL思想,兼容数据库,满足高并发和高可靠性两种需求。
9. 索引矩阵融合分区、图、键值等多种技术,实现网络数据的精准定位和快速检索。
10. 多种全新设计的分布算法,保证数据处理过程的简捷高效。
11. 分布式应用采取组件编程方案,结合应用容器管理,减少应用开发和维护的难度。
12. 导入微服务,将更多工作分散到运行过程中执行,包括用户业务和系统业务。
13. 体系化安全策略,将安全管理纳入系统运行的每一个环节。
14. 从软硬件两方面整合和强化系统的异构计算能力,使数据处理范围更加丰富灵活高效,尤其是计算密集型业务,例如人工智能 。
15. 使用类自然语句命令操纵集群,覆盖全部数据处理和管理工作。
16. 支持全球字符集,满足不同国家地区的用户语言使用习惯。
Laxcus分布式操作系统目前以寄居架构运行在Linux/Windows平台上,支持X86、Arm、PowerPC、Nvidia 芯片。以下将以3.x版本为基础,结合之前版本,来介绍Laxcus分布式操作系统主要的设计、技术、实现,以及产品发展过程。
如果详细了解和更多讨论,请扫描进入“Laxcus分布式操作系统”客户群





