集群操作系统的定义是指一种由多台电脑通过软件互相连接计算机组成的并行或分布式系统,并可以作为单独、统一的计算资源来使用。比如符合分散、failover,eg,Veritas Cluster Server等系统。
集群的关键技术分为四个层次:网络层、节点机及操作系统层、集群系统管理层、应用层。
以上四个层次技术有机结合,所有的相关技术虽然解决的问题不同,但都有其不可或缺的重要性。集群系统管理层是集群系统所特有的功能与技术的体现。在未来按需(On Demand)计算的时代,每个集群都应成为业务网格中的一个节点,所以自治性(自我保护、自我配置、自我优化、自我治疗)也将成为集群的一个重要特征。自治性的实现,各种应用的开发与运行,大部分直接依赖于集群的系统管理层,并且,系统管理层的完善程度,决定着集群系统的易用性、稳定性、可扩展性等诸多关键参数。正是集群管理系统将多台机器组织起来,使之可以被称为"集群"。
一般来说,集群是指一组高性能计算机通过高速网络连接起来的,在工作中像一个统一的资源,所有节点使用单一界面的计算系统。集群技术的出现,使得使用多台PC或工作站就可获得同大型机相匹敌的计算能力,同时成本大大降低,从而在很多高性能计算领域内由集群完全取代大型机也将成为可能。
广义上的集群的节点可以是任意类型的计算机,包括PC机、工作站、SMP等等,甚至是大型机。Linux集群是指一类以PC架构计算机为集群节点,以某一版本Linux操作系统为集群节点操作系统的集群。由于Linux本身具有开放源码、稳定、支持PC架构等诸多优势,以及操作系统及节点机价格的因素,Linux集群技术被认为是最具发展潜力的集群技术。