值得一提的是,与传统IT“先停机,再维护”的方式不同,ftServer平台的CRU支持热插拔,无需关闭平台或使用特殊工具。更换CRU后,系统会自动重新同步数据,这使ftServer成为远程制造场所或IT资源有限场所部署的理想选择。
最近在与某国内知名IT运维厂商负责人交流时,他谈到,随着企业智能化进程的推进,越来越多的智能化设备和系统的部署,导致企业IT系统越来越复杂,对IT运维人员的能力提出了更高的要求。
在很多企业,IT运维人员的日常工作重复且繁琐,比如系统更新、故障排查、数据备份,这些看似简单的工作却像一座座大山压在他们的肩上,救火式的故障处理方式让IT运维人员疲惫不堪。
因此,面对日趋复杂的IT系统,企业开始选用更加智能的IT运维平台来管理企业的系统和设备。但企业仍然面临挑战,很多企业虽然部署了智能化IT运维平台,在出现问题时能快速定位和处理故障,用最短的时间恢复系统,但终究无法从根本上消除故障,并彻底杜绝宕机的发生。
这位负责人说,尤其在制造企业,很多信息化或智能制造部门负责人,面对日趋智能化的工业系统,开始提出永不宕机的需求,意思是指系统或设备可以持续运行没有停机时间。这对企业持续推进智能制造升级至关重要。
特别对于流程工业企业,如果出现非计划系统停机,可能导致重大事故的发生,甚至对人员的生命安全构成威胁。因此,很多企业除了部署智能化IT运维平台,降低IT运维人员的压力外,还希望从硬件着手提升服务器的容错能力和可用性,通过软硬一体优化实现可靠性和可用性的双重提升。
实际上,Stratus作为全球领先的提供高可用且容错的计算平台服务商,以其独具特色的全双工硬件的单一系统设计和主动服务架构,能帮助企业在数据中心和边缘位置安全地远程运行关键任务应用,免受停机困扰,并将这些数据转化为可执行的情报。
在传统IT架构模式下,为实现永不宕机,企业就需要投入大量资本和人力资源,并且要进行持续的监测和更新。但Stratus的技术专家从两方面着手解决了传统IT架构所面临的问题,实现系统永远在线。
一方面是通过冗余设计为硬件增加可靠性,并构建故障快速迁移和恢复运行机制,实现业务不间断无缝切换;另一方面,通过开发配套软件,做好系统状态的实时监测,提前预警,在故障发生前进行风险的预防处理。
以Stratus ftServer容错服务器为例,在硬件设计上,服务器内部采用了两个相同的客户可更换单元(CRU)组成,每个单元都有自己的处理器、内存、存储和电源。所有冗余组件和子系统作为一个整体打包为单个系统。这种硬件架构设计的优势是,即使其中一个节点出现问题也不会影响整个系统的正常运行。此外,这种方法对应用程序完全透明,因此不需要部署开发开销,可大幅简化管理,并允许平台在运行时得到服务和维护,而无需中断或停机。
另一方面,为强化平台对潜在系统风险的掌控,ftServer还提供自动化的自监控、警报、自诊断和补救功能。
通过Stratus ActiveService"Network(ASN)或通过组织的现有监控方法发送的平台运行状况信息可在潜在问题发生之前提醒用户,防患于未然。
值得一提的是,与传统IT“先停机,再维护”的方式不同,ftServer平台的CRU支持热插拔,无需关闭平台或使用特殊工具。更换CRU后,系统会自动重新同步数据,这使ftServer成为远程制造场所或IT资源有限场所部署的理想选择。
作为长期从事工业数字化转型的人员,对工业自动化系统的可用性和安全性追求是无止境且近乎苛刻的。经过40多年的不断探索实践和创新研究,Stratus对如何解决工业级系统安全和非计划宕机问题也是专业的,Stratus容错服务器产品在多年的行业应用实践中广受考验,其可用性能达到99.9999%以上,已经成为工业企业核心系统的重要承载平台,为中国智能制造转型升级保驾护航。
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。