新闻是有分量的

探秘K1 Power:如何打造一台坚若磐石的高性能小型(2)

2019-11-15 02:34栏目:新闻

  ·捕获。K1 Power服务器装载了多达16万个故障检查器,可以实时监测系统运行状态。此外,还采用首错数据捕获(FFDC,First Failure Data Capture)的机制,在设计阶段就进行错误模拟,在实际运行阶段进行错误捕获。而发生错误之后,还可以在维护阶段进行错误重现。将所有可能产生的错误提前做到预警、备案和处理。

  ·重试。通过校验与重试设计,让软错误不影响整体系统运行。除了内存或者缓存本身的纠错机制外,K1 Power服务器还设计了重试机制,判断某个故障是不是偶发性的。其中,内存的控制器或指令集的重试机制,是Power服务器特有的。

  ·隔离与修复。在发生故障时,K1 Power服务器可实现细粒度的隔离,如单个CPU核心隔离,逻辑内存块隔离。x86服务器CPU内部某一个区域或某一个功能发生故障时,往往整个CPU就会故障。Power处理器可以将发生故障的核心单独隔离,同时处理器能继续工作,从而实现在线修复/更换。

探秘K1 Power:如何打造一台坚若磐石的高性能小型

  钢铁之躯——高品质工艺,更严苛的标准与测试

  服务器的高可靠性的实现不止依靠系统设计,同样还取决于优秀的制造工艺。K1 Power服务器采用了严格的元器件和部件选型标准,并在极限环境下进行严苛的测试,力求打造高品质平台。从物理层面上,进一步提升系统整体可靠性。

  由于POWER处理器都是高速信号,因此为了保证信号在CPU、内存、I/O以及加速器之间传递的稳定性,K1 Power服务器采用了高达40层的高复杂主板设计,所有与高速信号走线层相邻的平面层都是地平面,保证高速信号良好的完整性。此外,主板也需经过更严苛的板机测试,以保证100%可靠出货。

  在散热方面,K1 Power服务器采用了更高效的散热设计和散热管理。其导热材质选用铟金属片,将导热效率提升了近10倍。而且铟金属片相对于传统x86采用的导热膏来说,导热稳定性更强,保障长期使用。K1 Power服务器散热管理采用了动态分区散热控制技术。这种动态、智能化的散热控制,既提高了散热的利用效率,也保障了CPU等元器件的寿命以及性能稳定。

  K1 Power服务器采用了高标准的检测,生产测试功能覆盖率100%,高端机型测试大项共计660多项,同时测试老化时间达到48小时以上。通过自动化的测试系统,确保每台机器的检测的有效性。基于严苛的测试环境,确保每台服务器都能够在极限电压和动态频率下稳定工作,保证品质达到业界最高水准。

  不惧威胁——自下而上的安全加固,保护业务数据

  在关键业务场景下,系统安全性是至关重要的。K1 Power服务器在系统安全方面也进行了充分的考虑,支持多种国际标准和中国政府认证。与此同时,并不仅仅依赖于操作系统层面的安全性,还会在更底层的技术层面进行加固。

  一个非常具有代表性的举措是,K1 Power服务器所有部件的维护都需要通过认证,新更换的部件在没有认证之前是无法运行的,这样可以有效避免非认证部件导致的可靠性问题,保证整个系统的一致性。

  在操作系统方面,包括浪潮KUX在内的多家本地安全可信操作系统厂商认证了Power服务器平台,并取得了产品兼容性认证证书。另外,通过浪潮具有自主知识产权的操作系统安全加固模块SSR(国家等保三级认证),进一步保障系统安全无虞。

  最后

  不难看出,继承了浪潮K1小型机核心技术积累和自主创新能力,再融合POWER处理器出色计算能力的K1 Power服务器,既立足于实际场景需求,实现更精细化的设计;同时在生产的每一个环节都以高标准、高水准严格要求。这样的服务器平台,无疑能够成为支撑关键业务应用持续稳定运行的可靠基石。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。