当今的数据中心普遍存在电能质量监控问题,而解决这个问题可以节省时间和运营成本。
数据中心停机的代价极其昂贵——可能会造成数十万甚至数百万美元的损失。根据Uptime Institute 的数据,电源问题占数据中心中断的43%。
(相关资料图)
如今,激增的电力需求、不断增加的电力成本以及减少碳足迹的全球倡议推动了对更创新、更有效的方法的需求,以监测数据中心整个电源链的电能质量。因此,对新一代可靠、智能机架配电、监控和控制解决方案的需求从未如此强烈。
电气可靠性和电能质量对于解决停机预防至关重要。什么是电能质量?电能质量是电流的稳定性和可用性。良好的电能质量来自一致的电压、稳定的交流频率和类似于正弦波的平滑波形。
监控和管理数据操作中的电能质量对于高效可靠地运行至关重要。然而,在电能质量方面仍然存在未解决的挑战,包括数据可见性、效率和基础设施的优化以及与现有BMS和DCIM系统的集成。
挑战一:电能质量挑战来自无法查看精细的电能质量数据。
电能质量评估通常在启动阶段或数据中心的重大服务器检修期间作为一次性事件完成。这意味着他们通常不会考虑设施中电能质量问题的持续影响,或者哪些电能质量问题仅仅是由标准操作引起的。
在数据中心内,操作设备由于承载非线性负载而固有地容易出现电能质量问题。这种设备的示例包括开关模式电源装置、变速驱动器、计算机和不间断电源 (UPS)。非线性负载会导致谐波失真,从而导致不需要的电流、电缆过热、振动、设备误跳闸、能量损失和其他设备故障或故障。
缺乏对关键功率指标的可见性会严重限制故障转移计划并提高设备故障率,从而使设施面临停机风险。
挑战二:无法优化效率和基础设施
由于缺乏可用的电能质量指标,围绕优化运营效率和扩展关键任务基础设施的挑战出现了。由于无法有效地最大化空间和使用率,诸如闲置容量和数据中心行业的“电源故障”等问题成为部署高密度IT基础设施的障碍。
为实现部署中的最大使用率和效率铺平道路的相同级别的监控也可用于识别在闲置时消耗大量电力的僵尸服务器,并提供插座问题和过流事件的清晰度。所有这些事件都可能导致代价高昂的停机时间——与传统智能机架PDU解决方案相比,可以通过在机架和插座级别更好地实时、精细地了解电源质量来避免这个问题。
挑战三:电能质量监测缺乏与现有管理工具的集成
尽管当今市场上存在许多智能PDU,但数据中心设施管理人员仍然需要能够帮助他们进一步提高运营正常运行时间和效率的工具和功能。未经检查的电能质量问题带来的风险是真实存在的,Uptime Institute 的统计数据表明停机威胁仍然存在。
不幸的是,当前的智能PDU解决方案都难以与现有的任何建筑管理系统 (BMS) 或数据中心基础设施管理 (DCIM) 架构无缝集成。这在可用的一般监控与数据中心管理人员运营其设施所依赖的工具之间造成了鸿沟,阻碍了他们适当管理电能质量的能力。
用于监控和解决数据中心电能质量问题的理想智能PDU需要能够通过Redfish、JSON-RPC或 SNMP等通用 API与现有BMS和DCIM系统进行通信。
因此,重新构想智能PDU是目前改善数据中心设施正常运行时间的最佳起点。该工具非常适合提供设施管理人员保护其设施正常运行所需的实时可见性。但就目前而言,许多运营商仍在冒着底线风险,因为他们受到当前可用的智能PDU技术的限制。在机架和设备级别改进用于监控和解决电能质量问题的解决方案将使数据中心行业受益匪浅。
为什么改进机架PDU电能质量监控和智能化至关重要
仅在表面层面监控数据中心的用电量已经不够了。关键是要查看插座级别的情况。
在监控当今数据中心的电力使用情况时,只见树木不见森林是不够的,你需要能够看到森林和树木。
依赖机架配电单元的风险太大,因为机架配电单元仅提供有关电力消耗方式的基本概览。时间就是金钱,停机会造成很大的损失。数据中心跟踪的停机时间在六到七位数范围内,而造成100万美元以上损失的停机时间正在增加,占2022年所有停机时间的25%。加上不断增加的电力需求和全球范围内减少碳足迹的努力,跟踪机架电源所有元素的需求变得迫切,以提供高质量的电源可用性。
你看不到的 当今数据中心通常使用的智能PDU无法提供足够的电能质量信息来支持设施经理和运营团队寻求防止停机的方法。它们只能在机柜中提供有限的可见性,无法显示细粒度或设备级数据,也无法实时测量特定类型的电源相关数据。这一挑战有时迫使操作员使用非集成设备的独立电源研究来手动监控电源质量。数据中心经理需要能够跟上大规模的电能质量问题,并能够实时解决这些问题,最好是在它们导致代价高昂的停机时间之前解决。 数据中心使用的大部分电力都被插入机架PDU的设备消耗,这就是电力质量和负载会出现波动的地方。因此,对于IT和设施管理人员来说,智能机架PDU对数据中心的效率和有效性至关重要。
这些IT设备都有开关模式电源,这可能会出现电能质量问题。与电炉等线性负载不同,这些非线性负载、计算机和 不间断电源 以高振幅脉冲的形式产生电流,从而扭曲电流和电压的波形。诸如美国所有停机时间的 25%。加上不断增加的电力需求和全球范围内减少碳足迹的努力,跟踪机架电源所有元素的需求变得迫切,以提供高质量的电源可用性。
你看不到的
当今数据中心通常使用的智能 PDU 无法提供足够的电能质量信息来支持设施经理和运营团队寻求防止停机的方法。它们只能在机柜中提供有限的可见性,无法显示细粒度或设备级数据,也无法实时测量特定类型的电源相关数据。这一挑战有时迫使操作员使用非集成设备的独立电源研究来手动监控电源质量。数据中心经理需要能够跟上大规模的电能质量问题,并能够实时解决这些问题,最好是在它们导致代价高昂的停机时间之前解决。
数据中心使用的大部分电力都被插入机架 PDU 的设备消耗,这就是电力质量和负载会出现波动的地方。因此,对于 IT 和设施管理人员来说,智能机架 PDU 对数据中心的效率和有效性至关重要。
这些 IT 设备都采用开关模式电源,可能会出现电源质量问题。与电炉等线性负载不同,这些非线性负载、计算机和不间断电源以高振幅脉冲形式吸收电流,从而扭曲电流和电压波形。信息技术产业委员会曲线等操作标准有所帮助,但它们无法避免电气干扰,包括浪涌和尖峰。
数量和质量
数据中心经理通常专注于计算IT设备和运营资源使用的电量。通常,他们会忽视、低估或根本看不到电能质量问题,这可能会对IT基础设施系统造成严重破坏。电气和电子工程师协会已经定义了许多此类效率低下的问题。其中包括瞬变,即尖峰和其他会提高电压或电流的短期事件。当将半个周期的交流电压持续时间减少到一秒时,就会发生暂降。骤升是骤降的反面,骤降会增加交流电压。波形失真是正弦波的任何缺陷:谐波失真、电压或电流削波或尖峰。
常见的智能机架PDU无法充分了解在数据中心使用所有计算设备时不可避免地出现的大量电能质量问题。操作员需要能够查看精细的数据点,以准确、完整地了解正在发生的事情。
访问粒度数据的优点之一是可以识别问题发生的位置。一个很好的例子就是电源故障触发断路器。确定导致断路器跳闸的插座/设备是恢复的第一步。这个过程缓慢且耗时,需要拔出故障PDU支路上的所有设备,重新设置断路器,然后一次插入一个设备,直到再次跳闸。
峰谷
在决定位置时,电源监控和使用信息变得特别有用 。
安装新的服务器或设备。电力监控可以让你及时看到机柜在那个时间点的总负载,但你真正想知道的是在最坏情况下的负载是多少。如果你知道最坏的情况,你可以确保管理它所需的资源到位。
随着数据中心机架功率密度和耗电设备数量的不断增加,电源质量对于数据中心来说越来越重要。仅监视电随着数据中心中机架功率密度和耗电设备数量的不断增加,电能质量对数据中心来说变得越来越重要。仅仅监控电力使用是不够的。您需要深入了解细节,了解电源的使用方式以及电源的使用位置,直至插座,以充分利用电源。
资料来源:Raritan