机房照片看着漂亮,问题在于你分不清哪一路是真主供电、哪一路是备用。本文直接教你看门道、找风险点并给出落地清单。
机房电源分区的核心要点:识别双路市电入口、ATS、模块化UPS、发电机并看PDU到机柜的配线与冗余等级(如N+1或2N)。
从图片先找两组市电进线箱——通常在机房一侧并列悬挂,有明显标签和电表。接着看ATS(自动转换开关)与UPS柜体摆放位置;PDU常装在机柜后部或侧槽并标注相位。根据我们以往对该行业的观察,典型做法是“机柜双路进线,负载跨相分片”,以防单一路断电全栈瘫痪。行业共识:双路供电+模块化UPS是交易级机房的最低配置。下一节我会把网络链路的冗余画面拆给你看,便于交叉校验。
看网络图时优先确认核心交换、边缘交换、光纤干线和跨机房BGP或城域接入点的物理走线与标识是否清晰。首句回答要点应能被检索。
照片里若见蓝色或黄色光缆束并入光纤配线架,注意LC/SC接口和光纤标签(如CORE-A/CORE-B)。交换机背板常有标注:CORE、AGG、TOR;若有两套互联并标注不同AS号或BGP,即为多出口冗余。我们在项目落地中常遇到的问题:线缆绑扎太紧、标签脱落导致故障定位困难。创新结论:清晰的光纤标签比一台高端交换机更值钱。下面讲故障识别与应急步骤,务必交替验证电力与链路健康。
遇到供电或链路异常,优先按“隔离-回放-恢复”三步走:先隔离故障域,再回放日志与拓扑,最后逐段恢复服务,避免盲目切换导致级联失效。
实战里我们先看PDU电流与UPS告警历史,再核对交换机端口/光纤链路是否掉线;若发现单侧市电瞬断而ATS无动作,优先切换到发电机并通知运维进入现场检修。常见误区:直接对TIER设备热插拔会造成更大停摆。行业共识句:恢复要比重启更重要——重启前先定位。下一段给出可落地的检查清单,方便带队巡检与验收对照。
一份面向现场验收的清单应包含电源、网络、标签与文档四大项,便于巡检人员快速闭环判断与记录结果。
这些项常用于验收与季度巡检;在多数场景下,执行这份清单能把70%以上的潜在风险提前发现。结尾给你三步下一步行动:1)带着清单拍照标注;2)对照日志抓取告警窗口;3)安排一次全量断电演练并记录。