宕机后你要问的人是谁?责任模糊,赔付不到位,业务被牵着走——这是托管最常见的痛点。
在香港托管中,运维职责应明确划分为“机房/网络提供方负责设施与网络可达性,客户负责系统与应用层面的维护”,并以合同条款固定量化指标。
在实际项目落地中,我们常见提供方承担机柜、供电、BGP线路、跨境带宽与机房安全;客户负责系统补丁、应用发布与数据备份。下一步要把这些职责写进SLA。
SLA首要定义可量化指标:可用性(%Uptime)、故障响应时限、修复时限(RTO)、数据恢复点(RPO)以及赔付计算方法,这些直接决定赔偿触发条件。
不少同行反馈,模糊的“尽力而为”会把责任推回客户,因此把 可用率、回复时间、故障判定流程写明非常关键;此外要明确“维护窗口”的时间段与通知规则,以免误判。接下来看DDoS与高防责任划分。
一般情况下,基础DDoS防护由机房提供(高防IP与流量清洗),但应用层CC攻击和WAF配置常由客户或第三方安全厂商承担,这点必须在合同中区分清楚。
在实操中,我们建议同时要求机房提供流量清洗能力、清晰的触发阈值和切换流程;如果攻击超出清洗带宽,责任与二次响应应有明确约定。下一节讲免责与特殊条款。
免责条款应列出不可抗力、上游供应商中断、客户配置错误与第三方软件漏洞四类情形,并针对每类列出举证与通知义务。
在多次谈判经验里,运营方常以“上游链路中断”免责;我们通常要求对方提供上游链路监测日志作为免责凭证,并约定上游中断的最大容忍时间,以便追溯赔付责任。下一步讨论常见误区。
很多客户误以为“香港IDC自带高可用”就能省去容灾,事实是单点机房故障仍可造成重大影响,容灾方案必须另行设计并在SLA中量化。
反向排除法告诉我们:不要把全部希望放在单一BGP线路、不要只依赖机房的默认防护、不要忽视跨境链路的带宽峰值控制。下一段给出签约前的检查清单。
这些步骤能把模糊责任变成合同条款,减少后期争议。下一步是让你落地执行。
把下面四项放进你的签约议程:1)把SLA可用率和RTO写成表格;2)要求机房提供DDoS清洗证明;3)约定上游中断的举证标准;4)安排一次联调与压力测试。
行业共识:合同细节决定运维边界,量化指标决定赔付兑现;一个清晰的SLA往往比口头承诺更值钱。