支付宝27号全国瘫痪两小时,灾备能力引发争议
周氏180今天看到,各大门户网站都有一条关于支付宝的重大消息。原来,5月27日下午5点,拥有将近3亿活跃用户的支付宝出现了大面积访问故障,全国多省市支付宝用户出现手机和电脑支付宝无法登陆、余额错误等问题。
某报道中称:“在蚂蚁金服发给《财经》的官方回应中称,出现这一问题的原因在于市政施工导致杭州市某地光缆被挖断,影响了支付宝一个主要机房的正常运转。当天晚上19时左右,即在事故发生大约两个多小时以后,支付宝服务才恢复正常。”
周氏180了解到,作为拥有超过4万亿年交易总额的支付宝是中国第一大第三方交易平台,它约占中国整体社会消费金额的六分之一。故障发生后,周氏180非常担心账户资金安全问题,相信其他用户也有这样的顾虑,亦有用户反应出现账户余额不同步的现象。
周氏180从《财经》上了解,支付宝采用异地双活的系统架构,的确有多个机房。正因为如此,本次支付宝杭州机房网络中断,只影响了一个机房,其它机房的业务不受影响。
但这依然受到外界质疑。质疑焦点有二:一是恢复时间竟然长达两个小时;二是究竟是出于资金安全考虑而主动放缓速度还是支付宝应急预案出现漏洞?
一位国有大型银行内部人士向《财经》记者表示,如果在银行的支付系统发生大面积瘫痪超过2个小时,已经属于重大安全事故,很有可能要向国务院汇报备案。
他向《财经》记者强调,传统金融机构发生这样波及全国范围的安全问题几率微乎其微,原因在于银行涉及用户资金的重要系统灾备方案十分完备,一般是“两地三中心”云备份方案,保证“同城灾备结合异地灾备”,目的在于防止重大灾难或战争等极端情况。
上述国有大型银行内部人士认为,正因为此,如果银行系统出现支付宝因光缆被挖断而导致一个数据中心停摆的情况,用户流量和系统会向同城或异地其他数据中心切换。“就算不会是即时切换,也不会花费太长时间,同城可能会更快,就是用户根本感受不到延迟。”
这一说法得到多位接受《财经》记者采访的电信技术人士的支持。中国电信的一位技术高层人士分析,服务故障切换机制应该是自动的,根据一定的事先设置的策略,无需人为干预,人工可以在服务切换后,再重新定义流量疏导方式。
该人士称,支付宝多中心制的网络架构设计,不同于普通用户接入光缆宽带服务,不可能只是用一个区域性的小机房,一根光缆被挖断了就断服务了。支付宝机房服务的路由应该非常多,不可能只接一家运营商,即便只是一家,肯定也是多路由接入。“数据路由就像供电,来自不同的变压器和能原地。”