携程网及APP全面瘫痪 分析:可能是内部原因所致
2015年5月28日上午约11点,不少用户发现在线旅游网站携程无法打开,其APP也无法使用。到昨晚9点半,携程部分网页已可以打开,但仍不能预订。很多携程用户担心自己的订单是否会受到影响,对此,携程称,已下单的游客目前仍可正常出行。
□事件 携程艺龙均称遭攻击
昨天,很多人的朋友圈被一则携程服务瘫痪的消息刷屏,记者11点左右登录携程网,发现页面显示404报错。下午2点,携程网站首页已能打开,但是部分栏目和区域依然显示为空白。下午6点左右,携程首页已经能显示,但是链接跳转依然无法使用。
携程瘫痪后,携程官网置顶位置出现一行醒目提示:“携程网站暂时无法提供服务,您可以访问:艺龙旅行网。”大约在一周之前,携程以4亿美元收购艺龙37.6%股权,成为艺龙最大股东。
昨天,关于携程瘫痪内幕的传闻四起。一位自称携程员工的网友@gongxifacai杨在微博上爆料:“所有节点上的业务代码都被干掉了,业务部门那边都在忙部署。周围同事也觉得诡异,因为发布日志都没了,具体原因还在查,我个人猜测是有人内部报复”。也有人表示是携程服务器遭受了恶意攻击。
对此,携程昨天下午紧急发公告称,5月28日上午11:09,因携程部分服务器疑似遭到不明攻击,导致官方网站及APP暂时无法正常使用,目前系统正在逐步恢复中,详细原因也还在调查中。经过紧急排查,携程数据没有丢失,预订数据也保存完整。
受此影响,昨天携程股价盘前暴跌11.67%,报72美元。
如果以携程一季度净营业收入23亿元计算,携程瘫痪每小时损失或达106.5万美元。
昨天下午5点左右,记者登录艺龙旅行网发现艺龙首页也出现了短时间瘫痪。昨晚7点,艺龙官方发微博称,因遭受网络攻击,艺龙网首页出现部分用户无法访问的情况,目前已恢复正常。
□分析 可能是内部原因所致
一位不愿透露姓名的知情人士向记者透露,以携程积累的技术实力,即便全网被攻击,要恢复数据最多也只需要一个小时。但已经过去若干小时,携程数据仍没有恢复。这些数据涉及两个层面,一个是应用层面,也就是链接跳转和页面调度,一个是数据层面,如订单生成等,目前来看,主要问题出在应用层面,这可以说是携程发展16年来遇到的最大危机,携程怀疑有内鬼搞破坏,可能还要报案。当然,如果是内部人员“不小心”永久删除了一个重要数据文件,导致恢复的内容无法匹配,也反映出携程内部管理出现严重漏洞。
猎豹移动安全专家李铁军接受记者采访时表示,携程服务中断极有可能是内部管理失控导致,通常黑客从外部攻击很难做到让数据大量丢失,且备份远不至于拖延太久。通常黑客入侵往往只是悄无声息地拿走核心数据,一般不会进行破坏性操作。携程这次事故综合各方面信息来看,像内部人员所为(有可能已经造成数据损失)。以往携程方面也曾经被披露过一些安全漏洞,这些漏洞几乎不影响该公司的正常业务,受到威胁的往往只是用户。
□影响 已下单客户可正常出行
有很多携程用户担心自己的订单是否会受影响。记者拨打携程呼叫中心的服务电话了解到,在网站没有恢复之前,从呼叫中心无法查询到客户的订单具体情况。对此,携程内部产品部门相关负责人称,虽然呼叫中心无法查询,但是已下单的游客目前仍可正常出行,“携程内部有一个后台订单系统,网站、APP、呼叫中心等都是相互打通的,虽然网站、APP现在暂时无法登录,但是订单数据都还在,相关部门的产品经理会通过人工导出数据,然后以邮件等形式通知消费者。不过如果游客想修改订单或者退订,在系统没有恢复之前是不能操作的。”
6人游旅行网CEO贾建强告诉记者,现在OTA(在线旅游代理商)和各酒店、航空公司等产品提供方的后台都已经能够实现无缝对接,所以从游客预订的角度来讲没什么问题。“之前预订过的产品基本都是即时确认的,所以用户倒不必担心订单作废,但是携程此次事故有可能对用户近期的交易数据造成泄露。”
□延伸 为企业容灾能力敲响警钟
最近,微信、网易、支付宝等多个应用因机房出问题或光缆被挖断,出现了短暂的故障。业内人士指出,拥有大数据的互联网公司对于天灾人祸应该有一套严格的防范措施。
为预防服务器所在地出现火灾和地震等不可抗力,业内人士表示,应做好容灾系统建设。容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。
此外,安全专家田际云表示,随着移动互联网和云计算的发展,人为安全问题已经成为互联网最大的安全漏洞,统计显示,1/3的安全问题是人为操作导致。诸如,管理员使用弱密码、用户越权访问、网站数据文件误删除等多是人为原因导致。因此,需要企业有完善紧密的安全制度和网络及IT操作流程。建议安装配置专业的安全产品,通过权限对员工操控进行限制。
携程官方称,对于昨日携程官网和APP瘫痪的原因,经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
昨日上午11点,携程称因为部分服务器疑似遭到不明攻击,导致官方网站及APP暂时无法正常使用,直到晚上22时45分,携程官方确认除个别业务外,携程网站及APP恢复正常,数据没有丢失。
对于为何12小时后才恢复正常,携程解释称:
类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个WebService组成,而每个应用子系统和每个WebService之间都存在着相互调用的依赖关系。
发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个WebService的功能正常,同时确保应用子系统与WebService间的调用关系得以正常执行。
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与WebService功能的正常运行。
携程最后还保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,并表示携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。