(中国软件网讯/刘小菲) “Hi, 各位尊敬的 TeamCola 用户: 非常抱歉,从昨天下午17点32分开始,TeamCola服务器挂了。 具体的原因,是我们的阿里云服务器出现磁盘错误,在维护过程中执行了重启操作,然后就彻底挂了。最坏的情况是10月13日的所有新增数据丢失。再一次的为这次事件表示我们的歉意!我们诚恳的希望得到你们的谅解,在国内找一家靠谱的运营商太困难了 :(---- TeamCola 团队” 打开teamcola的官网http://teamcola.com/,以上言论赫然眼前,作为开发团队工作日志工具的创始公司,teamcola才刚刚崭露头角就立即受到了用户的关注和热情试用,昨日却突然出现挂机事件,这是怎么回事? 挂机事件解析
Teamcola是一款页面友好、使用便捷的团队工作日志记录软件,提供记录、汇总、订阅、邮件等功能,方便查阅团队工作进度、统计分类工作并能快速响应用户需求。据官网和新浪微博显示,本次挂机主要原因还是运营商阿里云的“不靠谱”,并且teamcola微博最新消息,“阿里云方面数据回滚已完成,确认12日与13日的数据已丢失。为确保服务的稳定性我们正在重装系统,TeamCola 预计今天下午三点左右恢复服务。” 中国软件网记者立即关注了teamcola相关人员并询问本次事件的过程和起因: “企业用户的数据丢失真不是一件小事,就算这次没事儿过去了,想问以后teamcola会不会更换运营商呢?怎样才能建立起云安全和云诚信呢?” 古龄:首先我们自己会做好异地数据备份,这样就算阿里云出问题了,我们也能很快的切换到镜像平台上,另外我们虽然有很多不满,但是不会一棒子打死,只是希望我们自己和其他所有服务提供商都能踏踏实实的做好本分的工作,特别是在这个本来就很落后的国家 :) “我看到有人说本次事件不全是阿里磁盘错误,那到底是什么原因呢?” 古龄 回复@刘小菲Soft6: 从一开始是在系统上无法创建目录,然后我们写了一条工单询问,按照阿里云的方法处理后还是没有解决,于是我们重启了一次服务器,但是我们的web server需要输入ssl证书的密码,所以无法远程启动,阿里云的工程师没能第一时间判断出来问题,导致他们认为是系统出了无法修复的故障。 “第一,为什么最开始系统出现无法创建目录的情况?第二,你们在重启之前不知道无法远程启动吗?第三,既然远程启动不成功为神马木有及时联系到阿里云告知详情呢?” 古龄 回复@刘小菲Soft6:1. 这个问题的原因是阿里云的操作系统不支持升级,而我们在不知情的时候做了升级操作,所以更新的内核会导致偶尔无法正常创建文件夹;2. 我们确实不知道重启后网卡会后于web server重启,但是;3. 让我们觉得非常不好的是,昨天晚上我们反馈这个问题后,阿里云没有工程师或客服来跟进。
首先,看得出此次挂机事件还是比较严重的,对于用户而言,数据丢失可大可小,甚至可能导致企业用户丢掉饭碗。对此,teamcola团队已推出补救方案,但补救的也许更多是用户心中的惊吓和疑问而不是业务资金上的丁点儿数字。 其次,本次事件虽然主因在阿里,并且根据teamcola人员的反应来看,阿里的态度并不尽人意。“没能第一时间判断出来问题”“没有工程师或客服来跟进”,笔者毕竟想问问阿里的工程师去做客服而客服去做工程师了吗? 第三,作为初始创业公司,思虑不周全,与运营商连通不顺畅也是很大一部分的原因。没有提前做好备份;没有提前了解清楚操作系统是否支持升级和是否支持远程重启便贸然执行;没有与阿里那边“上下一气”,做到有效沟通。都是一早便为本次挂机事件埋下的隐患。 (责任编辑:admin) |