论坛风格切换
正版合作和侵权请联系 sd173@foxmail.com
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 1086阅读
  • 0回复

[其他信息]国学数典论坛-服务器维护,200906月故障停机过程说明 [复制链接]

上一主题 下一主题
离线eddywong
 

发帖
5401
今日发帖
最后登录
2015-09-26
只看楼主 倒序阅读 使用道具 楼主  发表于: 2009-07-02 21:14:11
— 本帖被 eddywong 执行锁定操作(2009-09-20) —
国学数典论坛-服务器维护,200906月故障停机过程说明

第一阶段:
1,6月17日接到机房通知“6月18日凌晨3点服务器要搬迁(同大厦的不同机房间进行)”,随即发布了公告。
2,6月18日上午论坛可以登录,但发现多处表格损坏,随即加以修复。有些故障不能找到确切的原因,所以远程运行重启服务器命令,就此问题发生了。
=========================================================
第二阶段:
3,在机房的协助下多次重启均告失败后,就和机房协商由他们协助完成修复工作。
4,存储服务器的硬件配置在安装SUSE 10却有不少繁琐的操作。在机房工程师修复了近一个下午也没有任何进展,便失去了修复的信心。
5,这台服务器是我在北京安装的系统,所以马上决定让机房把服务器发至北京。
6,在焦急的等待了一个周末20日,21日。
=========================================================
第三个阶段【这是大家这些天看到的内容】:
1,2009.06.20 经检查服务器需要运回北京维护,再次开通时间暂时无法确定。
2,2009.06.22 服务器运抵北京,初步检查未发现重大异常;希望通过此次维护能提升数据安全级别。初步估计2009-06-29日服务器能提供服务。
【当服务器2009.06.22日被我看到时,浑身毛骨悚然,服务器的惨相足见货运公司(什么公司就不提它了)的野蛮,打开机箱后检查,发现有2处电容被损坏脱落,硬盘的连接线一半都脱落。待把各个连接线都检查好后,开机、等待。。。。。。系统居然运行正常,这和 2007年的那次事故心情是截然不同的--悬着的心终于舒服了!】【弄个冗余设备,这是早就有的打算,但一直迫于资金问题,一拖再拖。这次是幸运的,但不能保证每次都是幸运的,因数据安全问题整天提心吊胆!经商量后决定马上弄个冗余设备,就此数据安全多了套保险系统,这下我能睡个安稳觉了!:)】
3,2009.06.24 冗余设备调试完毕,已开始冗余测试。
4,2009.06.25 原本打算把服务器送到机房后再实施数据冗余,为保证数据安全;今日开始本地数据冗余,需要冗余的数据近4TB,每日(24小时)能冗余1TB数据,大概得4天能完成,所以服务器上线日期不得不再次延长,望大家谅解。
5,2009.06.28 数据冗余已经完成,开通时间大致在2009-07-01。
6,2009.07.01 服务器已经到机房,应该在下午3点的时候可以访问,敬请期待。
=========================================================
以上是整个事情的经过。
事故的起因:是服务器搬迁-----时间之久,让大家等的辛苦了!再次致歉!(这是“不好”)
但也由此督促了我们弄冗余设备的决心!-----这是有益的,也让大家对数据安全少了些担心!(这是“好”)
故障原因:因不能在北京重现在机房时的故障,此故障未知。
维护周期长的原因:
       --前后发货周期共计用去6天;
       --检查修复服务器用去1天,
       --服务器硬盘阵列维护;NAS系统创建用去2天(创建2次,因第一次创建的模式不能达到要求);
       --冗余4T数据3天多些,
说的比较啰嗦,大家包涵啊。 只是想能让大家知道事情的整个经过。


消息來源:
http://bbs.gxsd.com.cn/viewthread.php?tid=320545
1条评分
lst84 电魂 +2 闪电联盟因你而精彩! 2009-07-03