首页 > 实用范文 > 应急预案
机房用电应急预案
编辑:空谷幽兰 识别码:125-419837 应急预案 发布时间: 2023-04-19 18:17:38 来源:网络

第一篇:机房用电应急预案

1,机房意外停电后,首先确定停电的范围以及受影响的设备范围。2,确认停电的范围为本楼或本校区,应立即打后勤管理处电话汇报。估算电力可能恢复的时间。并通知网络中心领导。3,如果确认停电的时间为1个小时内,可以在UPS正常供电的时间内,等到电力恢复,如果不能确认在2小时内恢复,立即汇报给机房电源维护负责人和中心机房各设备的负责人到达现场。做好各设备的电源停电准备,在UPS供电达1.5小时后,严格殷实操作手册停掉存储和各应用服务器的电源。最后停核心交换机和路由器,等待电力恢复。电力恢复供电后转第七条执行。如果确认停电的范围仅在于本机房电源故障。立即汇报给机房电源维护负责人。4,机房维护负责人将掉电的电源柜总空开和分空开的状态处于下电状态。并向主管领导汇报。马上联系相关厂家,如有可能请厂家立即到现场支持。5,将掉电的所有设备电源处于下电状态。以防止电源柜加电对设备的冲击。6,等各厂家和相关人员到齐后,商议设备恢复时间因注意的事项。并形成相关文档。7,电力室恢复供电后,先不要急于给电源柜加电,等待10-20分钟后,再开始给电源柜加电,以防止供电不稳定或再次掉电。8,供电正常后,确定设备处于下电状态后,打开电力柜的总控开。9,根据设备加电顺序,启动分项空开。10,设备加电顺序,IP交换机和SAN交换机正常后再给存储加电,存储状态检查正常后,启动主机(以上各设备务必按操作手册的启动顺序上电).11,设备启动正常后,开始启动数据库。12,数据库启动正常后,开始启动中间件服务器。13,中间件服务器正常后,启动应用程序。

2,核心机房电力的保障一直是维护体系的头等重要事项,通过实施应急发电演练,建立了可靠的应急预案机制,最大限度的降低电源中断对网络传输质量的影响。现分享核心机房电源中断应急预案,希望分公司尽快建立一套统一指挥、职责明确、反应迅速、处置有力的机房安全保障机制。3,组织架构: 4,责任领导、工程维护、网络监控、网络运维、质量管理等相关人员。

5,机房电源系统说明: 6,1.机房电力是两路三相四线制供电,进线线缆规格为:RVV50*4+16*1铜芯护套线。

7,2.机房电源系统采用三级防雷系统,三级防雷分别位于电源进线端、UPS输入前端。

8,3.机房现有两台60KVA-UPS电源,均处于正常运行状态。

9,4.机房现有设备机柜已编号,均通过UPS电源和市电供电,每个机柜有独立的20A空气开关。空调、墙壁插座开关、应急灯、照明等都是单独空开接市电。

10,5.运行中的UPS电源所带负荷,在逆变运行状态下能正常工作约4小时(已经过UPS放电测试)。

11,一.核心机房电源中断预案

12,1.在接到停电通知的情况下: 13,1)计划性停电通知要确保综合部、工维机房管理部对口人接到通知(提前将对口联系人备案在物业处),机房管理员接到计划停电通知后,升级到调度中心进行信息发送,同步进行邮件通知相应应急小组成员。并与负责组长及责任领导电话告知,确保已经接收到本次停电的时间及可能发生的情况。

14,2)维部进行发电应急预案小组成员通知,提前做好机房发电预案要求的准备工作,将相应的发电机、连接线、人员安排到位,各司其职,随时待命现场,做发电准备工作。确保停电时刻的电力安全及机房用电的保障措施,提前调度安排好相应人员做好保障用电的措施。

15,3)计划停电时间开始后,马上启动应急发电操作,按照机房发电操作步骤实施阶梯供电的步骤,恢复市电保障。并进行现场值守及设备工作确认,确保全部正常后电话告知调度中心及维护体系领导。

16,2.在没有接到任何通知,突然发生停电的情况下:

17,确认停电线路,停电时刻,停电时间等要素,启动核心机房发电应急预案。

18,1)值班网管工作流程:

19,⑴值班网管监控到核心机房停电,第一时间告知工维部、网络部、运维部应急小组组长。信息传达到工维部机房管理员(一主一备),告知停电开始时间。

20,要求在停电5分钟内将消息传达到调度中心,各应急小组组长。如无法联系上,进行升级到责任领导-工维部经理经理处。21,⑵网管将停电信息电话传达后,进行调度派单,确保全部的应急小组成员都收到本次故障停电的信息。然后进行机房中设备的检查,包括:UPS设备主机、各核心设备、汇聚设备、服务器、语音系统等。检查是否受影响。同时启动机房降温措施(降温方案:初步为加装抽排风设备、增加大风扇排风形成热量流动降温)22,⑶实时监控设备及UPS工作情况,包括:电量下降情况,设备工作正常情况,每15分钟通报一次电量情况。

23,2)运维部应急工作流程:

24,⑴运维应急同事接到故障通告后,第一时间往停电现场赶,到现场配合网管/工维部门进行设备仪器的检查、客服语音系统的保障,应急发电的协助。

25,⑵现场配合进行机房降温散热措施实施,实时检查网络设备的工作情况。

26,3)运营质量管理应急工作流程:

27,⑴调度中心值班人员接到网管监控调度信息后,第一时间将故障信息记录并发故障通告到相关应急成员,并电话通知各应急小组组长是否知悉。

28,⑵进行客服调度系统的设备工作运行系统检查,特别语音系统级坐席电脑,是否有问题,如发现工作系统有异常,及时与运维应急小组成员沟通,进行检查处理。

29,⑶实时关注故障工单流程进度登记,配合应急小组进行人员调度通告。30,4)工维部应急工作流程:

31,⑴机房管理员第一时间往停电现场赶,同时进行电话沟通供电公司、物业方等,咨询停电原因,是属于计划性还是突发性停电,预计停电时长,将咨询清楚的结果反馈到应急小组成员中,电话联系物业沟通好需要发电需求申请。

32,⑵工维应急小组组长接到时间后第一时间往停电现场赶,同时进行发电应急小组成员调度,安排第一时间到场工作开展,并升级通报告知主管领导,对口集团维护中心上报信息。

33,⑶工维应急小组成员接到停电时间后第一时间往停电现场赶,要求30分钟内必须到场(住机房附近的人员往现场去,较远同事可以进行打车往现场去),先行到处同事配合网管、运维同事启动做好应急发电前的准备:连接线布放、接续、发电机发电前检测油/电/水路检查,确保正常。确保一切就绪后,确认可以进行发电操作后,按照发电操作流程进行发电恢复市电。

34,⑷网管将监控到停电的相应信息及级别同步发送到运营质量管理部调度岗,由调度岗将相应信息进行工维、运维、网络关联同事进行信息告知,同时报工维主管领导知悉。

35,5)应急机房发电操作流程:

36,⑴机房用电系统包括四方面:空调制冷、主/备UPS主机、照明系统、客服调度系统。37,⑵发电前考虑4方面系统设备用电功率情况,为保障发电机带动的正常,不能进行同步供电,要区分优先恢复的步骤实施,确认发电机的工作正常。在发电前将需要供电的“空调制冷、主/备UPS主机、照明系统、客服调度系统”的市电输入主开关关闭。防止同步启动时发电机的无法供电保证。

38,⑶启动发电机,检测发电输出电流通断,待发电机运行稳定后。

39,第一步启动空调制冷系统的市电输入开关,运维应急小组成员重新启动空调主机(空调因为市电恢复后需要重新启动)观察空调制冷工作是否正常。

40,第二步启动主UPS设备的市电输入开关,观察发电机运行稳定情况,主UPS主机工作稳定情况,网络设备的工作正常与否。

41,第三步启动客服系统的市电输入开关,包括(客服坐席电脑、UPS设备、空调制冷等),观察发电机运行稳定情况,设备恢复工作情况。

42,第四步启动备UPS设备、市电照明的市电输入开关,观察发电机运行稳定情况,备UPS主机工作稳定情况,网络设备的工作正常与否。

43,⑷发电机启动,市电输入正常后,网管将降温系统的抽排风设备关闭,与运维同事进行所有设备的运行进行全面的检查,确保设备已经是运行正常。

44,⑸发电机发起市电正常后,工维应急小组安排专人现场值守,及时关注发电机油量情况,同时与油品供应商确认油品配送要求及时间要求,并实时与供电部门确认市电恢复时间。

45,6)停电过程中突发事项预防: 46,⑴网管在停电时进行机房确认运行中的UPS工作组、设备组工作状态。主/备UPS工作切换是否正常,在市电中断时UPS是否已经开始进行供电保护。

47,⑵值班网管对机房中的所有设备进行全面检查,确保所有的设备已经是有主备供电,市电中断后UPS已经正常保障设备工作。同时对机房的温度进行观察,温度是否突然升高。

48,⑶停电后,UPS处于逆变工作状态,当班人员要每隔15分钟观察一次UPS的蓄电池容量、带负荷情况、机房环境温度,尽量使蓄电池容量大于60%,带负荷小于85%(因为已经有自购发电机应急,尽快要求短时间发起电,减少UPS的放电过度)。

49,⑷发现机房环境温度大于26℃。当以上指标不能保证时,要及时向机房管理员汇报,同时上报责任领导知悉,网管预案小组成员经过慎重讨论,适时采取关闭不必要网络的网络设备、加强通风降温等措施尽量延长关键设备运行时间

50,三.应急发电机的油品保障措施

51,发电机正常启动后,需要做到油品及时供应,具体保障措施方案为: 52,1.确认多家供应商进行油品供应,签署油品供应协议,确保油品的供应充足。

53,2.油品的供应以应急小组成员通知后开始准备,协议要求是6小时内送货到场。54,3.只要进行发电一小时以上,则必须在停止发电后补充满油品,确保发电机随时都是满配油品保障中。

55,4.油品的零购是属于公安部门的监管,所以分公司提前将资料向公安部门报备,在公司因为特殊原因有零购油品需求,在公安部门已经有分公司备案资料下,每次使用零购油品进行公安部门盖章申请。可以随时进行购买。

56,四.恢复交流电后的处理措施

57,1.打开电力室和网络机房空调市电开关,并将调节温度设定为20℃。首先恢复机房制冷系统的正常工作。

58,2.等供电稳定后(一般在恢复市电10分钟后),闭合主/备UPS设备空气开关,恢复给主/备UPS交流供电。观察并确认UPS转换为交流稳压和浮充状态。

59,3.闭合客服系统的主空气开关,恢复客服系统的交流供电,并观察设备工作运行情况。

60,4.观察10分钟后,确保所有网络及设备、UPS设备组工作稳定后,将发电机停止发电,并将情况报告给调度及主管领导。

61,5.应急小组将发电的物资进行收拾整理存放好,并进行记录发电机的工作时间及油/水/电路的切断。机房的降温设备的关闭确认及物资收拾整理存放好。62,6.将处理情况做详细书面记录,请相关人员签字确认并报集团公司信息化系统管理平台上填写相关记录。

63,五.发电机的日常维护措施

64,对于柴油发电机来说,由于它不是日常的主要供电设备,所以日常的维护保养主要包括以下几个方面:

65,1.定期检查和更换柴油过滤器和机油过滤器

66,2.定期清理检查进气过滤器,并在固定的周期进行更换(或者根据现场的工况和进气过滤器的透气程度进行更换)67,3.定期检查和清理电池组接线柱,保持接线柱清洁

68,4.定期检查电池组的充电状态,保证良好的充电效果

69,5.定期检查风扇皮带的状态,确保无损伤和处于正常的松紧度

70,6.定期检查冷却液的状态,确保满足要求

71,7.定期检查或者更换柴油机机油,确保油位正常

72,8.冬天寒冷季节要确保机组预热装置正常工作,以便在需要启动发电机时能正常启动

1.机房工作人员应具备用电常识,了解机房供电布局、开关位置、设备供电来源等,机房工作时间注意用电安全和自身安全。

2.机房工作人员不得私自更改设备供电线路,对自己所管设备进行断电操作时不能影响其他设备供电,新增设备需要供电应由机房电力管理员统一调配。

3.机房禁止使用高温、炽热、产生火花的大功率或危险设备,确需使用电焊、电钻等,须在电力管理员指导下用电。

4.工作时发现用电安全隐患如漏电、火花、设备异常发烧等现象,应立即报告机房电力管理员,并协助进行处理。

5、机房停电需要启用内部发电系统时,设备管理人须在场及时检查自管设备是否正常供电。

6、机房电力管理员应定期对机房供电设备、线路、电源、开关等相关设备进行安全检查,及时排除用电安全隐患。

1.综述 为尽量避免机房内电力意外事故,以保障人身安全、防止设备损坏及影响供电系统等为目的。规范数据中心机房设备加电、日常操作的用电安全防护措施,制定本文档。

2.范围 本文档适用于北京移动数据中心所有机房(菜市口、望京、昌平、丰台、大白楼)。

3.用电安全措施 机房日常用电安全的最高准则为确保人员安全。3.1 设备用电安全措施 3.1.1设备上架加电要求

•• 所有进入机房,需使用机房电源的设备应为正规品牌且具有3C标志(即中国强制性产品认证)中CCC+5安全认证标志或CCC+S&B安全与电磁兼容认证标志任意一个。任何自行组装(DIY)设备不得上架加电。• 设备上架加电前应在机房外,使用非机房(生产用电)电源进行加电、开机测试,测试该设备电源组件为正常运行方可上架加电。• 不能在机房外加电测试的直流电设备,进入机房后首次加电需机房负责人,电力维护人员,中通维护人员,运维人员及客户同时在场。• 不能在机房加电测试的其他交流电设备,进入机房后首次加电需机房负责人中通维护人员,运维人员及客户同时 在场。• 设备上架后,加电前,由中通维护人员对机柜电源进行通路、电压测试,测试结果正常后由客户自行闭合对应的空开。●以上任意一点不能达到标准,必须由机房负责人书面(包含邮件)批准。

3.1.2 设备日常操作安全措施

• 机房内应设置维护和测试用电源插座(地插、强插等),供日常维护过程中接插相关维护设备,仪器仪表等。严禁随意使用机柜内电源接插。• 需要关闭电源时,不要设想电源已关闭,必须仔细检查,确认。• 为避免静电对设备的电子器件造成损坏,对设备进行操作时应穿着防静电服或戴防静电手套或佩戴防静电手镯。• 拿电路板时,应拿电路板边缘,不要接触元器件和印制电路。• 保持机柜内清洁、无尘。• 防静电手镯的使用方法如下:

1、将手伸进防静电手镯,戴至手腕处。

2、拉紧锁扣,确认防静电手镯与皮肤有良好的接触。

3、将防静电手镯,插入设备的防静电手镯插孔内,或者是用鳄鱼夹夹在机柜的接地处。

4、确认防静电手镯良好接地。3.2.日常维护人员安全措施:

• 非电工作业人员、不具有电气电力专业资质人员严禁进行任何电工作业。电工作业包括但不限于以下内容:对机房配供电设施、装置进行安装、维护、检查、检修等操作。• 配供电设施、装置的绝缘或外壳损坏,可能导致人体接触及带电部分时,应立即停止使用,并及时修复或更换。• 移动用电设备、打开用电设备外壳时必须拔掉所有电源线和外部电缆。• 确认操作区域内地面无积水、潮湿等。• 为避免出现意外,尽量不要一个人进行带电维护。维护前应确认设备的电源开关,如发生意外,第一时间切断对应的电源开关。

1.机房工作人员应学习常规的用电安全操作和知识,了解机房内部的供电、用电设施的操作规程,注意节约用电。

2.机房工作人员应经常实习、掌握机房用电应急处理步骤、措施和要领;在真正接通设备电源之前必须先检查线路、接头是否安全连接以及设备是否已经就绪、人员是否已经具备安全保护。

3.机房管理人员必须定期安排有专业资质的人员检查供电、用电设备、设施;如发现用电安全隐患,应即时采取措施解决,不能解决的必须及时向相关负责人员提出解决。

4.机房不得乱拉乱接电线,应选用安全、有保证的供电、用电器材;严禁随意对设备断电、更改设备供电线路,严禁随意串接、并接、搭接各种供电线路。

5.机房工作人员对个人用电安全负责。外来人员需要用电的,必须得到机房管理人员允许,并使用安全和对机房设备影响最少的供电方式。

6.机房工作人员需要离开当前用电工作环境时,应检查并保证工作环境的用电安全。

7.最后离开机房的工作人员,应检查所有用电设备,应关闭长时间带电运作可能会产生严重后果的用电设备。

8.禁止在无人看管下在机房中使用高温、炽热、产生火花的用电设备。

9.在使用功率超过额定瓦数的用电设备前,必须得到上级主管批准,并在保证线路安全的基础上使用。

10.在外部供电系统停电时,机房工作人员应全力配合完成停电应急工作。

第二篇:机房应急预案

中心机房突发事件应急预案

第一条

机房突发事件包括网络设备或服务器故障、自然灾害(水、火、电等)造成的 物理破坏、人为失误造成的安全事件等等。针对突发事件的预防措施如下:

1.建立安全、可靠、稳定运行的机房环境,防火、防盗、防雷电、防水、防静电、防尘; 建立备份电源系统;加强所有人员防火、防盗等基本技能培训。

2.服务器采用可靠、稳定的硬件设备,落实数据备份机制,安装有效的防病毒软件,及时 更新升级扫描引擎;加强对局域网内所有用户和信息系统管理员的安全技术培训。

第二条

机房漏水应急预案如下:

1.发生机房漏水时,第一目击者应立即通知机房管理人员。

2.若空调系统出现渗漏水,机房管理人员应立即安排停用故障空调,清除机房积水,并及 时联系设备供应方处理,同时启动备用空调,必要情况下可临时用电扇对服务器进行降温。3.若为墙体或窗户渗漏水,机房管理人员应立即采取有效措施确保机房安全,同时安排通 知办公室,及时清除积水,维修墙体或窗户,消除渗漏水隐患。

第三条

机房火灾应急预案如下:

1.完善机房环境,确保机房具备二氧化碳灭火器;禁止携带易燃易爆物品进入机房。2.机房管理人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理,掌握消防 应急处理步骤、措施和要领,懂得灭火的方法,会扑救初起火灾,并定期组织灭火演习。3.一旦发生火灾,迅速切断机房电源,避免灾情的扩散,并迅速拨打物业管理和119火警电话。

4.等待消防车到来期间,应组织物业保安或工作人员在保证安全的前提下灭火,应急领导小组应在第一时间内集中所有二氧化碳灭火器,抓住时机,尽可能的把火扑灭。

5.配合消防部门调查事故原因,对造成的损失和起火原因做好记录,以便进行灾后总结。

第四条

雷击事故应急预案如下:

1.遇雷暴天气,机房管理人员在下班后应及时关闭所有服务器,切断电源,暂停内部计算 机网络工作。

2.雷暴天气结束后,机房管理人员应及时开通服务器,恢复内部计算机网络工作,对设备 和数据进行检查。出现故障的,事发部门应将故障情况及时报告机房管理人员。

3.因雷击造成损失的,机房管理人员应会同相关部门进行核实、报损,并在调查工作结束 后一日内书面报告领导。

第五条

设备防盗被盗或人为损害应急预案如下:

1.机房管理人员每日查看、清点设备并锁好机房大门。

2.机房管理人员每日检查录像监控服务器状态,确保监控画面正常,并检查每日录像正常性、完整性。

3.发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告相关负责人,同时保护好现场。

4.机房维护人员接报后,通知保安及公安部门,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。

5.事发单位和当事人应积极配合公安部门进行调查,并将有关情况向机房管理人员汇报。

第六条

机房停电应急预案如下:

1.接到停电通知后,机房管理人员应及时通过办公系统、电话等发布相关信息,部署应对具体措施,要求用户在停电前停止业务、保存数据。

2.机房管理人员每日检查UPS电源的状态,确保在突发停电时,UPS电源能自动供应服务器正常工作半个小时,保证员工工作的数据及时保存。

第七条

通信网络故障应急预案如下:

1.发生通信线路中断、流量异常等故障后,员工应及时通知机房管理人员。

2.机房管理人员在接到报告后,迅速组织相关技术人员检测故障区域,并作相关故障处理,必要时通知通信网络运营商查清原因;逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。

3.应急处理结束后,机房管理人员应在一日之内提交故障分析报告,以便备案。

第八条

服务器故障应急预案如下:

1.机房管理人员每日检查服务器状态,检查邮箱服务器状态,确保系统运行的完善。

2.机房管理人员定期备份服务器数据,并将备份资料刻录成光盘或拷贝到移动硬盘。

第九条

1.发生机房突发事件后,机房管理人员应采取有效措施开展先期处置,恢复信息网络正常状态。应急处置工作结束后,机房管理人员对事件发生原因、性质、影响、后果、责任及应急处置能力、恢复重建等问题进行全面调查评估,根据应急处置中暴露出的管理、协调和技术问题,改进和完善预案,实施针对性演练,总结经验教训,整改存在隐患,组织恢复正常工作秩序。

第三篇:机房应急预案

应急处置方案

第一节 总 则

1、保证人员和财产的安全为前提的原则:在由于火灾或电力问题造成的主机故障,在解决故障前,应以保证人员的生命安全和财产的安全为前提,然后进行故障的解决。

2、最快时间恢复业务的原则:本着先想尽一切方法,尽快恢复业务的原则来处理故障,如在有备用设备的情况下,主设备产生了故障,应先尽快将应用切换到备用机上,使业务能够运行,再对故障设备进行诊断和维修。

3、故障应急人员高度负责的原则:当故障应急人员在节假日接到故障通知时,本着高度负责的态度,应迅速接手处理障碍,如远程无法处理解决,应迅速赶到故障设备所在地,进行现场处理,处理故障的同时应及时向领导汇报。应急人员不可互相推卸责任,如因特殊情况,确实无法处理障碍,部门领导必须安排好其他人员处理。

4、尽可能全面的保留故障现场的原则:当故障发生后,应急人员应尽可能全面的备份出能够反映故障现象的各种日志、记录、受损文件等,便于业务恢复后,对故障的分析、解决,杜绝故障的再次发生。

应急方案的目标:保证预付卡运营系统连续安全稳定地运行。

第二节 应急领导小组

应急领导小组成员:

组 长: 副组长: 成 员:

第三节 电源系统故障应急处理

定期检查信息中心机房电源设备的运行状况,当发生下列突发事件时,按以下方案进行处置:

当中心机房发生市电供电突然停电或远程报警电源异常时。首先确认是否为正常停电及预计停电时间。检查不间断电源的电池可供电时间,需在不间断电源供电时效内关闭所有服务器及网络设备。

联系工程部查看停电原因,尽快恢复供电,并将情况报告相关领导

工程部联系电话:

第四节 空调系统故障应急处理

定期对空调的运行情况进行检查,如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与设备提供商进行联系。

当中心机房主空调因故障无法制冷,致使机房内环境温度超过摄氏40度时,打开机房房门,并关闭所有服务器及网络设备。对于无法自行处置的空调系统异常情况,及时与设备提供商联系,并报告公司领导。空调问题联系人:

第五节 中心机房自动消防系统应急处理

当中心机房发生火警时,按以下方案进行处置:

1.上班工作时间发生火警,听到自动消防系统发出的声光报警后,中心机房附近办公室人员应及时紧急撤离,避免气体自动消防系统启动后,消防气体对附近人员造成人身伤害。确认火警后,立刻拨打119报警,并说明尽量使用气体灭火器进行灭火,减少电子设备的损坏。

2.发生火警后,信息中心相关人员应马上赶赴现场,并向有关领导报告事故情况。同时立即联系联通等相关公司,及时评估事故损失情况,研讨尽快恢复信息系统正常运行的最佳方案。安保消防中控电话:

第六节 设备、网络系统故障应急处理

设备、网络应用系统故障应由发现人通知技术部,技术部门立即检查故障,进行初步故障定位,解决;

1.网络设备、服务器、储存设备均有备份,当设备存在硬件问题时,可随时把业务切换到备份主机上,保证业务正常运行; 2.应用系统每更新一次则做一次远程备份,在远程主机上分别备份旧的应用系统和更新后的应用系统,以当天的更新日期命名; 3.对磁盘柜上的数据库文件有定时任务,每天凌晨4:00会把数据库里的数据文件倒出到远程备份主机上,以确保磁盘柜出现硬件故障的时候,数据文件不丢失;对于网络、应用系统出现硬件方面的故障,比较严重的问题,对业务的正常运行造成较大的影响,立即向有关领导报告。

4、网络中有监控服务器,运用Cacti v10最新的版本,监控网络所有设备(路由器,防火墙,交换机以及服务器设备);对设备本身的硬件检测、外部入侵检测、外部攻击等多种对系统不利因素以发送mail的形式报警;相关人员收到报警信息,分析收到的log日志以做出相应的处理。

5、每周周五对网络设备进行日志及配置文件采集,对数据库数据文件定期下载,和远程备份;在本地电脑上保存最近的配置文件,以便在发生毁灭性的灾难时,用来重组。

对简单故障,运维人员应迅速排除故障,解决问题并记录。如果需要更换设备,应上报有关领导,经批准后马上更换故障设备,尽快恢复网络、应用系统运行。运维部门判断无法及时修理时,应立即通知相关的系统运行服务提供商,在最短的时间内安排修理或更换系统。

如发现属外部线路的问题,应与线路服务提供商联系,敦促对方尽快恢复故障线路。

启用备份线路、设备、系统,迅速恢复相关的应用。

联通联系电话:

第七节 黑客入侵的应急处理

发现网络上有黑客攻击行为,任何人员都有义务向技术部门报告。技术部立即启动应急响应,切断受攻击计算机与网络的连接,停止一切操作、保护现场,并上报有关领导。

对于黑客攻击,由计算中心组织应急响应专家小组查找入侵踪迹,分析入侵方式和原因。由安全管理员根据对入侵事件的分析,组织相关人员对内部网计算机整改,防止黑客用同样的手段再次入侵其他系统。安全管理员检查确定无安全隐患后,才可将受攻击计算机重新连接网络,或启用备份计算机来恢复应用。

安全管理员应做好记录,保护现场,进行日志收集等工作。如果能追查到攻击者的相关信息,可以对其发出警告,必要时可以采取进一步的行动,乃至采取法律手段。根据破坏程度,经有关领导同意后,上报公安部门。

若系统已被黑客破坏,无法恢复,应将受黑客攻击的计算机上的重要数据备份到其他存储介质,确保计算机内重要的数据不丢失。如果数据无法恢复,经有关领导同意后,可与国家指定的部门联系,由他们来协助恢复,为保证数据信息安全,需在安全管理部门作记录。

第八节 生产系统、数据库故障处理

生产系统出现故障,技术部做出应急处理

1.因软件设计缺陷、设计漏洞等引起的故障,通知公司研发部门在2小时内查明原因,解决问题。

2.数据库出现故障,运维人员应在2小时内查清故障原因,其他相关部门应积极配合,解决问题。

3.如出现数据丢失情况,确认不能自行恢复后,启用备份恢复数据,24小时内恢复运营。

本方案自发布之日起施行

第四篇:机房火灾应急预案

机房消防安全工作对于公司运营极为重要,一旦发生火灾,将直接导致公 司业务中断,严重影响公司的安全稳定,并造成巨大的经济财产损失。下面小编为大家带来了机房火灾应急预案,欢迎阅读借鉴。

为认真贯彻落实《国务院关于特大安全事故行政责任追究的规定》,积极提高我公司重点要害部位特大安全事故应急处理能力,努力减少各类特大安全事故所造成的损失,消除火灾事故的隐患,保障公司财产和员工的生命安全,特制定本预案。

本预案针对我公司通信机房的火灾而制定。

移动通信机房灭火流程如下:

(一)值班人员发现机房火情(包括监控中心人员)要立即到现场查看。

(二)如果是个别电路盘着火,应拔出着火的电路盘,用1211或二氧化碳灭火器将火扑灭。

(三)某机柜几块电路盘及电缆着火,应立即拔出着火的电路盘,用1211或二氧化碳灭火器喷射灭火剂将火扑灭。

(四)如果机房的机架机柜着火,值班人员无力自灭自救时,监控中心应切断机架机柜电源或楼层电源,关闭空调,严禁开窗,及时向公司安全生产管理领导小组报告。

(五)公司安全生产管理领导小组指挥机关义务消防队队员进行灭火,组织值班人员立即撤离现场,封闭门窗,按下区域自动灭火按钮灭火,同时拨打119报警,大声呼救,报告公司主管领导或安保值班室,监控室广播火警。

(六)在消防队到达后,应积极配合,简明扼要说明着火位置,火势情况和已采取的补救措施。

(七)用1211或二氧化碳灭火器喷射灭火剂能把火扑灭的,应配合消防队保护现场和消除隐患,防止再次着火。

(八)用1211或二氧化碳灭火器不能把火扑灭时,为防止烟熏引起人员中毒,应组织人员有序疏散,使用相应的灭火器材灭火,尽快将火扑灭。

(九)应保护好现场,按照事故调查处理办法执行。

(十)火灾报警电话: 119

本预案应注意的特别事项

1、当发生火灾情况,进行处理并保证人身安全的同时,根据设备的重要性进行相应的抢救措施,保证重要设备,特别是直通电话,以及与冀北、华北相应数据的上传,保证通道畅通。

2、抢救完主要设备,在进行次要的设备抢修,待事故处理完毕后,进行相应的实验,保证设备的运行性,并进行设备的可行性分析。

第五篇:机房停电应急预案

应急预案指面对突发事件如自然灾害、重特大事故、环境公害及人为破坏的应急管理、指挥、救援计划等。以下是小编整理好的机房停电应急预案,欢迎大家阅读参考!

机房安全应急预案【1】

机房是我单位的重要场所,重要仪器、设备相对集中,一旦发生事故,会造成严重后果。为此特制定本应急预案。

一、触电

(1)一旦发生触电事故,应迅速安全切断电源,切忌直接接触触电者。

(2)即刻拨打紧急电话120并通知相关领导,同时开展现场应急救护。

二、火灾

1、报警程序:

即刻通知领导及相关部门,根据火情大小如需报警立即就近用电话或手机报告消防中心(电话119).。

2、组织实施:

机房管理员一旦发现火情后,应即刻切断电源,并使用灭火器扑救起火设备。

三、空调漏水

若空调系统出现渗漏水,应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时临时用电扇进行降温。

四、设备发生被盗或人为损害事件

(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告中心负责人,同时保护好现场。

(2)中心负责人接报后,通知保卫处,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。

(3)当事人应当积极配合公安部门进行调查,并将有关情况向领导汇报。

五、机房停电

(1)接到长时间停电通知后,应及时发布相关信息,部署应对具体措施。

(2)如遇临时停电,且停电时间在3小时之内,管理员要检查UPS是否正常工作,以确保机房设备的正常运行。

六、网络故障

(1)发生通信线路中断、路由故障、流量异常等故障后,网络管理员应及时查清通信网络故障位置,隔离故障区域,组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。

(2)事态或后果严重的,应及时报告领导并请求协助解决。

七、不良信息和病毒事件

(1)发现不良信息或网络病毒时,管理员应立即断开网线,终止不良信息或网络病毒传播,并报告。

(2)中心负责技术人员应采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。

(3)事态或后果严重的,应及时报告相关领导以及相关部门。

八、服务器软件系统故障

(1)发生服务器软件系统故障后,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;

(2)若重启失败,应立即安排备份服务器启用,并请求技术人员支援,作好技术处理。

九、注意事项:

第一、机房管理员要加强日常监控,及时处理、消除及上报安全隐患。

第二、备齐安全相关装备。

第三、及时做好备份。

网络及机房故障应急预案【2】

为科学应对网络与信息安全突发事件,提高信息中心机房处理突发信息网络事件的能力,建立健全信息安全应急机制,有效预防、及时控制和最大限度地消除信息安全各类突发事件的危害和影响,特制订网络及教育技术中心机房故障应急预案。

本预案坚持“统一领导、协调配合、明确责任、依法规范、条块结合、整合资源、防范为主、加强监控”的原则。适用于网络及教育技术中心机房可能发生的网络与信息安全突发事件。

一、设备发生被盗或人为损害事件应急预案

⑴ 发生设备被盗或有人为损害设备情况时,使用者或管理者应立即报告科长,同时保护好现场。

⑵ 科长接报后,应立即报告处长,并通知安全公安处,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。

⑶ 事件当事人应当积极配合公安部门进行调查,并将有关情况向科长和处长汇报。

二、机房停电应急预案

⑴ 接到停电通知或遇不可预知的停电后,应立即报告科长,并通过网站发布或电话通知停电通告。

⑵ 停电已经发生,应立即检查机房供电情况,如UPS是否正常供电,设备是否出现关机等情况,并积极查看机房当前温度情况。

⑶ 机房温度超过30度且制冷空调无法开启,积极组织人员开始对次要设备进行关机。

⑷ 机房温度超过35度且制冷空调无法开启,积极组织人员开始对绝大部分设备进行关机。

⑸ 机房来电后先与物业部门确认供电是否恢复正常,如完全正常,先开制冷空调,并根据设备关机的反序开机,并检查各项服务是否正常开启。

三、网络故障应急预案

⑴发生通信网络故障后,网络管理员应第一时间明确网络故障的位置和程度,及时给科长汇报,并隔离故障区域,切断故障区与服务器的网络联接。

⑵针对故障原因,网络管理员及时制定故障解决预案,并报上级领导批准,情况严重时告知相关通信网络运营商,请求协助查清原因。

⑶网络管理员会同电信技术人员或公司技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。

⑷网络管理员以及关责任人负责写出故障分析报告,上报上级领导备案。

四、不良信息和网络病毒事件应急预案

⑴当发现不良信息或网络病毒时,网络管理员应立即断开该处网络,第一时间给上级领导汇报,并终止不良信息或网络病毒传播。

⑵立即通告局域网内所有计算机用户防病毒方法,隔离网络,指导各计算机操作人员进行杀毒处理,直至网络处于安全状态。

⑶对不良信息要进一步追查来源,对未经相关领导同意擅自发布信息,造成不良影响且触犯法律者,移交执法部门追究法律责任。

⑷情况严重时,应立即向上级领导报告,请求支援,作好应对措施。

五、黑客攻击事件应急预案

⑴当发现网络被非法入侵、网页内容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,及时给网络管理人员报告,网络管理员接到报告后立即给上级领导汇报。

⑵接到报告后,网络管理员立即关闭网络,封锁或删除被攻破的登陆帐号,阻断可疑用户进入网络的通道。

⑶及时清理系统、恢复数据、程序,尽力将系统和网络恢复正常;情况严重时,应立即级领导报告,请求支援,作好应对措施。

六、机房设备硬件故障应急预案

⑴发生机房设备硬件故障后,网络管理员立即确定故障设备及故障原因,并及时给领导汇报,制定处理预案。

⑵若故障设备在短时间内无法修复,应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。

⑶故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,应立即级领导报告,请求支援,作好应对措施。

七、应急处置

发生信息网络突发事件后,网络管理人员应在第一时间内向上级领导报告,并且成立应急小组,组织人员开展先期处置。发生重大事件应向上级领导部门报告。

机房用电应急预案
TOP