第一篇:IDC运维方案
IDC运维 目 录 1信息系统运维服务内容 4 1.1服务目标 4 1.2 服务内容 5 1.3信息资产统计服务 8 1.4网络、安全系统运维服务 8 1.5主机、存储系统运维服务 11 1.6数据库系统运维服务 15 1.7终端运维服务 17 1.8综合布线系统服务 17 1.9大屏幕显示系统的维护 19 1.10视频会议系统维护 20 1.11中心机房维护内容 20 1.12 UPS系统 23 2运维服务流程 25 2.1设备每月定检计划 25 2.2设备维修及更换流程 26 3服务管理制度规范 28 3.1服务时间 28 3.2行为规范 29 3.3 现场服务支持规范 29 3.4问题记录规范 29 4应急服务响应措施 31 4.1 应急基本流程 31 4.2 预防措施 31 4.3 突发事件应急策略 32 附件一 机房日常巡检表 35 附件二 服务器设备维护表 36 附件三 网络设备维护表 37 附件四 日常问题申报表 38 1信息系统运维服务内容 1.1服务目标 信息系统运行维护服务包括,信息系统相关网络及主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
用户信息系统的组成主要可分为两类:硬件设备和软件系统。
n 硬件设备包括:网络设备、安全设备、主机设备、存储设备等;
n 软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。
通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。
信息系统服务的目标:
n 对用户现有的信息系统基础资源进行监控和管理;
n 及时掌握网络信息系统资源现状和配置信息;
n 反映信息系统资源的可用性情况和健康状况;
n 创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
Ø 运行状态、故障情况 Ø 配置信息 Ø 可用性情况及健康状况性能指标 1.2 服务内容 1、客户端常用应用软件维护及系统维护 →客户端常用应用软件的安装、调试、管理、更新、升级、故障检测及排除。
→客户端操作系统的调试、管理、更新,升级,故障检测及排除。
→客户端操作系统包括winXP win7等。
→常用应用软件包括Office 202_、office2010、翻译类软件、阅读类软件、下载类软件等,但不包括某些专业应用软件,如专业财务软件、排版软件、工程计算软件等,以及客户自行开发使用的系统客户端应用程序。
→建立常用应用软件及驱动程序库。(视客户情况而定)2、客户计算机硬件维护及升级(不含设备费)→客户端计算机硬件设备的维护、保养、更新、升级、故障检测及排除。
→对于需要更换的设备,提供设备选型建议及市场参考价格,并可代为购买(设备采购费用另计)。
→建立电脑硬件配置档案,实行标准化管理。(视客户情况而定)3、单机计算机病毒防护 →安装、管理、维护客户端计算机的病毒防护系统。
→培训用户计算机病毒的防护知识以及防病毒软件的使用,建立用户的防病毒意识。升级、更新、优化用户已有的病毒防治系统。
→定期提供病毒检测、告警及最新预防措施。
→提供紧急病毒故障处理服务,对突发的新计算机病毒进行及时响应。
4、网络防病毒系统的维护 →对用户的网络防病毒系统进行维护,升级版本,更新病毒库从而确保网络、系统及数据资料的安全。
5、综合布线系统维护 →利用专业测试仪器提供对铜缆、光纤的布线故障检测处理。
→对现有综合布线系统中存在的缺陷、问题提供合理化改造或升级方案,并可提供专业水平的工程施工(工程费用另计)。
6、网络打印的故障处理 →解决驱动程序/软件设置/网络设置问题造成的网络打印故障。
7、非网络打印机的故障处理(非硬件损坏)→解决驱动程序/软件设置问题造成的打印故障。
8、其它外置设备的故障处理 →解决扫描仪、手写板、摄像头、外置硬盘、刻录机等外置设备由于驱动程序/软件设置问题造成的故障。
9、局域网系统的故障诊断 →检查由于网络设备(如网卡、网线、交换机等)或网络设置造成的局域网络通信故障。
10、配线架及机柜的维护 →整理并规范配线架及机柜内的走线,对于存在的缺陷和问题提供合理化改造方案。
11、服务器系统维护 →从服务器硬件选型、软件安装(限微软产品)、管理到软硬件更新、升级,提供全程维护服务。
→对操作系统提供性能监测、系统优化、故障检测、故障排除、用户管理、资源分配、安全性控制等。
→服务器软件安装(限微软产品)安装配置、维护、故障排除等。
12、服务器安全漏洞修补 →及时对各台服务器提供最新的安全漏洞修补程序,以避免服务器及内部网络遭受到黑客的攻击,对用户造成损失。
13、网络交换机维护 →提供网络交换机的调试、故障诊断、日常维护保养、更换升级建议。对于突发的紧急硬件故障可以提供匹配的设备进行临时替代,保证用户网络的正常运转。
14、路由器维护 →提供用户端路由器的调试、故障诊断、日常维护保养、更换升级建议。对于突发的紧急硬件故障可以提供匹配的设备进行临时替代,保证用户网络的正常运转。
15、办公自动软件的安装及维护 →对办公自动软件系统的数据库备份、客户端安装、软件故障排除等进行办公自动软件整体维护。
16、计算机机房及综合布线系统改造 →对用户现有计算机房及综合布线系统可能存在的线路混乱、不规范等问题提供合理化解决方案。
17、网络防病毒系统的建设 →按用户需求,规划、建设网络防病毒系统,实现全方位病毒防护,确保网络、系统及数据资料的安全。
18、单机备份网/ 络备份系统的选型及建设 →为需要单机备份或网络备份的用户提供专业的全套服务,包括系统及设备选型、策略制定、灾难恢复等。
19、路由器及交换机调试 →提供路由器及交换机进行实际操作调试。
→调试以基本的安装调试应用为主。
1.3信息资产统计服务 此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。
服务内容包括:
Ø 硬件设备型号、数量、版本等信息统计记录;
Ø 软件产品型号、版本和补丁等信息统计记录;
Ø 网络结构、网络路由、网络IP地址统计记录;
Ø 综合布线系统结构图的绘制;
Ø 其它附属设备的统计记录;
1.4网络、安全系统运维服务 从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。网络、安全系统基本服务内容:
序号 服务模块 内容描述 提供方 1 现场备件安装 配合用户进行,按备件到达现场时间工程师到达现场 2 现场软件升级 首先分析软件升级的必要性和风险,配合用户进行软件升级 3 现场故障诊断 按服务级别:7×24小时 5×8小时 4 电话远程技术支持 7×24小时 5 问题管理系统 对遇到的问题进行汇总和发布 网络核心交换机巡视典型作业计划书 系统管理单位:
维保单位:
设备名:
设备型号:
管理IP:
检查内容 参考标准 检查结果 检查结论 巡视方法描述 巡检周期 硬件运行状态 电源运行状态 □正常 □异常 风扇运行状态 □正常 □异常 模块运行状态 □正常 □异常 系统运行状态检查 VLAN 状态 □正常 □异常 配置 状态 □正常 □异常 OSPF 状态 □正常 □异常 日志检查 日志 状态 □正常 □异常 其他检查内容 □正常 □异常 □正常 □异常 □正常 □异常(1)用户现场技术人员值守 根据用户的需求提供长期的用户现场技术人员值守服务,保证网络的实时连通和可用,保障接入交换机、汇聚交换机和核心交换机的正常运转。现场值守的技术人员每天记录网络交换机的端口是否可以正常使用,网络的转发和路由是否正常进行,交换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议。
现场值守人员还进行安全设备的日常运行状态的监控,对各种安全设备的日志检查,对重点事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然。
同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知。具体记录的数据包括:
Ø 配置数据 Ø 性能数据 Ø 故障数据(2)现场巡检服务 现场巡检服务是对客户的设备及网络进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。同时,将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。
巡检包括的内容如下:
编号 巡检内容 1 硬件运行状态检查项目 单板状态检查 电源模块状态检查 风扇状态检查 整机指示灯状态检查 机框防尘网检查 机房温度、湿度检查 设备地线检查 2 软件运行情况检查项目 设备运行情况检查 网络报文分析 设备对接运行状况检查 路由运行情况检查 3 网络整体运行情况调查 网络运行问题调查 网络变更情况调查 网络历史故障调查(3)网络运行分析与管理服务 网络运行分析与管理服务是指工程师通过对网络运行状况、网络问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性高级服务,其内容包括:
服务内容 服务优点 向客户提供网络专家电话号码。
保证重大问题第一连线至网络专家。
网络专家组每周与客户进行不少于30分钟的电话技术交流 以最小成本保证及时解答客户关心的技术问题,并就某一领域技术问题展开深层次沟通。
每月向客户提交CASE汇总分析报告,并可扩展到每年 使客户了解网络历史故障情况以及故障预防建议,最大程度减少网络故障隐患,更高效的进行网络管理。
17次(月度、季度、年度)(4)重要时刻专人值守服务 保证重要时刻设备稳定运行对客户成功尤为关键,因此,可对客户提供重要时刻的专人现场值守支持,包括政府的重大会议期间、突发公共事件及其它任何客户认为可能对其工作产生重大影响的时刻。
如需专人值守,客户需至少提前2周与授权服务商客户服务经理联系。授权服务商均需按事先合同约定提供专人值守服务。客户如需超出合同约定范围的更多值守支持,需额外支付相应人力和差旅费用。
1.5主机、存储系统运维服务 主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
硬件维护包括增加设备、卸载设备、更换设备、除尘等,下面做一简要的叙述。
1.设备的增加 内存和硬盘的增加是服务器最常见的,安装的应用软件、资源库越来越多,服务器需要更多的内存和硬盘容量。增加内存前需要认定与服务器原有的内存的兼容性,最好是同一品牌的规格的内存。如果是服务器专用的ECC内存,则必须选用相同的内存,普通的SDRAM内存与ECC内存在同一台服务器上使用很可能会引起系统严重出错。在增加硬盘以前,需要认定服务器是否有空余的硬盘支架、硬盘接口和电源接口,还有主板是否支持这种容量的硬盘。尤其需要注意,防止买来了设备却无法使用。
2.设备的卸载和更换 卸载和更换设备时的问题不大,需要注意的是有许多品牌服务器机箱的设计比较特殊,需要特殊的工具或机关才能打开,在卸机箱盖的时候,需要仔细看说明书,不要强行拆卸。另外,必须在完全断电、服务器接地良好的情况下进行,即使是支持热插拔的设备也是如此,以防止静电对设备造成损坏。
3.除尘 尘土是服务器最大的杀手,因此需要定期给服务器除尘。尤其是在炎热的夏季,对于服务器来说,灰尘甚至是致命的。除尘方法与普通PC除尘方法相同,尤其要注意的是电源的除尘。
主机存储系统基本服务内容:
序号 服务模块 内容描述 提供方 1 现场备件安装 配合用户进行。按备件到达现场时间工程师到达现场 设备厂商及 2 补丁服务 消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。
设备厂商及 3 升级服务 对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。
设备厂商及 4 现场故障诊断 按服务级别:7×24小时 5×8小时 5 电话远程技术支持 7×24小时 6 问题管理系统 对遇到的问题进行汇总和发布 7 系统优化 对客户系统的括主机、存储设备、操作系统、提供优化服务。
现场值守人员可进行监控管理的内容包括:
Ø CPU 性能管理;
Ø 内存使用情况管理;
Ø 硬盘利用情况管理;
Ø 系统进程管理;
Ø 主机性能管理;
Ø 实时监控主机电源、风扇的使用情况及主机机箱内部温度;
Ø 监控主机硬盘运行状态;
Ø 监控主机网卡、阵列卡等硬件状态;
Ø 监控主机HA运行状况;
Ø 主机系统文件系统管理;
Ø 监控存储交换机设备状态、端口状态、传输速度;
Ø 监控备份服务进程、备份情况(起止时间、是否成功、出错告警);
Ø 监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;
Ø 对存储的性能(如高速缓存、光纤通道等)进行监控.小型机及服务器系统巡检典型作业计划书(HP服务器部分)系统管理单位:洛阳市人防办 设备名:
设备型号 设备序列号 管理IP:
检查内容 参考标准 检查结果 状态是否正常 巡检方法描述 巡检周期 硬件运行状态 电源指示灯 □正常 □异常 面板指示灯 □正常 □异常 内置磁带机 □正常 □异常 CPU 状态 □正常 □异常 内存状态 □正常 □异常 磁盘状态 □正常 □异常 网卡状态 □正常 □异常 HBA卡运行状态 □正常 □异常 系统检查 系统日志 □正常 □异常 Mail □正常 □异常 文件系统,包括磁盘卷剩余空间 □正常 □异常 硬件检测 □正常 □异常 交换分区 □正常 □异常 固件版本 □正常 □异常 补丁包版本 □正常 □异常 系统镜像 □正常 □异常 存储磁盘 □正常 □异常 检查内容 参考标准 检查结果 状态是否正常 巡检方法描述 巡检周期 设备名:
设备型号 设备序列号 管理IP:
系统管理单位:洛阳市人防办 小型机及服务器系统巡检典型作业计划书(HP服务器部分)存储驱动 □正常 □异常 进程状态 □正常 □异常 系统性能检查 CPU利用率 □正常 □异常 内存利用率 □正常 □异常 磁盘I/O性能 □正常 □异常 数据库运行状态 数据库安装目录 □正常 □异常 数据库进程状态 □正常 □异常 集群检查 集群进程状态 □正常 □异常 集群日志 □正常 □异常 存储检查 存储设备故障灯状态 □正常 □异常 SAN交换机端口状态 □正常 □异常 存储交换机环境状态 □正常 □异常 系统故障报告 □正常 □异常 1.6数据库系统运维服务 数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。
数据库运行维护服务还包括快速发现、诊断和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的应用系统。
数据库运行维护服务,主要工作是使用技术手段来达到管理的目标,以系统最终的运行维护为目标,提高用户的工作效率。
具体数据库运行维护监控的基本服务内容包括:
1.操作系统相关维护 DBA要注意对操作系统的监控:
※文件系统的空间使用情况,必要时对ORACLE的警告日志及TRC文件进行清理 ※如果ORACLE提供网络服务,检查网络连接是否正常 ※检查操作系统的资源使用情况是否正常 ※检查数据库服务器有没有硬件故障,如磁盘、内存报错 2.数据库相关维护 序号 服务模块 内容描述 提供方 1 Oracle数据库 7*24电话支持服务 每周7天,每天24小时支持中心电话,电子邮件答询,以满足业务发展的需要。
Oracle产品技术专家直接同客户对话,帮助解决客户提出的疑难问题。
根据问题的严重程度,将优先解决客户认为是关键而紧急的任务。
对客户提出的一般性问题进行技术咨询、指导。
定期的客户管理报告, 避免问题再度发生。
Oracle数据库产品 现场服务响应 数据库宕机 数据坏块 影响业务不能进行的产品问题 软件产品的更新及维护。
Oracle数据库产品 系统健康检查 对系统的配置及运作框架提出建议,以帮助您得到一个更坚强可靠的运作环境 降低系统潜在的风险,包括数据丢失、安全漏洞、系统崩溃、性能降低及资源紧张 检查并分析系统日志及跟踪文件,发现并排除数据库系统错误隐患 检查数据库系统是否需要应用最新的补丁集 检查数据库空间的使用情况 序号 服务模块 内容描述 提供方 协助进行数据库空间的规划管理 检查数据库备份的完整性 监控数据库性能 确认系统的资源需求 明确您系统的能力及不足 优化Oracle Server的表现 通过改善系统环境的稳定性来降低潜在的系统宕机时间 4 Oracle数据库产品 性能调优 分析用户的应用类型和用户行为 评价并修改ORACLE数据库的参数设置 评价并调整ORACLE数据库的数据分布 评价应用对硬件和系统的使用情况,并提出建议 利用先进的性能调整工具实施数据库的性能调整 培训用户有关性能调整的概念 提供用户完整的性能调整报告和解决方法 1.7终端运维服务 作为整体信息系统维护方案,终端设备维护必不可少。各种局部服务器、工作站、台式机、笔记本、显示设备等,除了必要保修外,需要进行日常的系统维护、系统调试和培训。
1.8综合布线系统服务 布线管理是针对设备间、交换间的工作区的配线设备、线缆、信息插座等设施,按照一定的模式进行标识和记录,内容包括:管理方式、标识、色标、交叉连接、跳线等这些内容的实施给系统维护、管理创造方便,提高了管理水平和工作效率,从而实现了综合布线系统的灵活性、开放性和扩展性。
综合布线线缆是综合布线系统的基础设施,是整个网络的中枢神经系统,它能为智能建筑提供语音、数据、图像、多媒体等系统的应用,并在不断的扩展中。这得益于综合布线系统网络灵活性及高可靠性,但也带来新的问题,主要表现在随着系统的使用、网络的发展,用户不 可避免的要对连接的缆线移动、添加、改动,使得跳线不断变更,在设备间主配线架及楼层配线架将会出现跳线管理的问题,众多的缆线很难避免出现混乱,这一直是用户极为关注的问题。
1.维护管理执行的标准 目前电信基础设施管理的标准是:
TIA/EIA—606标准,该标准是商业建筑物电信基础设施管理标准,是目前国际上有关商业建筑物电信基础结构的唯一管理标准。管理基础设施包括有以下范围:
※位于工作区、配线间、设备间和引入设施的终端部件;
※电信布线缆线和连接件;
※电信布线缆线路径、连接件位置、终端部件所在的位置:
※电信的接地与连接。
2.彩色标识维护管理方式的实施方法 彩色标识管理是在每个交接区实现线缆管理的方式,是在各色标区域之间按照应用的要求采用跳线连接。色标作为用来区分配线设备的性质,标识按性质排列的接线模块,表明端接区域、物理位置、编号、容量、规格等,以便管理人员一目了然地加以识别。即在配线架上将来自不同方向或不同应用功能设备的线路集中布放,并按规定不同颜色的标记区域,当一个工程内有多个设备问、交换间、楼层配线问,应采用统一的色标区别各类用途的配线区,综合布线管理系统通常使用三种标记:缆线标记、区域标记和插接件标记。
1、配线架面板为端口单独管理方式,因而可以轻松完成每一个端口的检查、替换或纠正。端口的易接近性是配线系统的重大创新,因而所有管理和维护操作都可在前端完成。
2、在IU高度的19”空间中,可以同时支持超五类、六类、七类信息模块、光纤管理单元和语音配线单元的管理,且每个端口的功能均可由客户自由制定。
3、电缆的管理:配线架后端带加长电缆托架并预留线槽,还可采用电缆管理条紧固及标识电缆。
4、光纤管理单元:光纤管理单元为防尘封闭式设计,单元内预留光纤盘绕位置,3口及6口光纤管理单元可分别实现6芯、12芯光纤的管理,还可以管理各类通用的光纤连接器(如6MT—RJ、LC、SC、ST等),在IU机柜空间上管理多达48芯光纤。
5、配线架信息端口采用免工具安装管理信息模块,所有维护操作均在配线架前端完成,每个端口单独管理,维护时仅取下对应端口的支件,不需任何工具。
1.9大屏幕显示系统的维护 1)维护周期的确定 维护周期应根据设备的工作环境来确定,如工作在环境条件较好灰尘较少(如调度指挥中心,监控中心等),建议设备的维护时间为6个月维护一次,如果环境较差应该缩短维护周期,建议3个月一次。(如车站,机场,购物娱乐场所等)。
2)常见故障现象及处理方法 a)色轮故障 现象——屏幕图像色彩不正常﹐偏蓝﹑偏绿﹑偏红或者颜色不稳定﹐忽蓝忽绿。打开内置状态15(按ADJUST-SHIFT-1-1-5-SHIFT)﹐可以发现颜色不正常(正常应为100%白色)。
处理方法——将色轮拆下﹐用棉签沾无水酒精擦拭色轮片和光耦探头或更换色轮。
b)DMD板故障 现象——屏幕图像呈黑白色﹐机器死机﹐不接受遥控器指令或屏幕底色有3条隐约可见的白线。
处理方法——更换DMD板。
c)控制模块故障 现象——屏幕中有一片图像颜色不稳定﹐此现象关机后再开机可能消失﹐ 但运行一段时间后会再次出现或屏幕图像有纹路。
处理方法——更换控制模块。
d)灯泡故障 现象——黑屏或屏幕象不稳定的日光灯一样忽明忽暗 处理方法——检查Power灯是否正常﹐Fan灯是否正常﹐Lamp灯是否闪烁﹐观察灯泡是否已碎﹐如是则需更换灯泡。
e)点灯器故障 现象——屏幕象不稳定的日光灯一样忽明忽暗﹔点灯器有无间隔发出丝丝的声音。
处理方法——先检查灯泡是否正常﹐如正常则需更换点灯器。
f)Digital线故障 现象——在串接状态下屏幕图像颜色有时偏蓝﹐有时偏绿﹐有时又正常﹔打开内置状态10﹐颜色正常。
处理方法——更换Digital线 g)遥控器故障 现象——遥控器控制无反应或不按控制动作。
处理方法——首先使用对其他屏进行控制﹐ 确定遥控器无问题后﹐ 检查红外接收板与电子模块联机﹐ 如无改善﹐ 则需更换红外接收板和电子模块。
h)颜色复位 现象——开机后屏幕突然出现色差(多发生在突然断电后)。
处理方法——检查gain及offset值﹐是否已恢复为初始值(gain为32,offset为127)﹐重新设定gain及offset值。
i)灰尘污染 现象——画面边缘出现蓝紫色斑﹐ 边缘不清。处理方法——调整光机内的小反射镜并清除小反射镜上的灰尘。
3)十大常见问题 序号 故障种类 故障现象 解决方案 1 色轮故障 屏幕图像色彩不正常﹐偏蓝﹑偏绿﹑偏红或者颜色不稳定﹐忽蓝忽绿。打开内置状态10﹐可以发现颜色不正常。
将色轮拆下﹐用棉签沾无水酒精擦拭色轮片和光耦探头或更换色轮。
DMD板故障 屏幕图像呈黑白色﹐机器死机﹐不接受遥控器指令或屏幕底色有3条隐约可见的白线。
更换DMD板 3 控制模块故障 屏幕中有一片图像颜色不稳定﹐此现象关机后再开机可能消失﹐但运行一段时间后会再次出现或屏幕图像有纹路。
更换控制模块 4 灯泡故障 黑屏或屏幕象不稳定的日光灯一样忽明忽暗﹔点灯器有时会间隔性发出丝丝的声音。
检查Power灯是否正常﹐Fan灯是否正常﹐Lamp灯是否闪烁﹐灯丝是否已碎﹐如是则需更换灯泡。
点灯器故障 屏幕有间歇性自动开关机现象﹐有时开机时会出现倒影。
先检查灯泡是否正常﹐如正常则需更换点灯器。
Digital线故障 屏幕图像颜色有时偏蓝﹐有时偏绿﹐有时又正常﹔打开内置状态10﹐颜色正常。
更换Digital线 7 遥控器故障 遥控器控制无反应 首先使用对其他屏进行控制﹐ 确定遥控器无问题后﹐ 检查红外接收板与电子模块联机﹐ 如无改善﹐ 则需更换红外接收板和电子模块。或与DMD芯片过热有关﹐需关机等待少时。
内部设置故障 开机后屏幕突然出现色差 检查Drive﹑Cutoff﹑Gain及Offset值﹐是否已恢复为初始值﹐需重新设定Drive﹑Cutoff﹑Gain及Offset值。
设备污染 画面左边出现蓝紫色斑﹐边缘不清 一般为光机内小反射镜积灰所致﹐ 可用皮吹吹去灰尘。
电源模块故障 暂无 1.10视频会议系统维护 1.常规检查:从用户终端手动呼叫打环测试设备:172.19.0.35,如果能握手成功并看到打环视频,说明终端、网络没有大问题。
2.用户打环成功但是无法从MCU发起呼叫:既然打环成功,说明路由、终端没有大问题,往往问题在区县信息中心或者用户终端前增加了防火墙,对外部发起的访问进行了限制或者nat转换不正确,请用户协助变更。如果会议比较着急,可以在MCU上把该终端模式改为“dial in”,让用户手工参加会议暂时解决问题。
3.双方向均无法呼叫:请网管检查网络问题,往往和上述问题有关。
4.MCU发动呼叫的时候,链接后马上断开:正常情况下链接有一段时间,或者链接成功或者断开,如果马上就断开,说明对方占用了终端IP地址或者链接到别的会议上。
5.如何测试MCU端口情况:一般我们要求开放所有端口,或者针对172.19.0.254开放tcp 3230-3231 1720,udp 3230-3235,注意要在终端上设置固定端口(防火墙中)。另外大部分设备提供了web管理模式,方便更改配置,也可以用作测试。
1.11中心机房维护内容 机房环境检查就是对机房的温度、湿度、照明、防鼠、防水、防尘、消防、卫生、门窗的关闭进行检查,主要通过检查以下设备或项目去完成:
1.机房空调 ※检查空调是否正常运行、制冷温度是否在规定范围内 ※检查空调设备断电后再通电的自动投运状况 ※检查空调是否有漏水现象 ※检查空调电源插头是否稳固、是否出现老化现象 ※检查空调设备卫生情况 ※填写巡检记录 2.照明设备 ※检查照明设备是否都能正常运行、照明光度是否足够 ※检查机房事故照明断电后的工作情况 ※检查照明设备是否出现老化迹象 ※检查照明设备的控制开关是否能正常使用、灵敏度 ※填写巡检记录 3.消防设备 ※检查消防设备合格证、是否通过安全定检 ※消防设备是否配备足够 ※消防设备是否完好(外观)※检查机房消防系统是否能正常运行 ※清洁消防设备 ※填写巡检记录 4.抽湿机 ※检查机房抽湿机是否正常运行 ※检查机房抽湿机设定的湿度是否在规定范围内 ※填写巡检记录 5.机房防鼠 ※检查机房所有与外界有联系的孔洞是否已严密封堵 ※检查机房门窗是否已关闭 ※检查机房门的防鼠板是否已装上并安装稳密 ※填写巡检记录 6.机房防水、防尘 ※检查机房空调是否有漏水现象 ※检查机房墙壁是否有渗水现象 ※检查机房门窗是否已关闭 ※填写巡检记录 7.机房卫生 ※检查机房是否有垃圾、杂物 ※清洁门窗、地柜;
整洁办公用品,清洁地面 ※负责施工后机房地面清洁工作 ※填写巡检记录 8.电池 ※检查蓄电池外观完好性 ※检查蓄电池是否有变型、渗液等状况 ※清洁蓄电池 ※填写巡检记录 9.防雷设备 ※检查防雷设备运行是否正常,能否实现防雷功能 ※检查、测试设备运行的相关参数是否正常并记录 ※检查设备的外观完好性 ※检查设备是否出现老化迹象 ※检查防雷设备接线是否牢固,线缆是否出现老化迹象 ※清洁防雷设备 ※填写巡检记录 1.12 UPS系统 主机的维护及注意事项 UPS主机一般是智能型的,它对环境温度要求不高,但要求室内清洁卫生否则灰尘遇潮湿会引起主机工作紊乱;
主机中的参数在使用中不能随意改变;
在断电时,应避免带负载启动UPS电源,应先关掉负载,等UPS启动后再开启负载,否则会有多负载的冲击电流和供电电流造成UPS电源瞬间过载,严重时会损坏变换器;
不能让UPS电源经常处于满载或过载。
1.蓄电池的维护及注意事项 尽管使用的是免维护蓄电池,但从广义来说一定的维护还是必要的。首先它对环境温度要求较高,工作环境一般要求在20℃—25℃之间,低于15℃时,其放电容量下降,温度每降低1℃,其容量下降1%,而温度过高(大于30%℃)其寿命就会缩短;
其次,要防止电池短路或深度放电,深度放电会造成电池内阻增大或充电电压过低从而导致降低甚至失去充电能力,放电程度越深,循环寿命越短;
第三,要避免大电流充放电,否则会造成电池极板膨胀变形,使得极板活性物质脱落,内阻增大,容量下降,寿命缩短;
第四,由于组合电池电压很高,存在电击危险,因此装卸导电联接条、输出线时应有安全保障;
第五,对于不经常停电的地区,建议用户每隔一个月对UPS进行一次人为的断电,让UPS电源在逆变状态下工作一段时间,防止电解液沉淀,以便让蓄电池维持良好的充放电特性,延长使用寿命;
第六,搬运电池时不要触动极柱和安全排气阀;
第七,不能用二氧化碳灭火器,一旦发生火灾,可用四氧化碳之类的灭火器;
第八,不能把不同容量、不同厂家、不同性能的电池联在一起,否则会影响整组蓄电池的性能。
同时,要定期对电池进行检查、测量,并做好记录。检查项目包括:整组电池的浮充电压,单体电池浮充电压,测单体电池电压时,应在电池放电状态下进行,否则测得的结果会是假电压,经验作法是在测量时,万用表两端并联一个1—3欧母的电阻丝;
检查电池是否损坏,壳、盖间有无泄漏,表面是否有灰尘等杂物,电池架、连接线、端子是否有松动或锈蚀等。雾溢出主要是排气阀附近。
2运维服务 建议洛阳市人防办采用的服务方式为一种为技术人员现场值守。
人员常驻服务 l 企业内建立服务中心,派驻专业人员与队伍来保证对客户的服务。
l 企业设备出现问题和故障,直接对常驻人员申报故障维护人员根据反映情况,马上作出处理及给予回复判断故障范围,根据故障难度,调度工程师现场服务查看现场问题,判断类别,报告相关技术问题故障实施处理,完成后清理现场 1)机房的日常维护 2)硬件设备的常规检查 3)系统软件的常规检查 l4)填写维护报告 5)填写相关日志报告,存案留底 根据洛阳市人防办的具体情况,结合洛阳市人防办的实际需要,我公司建议企业使用人员长驻服务方式,提供7×8小时的即时响应服务,更及时更快速的作出处理 2.1设备每月定检计划 每月对设备定检一次,检查服务器、电脑、打印机、路由器、交换机、视频会议设备、网络设备等维护内容中的所有设备的使用状况,集中处理相关故障,并严格按照相关表格填写局域网及各设备的运行状况,并做出分析意见与建议。
测试记录各设备的运行状态,如正常,则在对应的维护检查表内写测试数据,如有异常,则在表格内写测试数据,在备注栏内写原因;
并在遗留问题中总结测试结果。对非测试项目的问题在检修过程中是否发现新的问题及对内容作填写,同时在相应的设备记录表上填写详细的异常内容,并按相关规定进行处理。
2.2设备维修及更换流程 甲方与我公司签订维护合同后,维护内容中的设备,在维护合同内出现损坏需要维修或更换,将由我公司代为负责处理。
l 保修期内返厂维修:指企业需要维修或更换的设备在厂家规定的标准保修期内,坏件返回工厂维修,维护人员跟进全返厂维修过程,直至设备正常投入使用。
l 保修期外返厂维修:对已过保修期的坏件,由维护人员联系厂家,根据厂家的维修费用收费要求向甲方提交《设备维修费用申请报告》,获得批准后,维护人员将坏件送入工厂进行维修,跟进全过程,直至设备正常投入使用。
技术人员现场值守运行维护服务的基本操作流程如下图所示:
3服务管理 3.1服务时间(1)接收服务请求和咨询:
n 在5*8 小时工作时间内在现场值守,设置由专人职守的热线电话,接听内部的服务请求,并记录服务台事件处理结果。
(2)在非工作时间设置有专人7*24 小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24 小时机房监控人员的机房突发情况汇报。
(3)服务响应时间:
故障级别 响应时间 故障解决时间 I级:属于紧急问题;
其具体现象为:系统崩溃导致业务停止、数据丢失。
30分钟,2小时内提交故障处理方案 12小时以内 II级:属于严重问题;
其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。
30分钟,2小时内提交故障处理方案 24小时以内 III级:属于较严重问题;
其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。
30分钟,2小时内提交故障处理方案 48小时以内 IV级:属于普通问题;
其具体现象为:系统技术功能、安装或配置咨询,或其他显然不影响业务的预约服务。
30分钟,2小时内提交故障处理方案 3天内 n 技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于12小时内解决故障,公司将在16小时内提出应急方案,确保业务系统的运行。故障解决后24小时内,提交故障处理报告。说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况。
3.2行为规范(1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。
(2)与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。
(3)出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。
(4)现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。接听电话时要文明礼貌,语言清晰明了,语气和善。
(5)遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。
3.3 现场服务支持规范 运维服务人员要做到耐心、细心、热心的服务。工作要做到事事有记录、事事有反馈、重大问题及时汇报。严格遵守工作作息时间,严格按照服务工作流程操作。
(1)现场支持工程师应着装整洁、言行礼貌大方,技术专业,操作熟练、严谨、规范;
现场支持时必须遵守用户单位的相关规章制度。
(2)现场支持工程师在进行现场支持工作时必须在保证数据和系统安全的前提下开展工作。
(3)现场支持时出现暂时无法解决的故障或其他新的故障时,应告知用户并及时上报负责人,寻找其他解决途径。
(4)故障解决后,现场支持工程师要详细记录问题的发生时间、地点、提出人和问题描述,并形成书面文档,必要时应向用户介绍故障出现的原因及预防方法和解决技巧。
3.4问题反馈 根据使用人员提出问题的类别,将问题分为咨询类问题和系统缺陷类问题二类:咨询类问题是指通过服务热线或现场解疑等方式能够当场解决用户提出的问题,具有问题解答直接、快速和实时的特点,该问题到现场支持人员处即可中止,对于该类问题的记录可使用咨询类问题记录模版进行记录。系统缺陷类问题是指使用人员提出的问题涉及到系统相应环节的确认修改,需要经过逐级提交、诊断、确认、处理和回复等环节,处理解决需要IT系统运维服务项目组的分析确认,问题有解决方案后,将解决方案反馈给用户。具体提交流程如下:
(1)问题提交。应用信息系统的用户发现属于系统缺陷类的问题时,填写系统缺陷类问题提交单,提交服务支持中心。
(2)问题分析。服务中心接到用户提交的问题单,要组织相应人员对问题单中描述的问题进行分析研判,确定问题的类型(技术问题、业务问题或者操作问题)。属于技术问题,提交服务中心技术人员对存在的问题提出具体的处理意见和建议;
属于业务问题,提交服务中心业务人员进行处理;
属于操作问题,可安排相关人员对问题提出人进行解释,并将系统缺陷类问题提交单转为系统咨询类问题提交单。
(3)问题确认、解决。服务中心的技术人员和业务人员收到系统缺陷类问题提交单后,对提交的问题进行归类汇总和分析、确认。可以解决的,明确问题解决的具体处理建议和措施,经主管领导签字同意后,交实施人员进行解决方案的实施。服务人员确认是否解决,并将解决方法附在系统缺陷类问题提交单上反馈给问题提出人员。
(4)问题上报。服务人员收到经业务或技术人员确认的系统缺陷类问题提交单后,上报服务中心。
(5)问题回复。服务中心根据提交问题的进行分析,制定解决方案并进行实施的解决,同时做好变更记录。将解决方案汇总后及时向问题提交单位或问题交办单位作出回复,并将分析过程和问题产生原因一并提交。
4应急服务响应措施 公司已经针对本项目制定了详尽的设计、应急处理预案,整个流程严谨而有序。但是,在服务维护过程中,意外情况将难以完全避免。下面,我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程。
4.1 应急基本流程 维护服务应急处理流程 4.2 预防措施 针对上门服务过程中可能遇到的各种各样的风险,公司总结多年维护服务经验,针对一些可能出现的情况,制定了一系列预防处理措施,举例如下:
类型 事件 预防措施 处理 应用软件 无法启动软件可执行文件 上门人员提前准备好各类需维护软件安装程序 将应用软件数据文件备份后,重新安装 软件打开过程中或运行中异常错误关闭 上门人员准备好安装程序,操作系统优化和修补软件,查杀病毒软件 判断出错原因,备份数据,采取相关修复措施 操作系统 使用者本机操作系统异常或系统资源占用严重 准备好系统检查程序及修补程序,以及查杀病毒软件 告知使用者错误原因可能类型,提出解决方案,经使用者认可后采取相应措施 B/S结构系统,IE浏览器异常或无法下载控件 准备流氓软件清理程序、修复浏览器软件、查杀病毒软件 检查IE浏览器选项设置,分析原因进行修复 网络或服务器 B/S结构系统网络流量异常或服务器登录异常 判断服务器是否异常,否则准备杀毒软件 检查网络流量,流量异常小则报修网络服务商,流量异常大则查杀病毒 4.3 突发事件应急策略 系统运维应急方案是对中断或严重影响业务的故障,如宕机、数据丢失、业务中断等,进行快速响应和处理,在最短时间内恢复业务系统,将损失降到最低。在系统维护过程中,突发事件的出现将是很难完全避免的,针对这种情况,公司设计了完善的突发事件应急策略。
系统巡检人员要定期规范检查各硬件设备的运转情况和应用软件运行情况,同时做好日常的数据增量备份和定期全备份。对发现的问题在报各级负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。
对发现的问题在报负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。
公司不但拥有经验丰富的技术支持工程师,而且根据长期以来的客户服务工作经验,建立了常用知识库,其中包括多种常见技术故障和突发事件的应急策略。当获悉出现突发事件时,技术支持人员可以立即从知识库中获取相应的应急策略,并综合用户方的具体情况,给出相关解决方案,然后在第一时间以电话、邮件支持或现场服务的方式帮助用户解决问题,尽最大努力减小突发事件对用户日常应用的影响。
紧急情况 预防措施 应急策略 硬件损坏 项目单位操作用电脑硬件损坏 在磁盘数据未丢失情况下,保证数据安全性,建议项目单位替换相关硬件。
操作失误 加强培训力度,掌握培训效果,检验操作人员操作水准,提示注意事项。
操作失误未造成即成结果或数据未丢失情况下,保障数据安全,反之,协调相关部门,进行补救。对操作人员强调注意事项 配置丢失 培训时强调使用前配置方法和步骤,并特别提示需在使用前按要求操作 派出上门维护、培训人员重新配置,并耐心讲解。
数据丢失 培训时强调使用过程中注意定期备份重要数据,日常维护过程中,上门服务人员实时备份数据并告知用户 协调有关部门,进行补救,无法补救,提交报告说明原因。
突发事件应急策略服务流程图如下:
第二篇:IDC机房运维建设[范文]
IDC机房运维建设
机房建设,即指通过对机房的四个基本要素:结构,系统,服务,管理以及它们之间的相互联系的最优考虑,来提供一个投资合理,同时又高效,便利的环境,帮助企业实现包括成本,便利和安全多方面的目标。
机房建设的基础首先需要一个模块化的、灵活性的、可靠性极高的布线网络,它能连接话音、数据、图像以及各种用于控制和管理的设备与装置。企业就是利用这种布线网络的特点,来满足不断变化的使用者的需要,同时尽可能减少建设单位的花费。
内容:
机房装饰:抗静电地板铺设、微孔天花和机房墙板装修、天棚及地面防尘处理、防火门窗等; 供配电系统:供电系统、配电系统、照明、应急照明、UPS电源; 空调新风系统:机房精密空调、新风换气系统; 消防报警系统:消防报警、手提式灭火器; 防盗报警系统:红外报警系统;
防雷接地系统:电源防雷击抗浪涌保护、等电位连接、静电泄放、接地系统; 安防系统:门禁、视频。
机房动力环境监控系统:机房环境监控系统;
总体要求:布局合理、色彩明快、视野宽阔、具备防火、防潮、防尘、隔热、抗静电、抗腐蚀、易清洁、美观耐用等性能特点,并且材质轻盈、结构坚固、不易变形、拆装方便,便于地板下、吊顶内管线的连接、维修、机房装饰。
供配电:
电源供电采用一类供电,建立不间断供电系统。对外部设备、空调、照明、辅助插座等设备,由机房动力配电柜提供。
机房供、配电系统经机房配电柜向主机电源、外部设备、辅助设备、空调、照明等提供相制、电压、频率及额定容量符合要求的交流电。
机房专用配电柜
计算机机房专用配电柜,主要是指低压配电柜,在机房供配电系统中是重要的组成装置。机房低压配电柜设计的正确合理,配电柜内部件性能的好坏,对整个机房的正常用电起着重要的作用。
配电柜由自动空气开关、隔离开关、接触器、断电器、指示器、按钮、开关、电量仪、采集模块、电源防雷器等元器件和柜体组成。
配电柜具体配置及其技术要求如下:
(1)机房配电柜在编号时,除正常设配电柜号外,还应加配电柜的用途。如:动力配电柜、UPS配电柜。(2)机房配电柜根据用途设计各路供电准确,可靠。不同性质的供电对象不放在一个柜内控制。配电柜内要留用备用电路,作机房设备扩充时用。以便增容和维护使用。
(3)配电柜面板上可显示电流(大小及三相平衡情况)电压、频率用采集模块将运行状态传给场地集中监控系统。
(4)配电柜内主要电气组件应选用质量稳定,性能可靠的产品。主要有:紧急停电擎 / 各开关辅助触头(报警、故障、分合指示等)/ 主开关操作方式任选 / 通风、散热设备 / 各种测量仪表 /Vigil 漏电保护附件 / 脱扣方式(热磁式、电磁式)。组件之间的连接线(导线、电缆、中线、接地线等)均按国家规定的颜色、标志、编号。技术指针达到设计要求,能满足计算机设备及其辅助设备工作的要求。
(5)配电柜内配有应急开关。消防报警系统与动力配电柜(XP1)联动,当消防报警信号被确认后,由消防控制系统将动力配电柜(XP1)的电源切断。
(6)配电柜内应根据计算机设备及其辅助设备的不同要求,设置中线和接地的连接装置。配电柜(箱)中的安全保护接地线(PE)应与等电位接地汇集箱可靠连接,但注意机房内电源中线(N)应当与接地线(PE)绝缘。
(7)配电柜内采用的母线、接线排、及各种电缆、导线、中性线、接地线等,符合国家标准。关按国家规定的颜色标志、编号。所有空气开关连接均用铜排。
(8)配电柜内各种开关、操作按钮,标识清楚,可防止使用中出现误操作。
空调系统:
室内产生的有毒气体和生物污染物得不到合理的稀释和置换。CO2 浓度太高,空气品质劣化,困倦、无力、胸闷、精神恍惚、过敏、工作效率下降等。为了使工作人员在较封闭的机房内工作能有舒适感,需要在使用空调的同时不断补充新风,同时可保持机房内正压,提高机房洁净度。健康,节能,简捷,可靠的新风系统也成为人性化设计的重点。
监控系统:
通过预防性、主动式的维护,最大限度减小应用系统的非计划停机可能性;同时,对存在的问题及突发故障提供及时有效的技术支持、完善的解决方案和事后防范机制,最大限度地减少系统停机的持续时间,使应用系统达到可用性的最大化。
做到事前有预防,事中有措施,事后有预案,把握主动权,采取防治结合预防为主的方式积极消除各种隐患着力提高应急预案的能力。
等级:
新规范的最大特点是将电子信息系统机房根据使用性质、管理要求及其在经济和社会中的重要性划分为A、B、C三级。之所以这样说,是因为机房包含的范围太大,有银行、电信业的大的数据中心,也有企业自用的小机房,随着信息技术的发展,各行各业对机房的建设也都提出了不同的要求,如果不分级,规范遇到的最大问题将是可操作性。
根据新规范的定义,A级是最高级别,主要是指涉及国计民生的机房设计。其电子信息系统运行中断将造成重大的经济损或公共场所秩序严重混乱。像国家气象台;国家级信息中心、计算中心;重要的军事指挥部门;大中城市的机场、广播电台、电视台、应急指挥中心;银行总行等属A级机房。
B级定义为电子信息系统运行中断将造成一定的社会秩序混乱和一定的经济损失的机房。科研院所;高等院校;三级医院;大中城市的气象台、信息中心、疾病预防与控制中心、电力调度中心、交通(铁路、公路、水运)指挥调度中心;国际会议中心;国际体育比赛场馆;省部级以上政府办公楼等属B级机房。
A级或B级范围之外的电子信息系统机房为C级。
制约因素:
电力问题
随着设备的不断增加,数据中心能耗问题日趋严重。由于电网供电质量不稳定,有时会出现电源故障,包括电压浪涌、电压过压、欠压、瞬时电流冲击和故障停电等;事实证明,在计算机故障中,有50%的原因是电源故障造成的。所以一个高品质,电力稳定的数据中心机房环境是计算机和网络系统可靠运行的基础。
成本问题
提起数据中心的规划,很多企业的CIO仍旧没有给与足够的重视,他们要不是过度“谨慎”,要不就是很“激进”。前者会造成数据中心扩容困难,一旦业务量上升,IT设施跟进缓慢,由于前期预见性不足,导致数据中心的再建设,即重复性建设,这样会造成具大的浪费,无论是时间还是人力;后者目光很长远,初期投资就“下狠本”,预留出未来几十年的扩容空间和负载能力,但这样做是一种“过度规划”的冒进行为,考虑到经济形式依旧不明朗,如果日后业务萎缩,给企业带来的损失依旧不可小觑。
如何在有限的预算内,既保证数据中心的可扩展性,又确保不会造成过度浪费,是企业在数据中心规划过程中要认真考虑的问题。
灵活性和兼容性
随着科学技术的发展,不可能保证一个系统永远处于领先地位。因此在设计方案时,必须考虑到各系统的升级扩容的灵活性和兼容性,这就需要采用模块化、开放式、集散式、分布式的控制系统。使得不改变原有设备,在不损失前期投资的情况下,能够方便的升级和扩容,确保系统不过时。
操作和维护的方便性
人力成本的价值在大幅度增加,系统设计如何做到操作和维护更方便,对于提高工作效率,降低人力成本和维护成本,提高系统总体性能价格比是极其重要的环节。
由于机房具有一定复杂性,随着业务的发展,管理任务必定会日益繁重。所以在机房的设计中,必须建立一套全面、完善的机房管理和监控系统。所选用的设备应具有智能化,可管理的功能,同时采用先进的管理监控系统设备及软件,实现先进的集中管理,从而迅速确定故障,提高运行性能、可靠性,简化机房管理人员的维护工作。
客户都期望:系统稳定和数据安全 灵活性高,便于管理:模块式基础结构,迅速完成数据中心的建设,升级和管理 新技术的应用:适应快速变化的电信技术和市场需求 优化投资,节能增效:节省资源,提高效率
第三篇:监控运维方案
视频监控系统维护保养方案
由于监控系统的维护不受重视,致使很多监控设备刚刚投入使用就被损坏,原因不外乎以下几点。首先,管理部门对监控系统维护工作重视程度不够,认为没必要投入多的人力、物力及财力,因而在管理过程中忽略对监控系统设施的管理,导致系统的后期管理和维护跟不上。其次是没有一个完备的、有计划性的监控设备维护实施方案。设备维护是一项艰巨而重要的工作,监控设备分类并制定出维护方案,把复杂繁琐的工作变得条理化,明确化。当某个设备出现故障时,专业技术员可以很快调出这个设备的相关技术参数、性能指标等相关资料,并采取针对性的维护措施,有效的提高设备的维护效率。第三是监控设备的采购中过多的考虑了设备的性价比而忽视了监控系统及设备后期的维护和保养。监控设备品牌过多、产品供应商过多,厂家售后保障措施不到位等等原因,导致监控设备使用一段时间后,设备故障不断、损坏率不断攀升,最终不得不对原有设备进行大面积更新,出现重复投资、浪费严重的现象。
监控设备的维护方法
为了做好监控设备的维护工作,维修中心配备相应的人力、物力(工具、通讯设备等),负责日常对监控系统的监测、维护、服务、管理,承担起设备的维护服务工作,以保障监控系统的长期、可靠、有效地运行
1、维护基本条件
古话说的好,“巧妇难为无米之炊”,对监控系统的维护来说也是一样的道理,对监控系统进行正常的设备维护所需的基本维护条件,即做到“四齐”,即备件齐、配件齐、工具齐、仪器齐。1)备件齐
通常来说,每一个系统的维护都必须建立相应的备件库,主要储备一些比较重要而损坏后不易马上修复的设备,如摄像机、镜头、监视器等。这些设备一旦出现故障就可能使系统不能正常运行,必须及时更换,因此必须具备一定数量的备件,而且备件库的库存量必须根据设备能否维修和设备的运行周期的特点不断进行更新。2)配件齐
配件主要是设备里各种分立元件和模块的额外配置,可以多备一些,主要用于设备的维修。常用的配件主要有电路所需要的各种集成电路芯片和各种电路分立元件。其他较大的设备就必须配置一定的功能模块以备急用。这样,经过维修就能用小的投入产生良好的效益,节约大量更新设备的经费。3)工具和检测仪器齐 要做到勤修设备,就必须配置常用的维修工具及检修仪器,如各种钳子、螺丝刀、电笔、电烙铁、胶布、万用表、示波器等等,需要时还应随时添置,必要时还应自己制作如模拟负载等作为测试工具。
2、设备维护中的一些注意事项
在对监控系统设备进行维护过程中,应对一些情况加以防范,尽可能使设备的运行正常,主要需做好防潮、防尘、防腐、防雷、防干扰的工作。1)防潮、防尘、防腐
对于监控系统的各种采集设备来说,由于设备直接置于有灰尘的环境中,对设备的运行会产生直接的影响,需要重点做好防潮、防尘、防腐的维护工作。如摄像机长期悬挂于棚端,防护罩及防尘玻璃上会很快被蒙上一层灰尘、碳灰等的混合物,又脏又黑,还具有腐蚀性,严重影响收视效果,也给设备带来损坏,因此必须做好摄像机的防尘、防腐维护工作。在某些湿气较重的地方,则必须在维护过程中就安装位置、设备的防护进行调整以提高设备本身的防潮能力,同时对高湿度地带要经常采取除湿措施来解决防潮问题。2)防雷、防干扰
只要从事过机电系统的维护工作的人都知道,雷雨天气一来,设备遭雷击是常事,给监控设备正常的运行造成很大的安全隐患,因此,监控设备在维护过程中必须对防雷问题高度重视。防雷的措施主要是要做好设备接地的防雷地网,应按等电位体方案做好独立的地阻小于1欧的综合接地网,杜绝弱电系统的防雷接地与电力防雷接地网混在一起的做法,以防止电力接地网杂波对设备产生干扰。防干扰则主要做到布线时应坚持强弱电分开原则,把电力线缆跟通讯线缆和视频线缆分开,严格按通信和电力行业的布线规范施工。
3、具体如下:
I.每季度一次设备的除尘、清理,扫净监控设备显露的尘土,对摄像机、防护罩等部件要卸下彻底吹风除尘,之后用无水酒精棉将各个镜头擦干净,调整清晰度,防止由机器运转、静电等因素将尘土吸入监控设备机体内,确保机器正常运行。同时检查监机房通风、散热、净尘、供电等设施。室外温度应在-20℃~+60℃,相对湿度应在10%~100%;室内温度应控制在+5℃~+35℃,相对湿度应控制在10%~80%,留给机房监控设备一个良好的运行环境。
II.根据监控系统各部份设备的使用说明,每月检测其各项技术参数及监控系统传输线路质量,处理故障隐患,协助监控主管设定使用级别等各种数据,确保各部份设备各项功能良好,能够正常运行。III.对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象应及时更换、维修,如视频头等。
IV.对易吸尘部份每季度定期清理一次,如监视器暴露在空气中,由于屏幕的静电作用,会有许多灰尘被吸附在监视器表面,影响画面的清晰度,要定期擦拭监视器,校对监视器的颜色及亮度。
V.对长时间工作的监控设备每月定期维护一次,如硬盘录像机长时间工作会产生较多的热量,一旦其电风扇有故障,会影响排热,以免硬盘录像机工作不正常。
VI.对监控系统及设备的运行情况进行监控,分析运行情况,及时发现并排除故障。如:网络设备、服务器系统、监控终端及各种终端外设。桌面系统的运行检查,网络及桌面系统的病毒防御。
VII.每月定期对监控系统和设备进行优化:合理安排监控中心的 监控网络需求,如带宽、IP地址等限制。提供每月一次的监控系统网络性能检测,包括网络的连通性、稳定性及带宽的利用率等;实时检测所有可能影响监控网络设备的外来网络攻击,实时监控各服务器运行状态、流量及入侵监控等。对异常情况,进行核查,并进行相关 的处理。根据用户需要进行监控网络的规划、优化;协助处理服务器软硬件故障及进行相关硬件软件的拆装等。
VIII.提供每月一次的定期信息服务:每月第一个工作日,将上月抢修、维修、维护、保养记录表以电子文档的形式报送监控 工程质量保证:
维护与保养工作的前提条件是系统的工程质量良好,为此,各相关部门必须做到:
1、采购部:必须确保采购的器材与材料符合工程需要,达到国家相关部门的要求,安防工程专用的专业器材必须选用通过公安部门检测的合格产品。
2、工程部:制定的工程方案必须是科学合理的系统方案,必须符合建设单位的使用要求,可以达到国家相关规定的检测。
3、技术部:工程实施过程中,必须狠抓工程质量,落实各项质量保障措施,以确保没有工程质量隐患。
工程技术资料的交接
为了确保售后服务部可以有更好的条件做好系统维护与维修保 养工作,工程技术部在工程完成后必须做到:
1、工程验收或交付使用时,必须通知售后服务部人员到场,使 得售后服务人员尽快熟悉工程的组成,使用情况与建设单位的相关使用人员。
2、工程交付使用后,工程部、技术部必须向售后服务部提交该 工程的以下资料:(1)所有设计方案、图纸
(2)相关器材及设备的说明书、合格证、检测报告等(3)工程的所有竣工资料系统维护的日常例行工作
系统维护的日常例行工作,由售后服务部负责日常实施,具体规定如下:
1、建立系统维护工作档案,详细记录各工程系统的日常维护工作,做到任何一个系统,都可以交由本部门任何一名技术人员随时进行,而不会因为缺少相关资料或不是本人经办而无法开展工作。
2、从系统交付使用开始,每月与用户的使用人员电话交流一次,做到系统的使用情况心中有数,对用户使用过程中碰到的各种问题耐心解答,使得 用 户 可 以 用 好 系 统,充 分 发 挥 系 统 的 功 能 越 作 用,将 种故障尽量消除在问题出现前。
3、从系统交付使用开始,每二个月对系统的情况进行一次例行检查,且尽可能邀请用户的使用人员陪同检查,同时可以对使用人员的使用和日常维护能力进行实际的进一步培训和提高。
4、从系统交付使用开始,每半年对系统的关键设备如闭路电视监
控 系 统的摄像枪、云台、数码录像主机、彩显、监视器等,以及防系统的主机、探测器等器材,综合检查一次其工作性能,确保系统的运作情况良好。
5、从系统交付使用开始,每年对系统的所有设备和线路进行一次全面检查,尽量使得系统的性能维持在交付使用时的良好状态。对于由于使用时间过久,而性能偏差太大影响系统的整体效果的,应 该 尽量说服用户予以更换,以确保系统的正常使用。维修保养工作的具体运作
1、行政部应该将所有用户的相关情况整理归档,接待并整 理好用户的报障记录。
2、每天上班后即将待处理的报障记录交给售后服务经理,售后 服务经理可以根据具体情况安排工作。
3、行政部与售后部协作,建立维修工作记录卡,每次客户报障,从接到电话,到派出相关技术人员前往处理,以及处理过程,处理结果,用户意见均应有完整记录,并将其作为相关人员的工作考核标准,列入考核体系中。
4、一般的故障处理,售后服务人员应于接报后次日完成,主要 设备的故障,影响系统使用的,在接报后4小时内完成处理,维修保养工作的具体运作,特别严重的故障引致系统瘫痪的,应在接报后2小时内到场。
5、按照国家相关规定落实保修工作,属于保修范围的,一定要 保证用户得到保修服务,对于将会影响系统整体工作的器材,保修期间应该提供备用机,或根据现场情况,采取可行的办法使得用户可以继续正常地使用系统的基本功能,尽量减少由于保修工作对用户所造成的不便。
二、检修主要问题
1超五类网线抗拉性差,检查线是否被拉断?可观察变压器电源指示灯供电状态?检查变压器工作是否正常?
2网线拉断处已完全正确对接好,但还无法供电,检查网络插座是否被损坏?检查变压器工作是否正常?
3线路供电正常,无视频信号,检查线是否被拉断?网线拉断处已完全正确对接好,检查双绞线视频传输器是否损坏或接头松动,可与其它通道交换检测。(如检查双绞线视频传输器损坏请申请更换)4有视频不能控制云台,检查线是否被拉断?网线拉断处已完全正确对接好,检查球机编号与其通道地址编码是否对应?
解决方法:3台球机地址编码分别为大门口
1、油罐区
2、钻井平台3,主机(硬盘录像机)通道地址编码,通道1地址编码为1,通道2地址编码为2,通道3地址编码为3。如球机安装位置错位,请调换原来位置。
三、摄像机维护与维修
①外部透明罩是高度透明的亚克力板,经一次性压制成半球形,摄像机需要良好的透光性,切勿磨花透明罩导致摄像机图像模糊,平时要保持透明罩干净明亮。当发现图像模糊时,请检查透明罩外部是否太脏或是已磨花。如内部积灰请小心卸下整机,在安全的条件下打开摄像机透明罩,小心擦灰。
②内部不仅有电子电路,还有机械装置,它的体积小内部空间有限,机械装置比较小巧,切记轻拿轻放,勿摔勿碰。监控系统安装线序说明
本系统为了拆卸再次安装方便,特采用超五类550室外阻水双绞线,以集中供电方式安装。安装注意事项:
1、线缆采用RJ45标准水晶插头连接,线序为:橙白、橙、绿 白、蓝、蓝白、绿、棕白、棕(标准485B)。
2、线色功能对照:
3、电源采用集中供电方式,统一在控制室内输出,以AC220V
电压传送至摄像机安装位置,由变压器变为AC24V供给摄像机,电源接头采用活接插头。
监控摄像机的日常维护注意事项
由于工业CCD摄像机是24小时不间断地工作,因此作好摄像机的日常维护将对其使用寿命和效果具有很大的影响,摄像机的日常维护应注意如下几点:(1)通电以前应保证摄像机各种状态设置正确。(2)避免在高温、潮湿、强磁场的环境工作。(3)避免阳光或强光长时间直射,以免损坏摄像靶面。(4)注意摄像机的工作电源的稳定性。(5)注意摄像机的日常清洁。
(6)注意光圈调整,降低或避免由于景物对比度的较大反差引起的“拖尾”现象。
1、熟悉产品性能工程商和用户在拿到半球摄像机产品后,应熟悉该产品的技术参数,如输入电压是多少,功率多大,有什么功能等,尽量做到心里有数。
2、检查安装前应对半球摄像机进行检测和调整,使摄像机处于正常的工作状况。
3、安装方式施工前,可以根据环境和安全性、美观性等出发,采用壁装或者吊装等安装方式。
4、安装角度半球摄像机的安装角度直接影响到监控图像的范围,所以安装时需要更多地按实地需求来操作。如安装在小区门口小于6米处时,摄像机的角度建议最好是30°-60°;若安装在收银台时,摄像机的角度应考虑在±15°-20°等。总之,摄像机尽可能避免逆光摄像情况的出现,这样方能尽可能地达到客户的要求。
5、做好视频接口的处理半球摄像机视频信号输出端口、电源输入端口、控制信号端口比较重要,安装时应尽量做好防水,以及防氧化处理。以免日后出现不稳定、不受控制,甚至不显示图像的现象。摄像机一般都需要24小时不间断地工作,因此做好摄像机的维护,则可以延长摄像机的寿命和保障摄像机图像效果的稳定性。
闭路电视监控系统维修保养细则 1闭路电视监控系统主要包括:(1)摄像机信号采集系统(2)信号传输系统(3)本地记录控制系统(4)本地显示系统 闭路电视监控维修保养方式:
根据闭路监控系统的特点及实际情况我们制定下列方式: 每月一次现场巡视系统各个部分(包括摄像头及其相应的防雷设备)的工作情况,发现问题时立即现场修复。3 摄像机信号采集系统的维修保养 3.1 摄像机可以分为:
(1)摄像机成像机芯(2)内置万向云台(3)内置万能解码器
(4)22倍物理变焦10倍电子放大镜头(5)护罩和支架 3.2维护保养内容
(1)摄像头信号丢失,应检查摄像头电源线及信号线,检查相关接头,尽快维修。(2)CCD芯片发热老化。(3)解码器的解码板继电器不动作(4)镜头不动作。(5)云台不动作等等。(6)护罩的清洁卫生 3.3维护保养方法
(1)摄像枪部分:目测摄像机有无图像、干扰、清晰度如何、信 号的强弱情况等。(2)云台部分:进行云台控制,检查水平、垂直方向的运作情况,包括上下、左右、自动。
(3)镜头部分:调试可变镜头伸缩情况,光圈开与闭,焦距的调 整。
(4)电源部分:用万用表检查电源的输出是否稳定,电源的发热情况是否正常。(5)卫生状况:摄像机外罩是否清洁直接关系到摄像枪的图像清 晰度。(6)安全状况:检查摄像头的云台、支架间是否牢固。
(7)焊点状况:每月一次检查各BNC接头是否焊点老化。监控故障处理方法与注意事项
监控设备在安装过程中就已经做好了准备,在设备日常使用中要注意清洁和防尘,切忌不要勤开关。比如在开启系统后不要马上关闭系统,这样会容易在带电的状态下突然断电损坏设备。虽然在系统控制编写程序时已经注意到该事项。是已经作了一定保护能力。但不能具体。避免潜在损害
1.请勿尝试自行维修组成系统的所有器材,除非您是经过系统培训的维修技术人员,请始终严格按照操作手册进行系统的使用和维护。
2.请保持所有器材的通风畅顺,否则可能会导致器材内部组件短路而引起火灾或触电事件,甚至可能会因此造成整个系统的崩溃。
3.为了避免可能发生的电击事件,请勿在雷雨天期间连接或断开系统的任何电缆,也不要尝试对系统的器材进行带电维修和安装。
4.本系统的大部分器材都经过了严格的电磁辐射(EMC)或类似的安全验证,一般情况不会对其它电子产品产生干扰,但在系统需要增加电子器材设备时,请注意您选择的产品有无通过类似的测试验证,以免对现有的系统产生干扰。
5.断开所有电缆连接时,请针对不同的电缆连接头方式,捂紧连接器进行拔插,请勿使用蛮力强拉电缆。连接电缆之前,请确认两个连接头的朝向正确并对齐。6.系统或器材在关闭之后,请勿尝试即时重启,投影机必须要等待散热风扇完全停止运行才能重启,散热时间视乎运行的状态而定(一般建议不低于30分钟)。其它电子器材重启间隔时间建议不少于3分钟。
7.投影机启动时间大约60秒(按下Stby键后),30秒后才会打开光栅,有强光投射于屏幕,此过程请不要朝镜头内看,以免光栅打开灼伤眼睛。
8.保持电子系统运行的基本清洁环境,做到无烟雾、无灰尘,因为烟雾和灰尘对投影机以及所有电子器材的损害较大,虽然投影机拥有密封、防尘、防烟的DMD?芯片。9.其它安全说明或详细的注意事项请参考附件的产品说明书。在一个监控系统进入调试阶段、试运行阶段以及交付使用后,有可能出现这样那样的故障现象,如:不能正常运行、系统达不到设计要求的技术指标、整体性能和质量不理想,亦即一些“软毛病”。这些问题对于一个监控工程项目来说,特别是对于一个复杂的、大型的监控工程项目来说,是在所难免的。电源故障
电源不正确大致有如下几种可能:供电线路或供电电压不正确、功率不够(或某一路供电线路的线径不够,降压过大等)、供电系统的传输线路出现短路、断路、瞬间过压等。特别是因供电错误或瞬间过压导致设备损坏的情况时有发生。因此,在系统调试中,供电之前,一定要认真严格地进行核对与检查,绝不应掉以轻心。线路故障 若处理不好,特别是与设备相接的线路处理不好,就会出现断路、短路、线间绝缘不良、误接线等导致设备的损坏、性能下降的问题。在这种情况下,应根据故障现象冷静地进行分析,判断在若干条线路上是由于哪些线路的连接有问题才产生那种故障现象。这样就会把出现问题的范围缩小了。特别值得指出的是,带云台的摄像机由于全方位的运动,时间长了,导致连线的脱落、挣断是常见的。因此,要特别注意这种情况的设备与各种线路的连接应符合长时间运转的要求。视频监控系统安装定期维护保养的好处在哪里?
一、视频监控系统的监控中心设备 如矩阵、视频服务器、电视墙等,安装在监控中心机房,设备集中在一个环境比较好的室内运行,监控中心设备出现故障的机率较小;而前端的摄像机、快球安装在室外,视频光端机安装在室外配电箱中,设备要经受风吹雨打、夏天高温和冬天低温等恶劣的环境中工作,因此出现故障的机率比较高。对前端监控设备的维护,必须能够测试摄像机图像、快球的图像、云台控制、视频光端机的光功率,以及使用万用表对供电系统进行测试等,才能综合解决前端设备可能出现在故障。在视频监控系统中由于每个监控点位于不同的位置,需要花很多人力和时间在前端摄像机(快球)、传输设备安装,以及传输线路辅设,如何快速检测和维护设备和传输线路,对于监控系统的维护,通常是对监控设备和传输线路进行检修维护。
二、前端设备摄像机维护当监控中心收不到图像时,工程人员首先要检测摄像球或球机是否正常。检测摄像设备时,工程人员使用视频监控综合测试仪表做三方面检测工作:第一、用仪表测试摄像机是否有图像,彩色显示屏能够清晰显示摄像机采集的图像,如果仪表收不到图像或收到的图像异常,说明摄像机存在故障;第二、使用监控综合测试仪的视频信号衰减测量,测量摄像机的视频复和电平,正常范围是800-1000mV,电平太低会造成图像变暗,电平太高会造成虚影;第三、使用仪表的万用表,测量摄像机的变压器供电是否正常,一般变压器输出是直流12V,球机的变压器输出是交流24V,变压器是监控系统中故障率比较高的配件。
三、云台控制维护安防监控系统中,云台或球机应用很广泛,监控中心工作人员可以机动的调整摄像角度,当云台或球机不受控制时,或者在某个位置转动不了,工程人员需要携带多功能键盘测试云台或球机的转动是否正常。但是,不同的云台或球机厂家,他们拥有自己专用协议,工程商维护球机时就要带相应的多功能键盘测试,有可能要带多个键盘以备测试不同的球机使用。工程人员使用视频监控综合测试仪很好的解决这个问题,因为它内嵌入了多种协议,和专用于测试云台转动的云台续转测试功能,工程人员可以通过仪表操作云台不停云台转动的云台续转测试功能,工程人员可以通过仪表操作云台不停转动,观察云台转动时是否有卡位的现象。
四、视频光端维护视频光端机分为发射端设备和接收端设备,发射端设备和摄像机一样置于室外,工程人员通常是对发射端设备过行维护测试。对于光端机的检修工作,分三个步骤进行测试:
第一、用视频监控综合测试仪的万用表测量光端机的供电是否正常,一般电源输入是直流5V;第二,测量光端机的光纤输出功率是否正常,发射端发射波长是1310n接收波长1510n,20KM的光端机一般发射功率是-9dBm左右;第三,测试光端机的视频端口和RS485/RS232通信是否正常。监控综合测试仪发送标准彩色图型条图像信号到视频光端机,监控中心收到视频光端机送来的测试彩色条,说明视频传输部份正常;用仪表的RS485/RS232数据捕捉功能接收光端机的控制信号,如果接收到监控中心发送过来的控制代码,说明光端机的RS485/RS232通信传输正常。
五、BNC同轴电缆传输维护工程人员对线缆维护时,使用综合测试仪做三个步骤的工作: 第一,在摄像机端,将BNC线缆接入仪表,使用仪表的图像发生器发送标准彩色图型条,正常情况下,监控中心的监视器应该收到同样的彩色图型条,这个步骤判断BNC线是否断开,监控中心收到图像色彩是否正常;第二,在监控中心,使用仪表的视频信号衰减测量功能,测量视频复和电平经过BNC线缆传输后是否衰减过大,一般正常是800-1000mV,衰减过大会造成图像抖动、图像变暗等现象。第三,如果BNC线缆中间断开,因为BNC线缆埋在线槽里,工程人员没有测试工具要找出故障点非常困难,使用综合测试仪表的测线功能,仪表发射信号并测量出大概断点位置,为工程人员马上找到断点位置,大大提高工作效率。目前的视频监控系统,传统的模拟图像占主导地位,IP数字摄像由于兼容性等问题,暂时未来得到普及。一般小区域的监控系统如工厂、楼宇,直接采用BNC同轴电缆传输图像,BNC同轴电缆由于抗干扰性弱,而且每条BNC线缆只能传输一路视频,但由于监控区域小,采用同轴电缆传输相对成本较低,BNC同轴电缆得以普遍使用。BNC线缆由于老化、人为损坏等原因,造成视频图像质量下降甚至中断,在维护工作中通常需要检测BNC线缆是否有问题。
六、光纤传输维护
光纤传输具有容量大、高速率、高稳定性等特点,视频监控系统越来越多采用视频光端机、光收发器等光纤设备来传送视频图像和控制信号。高速公路监控、平安城市监控等大规型的监控系统采用光纤传输来实现高稳定的视频传输,随着光纤通信技术发展,视频光端和光纤线缆价格越来越低,视频监控系统采用光纤传输已经非常普及。光纤传输通常是应用在几百米到一百公里之间信号传输,对光纤线缆进行检测也是必不可少的环节。对于光纤的维护,工程人员必须使用专业的光纤测试仪表,如光源、光功率计、OTDR等。稳定光源是专门用来发出高稳定功率值的雷射光,雷射光经光纤传输后有一定的衰减,通过光功率计测量经光纤传输后的功率值,计算出光纤损耗值是多少dB。测量光纤耗时,必须用光源和光功率计配对使用,才能准备计算出光纤损耗;而OTDR是用来测量光纤的断点位置的仪器,它探测光纤大概在多少公里处断开,但OTDR的造价太高,规模较小的工程商可以采用光纤寻障仪来测量断点位置。对于小规模的工程商,最需要的光纤测量工具就是光功率计,因为长距离的光缆通常是电信运营商或广电系统进维护,小规模的工程商只需要测量光纤设备的功率和光纤损耗,找出问题所在就足够了。维护光纤时,工程人员使用监控综合测试仪的光功率测量功能,切换到相对应的波长对多模、单模的光纤进行测量,光纤连接的光通信设备(如视频光端机、光收发器)正常情况下会发射光信号,如果仪表接收不到光信号时,显示-70dBm,说明光纤不通,需要检查光纤跳线、光缆是否断开或损坏。总结:我国的平安城市治安监控系统,在全国各省市全面实施,并取得显著的成果。目前,全国乃至全世界,视频监控系统的应用都非常广泛,在道路、治安、森林防火、楼宇、工厂、商场、超市、企业、家居等各个领域发挥其重要的作用。庞大的监控系统中,前端的快球、摄像机设备,可以说是不计其数。从而因此,安防监控安装的定期维护保养不但可以更进一步提高了人们安全性和工作效率,还带来极大的便利,节省了人力、物力和财力。设备质量问题
从理论上说,各种设备和部件都有可能发生质量问题。但从经验上看,纯属产品本身的质量问题,多发生在解码器、电动云台、传输部件等设备上。值得指出的是,某些设备从整体上讲质量上可能没有出现不能使用的问题,但从某些技术指标上却达不到产品说明书上给出的指标。因此必须对所选的产品进行必要的抽样检测。如确属产品质量问题,最好的办法是更换该产品,而不应自行拆卸修理。除此之外,最常见的是由于对设备调整不当产生的问题。比如摄像机后截距的调整是非常细致和精确的工作,如不认真调整,就会出现聚焦不好或在三可变镜头的各种操作时发生散焦等问题。另外,摄像机上一些开关和调整旋钮的位置是否正确、是否符合系统的技术要求、解码器编码开关或其它可调部位设置的正确与否都会直接影响设备本身的正常使用或影响整个系统的正常性能。
如果做到以上这些防护与保养相信监控设备会使用很久。视频监控系统维修保养
在我们工程安装和旧工程改造中发现有很多客户对监控系统维护保养的不及时,和监控系统经常性的出现问题表现出很多意见和不满。
针对这种情况,我们对市场进行了分析对产品进行了研究,同时和多家监控产品厂家达成协议,为了相应市场要求,同时为了解决广大客户安防监控系统维修保养问题,安装单位维修不及时等一系列让客户头疼的问题,欣智恒在这种情况之下推出了多种组合的服务体系,其中包括,整体式监控维保,监控维护,监控定期保养,监控工程改造,监控按次上门服务,维修保养等服务。
以人为本,交流、坦诚、信任为公司的内部管理信条。以科技创新,新技术、新思路、新方法为营销理念。光明磊落、任重道远、众志成城、持之以恒。监控维保服务承诺
作为专业的一级维修服务企业,我公司不仅技术力量雄厚、维修面广、设备先进、有着十分丰富的管理经验,而且特别注重服务质量、服务意识等方面的培训和承诺。首先在服务意识的培训方面,欣智恒教育员工要高度树立“让每一次服务都能使客户满意”的宗旨,要求员工做到用语文明、着装统一、实事求是。除服务意识的培训外,在具体措施方面,我们有如下服务承诺:
1.服务热线:周一至周六,早8:30~17:30值班,10分钟内做出回应。2.抢修小组,可随时到现场抢修。
3.城区内提供上门服务,仅收取适当上门费(事先商议)。4.实行先检查故障,再报所需费用,最后维修排除的政策。5.故障没排除,不收取费用。
6.费用或服务不满意,用户可选择放弃维修。7.最大限度给客户自由选择权。8.在选用配件方面,严把质量关,从原厂或一级厂采购正品配件,杜绝假冒伪劣配件的使用。
9.在维修或安装作业方面,严格按维修程序及操作规程执行,确保维修质量。10.在收费方面,严格执行市物价局和欣智恒公司《收费标准》执行,换下的旧零件可返还给客户,决不夸大故障、绝不乱收费。11.所有经我公司修好的监控设备一律实行保修,保修期为三个月,在保修期内如因维修质量或配件质量问题造成用户的机器再次出现故障,一律由我公司负责免费维修。监控产品售后服务
我们保证:我们出售的产品是通过正规进货渠道采购的产品.与您亲临厂家选购产品时享受同样的质量保证对有质量保证书的产品按照保证书的承诺执行.其它产品按国家有关规定执行。
通讯与安全网所销售的产品除人为或自然不可抗拒因素损坏外免费保修一年(除厂商提供的保修期及特别标明的产品外)。
我公司对所销售产品施行以下品质担保: 1.乙方对其所售产品提供一年期免费质保和终身维修服务。即一年内,由于产品本身材质不良或设计缺陷造成的损害,乙方负责免费更换或维修(一个月内包换,但须保证产品外观没有磨损,不影响乙方二次销售),一年以后,乙方所进行的维修、更换将收取一定成本费用。质保时,请务必将产品(包括各配件)一同返回,并出示购物发票或《销售合同》等有效证明,我们会给您及时修复或更换新的产品。
2.以下非本公司因素造成的产品损害或其他原因均不在本公司的免费维修之列: a.安装不正确 b.电压不稳 c.自然因素 d.意外事故 e.未按使用说明书使用而造成使用不当 f.非本公司授权的维修或改动 g.未提供应有的工作环境 h.机器缺少必要的保养
3.在售后一周内,由于产品品质问题严重影响甲方使用的,甲方可要求退货,但须保证产品外观无任何损伤且包装完整;乙方承诺在收到退货后二个工作日内办理完毕退货手续。
4.乙方对所售产品提供相应的技术支持和技术合作,并保证24小时技术热线服务。
第四篇:IT运维方案
运维服务方案
202_年2月
第1 页
..........................................................................................................................................................2 第1章 项目概况............................................................................................................................3 1.1 项目目标...............................................................................................................................3 1.2 需求分析...............................................................................................................................3 第2章 运维服务管理体系建设....................................................................................................4 2.1 IT服务管理概述...................................................................................................................4 2.2 运维服务管理流程体系.......................................................................................................5 2.2.1 服务支持.......................................................................................................................6 2.2.2 服务提供.......................................................................................................................7 2.2.3 服务质量承诺.............................................................................................................11 2.3 服务管理............................................................................................................................11 2.3.1 服务管理总则.............................................................................................................11 2.3.2 问题管理.....................................................................................................................12 2.3.3 服务记录管理.............................................................................................................13
第2 页
第1章 项目概况
1.1 项目目标
结合企业业务工作及信息化建设实际,完善运维管理体系的建设,加强信息系统正常运行保障,“以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、提升用户服务满意度。
1.2 需求分析
本次项目需求主要包括两个部分,1、运维管理体系建设要求;
2、信息系统正常运行保障服务。
其中运维管理体系建设应完善服务内控制度即服务质量管理,逐步建立起一套符合企业自身实际的运维管理标准及应用制度;建设IT运营维护管理平台,采用标准的IT运维管理流程,提供准确、详尽、专业的报告制度,通过客观分析运维过中出现的各种障碍及问题,为企业信息化建设提供决策依据。
信息系统正常运行保障涵盖了
1、一般信息化设备及软件的运维管理;
2、防病毒服务;
3、办公区域内设备及软件巡检普查;
4、提供符合企业实际的服务响应水平及质量保障;
5、信息化资产管理
第3 页
第2章 运维服务管理体系建设
2.1 IT服务管理概述
现今,随着计算机技术,特别是网络技术的飞速发展,对于许多行政单位,许多企业而言,IT技术越来越深入到核心业务,影响策略制定和企业的发展。从而对IT环境的可靠性,可用性和快速适应性提出了越来越高的要求,与此同时,IT环境(包括软/硬件及相关技术)却变得越来越复杂。因此,对于一个单位而言:
如何把有限的IT资源最有效的作用于核心业务的发展
如何最快地获取专业的支持能力
如何实现对系统的完善管理,提高系统的可靠性和可用性
如何提高用户的工作效率,增加最终用户满意度
如何跟上IT技术的发展,及时更新相关技术
如何提高对IT系统利用的灵活性
如何更好地管理IT运营成本
以提高服务能力,将会是单位可能面临的问题。
IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套指导IT服务的方法论。ITIL是英国国家电脑局(CCTA)于八十年代开发的一套IT业界的服务管理标准库,它把业界在IT管理方面最好的方法归纳起来,形成规范,旨在为企业的IT部门提供一套从计划、研发、实施到运维的标准方法。它一经提出,便被欧洲各大公司纷纷采纳,随后在澳洲,美洲和亚洲流行开来,目前已成为IT服务管理事实上的标准。
第4 页
通过参考这些标准,我们可以充分借鉴国际化标准的IT服务管理最佳经验,使我们“站在巨人的肩膀上”来设计、规划及运维IT服务,尽可能少走弯路,有效提高IT服务的质量。
ITIL框架图
ITIL是基于流程的方法论。IT部门可用其检查是否用一种可控的和可训练有素的方法为最终用户交付所需的IT服务。ITIL合并了一套最佳的实践惯例,可适用于几乎所有IT组织,无论其规模大小,或采取何种技术。
ITIL对IT服务管理实践中涉及的许多重要问题进行了系统的分析,包括全面的检查清单、任务、程序、责任等与任何IT服务组织密切相关的问题。这些概念的定义也涵盖了大多数IT服务组织的主要行为。IT服务组织可以借助ITIL的指导建立和拓展自己的IT服务流程。
2.2 运维服务管理流程体系
运维务管理最核心的是“服务支持”(ServiceSupport)和“服务提供”(ServiceDelivery)两个模块。各流程相互贯穿和作用,形成有机整体,共同建立一个健全的服务管理体系。
第5 页
2.2.1 服务支持
服务支持的内容描述了一个客户如何访问适当的服务,以支持其业务。服务支持包含以下内容:
2.2.1.1 服务台
我们为企业提供统一报障、统一维修、统一的报障电话申请服务。服务台是服务提供者和用户之间的日常工作的单一联系点。它也是报告突发事件和提交服务请求的焦点。正因为如此,服务台的职责是保持将服务相关信息,行为和契机通知用户,并追踪了解用户每日的行为。例如,服务台可能扮演用户提交变更请求的联系点,基于变更管理流程传达变更实施计划,并保持将变更实施进程通知用户。变更管理应该确保服务台随时保持对变更行为情况的掌握。
2.2.1.2 突发事件管理
突发事件管理流程致力于解决突发事件,并快速恢复服务供应。突发事件被记录下来,并且事件记录的质量决定了相关的其它流程的效力。
突发事件管理的目标:
突发事件管理的目标是尽可能迅速地根据SLA中定义的普通服务级别作出反应,使产生问题后对业务行为及组织和用户的影响最小。突发事件管理也应该保留对事件的有效记录,以便于衡量和改进流程,并向其它流程汇报。
2.2.1.3 问题管理
对于突发事件有两种处理方法,一种是对其做出服务快速响应,尽快恢复其正常运行,另一种是鉴别和解决问题根源。这两种方法之间存在微妙的区别,而且经常被互相混淆。对其做好区分具有重要意义。
如果问题被怀疑存在于IT架构内部,问题管理流程将会瞄准其潜在的根源。
第6 页
一个问题可能是被突发事件暴露出来的,但是显然,问题管理的目标是解决问题根源,预防其可能产生的干扰,而不是迅速恢复系统运行。
当问题被识别后(被识别的问题通常称之为已知错误),通常需要进行一个业务决策,决定是否采取永久性措施改进系统架构,以预防再次发生新的突发事件。如果需要,提交一个变更请求来实现改进。
为了有效和高效地识别突发事件背后的问题根源及其发展趋势,问题管理流程需要准确全面的突发事件的记录。问题管理流程同样需要和可用性管理流程密切联络,以确定这些趋势并明确补救措施的重要性。
2.2.2 服务提供
服务提供主要包括:服务级别管理、能力管理、持续持续管理、可用性管理等。
2.2.2.1 服务级别管理
服务级别管理的目标是缕清与客户之间有关IT服务的协议,并付诸实施。因此,服务级别管理需要收集客户需求,IT服务组织可提供的设施,以及可用的财务资源。服务级别管理针对提供给客户的服务(聚焦客户的)。因此是基于客户需求建立服务(需求拉动),而非单纯基于现有技术所及(供应驱动),从而使IT服务组织提高客户满意度。服务级别管理阐述的内容有:
如何在服务级别协议(Service Level Agreement – SLA)中清楚地定义条款,使其可优化IT服务成本,并为用户所接受。 如何监控和讨论所提供的服务。
如何管理IT服务组织的供应商及其下包合同。
服务级别管理(Service Level Management -SLM)流程是用来确保服务级别协议,并支持运行级别协议及其它合同,保证所有对服务质量的影响减少
第7 页
到最小。此流程在服务质量和SLA基础上评估各种变更造成的影响,包含预期变更前的影响,也包含评估实施变更后的影响。SLA中某些最重要的目标和服务可用性、以及在容许周期内对突发事件形成决策有关。
SLM是服务支持和服务交付的关键。由于它依赖于其它流程的存在性,有效性及运行效率,它不可孤立存在。一个缺乏基础支持流程的SLA是没有意义的,缺乏支持的SLA就失去了承认其内容的基础。
2.2.2.2 一般设备软件安装及维护
此部分主要解决在用户使用当中遇到的软件各种问题,在进行软件维护时应做好用户数据的备份,建立软件维护流程,通过现场解决及用户培训的多种方式提高用户的使用水平和解决一般问题的能力。
软件维护主要内容包括:
对WINDOWS操作系统的安装、调试及升级;
外设(打印机、扫描仪等设备)的相关驱动程序及软件的安装调试; 经越秀工商授权进行软件安装、升级并排除软件使用过程中的故障; 解决软件冲突造成的系统故障;
对计算机进行病毒检测和清除,防止病毒扩散;
计算机标配的软件备份,包括随机恢复光盘,附带赠送软件、驱动程序等;
计算机外设的软件备份。
2.2.2.3 一般设备硬件日常保养及维修
计算机硬件维护:包括主机、硬盘、驱动器、显示适配卡及服务器等安装、调试和配置,充分利用现有设备,进行系统优化配置;对使用中的计算机存在或将要出现的故障进行及时的诊断、维修、替换,对客户原厂保修的机器(如计算
第8 页
机及配件、服务器等),我们代为联络维修,并跟踪维修情况。并根据越秀工商需要,对设备进行升级或更新,保证设备正常运行。
周边设备的维护:包括打印机、扫描仪、显示器等使用过程中出现的故障或不稳定因素排除,必要时对越秀工商原厂保修期内的机器,我们代为联络维修,跟踪维修情况,并根据客户需要,对设备进行升级或更新,保证工作任务的正常进行;
系统硬件设备(计算机、服务器,路由器,交换机、备份设备、MODEM等)、计算机线路连接、各种设备工作状态例行检查和维护;操作项目
维护工程师每月的对企业计算机设备的巡检服务,了解和记录最新的使用情况,对各终端在用办公软件予以普查并核对运维软件资产记录,通过月服务报告上报企业普查情况;对经常出现问题的设备进行登记和记录,并且制定知识库,对常出现的设备要重点检查、消除隐患,最大限度降低计算机设备的故障率。
维护工程师在对用户维护的时候,必须按照服务流程来进行,给用户提供快速、标准、满意的服务。对保内的计算机硬件进行免费的更换,时间方面按照原厂商的服务标准时间来进行。对保外的设备,维修费情况按照合同约定执行。
对经过维修或已更换配件的设备,根据具体情况延长保修期并更新资产库记录,更新配置库记录。
对终端用户的输入设备以及公用设备予以定期消毒处理。
第9 页
运维服务商每月进行一次巡检运维工程师制定《巡检工作计划》,说明采巡检时间安排、巡检内容、巡检地点、资源配合等是否通过服务主管、运维部、信息中心审批?是否运维工程师按照《巡检工作计划》执行巡检工作,并将巡检过程和结果记录在《巡检记录表》中运维工程师在完成巡检工作后,对巡检结果进行评估,并提出意见和建议,形成《巡检报告》是否通过服务主管、运维部、信息中心审批?是巡检过程中是否发现问题?否是否转【问题管理】流程中系统存在问题流程处理巡检过程是否有不符合的配置项?否结束是转【配置管理】流程处理图4-3 例行维护流程图
一般信息化设备硬件服务还包括:
供应商根据实际需要,经企业同意准备相应数量的维护零配件,协助越秀工商进行备件库的管理,并在零配件不足时及时补仓。 定期对计算机设备进行保养维护,定期进行用户满意度调查; 对一般信息化设备硬件进行定期巡检、保养,以保障设备运行正常; 进行硬件设备普查工作,建设可实现动态维护的硬件设备档案库 定期对公用信息化设备消毒除尘;
第10 页
检查硬件实际配置与设备登记表是否相符。 对故障设备的维修
在响应时间内完成故障设备的维修,维修人员应严格遵守维修规程。 建立硬件应急维修小组,对关键重点岗位及紧急的故障及时响应并及时汇报,对于故障设备的维修由越秀工商指定的具体技术人员组织监督进行;
对处于保修期内的故障设备,供应商在广州市工商局越秀分局授权的范围内代表越秀工商协调产品供货商予以维修,并监督维修时效和质量;
对处于保修期外的故障设备维修,如需更换零配件,可由供应商提供多家的报价,经用户选择审核确认后,方可进行更换;
2.2.2.4 客户端病毒处理
对存在病毒的终端予以隔离,生成事件安排工程师予以处理。
2.2.3 服务质量承诺
a、工作时间承诺:每周一至周五(不含节假日),按照采购人工作时间提供服务,投标人在接到采购人服务申请后 1小时 内响应采购人。如采购人需要投标人在节假日期间提供服务,投标人会全力支持,如需要,可到现场支持。
b、响应方式承诺:热线电话、远程桌面支持,驻场解决。
c、服务类型承诺:送修、现场、特殊服务要求(如购件、升级等)。d、保密要求承诺:详见保密协议。
2.3 服务管理 2.3.1 服务管理总则
服务工程师将认真学习和遵守采购人所有有关外来人员管理的规章制度,且
第11 页
有义务不对外透露在采购人获得的一切信息。
项目组成员在采购人的一切工作都在得到信息中心管理人员的授权之后进行。
项目组成员一旦发生政治事件、泄密、盗用用户资料、擅自更资料、故意隐瞒、超越授权操作导致恶性事件或给采购人带来影响重大的事件等事件,即视为安全事故。
全面配合采购人积极参与对其派驻工程师的有效的监督和管理,遵守采购人的相关规章制度。
坚决杜绝因项目组成员发生的安全问题。
保证其项目组成员符合一定的技术水平,采购人有权对不满足工作要求的越维科技项目组成员向越维科技提出更换的要求;工作中坚决杜绝弄虚作假的现象出现。
未经采购人同意,不将所接触到的采购人技术或业务资料、数据用作其他用途或以任何形式泄露归第三方。
2.3.2 问题管理
1、常见问题管理服务
根据多年的服务数据分析,我们发现,在日常运行服务项目中,70%的问题,都是曾经出现过的,如果能够对服务进程中遇到的所有问题及解决办法都作好详尽的记录,并将此作为服务项目组培训的素材,讲大大的缩短故障处理时间,降低服务成本。
针对采购人IT设备经常出现的故障,或采购人在计算机应用中经常遇到的问题,由项目负责人和技术骨干进行该类问题的技术研究并提供解决办法和防范建议的服务。
2、提升问题管理服务
对采购人IT设备出现的未知解决方案的故障,或采购人用户在计算机应用中遇到的未知解决办法的问题,越维科技提供相关资深工程师和项目主管一起进行该类问题的技术研究并提供应急性质的解决办法和相应的防范建议。
第12 页
2.3.3 服务记录管理
我司使用服务单作为服务记录,记录分别由服务受理人员、服务工程师以及被服务的客户三方完成,并且由客服中心服务台统一进行定期回访,每季度根据服务单统计服务信息并形成服务报告提交给采购人。
第13 页
第五篇:IT运维
IT运维IT 运维管理
所谓 IT 运维管理,是指单位 IT 部门采用相关的方法、手段、技术、制度、流程和文档 等,对IT 运行环境(如硬软件环境、网络环境等)、IT 业务系统和 IT 运维人员进行的综合管理.IT 运维管理主要包括七个方面的管理内容:
·设备管理:对网络设备、服务器设备、操作系统运行状况进行监控和管理;
·应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服 务的监控管理,如邮件系统、DNS、Web 等的监控与管理;
·数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;
·业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理, 主要关注该业务系统的 CSF(关键成功因素 Critical Success Factors)和KPI(关键绩效指 标Key Performance Indicators);
·目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;
·资源资产管理:管理企业中各 IT 系统的资源资产情况,这些资源资产可以是物理存在 的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;
·信息安全管理:目前信息安全管理主要依据的国际标准是 ISO17799,该标准涵盖了信 息安全管理的十大控制方面,36 个控制目标和 127 种控制方式,如企业安全组织方式、资产 分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;·日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩 效考核量化依据、提供解决经验与知识的积累与共享手段.