2007年10月22日星期一

IT服务信息库(我们老大写的)





IT服务信息库是通过对系统运维过程中,主机网络设备、应用系统的基础数据的收集,并通过分类和处理加以有效利用,使之能够为日常运维工作提供可靠的信息支持和强有力的工具。
IT服务信息库主要包括系统维护方案、系统构成信息、系统变更信息、系统性能信息、系统故障信息、要求事项信息。以及基于这些基础信息的系统监控管理、系统可用性管理、性能管理、构成/变更管理、风险管理、安全管理、故障管理等。
1、系统维护方案:主要包括系统的检查时间、数据的备份方式、系统维护流程等系统维护策略性信息。
2、系统构成信息:主要包括主机、网络设备信息、数据库/中间件/业务系统等硬件信息。例如配置信息、内核参数信息、端口状态、IP地址、路由信息、数据库进程、业务系统运行情况等。这些信息通过系统自动采集和人工录入的方式形成各种表格、模版,主要包含的具体信息由。并可以根据用户需要,可以分别针对不同的设备和不同的业务系统进行分类。为系统故障排查,性能优化提供了第一手的详细数据。
3、系统变更信息:主要指对整个系统在运维过程中所做的升级、改造、调优等一切变更的过程和结果做详细的记录,变更的成功信息会自动返回到构成信息库。
4、系统性能管理:主要指系统自动实时采集数据,可以进行自定义设置,自动将一定时间内的性能信息,例如 负荷、端口状态,磁盘I/O量,应用所占资源等数值进行统一的存储。
5、系统故障信息:对系统所有的故障判断、处理方案、处理过程、处理结果进行收集和存储。
6、要求事项信息:对用户的需求、工期要求、采购信息、日志、周报、月报等进行收集和存储。
有了这些基础信息,通过对这些数据信息的有效分类和管理,形成了固定的服务模型,主要包括系统监控管理、构成变更管理、故障管理、可用性管理等。
1、系统监控管理:通过对所有设备和应用系统性能信息的采集,实现实时的性能监控, 包括所有主机、网络设备,以及数据库、中间件、各种业务系统等
2、构成/变更管理:通过对IT设备、应用系统的构成信息,变更信息,补丁信息等的管理,更加了解系统的情况,为系统将来的升级改造提供详细的基础资料。
3、故障管理:对故障处理的过程、原因等数据进行分析管理,并且根据故障现象,自动检查其他设备、系统是否存在相同现象,并及时提出系统优化改善方案。
4、可用性管理:对于系统负荷、故障率很高的设备、应用, 进行充分的风险识别和风险应对,自动判断是不是需要系统、补丁升级,提出应对方案。另外操作风险也会给系统来很大的安全隐患, 通过制度和培训来缩小操作风险。
IT服务信息库的最终目的是通过对IT平台、应用系统、业务系统的基础数据的收集和对这些数据的有效管理,对日常的运维工作提供有力的工具和有效的信息支持。自动对系统未来可能出现的风险和问题进行预测,提出相应的方案,实现对性能的优化和风险的预测,从而保障系统的正常稳定的运行。

没有评论: