海量运维监控系统规划与部署_运维教程

资源名称:海量运维监控系统规划与部署 

内容简介:

今天,互联网大潮催生了众多卓越的互联网企业,其用户数及业务规模很容易达到海量级别,且企业内部对IT运维管理的质量水准也日益提出高标准和严要求,而IT运维管理的核心业务之一,IT运维监控工作就变得愈加重要。本书针对海量IT系统的特点,不仅提倡IT运维监控系统要基于Nagios和Centreon等开源系统量身定做,采取开源监控技术与企业IT服务和运维管理流程相结合的技术路线,而且从开源监控系统的规划、管理、流程/规范、系统/平台、监控、告警、安全、部署实施、优化、考核、持续优化和提升等诸多方面来与大家详细分享体会。

本书共分14章 涵盖的内容主要包括:

1、带领读者深度了解 Nagios和Centreon如何在Linux系统上部署,以及如何与NagVis进行集成

2、从专家角度介绍如何管理Centreon、Nagios和NagVis,以及如何运用相关技巧优化这套组件以提升监控系统效率

3、运用大量脚本样例和截图,手把手帮助读者解决在构建开源监控系统中遇到的各类实际问题

4、利用NagVis和RRDTool 集成开源监控系统的视图功能

5、按部就班地协助用户定制化实现既符合ITIL最佳实践,又符合企业自身特点的企业级IT运维监控系统

本书适合在互联网企业以及传统企业内部,那些想了解、学习、规划以及快速构建开源IT运维监控系统的人员阅读,可以作为学习Nagios和Centreon的工具书,也适合想更深入学习Centreon的读者。让读者真正理解Linux、Nagios、Centreon和NagVis这一套犀利武器,为海量IT运维监控工作保驾护航。

资源目录:

1企业级IT监控系统概述

1.1什么是IT运维监控系统

1.2开源监控软件之崛起-Linux、Nagios、Centreon和NagVis

1.3Nagios简介

1.3.1云计算和海量运维监控的最佳选择

1.3.2Nagios的主机检测与服务检测

1.3.3监控信息的提供者

1.3.4及时的通知机制

1.3.5从外部系统接收信息

1.3.6Nagios与Linux的关系

1.4Centreon简介

1.4.1Centreon引擎

1.4.2为什么要有Centreon引擎

1.5NagVis简介

1.6为什么要基于开源软件构建IT运维监控系统?

2企业级IT运维监控系统的构建-从源代码到企业级系统

2.1可供选择的操作系统

2.1.1选用Red Hat Enterprise Linux作为操作系统

2.1.2选择部署方式

2.2服务器安装规划

2.2.1服务器参数规划

2.2.2服务器存储规划

2.3Linux的逻辑卷(LVM)管理机制

2.3.1为什么要使用LVM

2.3.2LVM基本概念

2.3.3操作系统分区划分样例

3配置VMWARE虚拟机

3.1新建虚拟机向导

3.2VMware的联网模式简介

3.2.1虚拟网络设备

3.2.2虚拟机联网方式之桥接模式(bridged networking)

3.2.3虚拟机联网方式之网络地址转换(network address translation,简称NAT)模式

3.2.4虚拟机联网方式之仅主机(host-only networking)模式

3.2.5关于虚拟机联网方式中的DHCP服务

3.2.6选择Nagios虚拟服务器的联网方式

3.3完成虚拟机创建向导并查看配置清单

4为虚拟机安装RHEL操作系统

4.1引导菜单

4.2操作系统安装欢迎界面(语言及键盘布局)

4.3存储设备选择

4.4主机名与网络设置

4.5时区选择

4.6磁盘分区设置

4.7划分文件系统

4.8安装操作系统软件

4.8.1格式化虚拟机硬盘

4.8.2选择操作系统安装类型

4.8.3安装操作系统

4.8.4操作系统初始化配置

4.8.5创建操作系统账户

4.8.6设置操作系统时间

4.8.7设置Kdump

4.8.8操作系统网络配置

4.8.9yum源配置

5Nagios的安装

5.1Nagios安装前的准备工作

5.2创建Nagios用户和组

5.3编译并安装Nagios

5.4安装Nagios插件

5.5配置Nagios的WEB用户界面

5.6SELinux

5.7访问用户认证与授权

6NDOUtils安装

6.1配置并编译NDOUtils

6.2拷贝编译后的文件至运行目录

6.3检查MySQL的配置

6.4创建NDOUtils数据库表

6.5配置NDOUtils

6.6添加ndo2db为系统服务

7Centreon的安装与配置

7.1什么是监控以及如何监控

7.1.1监控已经不再局限于基础设施

7.1.2基础设施监控

7.1.3应用程序监控

7.1.4SLA监控

7.1.5业务活动监控

7.2究竟什么是运维监控

7.2.1运维监控的原则

7.2.2主动监控模式

7.2.3被动监控模式

7.3SNMP

7.4Centreon-不仅仅是包装后的Nagios

7.4.1MERETHIS公司简介

7.4.2Centreon的功能

7.5Centreon的架构

7.5.1系统组件

7.5.2数据存储

7.5.3检测命令

7.5.4调度进程

7.5.5其他兼容Centreon的调度引擎

7.5.6代理进程

7.6后台服务和定时任务

7.6.1centcore服务

7.6.2centstorage服务

7.6.3定时任务

7.7系统架构-简洁及分布式

7.8捕获SNNP trap告警信息

8Centreon的安装

8.1安装前提

8.2安装Centreon监控系统中央服务器

8.2.1系统软件需求

8.2.2部署Centreon监控系统

8.3安装后配置

8.4Centreon的WEB用户界面

8.5Centreon的语言设置

8.6Centreon的数据库连接配置

8.7通过Centreon激活Nagios监控

8.8安装过程中的问题解决

8.8.1Export时显示sudo相关错误

8.8.2在/var/log/messages中出现Warning: queue send error错误

9Centreon的管理

9.1Centreon的调度进程和代理进程

9.2Centreon对于Nagios调度进程的管理

9.2.1Files选项卡

9.2.2Check Options选项卡

9.2.3Log Options 选项卡

9.2.4Data选项卡

9.2.5Tuning选项卡

9.2.6Admin选项卡

9.2.7Debug选项卡

9.3Centreon对于NDOUtils代理进程的管理

9.3.1General选项卡:

9.3.2Database选项卡:

9.3.3Retention选项卡

9.4Centreon对于ndomod的管理

9.5Centreon的实时监控

9.5.1主机和主机组

9.5.2服务、服务组和元服务

9.5.3硬状态和软状态

9.5.4状态波动与状态特殊震荡

10Centreon的实时监控

10.1专注于实时监控的Centreon

10.2Centreon的通用监控

10.3状态总揽视图

10.4全局健康视图

10.5主机的实时监控

10.6主机的详细信息视图

10.7服务的实时监控

10.8在实时监控界面中进行监控项相关操作

10.8.1主机和服务操作概述

10.8.2处于告警状态下的主机或者服务进行确认

10.8.3计划停机

10.8.4添加备注

10.8.5对于调度任务的直接控制

11Centreon的配置

11.1Centreon的监控对象模型

11.2通用功能配置界面

11.3Nagios配置文件的生成与部署

11.4宏、检测命令与检测插件

11.5检测命令与检测插件

11.6执行周期

11.7主机模板和服务模板

11.8主机和主机组

11.9主机的配置界面

11.9.1通用配置选项卡

11.9.2“关系”选项卡

11.9.3“数据处理”选项卡

11.9.4“主机扩展信息”选项卡

11.10主机组

11.11服务

11.11.1“服务配置”选项卡

11.11.2“关系”选项卡

11.11.3“数据处理”选项卡

11.12元服务

11.13被动监控模式和SNMP trap(SNMP陷阱)

11.14通知

11.14.1通知策略定义

11.14.2为主机和服务配置通知策略

11.15通知消息联系人、联系人组以及联系人模板

11.15.1配置通知消息联系人/用户

11.16Commands通知命令

11.17Escalation-告警通知的升级

11.18性能图形

11.18.1相关定义

11.18.2查看图形与进一步分析

11.18.3配置性能图形相关属性

11.18.4配置性能曲线相关属性

11.19利用性能图形实现早期预警

11.20报表

12Centreon的管理和优化

12.1Centreon的管理菜单

12.2通用选项

12.2.1Centreon的通用选项界面

12.2.2Centreon的监控选项界面

12.3CentStorage的相关配置

12.3.1性能数据的配置管理

12.3.2度量和计量

12.3.3监控性能指标的相关操作

12.4访问控制列表(ACL)

12.4.1访问控制列表的配置与管理

12.4.2访问组

12.5调度进程的运行时统计信息

12.6Centreon监控平台的备份与恢复

13NagVis的安装与配置

13.1NagVis的地图

13.2NagVis的运作机制

13.3NagVis的安装

13.4Nagvis的配置

13.4.1配置NagVis的默认参数

13.4.2配置NagVis的后台数据源

13.5NagVis地图介绍

13.6NagVis的地图的配置管理

13.7NagVis中背景图片的管理

13.8配置NagVis的监控地图

13.9设置NagVis图标的超链接

13.10设置NagVis的WEB界面为自动登录

14构建企业级IT运维监控系统

14.1IT服务管理和ITIL

14.2IT运维监控系统与ITIL的关系

14.2.1ITIL的产生与发展

14.2.2ITIL的管理框架简介

14.2.3运用ITIL解决企业IT服务管理面临的问题

14.3企业级IT运维监控系统的构建与实施

14.3.1咨询与梳理步骤

14.3.2互联网运维监控实践

14.3.3提升监控及预警能力

14.3.4监控及预警质量的持续改进

资源截图:

1.png


智研优享资源 » 海量运维监控系统规划与部署_运维教程

发表回复

提供最优质的资源集合

立即查看 了解详情