万维景盛2月19日消息,阿里云计算有限公司日前发布一款新产品云监控的主机监控,主机监控支持控制台一键安装和命令行手工安装,提供对CPU、内存、带宽、磁盘IO等30余种监控指标、秒级频率、进程级粒度。通过万维景盛邀请注册的阿里云VIP会员可以免费使用该功能。
云监控为阿里云用户提供主机监控功能,一键安装插件后,即可查看30余个监控项的监控图表,设置报警更是天然支持~~也可以安装在非 ECS 的服务器上,有没有很开心~
进程监控介绍
进程监控默认为您采集最近一段时间内活跃进程消耗的CPU使用率、内存使用率,以及进程的文件打开数。如果您添加了进程关键字,还会采集包含关键字的进程个数。
如果您查询的时间范围内,Top5的进程不固定,进程列表中会展示这段时间内全部进入过Top5的进程,列表中的时间表示该进程最后一次进入Top5的时间。
只有进入Top5 的进程才会采集进程的CPU使用率、内存使用率和打开文件数,所以如果该进程在查询的时间范围内未持续进入Top5,会出现监控图中数据点不连续的情况,数据点的密集程度则表明了该进程在服务器上的活跃程度。
监控项说明
CPU 相关监控项
以下为CPU使用率相关监控指标,可参考Linux的top命令来理解各项指标含义。
监控项名称 | 监控项含义 | 单位 | 说明 |
---|---|---|---|
Host.cpu.idle | 当前空闲CPU百分比 | % | |
Host.cpu.system | 当前内核空间占用CPU百分比 | % | 指系统上下文切换的消耗,该监控项数值比较高,说明服务器开了太多的进程或者线程 |
Host.cpu.user | 当前用户空间占用CPU百分比 | % | 用户进程对CPU的消耗 |
Host.cpu.iowait | 当前等待IO操作的CPU百分比 | % | 该项数值比较高说明有很频繁的IO操作 |
Host.cpu.other | 其他占用CUP百分比 | % | 其他消耗,计算方式为(Nice + SoftIrq + Irq + Stolen)的消耗 |
Host.cpu.total | 当前消耗的总CPU百分比 | % | 指以上各项CPU消耗的总和,通常用于报警 |
内存相关监控项
以下为内存相关监控项,可参考free命令来理解各项指标含义。
监控项名称 | 监控项含义 | 单位 | 说明 |
---|---|---|---|
Host.mem.total | 内存总量 | bytes | 服务器的内存总量 |
Host.mem.used | 已用内存量 | bytes | 用户程序使用的内存 + buffers + cached,buffers为缓冲区占用的内存空间,cached为系统缓存占用的内存空间 |
Host.mem.actualused | 用户实际使用的内存 | bytes | 计算方法为(used - buffers - cached) |
Host.mem.free | 剩余内存量 | bytes | 计算方法为(内存总量-已用内存量) |
Host.mem.freeutilization | 剩余内存百分比 | % | 计算方法为(剩余内存量/内存总量*100%) |
Host.mem.usedutilization | 内存使用率 | % | 计算方法为( Actual used/total*100%) |
系统平均负载监控项
以下为系统平均负载相关监控项,可参考Linux top命令来理解各项指标含义。监控项数值越高代表系统越繁忙。
监控项名称 | 监控项含义 | 单位 |
---|---|---|
Host.load1 | 过去1分钟的系统平均负载,Windows操作系统没有此指标 | 无 |
Host.load5 | 过去5分钟的系统平均负载,Windows操作系统没有此指标 | 无 |
Host.load15 | 过去15分钟的系统平均负载,Windows操作系统没有此指标 | 无 |
磁盘相关监控项
磁盘使用率与inode使用率可参考Linux df命令。
磁盘读写指标可参考Linux iostat命令。
监控项名称 | 监控项含义 | 单位 |
---|---|---|
Host.diskusage.used | 磁盘的已用存储空间 | bytes |
Host.disk.utilization | 磁盘使用率 | % |
Host.diskusage.free | 磁盘的剩余存储空间 | bytes/s |
Host.diskussage.total | 磁盘存储总量 | bytes |
Host.disk.readbytes | 磁盘每秒读取的字节数 | bytes/s |
Host.disk.writebytes | 磁盘每秒写入的字节数 | bytes/s |
Host.disk.readiops | 磁盘每秒的读请求数量 | 次/秒 |
Host.disk.writeiops | 磁盘每秒的写请求数量 | 次/秒 |
文件系统监控项
监控项名称 | 监控项含义 | 单位 | 说明 |
---|---|---|---|
Host.fs.inode | inode使用率,UNIX/Linux系统内部使用inode号码来识别文件,磁盘还未存满,但inode已经分配完时会出现无法在磁盘新建文件的情况,Windows操作系统没有此指标 | % | inode数量代表文件系统文件数量,大量小文件会导致inode使用率过高 |
网络相关监控项
以下为网络相关指标,可参考Linux iftop。TCP连接数的采集,可参考Linux ss命令。
TCP连接数会默认采集 TCP_TOTAL(总连接数)、ESTABLISHED(正常连接状态),NON_ESTABLISHED(非连接的状态连接数,ESTABLISHED以外的所有状态),如果您需要获取各个状态连接数的数量,请按如下说明操作:
Linux操作系统 您可以将cloudmonitor/config/conf.properties配置文件的netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。 Windows操作系统 您可以在C:\”Program Files”\Alibaba\cloudmonitor\config的配置文件中,将netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。
监控项名称 | 监控项含义 | 单位 |
---|---|---|
Host.netin.rate | 网卡每秒接收的比特数,即网卡的上行带宽 | bits/s |
Host.netout.rate | 网卡每秒发送的比特数,即网卡的下行带宽 | bits/s |
Host.netin.packages | 网卡每秒接收的数据包数 | 个/秒 |
Host.netout.packages | 网卡每秒发送的数据包数 | 个/秒 |
Host.netin.errorpackage | 设备驱动器检测到的接收错误包的数量 | 个/秒 |
Host.netout.errorpackages | 设备驱动器检测到的发送错误包的数量 | 个/秒 |
Host.tcpconnection | 各种状态下的TCP连接数包括LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT1、CLOSE_WAIT、FIN_WAIT2、LAST_ACK、TIME_WAIT、CLOSING、CLOSED | 个 |
进程相关监控项
进程的CPU使用率、内存使用率可参考Linux top命令,CPU使用率为多核使用情况。
Host.process.openfile 可参考Linux lsof命令。
Host.process.number 可参考Linux ps aux |grep '关键字' 命令。
监控项名称 | 监控项含义 | 单位 |
---|---|---|
Host.process.cpu | 某个进程消耗的CPU百分比 | % |
Host.process.memory | 某个进程消耗的内存百分比 | % |
Host.process.openfile | 当前进程打开文件数 | 个 |
Host.process.number | 指定关键字的进程数 | 个 |
忙碌的小编顺便给您发个福利:
万维景盛作为阿里云顶级分销商,为广大客户提供优质的阿里云虚拟主机和云服务器,天天双11活动正在进行中,大量优惠券等你来!立即抢券!
当然,作为高端用户的您如果买阿里云服务器,万维景盛也为您准备了好礼,使用推荐码TZ2DHZ结算即可立即打9折!如果希望续费也打折,请联系客服QQ邀请注册VIP账号,终身可优惠哦!