如何有效利用服务器监控接口来提升系统性能与稳定性?

小贝
预计阅读时长 11 分钟
位置: 首页 小红书 正文

服务器监控接口是用于实时监测和管理服务器运行状态的重要工具,通过这些接口,管理员可以获取各种关键性能指标(KPIs),如CPU使用率、内存占用、磁盘I/O等,从而确保服务器的稳定运行和高效管理。

一、接口描述

服务器监控接口

1、接口地址:monitor.api.qcloud.com

2、接口名称:GetMonitorData

3、命名空间:qce/cvm

4、请求方式:GET

5、公共请求参数:正式调用时需要加上公共请求参数,具体见公共请求参数文档。

二、输入参数

参数名称 必选 类型 输入内容 描述
namespace String qce/cvm 每个云产品会有一个命名空间,具体名称见输入内容一栏。
metricName String 具体的指标名称 指标名称,具体名称见本文2.2章节
dimensions.0.name String unInstanceId 入参为服务器 ID
dimensions.0.value String 云服务器的具体 ID 调用 DescribeInstances 接口获取的 unInstanceId 字段
period Int 60/300 监控统计周期,绝大部分指标支持60s统计粒度,部分指标仅支持300s统计粒度,统计粒度根据指标的不同而变,输入参数时可参考本文2.2章节的指标详情列表。
startTime Datetime 起始时间 起始时间,如"2016-01-01 10:25:00",默认时间为当天的”00:00:00”
endTime Datetime 结束时间 结束时间,默认为当前时间,endTime 不能小于 startTime

三、输出参数

输出参数包括监控数据的各项指标值,例如CPU使用率、内存占用、磁盘I/O等,具体格式和内容会根据不同的监控指标有所不同。

四、错误码表

错误码表列出了可能返回的各种错误码及其含义,帮助用户快速定位问题,常见错误码包括:

服务器监控接口

400:请求参数错误

401:未授权访问

403:禁止访问

404:资源未找到

500:服务器内部错误

五、监控指标

不需要安装监控Agent,就能获取数据的监控指标

指标名称 含义 单位 统计粒度(period)
lan_outtraffic 内网出带宽 Mbps 60s、300s
lan_intraffic 内网入带宽 Mbps 60s、300s
lan_outpkg 内网出包量 个/秒 60s、300s
lan_inpkg 内网入包量 个/秒 60s、300s
wan_outtraffic 外网出带宽 Mbps 60s、300s
wan_intraffic 外网入带宽 Mbps 60s、300s
acc_outtraffic 外网出流量 MB 60s、300s
wan_outpkg 外网出包量 个/秒 60s、300s
wan_inpkg 外网入包量 个/秒 60s、300s
base_cpu_usage 宿主机分配给子机 CPU 和运行时间的百分比(基础 CPU 使用率) % 10s、60s、300s

安装监控Agent才能获取数据的监控指标

指标名称 指标中文名称 计算方式 指标含义 单位 统计粒度(period)
tcp_curr_estab TCP连接数 Windows:调用 GetTcpTable 获取状态值为 MIB_TCP_STATE_ESTAB 的 tcp 数 Linux:从 /proc/net/snmp 获取 CurrEstab 的值 处于 ESTABLISHED 状态的 TCP 连接数量 10s、60s、300s
cpu_usage CPU使用率 CPU 的 user+nice+system+irq+softirq+iowait 时间占总的时间的百分比 机器运行期间实时占用的 CPU 百分比 % 10s、60s、300s
cpu_loadavg CPU平均负载 分析 /proc/loadavg 中的数据,以10s为间隔采集过去1分钟内系统平均负载
(Windows 机器没有此指标)
一段时间内正在使用和等待使用 CPU 的平均任务数 10s、60s、300s
mem_used 内存使用量 Windows:调用 GlobalMemoryStatusEx
Linux:调用 psutil.virtual_memory()
计算:取 /proc/meminfo 的 Memtotal-MemFree-Buffers-Cached-SReclaimable(SReclaimable代表可回收的slab内存大小)
用户实际使用的内存量 MB 10s、60s、300s
mem_usage 内存利用率 mem_used/MemTotal 内存使用量和总内存量的比值 % 10s、60s、300s
disk_read_traffic(旧,不建议再使用此指标,磁盘数据调用请参考块存储监控 API 文档。) 磁盘读流量 Windows:通过 ioctrl 调用发送IOCTL_DISK_PERFORMANCE 获取磁盘读取字节大小
Linux:通过 psutil.disk_io_counters 获取磁盘读取字节大小
计算:两次调用的差值/调用时间的差值 获得磁盘读流量
磁盘分区每秒读取的字节数 KB/s 10s、60s、300s
disk_write_traffic(旧,不建议再使用此指标,磁盘数据调用请参考块存储监控 API 文档。) 磁盘写流量 Windows:通过 ioctrl 调用发送IOCTL_DISK_PERFORMANCE 获取磁盘写入字节大小
Linux:通过 psutil.disk_io_counters 获取磁盘写入字节大小
计算:两次调用的差值/调用时间的差值 获得磁盘写流量
磁盘分区每秒写入的字节数 KB/s 10s、60s、300s

六、相关问题与解答

服务器监控接口

问:如何选择合适的监控统计周期?

答:选择合适的监控统计周期取决于具体的监控需求和资源消耗情况,较短的统计周期(如60秒)能提供更详细的数据,但会增加系统负担;较长的统计周期(如300秒)则可以减少资源消耗,但可能会错过一些短暂的异常情况,建议在实际应用中根据具体情况进行调整。

问:如何安装监控Agent?

答:安装监控Agent的具体步骤如下:

1、下载监控Agent安装包。

2、根据操作系统类型选择相应的安装命令或脚本。

3、执行安装命令或脚本,按照提示完成安装过程。

4、配置监控Agent的相关参数,如监控指标、报警阈值等。

5、启动监控Agent,并确认其正常运行。

问:如何设置报警阈值?

答:设置报警阈值通常涉及以下几个步骤:

1、根据业务需求确定关键性能指标(KPI)。

2、分析历史数据,找出KPI的正常范围和异常范围。

3、根据异常范围设定报警阈值,可以将CPU使用率超过80%作为报警阈值。

4、配置监控系统,使其在KPI超过报警阈值时触发报警通知。

5、定期审查和调整报警阈值,以确保其有效性和准确性。

通过以上介绍,希望能帮助您更好地理解和使用服务器监控接口,实现对服务器的有效管理和优化。

以上内容就是解答有关“服务器监控接口”的详细内容了,我相信这篇文章可以为您解决一些疑惑,有任何问题欢迎留言反馈,谢谢阅读。

-- 展开阅读全文 --
头像
新年活动期间,安全专家服务有哪些特别之处?
« 上一篇 2024-11-19
如何修改服务器的默认网关?
下一篇 » 2024-11-19
取消
微信二维码
支付宝二维码

发表评论

暂无评论,3人围观

目录[+]