asynchronous_metrics
此系统表中的数据本地保存在 ClickHouse Cloud 的每个节点上。因此,要获得所有数据的完整视图,需要使用 clusterAllReplicas
函数。有关更多详细信息,请参阅此处。
包含在后台定期计算的指标。例如,正在使用的 RAM 量。
列
示例
SELECT * FROM system.asynchronous_metrics LIMIT 10
┌─metric──────────────────────────────────┬──────value─┬─description────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ AsynchronousMetricsCalculationTimeSpent │ 0.00179053 │ Time in seconds spent for calculation of asynchronous metrics (this is the overhead of asynchronous metrics). │
│ NumberOfDetachedByUserParts │ 0 │ The total number of parts detached from MergeTree tables by users with the `ALTER TABLE DETACH` query (as opposed to unexpected, broken or ignored parts). The server does not care about detached parts and they can be removed. │
│ NumberOfDetachedParts │ 0 │ The total number of parts detached from MergeTree tables. A part can be detached by a user with the `ALTER TABLE DETACH` query or by the server itself it the part is broken, unexpected or unneeded. The server does not care about detached parts and they can be removed. │
│ TotalRowsOfMergeTreeTables │ 2781309 │ Total amount of rows (records) stored in all tables of MergeTree family. │
│ TotalBytesOfMergeTreeTables │ 7741926 │ Total amount of bytes (compressed, including data and indices) stored in all tables of MergeTree family. │
│ NumberOfTables │ 93 │ Total number of tables summed across the databases on the server, excluding the databases that cannot contain MergeTree tables. The excluded database engines are those who generate the set of tables on the fly, like `Lazy`, `MySQL`, `PostgreSQL`, `SQlite`. │
│ NumberOfDatabases │ 6 │ Total number of databases on the server. │
│ MaxPartCountForPartition │ 6 │ Maximum number of parts per partition across all partitions of all tables of MergeTree family. Values larger than 300 indicates misconfiguration, overload, or massive data loading. │
│ ReplicasSumMergesInQueue │ 0 │ Sum of merge operations in the queue (still to be applied) across Replicated tables. │
│ ReplicasSumInsertsInQueue │ 0 │ Sum of INSERT operations in the queue (still to be replicated) across Replicated tables. │
└─────────────────────────────────────────┴────────────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘
指标描述
AsynchronousHeavyMetricsCalculationTimeSpent
计算异步重度(表相关)指标所花费的时间(秒)(这是异步指标的开销)。
AsynchronousHeavyMetricsUpdateInterval
重度(表相关)指标更新间隔
AsynchronousMetricsCalculationTimeSpent
计算异步指标所花费的时间(秒)(这是异步指标的开销)。
AsynchronousMetricsUpdateInterval
指标更新间隔
BlockActiveTime_name
块设备排队 IO 请求的时间(秒)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockDiscardBytes_name
块设备上丢弃的字节数。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockDiscardMerges_name
从块设备请求并由 OS IO 调度程序合并在一起的丢弃操作数。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockDiscardOps_name
从块设备请求的丢弃操作数。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockDiscardTime_name
在从块设备请求的丢弃操作中花费的时间(秒),在所有操作中求和。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockInFlightOps_name
此值计算已发布到设备驱动程序但尚未完成的 I/O 请求数。它不包括队列中但尚未发布到设备驱动程序的 IO 请求。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockQueueTime_name
此值计算 IO 请求在此块设备上等待的毫秒数。如果有多个 IO 请求等待,则此值将随着毫秒数乘以等待请求数的乘积而增加。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockReadBytes_name
从块设备读取的字节数。由于使用了 OS 页面缓存(可节省 IO),它可能低于从文件系统读取的字节数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockReadMerges_name
从块设备请求并由 OS IO 调度程序合并在一起的读取操作数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockReadOps_name
从块设备请求的读取操作数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockReadTime_name
在从块设备请求的读取操作中花费的时间(秒),在所有操作中求和。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockWriteBytes_name
写入块设备的字节数。由于使用了 OS 页面缓存(可节省 IO),它可能低于写入文件系统的字节数。由于直写缓存,写入块设备可能比相应的写入文件系统稍晚发生。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockWriteMerges_name
从块设备请求并由 OS IO 调度程序合并在一起的写入操作数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockWriteOps_name
从块设备请求的写入操作数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
BlockWriteTime_name
在从块设备请求的写入操作中花费的时间(秒),在所有操作中求和。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block
。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt
CPUFrequencyMHz_name
CPU 的当前频率,以 MHz 为单位。大多数现代 CPU 都会动态调整频率以实现节能和睿频加速。
CompiledExpressionCacheBytes
用于 JIT 编译代码缓存的总字节数。
CompiledExpressionCacheCount
JIT 编译代码缓存中的总条目数。
DiskAvailable_name
磁盘(虚拟文件系统)上的可用字节数。远程文件系统可以显示一个很大的值,如 16 EiB。
DiskTotal_name
磁盘(虚拟文件系统)的总大小(以字节为单位)。远程文件系统可以显示一个很大的值,如 16 EiB。
DiskUnreserved_name
磁盘(虚拟文件系统)上的可用字节数,不包括用于合并、提取和移动的预留空间。远程文件系统可以显示一个很大的值,如 16 EiB。
DiskUsed_name
磁盘(虚拟文件系统)上已使用的字节数。远程文件系统并非总是提供此信息。
FilesystemCacheBytes
cache
虚拟文件系统中的总字节数。此缓存保存在磁盘上。
FilesystemCacheFiles
cache
虚拟文件系统中缓存的文件段总数。此缓存保存在磁盘上。
FilesystemLogsPathAvailableBytes
ClickHouse 日志路径挂载的卷上的可用字节数。如果此值接近于零,则应在配置文件中调整日志轮换。
FilesystemLogsPathAvailableINodes
ClickHouse 日志路径挂载的卷上的可用 inode 数。
FilesystemLogsPathTotalBytes
ClickHouse 日志路径挂载的卷的大小,以字节为单位。建议日志至少有 10 GB 的空间。
FilesystemLogsPathTotalINodes
ClickHouse 日志路径挂载的卷上的 inode 总数。
FilesystemLogsPathUsedBytes
ClickHouse 日志路径挂载的卷上已使用的字节数。
FilesystemLogsPathUsedINodes
ClickHouse 日志路径挂载的卷上已使用的 inode 数。
FilesystemMainPathAvailableBytes
主 ClickHouse 路径挂载的卷上的可用字节数。
FilesystemMainPathAvailableINodes
主 ClickHouse 路径挂载的卷上的可用 inode 数。如果它接近于零,则表示配置错误,即使磁盘未满,您也会收到“设备上没有剩余空间”的错误。
FilesystemMainPathTotalBytes
主 ClickHouse 路径挂载的卷的大小,以字节为单位。
FilesystemMainPathTotalINodes
主 ClickHouse 路径挂载的卷上的 inode 总数。如果它小于 2500 万,则表示配置错误。
FilesystemMainPathUsedBytes
主 ClickHouse 路径挂载的卷上已使用的字节数。
FilesystemMainPathUsedINodes
主 ClickHouse 路径挂载的卷上已使用的 inode 数。此值主要对应于文件数。
HTTPThreads
HTTP 接口服务器(不带 TLS)中的线程数。
InterserverThreads
副本通信协议服务器(不带 TLS)中的线程数。
Jitter
用于计算异步指标的线程计划唤醒时间和实际唤醒时间之间的差异。系统整体延迟和响应能力的代理指标。
LoadAverageN
整个系统负载,在 1 分钟内通过指数平滑进行平均。负载表示当前由 CPU 运行或等待 IO,或准备运行但此时未被调度的所有进程(OS 内核的调度实体)中的线程数。此数字包括所有进程,而不仅仅是 clickhouse-server。如果系统过载,并且许多进程已准备好运行但正在等待 CPU 或 IO,则该数字可能大于 CPU 核心数。
MMapCacheCells
使用 mmap
打开的文件数(映射到内存中)。这用于设置 local_filesystem_read_method
设置为 mmap
的查询。使用 mmap
打开的文件保存在缓存中,以避免代价高昂的 TLB 刷新。
MarkCacheBytes
标记缓存的总大小(以字节为单位)
MarkCacheFiles
标记缓存中缓存的标记文件总数
MaxPartCountForPartition
MergeTree 系列的所有表的所有分区中每个分区的最大部件数。大于 300 的值表示配置错误、过载或大量数据加载。
MemoryCode
为服务器进程的机器代码页面映射的虚拟内存量,以字节为单位。
MemoryDataAndStack
为堆栈使用和已分配内存映射的虚拟内存量,以字节为单位。它是否包括每个线程的堆栈和使用“mmap”系统调用分配的大部分已分配内存尚不明确。此指标的存在仅出于完整性原因。我建议使用 MemoryResident
指标进行监控。
MemoryResidentMax
服务器进程使用的物理内存最大量,以字节为单位。
MemoryResident
服务器进程使用的物理内存量,以字节为单位。
MemoryShared
服务器进程使用的内存量,也由其他进程共享,以字节为单位。ClickHouse 不使用共享内存,但某些内存可能因其自身原因而被 OS 标记为共享内存。此指标不太有意义,仅出于完整性原因而存在。
MemoryVirtual
服务器进程分配的虚拟地址空间的大小,以字节为单位。虚拟地址空间的大小通常远大于物理内存消耗,不应将其用作内存消耗的估计值。此指标的大值完全正常,仅具有技术意义。
MySQLThreads
MySQL 兼容协议服务器中的线程数。
NetworkReceiveBytes_name
通过网络接口接收的字节数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
NetworkReceiveDrop_name
数据包通过网络接口接收时丢弃的字节数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
NetworkReceiveErrors_name
通过网络接口接收时发生错误的次数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
NetworkReceivePackets_name
通过网络接口接收的网络数据包数量。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
NetworkSendBytes_name
通过网络接口发送的字节数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
NetworkSendDrop_name
通过网络接口发送数据包时,数据包被丢弃的次数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
NetworkSendErrors_name
通过网络接口发送数据时发生错误的次数(例如 TCP 重传)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
NetworkSendPackets_name
通过网络接口发送的网络数据包数量。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
NumberOfDatabases
服务器上的数据库总数。
NumberOfDetachedByUserParts
用户使用 ALTER TABLE DETACH
查询从 MergeTree 表中分离出的部件总数(与意外、损坏或被忽略的部件相对)。服务器不关心分离出的部件,它们可以被删除。
NumberOfDetachedParts
从 MergeTree 表中分离出的部件总数。部件可以由用户使用 ALTER TABLE DETACH
查询分离,也可以由服务器自身在部件损坏、意外或不需要时分离。服务器不关心分离出的部件,它们可以被删除。
NumberOfTables
服务器上所有数据库中的表总数,不包括不能包含 MergeTree 表的数据库。排除的数据库引擎是那些动态生成表集的引擎,例如 Lazy
、MySQL
、PostgreSQL
、SQlite
。
OSContextSwitches
主机上系统经历的上下文切换次数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSGuestNiceTime
在 Linux 内核控制下,为客户操作系统运行虚拟 CPU 所花费的时间比率,当客户操作系统被设置为更高优先级时(参见 man procfs
)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSGuestNiceTimeCPU_N
在 Linux 内核控制下,为客户操作系统运行虚拟 CPU 所花费的时间比率,当客户操作系统被设置为更高优先级时(参见 man procfs
)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSGuestNiceTimeNormalized
该值与 OSGuestNiceTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
OSGuestTime
在 Linux 内核控制下,为客户操作系统运行虚拟 CPU 所花费的时间比率(参见 man procfs
)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSGuestTimeCPU_N
在 Linux 内核控制下,为客户操作系统运行虚拟 CPU 所花费的时间比率(参见 man procfs
)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSGuestTimeNormalized
该值与 OSGuestTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
OSIOWaitTime
CPU 核心未运行代码的时间比率,但当进程等待 IO 时,OS 内核未在此 CPU 上运行任何其他进程。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSIOWaitTimeCPU_N
CPU 核心未运行代码的时间比率,但当进程等待 IO 时,OS 内核未在此 CPU 上运行任何其他进程。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSIOWaitTimeNormalized
该值与 OSIOWaitTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
OSIdleTime
从 OS 内核的角度来看,CPU 核心空闲(甚至没有准备好运行等待 IO 的进程)的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这不包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 核心)导致 CPU 利用率不足的时间。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSIdleTimeCPU_N
从 OS 内核的角度来看,CPU 核心空闲(甚至没有准备好运行等待 IO 的进程)的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这不包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 核心)导致 CPU 利用率不足的时间。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSIdleTimeNormalized
该值与 OSIdleTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
OSInterrupts
主机上的中断次数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSIrqTime
CPU 上运行硬件中断请求所花费的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的数值较高可能表示硬件配置错误或网络负载非常高。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSIrqTimeCPU_N
CPU 上运行硬件中断请求所花费的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的数值较高可能表示硬件配置错误或网络负载非常高。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSIrqTimeNormalized
该值与 OSIrqTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
OSMemoryAvailable
程序可用的内存量,以字节为单位。这与 OSMemoryFreePlusCached
指标非常相似。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSMemoryBuffers
OS 内核缓冲区使用的内存量,以字节为单位。这通常应该很小,较大的值可能表示 OS 配置错误。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSMemoryCached
OS 页面缓存使用的内存量,以字节为单位。通常,几乎所有可用内存都由 OS 页面缓存使用 - 此指标的高值是正常且预期的。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSMemoryFreePlusCached
主机系统上的可用内存加上 OS 页面缓存内存量,以字节为单位。此内存可供程序使用。该值应与 OSMemoryAvailable
非常相似。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSMemoryFreeWithoutCached
主机系统上的可用内存量,以字节为单位。这不包括 OS 页面缓存内存使用的内存量,以字节为单位。页面缓存内存也可供程序使用,因此此指标的值可能会令人困惑。请参阅 OSMemoryAvailable
指标。为了方便起见,我们还提供了 OSMemoryFreePlusCached
指标,它应该与 OSMemoryAvailable 有些相似。另请参阅 https://www.linuxatemyram.com/。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSMemoryTotal
主机系统上的总内存量,以字节为单位。
OSNiceTime
CPU 核心运行具有更高优先级的用户空间代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSNiceTimeCPU_N
CPU 核心运行具有更高优先级的用户空间代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSNiceTimeNormalized
该值与 OSNiceTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
OSOpenFiles
主机上打开的文件总数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSProcessesBlocked
线程阻塞等待 I/O 完成的数量 (man procfs
)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSProcessesCreated
创建的进程数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSProcessesRunning
操作系统可运行(正在运行或准备运行)的线程数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。
OSSoftIrqTime
CPU 上运行软件中断请求所花费的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的数值较高可能表示系统上运行的软件效率低下。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSSoftIrqTimeCPU_N
CPU 上运行软件中断请求所花费的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的数值较高可能表示系统上运行的软件效率低下。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSSoftIrqTimeNormalized
该值与 OSSoftIrqTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
OSStealTime
在虚拟化环境中运行时,CPU 花费在其他操作系统中的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。并非每个虚拟化环境都提供此指标,而且大多数都不提供。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSStealTimeCPU_N
在虚拟化环境中运行时,CPU 花费在其他操作系统中的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。并非每个虚拟化环境都提供此指标,而且大多数都不提供。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSStealTimeNormalized
该值与 OSStealTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
OSSystemTime
CPU 核心运行 OS 内核(系统)代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSSystemTimeCPU_N
CPU 核心运行 OS 内核(系统)代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSSystemTimeNormalized
该值与 OSSystemTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
OSThreadsRunnable
操作系统内核看到的“可运行”线程总数。
OSThreadsTotal
操作系统内核看到的线程总数。
OSUptime
主机服务器(运行 ClickHouse 的机器)的正常运行时间,以秒为单位。
OSUserTime
CPU 核心运行用户空间代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这还包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 核心)导致 CPU 利用率不足的时间。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSUserTimeCPU_N
CPU 核心运行用户空间代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这还包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 核心)导致 CPU 利用率不足的时间。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。
OSUserTimeNormalized
该值与 OSUserTime
类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。
PostgreSQLThreads
PostgreSQL 兼容协议服务器中的线程数。
QueryCacheBytes
查询缓存的总大小,以字节为单位。
QueryCacheEntries
查询缓存中的条目总数。
ReplicasMaxAbsoluteDelay
在复制表之间,最新鲜的复制部件与仍待复制的最新鲜数据部件之间的时间差最大值,以秒为单位。非常高的值表示没有数据的副本。
ReplicasMaxInsertsInQueue
在复制表之间,队列中(仍待复制)的 INSERT 操作的最大数量。
ReplicasMaxMergesInQueue
在复制表之间,队列中(仍待应用)的合并操作的最大数量。
ReplicasMaxQueueSize
在复制表之间,队列大小(以 get、merge 等操作的数量计)的最大值。
ReplicasMaxRelativeDelay
在复制表之间,副本延迟与同一表的最新的副本的延迟之间的最大差异。
ReplicasSumInsertsInQueue
在复制表之间,队列中(仍待复制)的 INSERT 操作的总和。
ReplicasSumMergesInQueue
在复制表之间,队列中(仍待应用)的合并操作的总和。
ReplicasSumQueueSize
在复制表之间,队列大小(以 get、merge 等操作的数量计)的总和。
TCPThreads
TCP 协议(不含 TLS)服务器中的线程数。
Temperature_N
对应设备的温度,单位为 ℃。传感器可能会返回不真实的值。来源:/sys/class/thermal
Temperature_name
对应硬件监控器和对应传感器报告的温度,单位为 ℃。传感器可能会返回不真实的值。来源:/sys/class/hwmon
TotalBytesOfMergeTreeTables
MergeTree 系列的所有表中存储的总字节数(已压缩,包括数据和索引)。
TotalPartsOfMergeTreeTables
MergeTree 系列的所有表中的数据部件总数。大于 10,000 的数字将对服务器启动时间产生负面影响,并且可能表明分区键的选择不合理。
TotalPrimaryKeyBytesInMemory
主键值使用的内存总量(以字节为单位)(仅考虑活动部件)。
TotalPrimaryKeyBytesInMemoryAllocated
为主键值保留的内存总量(以字节为单位)(仅考虑活动部件)。
TotalRowsOfMergeTreeTables
MergeTree 系列的所有表中存储的总行数(记录)。
UncompressedCacheBytes
未压缩缓存的总大小,以字节为单位。未压缩缓存通常不会提高性能,应尽量避免使用。
UncompressedCacheCells
未压缩缓存中的条目总数。每个条目代表一个解压缩的数据块。未压缩缓存通常不会提高性能,应尽量避免使用。
Uptime
服务器正常运行时间,以秒为单位。它包括接受连接之前服务器初始化所花费的时间。
jemalloc.active
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.allocated
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.dirty_purged
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.muzzy_purged
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pactive
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pdirty
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pmuzzy
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_runs
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_threads
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.run_intervals
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.epoch
jemalloc(Jason Evans 的内存分配器)统计数据的内部增量更新编号,用于所有其他 jemalloc
指标。
jemalloc.mapped
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.metadata
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.metadata_thp
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.resident
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.retained
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
jemalloc.prof.active
低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html
另请参阅
- 监控 — ClickHouse 监控的基本概念。
- system.metrics — 包含即时计算的指标。
- system.events — 包含已发生事件的数量。
- system.metric_log — 包含来自表
system.metrics
和system.events
的指标值的历史记录。