跳到主要内容
跳到主要内容
编辑此页

asynchronous_metrics

在 ClickHouse Cloud 中查询

此系统表中的数据本地保存在 ClickHouse Cloud 的每个节点上。因此,要获得所有数据的完整视图,需要使用 clusterAllReplicas 函数。有关更多详细信息,请参阅此处

包含在后台定期计算的指标。例如,正在使用的 RAM 量。

  • metric (String) — 指标名称。
  • value (Float64) — 指标值。
  • description (String - 指标描述)

示例

SELECT * FROM system.asynchronous_metrics LIMIT 10
┌─metric──────────────────────────────────┬──────value─┬─description────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ AsynchronousMetricsCalculationTimeSpent │ 0.00179053 │ Time in seconds spent for calculation of asynchronous metrics (this is the overhead of asynchronous metrics). │
│ NumberOfDetachedByUserParts │ 0 │ The total number of parts detached from MergeTree tables by users with the `ALTER TABLE DETACH` query (as opposed to unexpected, broken or ignored parts). The server does not care about detached parts and they can be removed. │
│ NumberOfDetachedParts │ 0 │ The total number of parts detached from MergeTree tables. A part can be detached by a user with the `ALTER TABLE DETACH` query or by the server itself it the part is broken, unexpected or unneeded. The server does not care about detached parts and they can be removed. │
│ TotalRowsOfMergeTreeTables │ 2781309 │ Total amount of rows (records) stored in all tables of MergeTree family. │
│ TotalBytesOfMergeTreeTables │ 7741926 │ Total amount of bytes (compressed, including data and indices) stored in all tables of MergeTree family. │
│ NumberOfTables │ 93 │ Total number of tables summed across the databases on the server, excluding the databases that cannot contain MergeTree tables. The excluded database engines are those who generate the set of tables on the fly, like `Lazy`, `MySQL`, `PostgreSQL`, `SQlite`. │
│ NumberOfDatabases │ 6 │ Total number of databases on the server. │
│ MaxPartCountForPartition │ 6 │ Maximum number of parts per partition across all partitions of all tables of MergeTree family. Values larger than 300 indicates misconfiguration, overload, or massive data loading. │
│ ReplicasSumMergesInQueue │ 0 │ Sum of merge operations in the queue (still to be applied) across Replicated tables. │
│ ReplicasSumInsertsInQueue │ 0 │ Sum of INSERT operations in the queue (still to be replicated) across Replicated tables. │
└─────────────────────────────────────────┴────────────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

指标描述

AsynchronousHeavyMetricsCalculationTimeSpent

计算异步重度(表相关)指标所花费的时间(秒)(这是异步指标的开销)。

AsynchronousHeavyMetricsUpdateInterval

重度(表相关)指标更新间隔

AsynchronousMetricsCalculationTimeSpent

计算异步指标所花费的时间(秒)(这是异步指标的开销)。

AsynchronousMetricsUpdateInterval

指标更新间隔

BlockActiveTime_name

块设备排队 IO 请求的时间(秒)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockDiscardBytes_name

块设备上丢弃的字节数。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockDiscardMerges_name

从块设备请求并由 OS IO 调度程序合并在一起的丢弃操作数。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockDiscardOps_name

从块设备请求的丢弃操作数。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockDiscardTime_name

在从块设备请求的丢弃操作中花费的时间(秒),在所有操作中求和。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockInFlightOps_name

此值计算已发布到设备驱动程序但尚未完成的 I/O 请求数。它不包括队列中但尚未发布到设备驱动程序的 IO 请求。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockQueueTime_name

此值计算 IO 请求在此块设备上等待的毫秒数。如果有多个 IO 请求等待,则此值将随着毫秒数乘以等待请求数的乘积而增加。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockReadBytes_name

从块设备读取的字节数。由于使用了 OS 页面缓存(可节省 IO),它可能低于从文件系统读取的字节数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockReadMerges_name

从块设备请求并由 OS IO 调度程序合并在一起的读取操作数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockReadOps_name

从块设备请求的读取操作数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockReadTime_name

在从块设备请求的读取操作中花费的时间(秒),在所有操作中求和。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockWriteBytes_name

写入块设备的字节数。由于使用了 OS 页面缓存(可节省 IO),它可能低于写入文件系统的字节数。由于直写缓存,写入块设备可能比相应的写入文件系统稍晚发生。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockWriteMerges_name

从块设备请求并由 OS IO 调度程序合并在一起的写入操作数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockWriteOps_name

从块设备请求的写入操作数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

BlockWriteTime_name

在从块设备请求的写入操作中花费的时间(秒),在所有操作中求和。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。请参阅 https://linuxkernel.org.cn/doc/Documentation/block/stat.txt

CPUFrequencyMHz_name

CPU 的当前频率,以 MHz 为单位。大多数现代 CPU 都会动态调整频率以实现节能和睿频加速。

CompiledExpressionCacheBytes

用于 JIT 编译代码缓存的总字节数。

CompiledExpressionCacheCount

JIT 编译代码缓存中的总条目数。

DiskAvailable_name

磁盘(虚拟文件系统)上的可用字节数。远程文件系统可以显示一个很大的值,如 16 EiB。

DiskTotal_name

磁盘(虚拟文件系统)的总大小(以字节为单位)。远程文件系统可以显示一个很大的值,如 16 EiB。

DiskUnreserved_name

磁盘(虚拟文件系统)上的可用字节数,不包括用于合并、提取和移动的预留空间。远程文件系统可以显示一个很大的值,如 16 EiB。

DiskUsed_name

磁盘(虚拟文件系统)上已使用的字节数。远程文件系统并非总是提供此信息。

FilesystemCacheBytes

cache 虚拟文件系统中的总字节数。此缓存保存在磁盘上。

FilesystemCacheFiles

cache 虚拟文件系统中缓存的文件段总数。此缓存保存在磁盘上。

FilesystemLogsPathAvailableBytes

ClickHouse 日志路径挂载的卷上的可用字节数。如果此值接近于零,则应在配置文件中调整日志轮换。

FilesystemLogsPathAvailableINodes

ClickHouse 日志路径挂载的卷上的可用 inode 数。

FilesystemLogsPathTotalBytes

ClickHouse 日志路径挂载的卷的大小,以字节为单位。建议日志至少有 10 GB 的空间。

FilesystemLogsPathTotalINodes

ClickHouse 日志路径挂载的卷上的 inode 总数。

FilesystemLogsPathUsedBytes

ClickHouse 日志路径挂载的卷上已使用的字节数。

FilesystemLogsPathUsedINodes

ClickHouse 日志路径挂载的卷上已使用的 inode 数。

FilesystemMainPathAvailableBytes

主 ClickHouse 路径挂载的卷上的可用字节数。

FilesystemMainPathAvailableINodes

主 ClickHouse 路径挂载的卷上的可用 inode 数。如果它接近于零,则表示配置错误,即使磁盘未满,您也会收到“设备上没有剩余空间”的错误。

FilesystemMainPathTotalBytes

主 ClickHouse 路径挂载的卷的大小,以字节为单位。

FilesystemMainPathTotalINodes

主 ClickHouse 路径挂载的卷上的 inode 总数。如果它小于 2500 万,则表示配置错误。

FilesystemMainPathUsedBytes

主 ClickHouse 路径挂载的卷上已使用的字节数。

FilesystemMainPathUsedINodes

主 ClickHouse 路径挂载的卷上已使用的 inode 数。此值主要对应于文件数。

HTTPThreads

HTTP 接口服务器(不带 TLS)中的线程数。

InterserverThreads

副本通信协议服务器(不带 TLS)中的线程数。

Jitter

用于计算异步指标的线程计划唤醒时间和实际唤醒时间之间的差异。系统整体延迟和响应能力的代理指标。

LoadAverageN

整个系统负载,在 1 分钟内通过指数平滑进行平均。负载表示当前由 CPU 运行或等待 IO,或准备运行但此时未被调度的所有进程(OS 内核的调度实体)中的线程数。此数字包括所有进程,而不仅仅是 clickhouse-server。如果系统过载,并且许多进程已准备好运行但正在等待 CPU 或 IO,则该数字可能大于 CPU 核心数。

MMapCacheCells

使用 mmap 打开的文件数(映射到内存中)。这用于设置 local_filesystem_read_method 设置为 mmap 的查询。使用 mmap 打开的文件保存在缓存中,以避免代价高昂的 TLB 刷新。

MarkCacheBytes

标记缓存的总大小(以字节为单位)

MarkCacheFiles

标记缓存中缓存的标记文件总数

MaxPartCountForPartition

MergeTree 系列的所有表的所有分区中每个分区的最大部件数。大于 300 的值表示配置错误、过载或大量数据加载。

MemoryCode

为服务器进程的机器代码页面映射的虚拟内存量,以字节为单位。

MemoryDataAndStack

为堆栈使用和已分配内存映射的虚拟内存量,以字节为单位。它是否包括每个线程的堆栈和使用“mmap”系统调用分配的大部分已分配内存尚不明确。此指标的存在仅出于完整性原因。我建议使用 MemoryResident 指标进行监控。

MemoryResidentMax

服务器进程使用的物理内存最大量,以字节为单位。

MemoryResident

服务器进程使用的物理内存量,以字节为单位。

MemoryShared

服务器进程使用的内存量,也由其他进程共享,以字节为单位。ClickHouse 不使用共享内存,但某些内存可能因其自身原因而被 OS 标记为共享内存。此指标不太有意义,仅出于完整性原因而存在。

MemoryVirtual

服务器进程分配的虚拟地址空间的大小,以字节为单位。虚拟地址空间的大小通常远大于物理内存消耗,不应将其用作内存消耗的估计值。此指标的大值完全正常,仅具有技术意义。

MySQLThreads

MySQL 兼容协议服务器中的线程数。

NetworkReceiveBytes_name

通过网络接口接收的字节数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkReceiveDrop_name

数据包通过网络接口接收时丢弃的字节数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkReceiveErrors_name

通过网络接口接收时发生错误的次数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkReceivePackets_name

通过网络接口接收的网络数据包数量。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkSendBytes_name

通过网络接口发送的字节数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkSendDrop_name

通过网络接口发送数据包时,数据包被丢弃的次数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkSendErrors_name

通过网络接口发送数据时发生错误的次数(例如 TCP 重传)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkSendPackets_name

通过网络接口发送的网络数据包数量。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NumberOfDatabases

服务器上的数据库总数。

NumberOfDetachedByUserParts

用户使用 ALTER TABLE DETACH 查询从 MergeTree 表中分离出的部件总数(与意外、损坏或被忽略的部件相对)。服务器不关心分离出的部件,它们可以被删除。

NumberOfDetachedParts

从 MergeTree 表中分离出的部件总数。部件可以由用户使用 ALTER TABLE DETACH 查询分离,也可以由服务器自身在部件损坏、意外或不需要时分离。服务器不关心分离出的部件,它们可以被删除。

NumberOfTables

服务器上所有数据库中的表总数,不包括不能包含 MergeTree 表的数据库。排除的数据库引擎是那些动态生成表集的引擎,例如 LazyMySQLPostgreSQLSQlite

OSContextSwitches

主机上系统经历的上下文切换次数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSGuestNiceTime

在 Linux 内核控制下,为客户操作系统运行虚拟 CPU 所花费的时间比率,当客户操作系统被设置为更高优先级时(参见 man procfs)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSGuestNiceTimeCPU_N

在 Linux 内核控制下,为客户操作系统运行虚拟 CPU 所花费的时间比率,当客户操作系统被设置为更高优先级时(参见 man procfs)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSGuestNiceTimeNormalized

该值与 OSGuestNiceTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

OSGuestTime

在 Linux 内核控制下,为客户操作系统运行虚拟 CPU 所花费的时间比率(参见 man procfs)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSGuestTimeCPU_N

在 Linux 内核控制下,为客户操作系统运行虚拟 CPU 所花费的时间比率(参见 man procfs)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSGuestTimeNormalized

该值与 OSGuestTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

OSIOWaitTime

CPU 核心未运行代码的时间比率,但当进程等待 IO 时,OS 内核未在此 CPU 上运行任何其他进程。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSIOWaitTimeCPU_N

CPU 核心未运行代码的时间比率,但当进程等待 IO 时,OS 内核未在此 CPU 上运行任何其他进程。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSIOWaitTimeNormalized

该值与 OSIOWaitTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

OSIdleTime

从 OS 内核的角度来看,CPU 核心空闲(甚至没有准备好运行等待 IO 的进程)的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这不包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 核心)导致 CPU 利用率不足的时间。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSIdleTimeCPU_N

从 OS 内核的角度来看,CPU 核心空闲(甚至没有准备好运行等待 IO 的进程)的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这不包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 核心)导致 CPU 利用率不足的时间。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSIdleTimeNormalized

该值与 OSIdleTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

OSInterrupts

主机上的中断次数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSIrqTime

CPU 上运行硬件中断请求所花费的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的数值较高可能表示硬件配置错误或网络负载非常高。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSIrqTimeCPU_N

CPU 上运行硬件中断请求所花费的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的数值较高可能表示硬件配置错误或网络负载非常高。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSIrqTimeNormalized

该值与 OSIrqTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

OSMemoryAvailable

程序可用的内存量,以字节为单位。这与 OSMemoryFreePlusCached 指标非常相似。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryBuffers

OS 内核缓冲区使用的内存量,以字节为单位。这通常应该很小,较大的值可能表示 OS 配置错误。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryCached

OS 页面缓存使用的内存量,以字节为单位。通常,几乎所有可用内存都由 OS 页面缓存使用 - 此指标的高值是正常且预期的。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryFreePlusCached

主机系统上的可用内存加上 OS 页面缓存内存量,以字节为单位。此内存可供程序使用。该值应与 OSMemoryAvailable 非常相似。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryFreeWithoutCached

主机系统上的可用内存量,以字节为单位。这不包括 OS 页面缓存内存使用的内存量,以字节为单位。页面缓存内存也可供程序使用,因此此指标的值可能会令人困惑。请参阅 OSMemoryAvailable 指标。为了方便起见,我们还提供了 OSMemoryFreePlusCached 指标,它应该与 OSMemoryAvailable 有些相似。另请参阅 https://www.linuxatemyram.com/。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryTotal

主机系统上的总内存量,以字节为单位。

OSNiceTime

CPU 核心运行具有更高优先级的用户空间代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSNiceTimeCPU_N

CPU 核心运行具有更高优先级的用户空间代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSNiceTimeNormalized

该值与 OSNiceTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

OSOpenFiles

主机上打开的文件总数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSProcessesBlocked

线程阻塞等待 I/O 完成的数量 (man procfs)。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSProcessesCreated

创建的进程数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSProcessesRunning

操作系统可运行(正在运行或准备运行)的线程数。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSSoftIrqTime

CPU 上运行软件中断请求所花费的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的数值较高可能表示系统上运行的软件效率低下。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSSoftIrqTimeCPU_N

CPU 上运行软件中断请求所花费的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的数值较高可能表示系统上运行的软件效率低下。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSSoftIrqTimeNormalized

该值与 OSSoftIrqTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

OSStealTime

在虚拟化环境中运行时,CPU 花费在其他操作系统中的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。并非每个虚拟化环境都提供此指标,而且大多数都不提供。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSStealTimeCPU_N

在虚拟化环境中运行时,CPU 花费在其他操作系统中的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。并非每个虚拟化环境都提供此指标,而且大多数都不提供。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSStealTimeNormalized

该值与 OSStealTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

OSSystemTime

CPU 核心运行 OS 内核(系统)代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSSystemTimeCPU_N

CPU 核心运行 OS 内核(系统)代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSSystemTimeNormalized

该值与 OSSystemTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

OSThreadsRunnable

操作系统内核看到的“可运行”线程总数。

OSThreadsTotal

操作系统内核看到的线程总数。

OSUptime

主机服务器(运行 ClickHouse 的机器)的正常运行时间,以秒为单位。

OSUserTime

CPU 核心运行用户空间代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这还包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 核心)导致 CPU 利用率不足的时间。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSUserTimeCPU_N

CPU 核心运行用户空间代码的时间比率。这是一个系统级指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这还包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 核心)导致 CPU 利用率不足的时间。单个 CPU 核心的值将在 [0..1] 区间内。所有 CPU 核心的值计算为它们的总和 [0..num cores]。

OSUserTimeNormalized

该值与 OSUserTime 类似,但除以 CPU 核心数,以便在 [0..1] 区间内测量,而与核心数无关。这允许您在集群中的多台服务器上平均此指标的值,即使核心数不均匀,仍然可以获得平均资源利用率指标。

PostgreSQLThreads

PostgreSQL 兼容协议服务器中的线程数。

QueryCacheBytes

查询缓存的总大小,以字节为单位。

QueryCacheEntries

查询缓存中的条目总数。

ReplicasMaxAbsoluteDelay

在复制表之间,最新鲜的复制部件与仍待复制的最新鲜数据部件之间的时间差最大值,以秒为单位。非常高的值表示没有数据的副本。

ReplicasMaxInsertsInQueue

在复制表之间,队列中(仍待复制)的 INSERT 操作的最大数量。

ReplicasMaxMergesInQueue

在复制表之间,队列中(仍待应用)的合并操作的最大数量。

ReplicasMaxQueueSize

在复制表之间,队列大小(以 get、merge 等操作的数量计)的最大值。

ReplicasMaxRelativeDelay

在复制表之间,副本延迟与同一表的最新的副本的延迟之间的最大差异。

ReplicasSumInsertsInQueue

在复制表之间,队列中(仍待复制)的 INSERT 操作的总和。

ReplicasSumMergesInQueue

在复制表之间,队列中(仍待应用)的合并操作的总和。

ReplicasSumQueueSize

在复制表之间,队列大小(以 get、merge 等操作的数量计)的总和。

TCPThreads

TCP 协议(不含 TLS)服务器中的线程数。

Temperature_N

对应设备的温度,单位为 ℃。传感器可能会返回不真实的值。来源:/sys/class/thermal

Temperature_name

对应硬件监控器和对应传感器报告的温度,单位为 ℃。传感器可能会返回不真实的值。来源:/sys/class/hwmon

TotalBytesOfMergeTreeTables

MergeTree 系列的所有表中存储的总字节数(已压缩,包括数据和索引)。

TotalPartsOfMergeTreeTables

MergeTree 系列的所有表中的数据部件总数。大于 10,000 的数字将对服务器启动时间产生负面影响,并且可能表明分区键的选择不合理。

TotalPrimaryKeyBytesInMemory

主键值使用的内存总量(以字节为单位)(仅考虑活动部件)。

TotalPrimaryKeyBytesInMemoryAllocated

为主键值保留的内存总量(以字节为单位)(仅考虑活动部件)。

TotalRowsOfMergeTreeTables

MergeTree 系列的所有表中存储的总行数(记录)。

UncompressedCacheBytes

未压缩缓存的总大小,以字节为单位。未压缩缓存通常不会提高性能,应尽量避免使用。

UncompressedCacheCells

未压缩缓存中的条目总数。每个条目代表一个解压缩的数据块。未压缩缓存通常不会提高性能,应尽量避免使用。

Uptime

服务器正常运行时间,以秒为单位。它包括接受连接之前服务器初始化所花费的时间。

jemalloc.active

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.allocated

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.dirty_purged

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.muzzy_purged

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pactive

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pdirty

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pmuzzy

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_runs

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_threads

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.run_intervals

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.epoch

jemalloc(Jason Evans 的内存分配器)统计数据的内部增量更新编号,用于所有其他 jemalloc 指标。

jemalloc.mapped

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.metadata

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.metadata_thp

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.resident

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.retained

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

jemalloc.prof.active

低级内存分配器 (jemalloc) 的内部指标。请参阅 https://jemalloc.net/jemalloc.3.html

另请参阅

  • 监控 — ClickHouse 监控的基本概念。
  • system.metrics — 包含即时计算的指标。
  • system.events — 包含已发生事件的数量。
  • system.metric_log — 包含来自表 system.metricssystem.events 的指标值的历史记录。