跳至主要内容

asynchronous_metrics

包含在后台定期计算的指标。例如,正在使用的 RAM 量。

示例

SELECT * FROM system.asynchronous_metrics LIMIT 10
┌─metric──────────────────────────────────┬──────value─┬─description────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ AsynchronousMetricsCalculationTimeSpent │ 0.00179053 │ Time in seconds spent for calculation of asynchronous metrics (this is the overhead of asynchronous metrics). │
│ NumberOfDetachedByUserParts │ 0 │ The total number of parts detached from MergeTree tables by users with the `ALTER TABLE DETACH` query (as opposed to unexpected, broken or ignored parts). The server does not care about detached parts and they can be removed. │
│ NumberOfDetachedParts │ 0 │ The total number of parts detached from MergeTree tables. A part can be detached by a user with the `ALTER TABLE DETACH` query or by the server itself it the part is broken, unexpected or unneeded. The server does not care about detached parts and they can be removed. │
│ TotalRowsOfMergeTreeTables │ 2781309 │ Total amount of rows (records) stored in all tables of MergeTree family. │
│ TotalBytesOfMergeTreeTables │ 7741926 │ Total amount of bytes (compressed, including data and indices) stored in all tables of MergeTree family. │
│ NumberOfTables │ 93 │ Total number of tables summed across the databases on the server, excluding the databases that cannot contain MergeTree tables. The excluded database engines are those who generate the set of tables on the fly, like `Lazy`, `MySQL`, `PostgreSQL`, `SQlite`. │
│ NumberOfDatabases │ 6 │ Total number of databases on the server. │
│ MaxPartCountForPartition │ 6 │ Maximum number of parts per partition across all partitions of all tables of MergeTree family. Values larger than 300 indicates misconfiguration, overload, or massive data loading. │
│ ReplicasSumMergesInQueue │ 0 │ Sum of merge operations in the queue (still to be applied) across Replicated tables. │
│ ReplicasSumInsertsInQueue │ 0 │ Sum of INSERT operations in the queue (still to be replicated) across Replicated tables. │
└─────────────────────────────────────────┴────────────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

指标描述

AsynchronousHeavyMetricsCalculationTimeSpent

用于计算异步繁重(与表相关的)指标所花费的时间(以秒为单位)(这是异步指标的开销)。

AsynchronousHeavyMetricsUpdateInterval

繁重(与表相关的)指标更新间隔

AsynchronousMetricsCalculationTimeSpent

用于计算异步指标所花费的时间(以秒为单位)(这是异步指标的开销)。

AsynchronousMetricsUpdateInterval

指标更新间隔

BlockActiveTime_name

块设备排队 I/O 请求所花费的时间(以秒为单位)。这是一个系统范围的指标,它包含主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。查看 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardBytes_name

块设备上已丢弃的字节数。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用这些操作。这是一个系统范围的指标,它包含主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。查看 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardMerges_name

从块设备请求并由操作系统 I/O 调度程序合并在一起的丢弃操作数量。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用这些操作。这是一个系统范围的指标,它包含主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。查看 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardOps_name

从块设备请求的丢弃操作数量。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用这些操作。这是一个系统范围的指标,它包含主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。查看 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardTime_name

在从块设备请求的丢弃操作中花费的时间(以秒为单位),对所有操作求和。这些操作与 SSD 相关。ClickHouse 不使用丢弃操作,但系统上的其他进程可以使用这些操作。这是一个系统范围的指标,它包含主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。查看 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockInFlightOps_name

此值计算已发出给设备驱动程序但尚未完成的 I/O 请求数量。它不包括已排队但尚未发出给设备驱动程序的 I/O 请求。这是一个系统范围的指标,它包含主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。查看 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockQueueTime_name

此值计算 I/O 请求在此块设备上等待的毫秒数。如果有许多 I/O 请求正在等待,则此值将随着等待请求数乘以毫秒数的乘积而增加。这是一个系统范围的指标,它包含主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。查看 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadBytes_name

从块设备读取的字节数。由于操作系统页面缓存的使用,它可能低于从文件系统读取的字节数,这可以节省 I/O。这是一个系统范围的指标,它包含主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。查看 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadMerges_name

从块设备请求并由操作系统 I/O 调度程序合并在一起的读取操作数量。这是一个系统范围的指标,它包含主机上的所有进程,而不仅仅是 clickhouse-server。来源:/sys/block。查看 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadOps_name

从块设备请求的读取操作次数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 ClickHouse 服务器。来源:/sys/block。参见 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadTime_name

从块设备请求的读取操作所花费的时间(以秒为单位),所有操作的总和。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 ClickHouse 服务器。来源:/sys/block。参见 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteBytes_name

写入块设备的字节数。由于操作系统页面缓存的使用,它可能低于写入文件系统的字节数,从而节省了 I/O。由于直写缓存,写入块设备的操作可能比相应地写入文件系统的操作晚。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 ClickHouse 服务器。来源:/sys/block。参见 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteMerges_name

从块设备请求的写入操作数,并由操作系统 I/O 调度程序合并在一起。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 ClickHouse 服务器。来源:/sys/block。参见 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteOps_name

从块设备请求的写入操作次数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 ClickHouse 服务器。来源:/sys/block。参见 https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteTime_name

从块设备请求的写入操作所花费的时间(以秒为单位),所有操作的总和。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 ClickHouse 服务器。来源:/sys/block。参见 https://www.kernel.org/doc/Documentation/block/stat.txt

CPUFrequencyMHz_name

CPU 的当前频率,以 MHz 为单位。大多数现代 CPU 会动态调整频率以节省电能和 Turbo Boosting。

CompiledExpressionCacheBytes

JIT 编译代码缓存使用的总字节数。

CompiledExpressionCacheCount

JIT 编译代码缓存中的总条目数。

DiskAvailable_name

磁盘(虚拟文件系统)上的可用字节数。远程文件系统可能显示一个很大的值,例如 16 EiB。

DiskTotal_name

磁盘(虚拟文件系统)的总大小(以字节为单位)。远程文件系统可能显示一个很大的值,例如 16 EiB。

DiskUnreserved_name

磁盘(虚拟文件系统)上的可用字节数,不包括合并、获取和移动的预留空间。远程文件系统可能显示一个很大的值,例如 16 EiB。

DiskUsed_name

磁盘(虚拟文件系统)上使用的字节数。远程文件系统并不总是提供此信息。

FilesystemCacheBytes

cache 虚拟文件系统中的总字节数。此缓存保存在磁盘上。

FilesystemCacheFiles

cache 虚拟文件系统中缓存的文件段的总数。此缓存保存在磁盘上。

FilesystemLogsPathAvailableBytes

安装 ClickHouse 日志路径的卷上的可用字节数。如果此值接近零,则应在配置文件中调整日志轮换。

FilesystemLogsPathAvailableINodes

安装 ClickHouse 日志路径的卷上的可用 inode 数。

FilesystemLogsPathTotalBytes

安装 ClickHouse 日志路径的卷的大小(以字节为单位)。建议至少为日志预留 10 GB 空间。

FilesystemLogsPathTotalINodes

安装 ClickHouse 日志路径的卷上的 inode 总数。

FilesystemLogsPathUsedBytes

安装 ClickHouse 日志路径的卷上使用的字节数。

FilesystemLogsPathUsedINodes

安装 ClickHouse 日志路径的卷上使用的 inode 数。

FilesystemMainPathAvailableBytes

安装主 ClickHouse 路径的卷上的可用字节数。

FilesystemMainPathAvailableINodes

安装主 ClickHouse 路径的卷上的可用 inode 数。如果它接近于零,则表示配置错误,即使磁盘未满,您也会收到“设备上没有剩余空间”的错误。

FilesystemMainPathTotalBytes

安装主 ClickHouse 路径的卷的大小(以字节为单位)。

FilesystemMainPathTotalINodes

安装主 ClickHouse 路径的卷上的 inode 总数。如果它小于 2500 万,则表示配置错误。

FilesystemMainPathUsedBytes

安装主 ClickHouse 路径的卷上使用的字节数。

FilesystemMainPathUsedINodes

安装主 ClickHouse 路径的卷上使用的 inode 数。此值主要对应于文件数。

HTTPThreads

HTTP 接口服务器中的线程数(不含 TLS)。

InterserverThreads

副本通信协议服务器中的线程数(不含 TLS)。

Jitter

异步指标计算线程计划唤醒时间与实际唤醒时间之间的差值。它反映了系统总体延迟和响应能力的代理指标。

LoadAverage_N

系统整体负载,以 1 分钟为单位进行指数平滑平均。负载表示所有进程(操作系统内核的调度实体)中当前正在由 CPU 运行或等待 I/O 或准备运行但此时未被调度的线程数。此数字包括所有进程,而不仅仅是 ClickHouse 服务器。如果系统过载,并且许多进程准备运行但等待 CPU 或 I/O,则此数字可能大于 CPU 内核数。

MMapCacheCells

使用 mmap 打开的文件数(映射到内存)。这用于设置 local_filesystem_read_methodmmap 的查询。使用 mmap 打开的文件保存在缓存中,以避免代价高昂的 TLB 刷新。

MarkCacheBytes

标记缓存的总大小(以字节为单位)。

MarkCacheFiles

缓存到标记缓存中的标记文件总数。

MaxPartCountForPartition

所有 MergeTree 系列表的所有分区的所有分区中每个分区的最大分区数。大于 300 的值表示配置错误、过载或大量数据加载。

MemoryCode

为服务器进程的机器代码页映射的虚拟内存量(以字节为单位)。

MemoryDataAndStack

为堆栈使用和已分配内存映射的虚拟内存量(以字节为单位)。它没有指定是否包括每个线程的堆栈和大多数已分配内存,这些内存是使用“mmap”系统调用分配的。此指标仅出于完整性考虑而存在。我建议使用 MemoryResident 指标进行监控。

MemoryResidentMax

服务器进程使用的最大物理内存量(以字节为单位)。

MemoryResident

服务器进程使用的物理内存量(以字节为单位)。

MemoryShared

服务器进程使用的内存量,这些内存也由其他进程共享(以字节为单位)。ClickHouse 不使用共享内存,但某些内存可能会被操作系统标记为共享,原因是操作系统本身。监控此指标意义不大,它仅出于完整性考虑而存在。

MemoryVirtual

服务器进程分配的虚拟地址空间大小,以字节为单位。虚拟地址空间的大小通常远大于物理内存消耗,不应将其用作内存消耗的估计。此指标的大值完全正常,并且仅在技术上才有意义。

MySQLThreads

MySQL 兼容协议服务器中的线程数。

NetworkReceiveBytes_name

通过网络接口接收的字节数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkReceiveDrop_name

通过网络接口接收时丢弃数据包的字节数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkReceiveErrors_name

通过网络接口接收时发生错误的次数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkReceivePackets_name

通过网络接口接收的网络数据包数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkSendBytes_name

通过网络接口发送的字节数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkSendDrop_name

通过网络接口发送时丢弃数据包的次数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkSendErrors_name

通过网络接口发送时发生错误(例如 TCP 重传)的次数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NetworkSendPackets_name

通过网络接口发送的网络数据包数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

NumberOfDatabases

服务器上数据库的总数。

NumberOfDetachedByUserParts

用户使用 ALTER TABLE DETACH 查询(而不是意外、损坏或忽略的部件)从 MergeTree 表中分离的部件总数。服务器不关心分离的部件,它们可以被删除。

NumberOfDetachedParts

从 MergeTree 表中分离的部件总数。部件可以通过用户使用 ALTER TABLE DETACH 查询或由服务器本身在部件损坏、意外或不需要时进行分离。服务器不关心分离的部件,它们可以被删除。

NumberOfTables

服务器上所有数据库的表总数,不包括不能包含 MergeTree 表的数据库。排除的数据库引擎是那些动态生成表集的引擎,例如 LazyMySQLPostgreSQLSQlite

OSContextSwitches

系统在主机上进行的上下文切换次数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSGuestNiceTime

当来宾被设置为较高优先级时(参见 man procfs),Linux 内核控制下为来宾操作系统运行虚拟 CPU 所花费时间的比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSGuestNiceTimeCPU_N

当来宾被设置为较高优先级时(参见 man procfs),Linux 内核控制下为来宾操作系统运行虚拟 CPU 所花费时间的比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSGuestNiceTimeNormalized

该值类似于 OSGuestNiceTime,但除以 CPU 内核数量以在以下范围内测量[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

OSGuestTime

Linux 内核控制下为来宾操作系统运行虚拟 CPU 所花费时间的比例(参见 man procfs)。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSGuestTimeCPU_N

Linux 内核控制下为来宾操作系统运行虚拟 CPU 所花费时间的比例(参见 man procfs)。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标与 ClickHouse 无关,但为了完整性仍然存在。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSGuestTimeNormalized

该值类似于 OSGuestTime,但除以 CPU 内核数量以在以下范围内测量[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

OSIOWaitTime

CPU 内核未运行代码,但操作系统内核未在此 CPU 上运行任何其他进程(因为进程正在等待 IO)的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSIOWaitTimeCPU_N

CPU 内核未运行代码,但操作系统内核未在此 CPU 上运行任何其他进程(因为进程正在等待 IO)的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSIOWaitTimeNormalized

该值类似于 OSIOWaitTime,但除以 CPU 内核数量以在以下范围内测量[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

OSIdleTime

从操作系统内核的角度来看,CPU 内核处于空闲状态(甚至没有准备好运行等待 IO 的进程)的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这并不包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 内核)导致 CPU 利用率不足的时间。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSIdleTimeCPU_N

从操作系统内核的角度来看,CPU 内核处于空闲状态(甚至没有准备好运行等待 IO 的进程)的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这并不包括由于 CPU 内部原因(内存负载、流水线停顿、分支预测错误、运行另一个 SMT 内核)导致 CPU 利用率不足的时间。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSIdleTimeNormalized

该值类似于 OSIdleTime,但除以 CPU 内核数量以在以下范围内测量[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

OSInterrupts

主机上的中断次数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSIrqTime

在 CPU 上运行硬件中断请求所花费时间的比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的高值可能表明硬件配置错误或网络负载过高。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSIrqTimeCPU_N

在 CPU 上运行硬件中断请求所花费时间的比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的高值可能表明硬件配置错误或网络负载过高。单个 CPU 内核的值将在以下间隔内[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSIrqTimeNormalized

该值类似于 OSIrqTime,但除以 CPU 内核数量以在以下范围内测量[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

OSMemoryAvailable

程序可用的内存量,以字节为单位。这与 OSMemoryFreePlusCached 指标非常相似。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryBuffers

操作系统内核缓冲区使用的内存量,以字节为单位。这通常应该很小,并且大的值可能表明操作系统配置错误。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryCached

操作系统页面缓存使用的内存量,以字节为单位。通常,几乎所有可用内存都由操作系统页面缓存使用——此指标的高值是正常的,也是预期的。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryFreePlusCached

主机系统上的空闲内存量加上操作系统页面缓存内存,以字节为单位。此内存可供程序使用。该值应与 OSMemoryAvailable 非常相似。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryFreeWithoutCached

主机系统上的空闲内存量,以字节为单位。这并不包括操作系统页面缓存内存使用的内存,以字节为单位。页面缓存内存也可供程序使用,因此此指标的值可能会令人困惑。请改用 OSMemoryAvailable 指标。为了方便起见,我们还提供了 OSMemoryFreePlusCached 指标,该指标应与 OSMemoryAvailable 相似。另请参见 https://www.linuxatemyram.com/。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSMemoryTotal

主机系统上的总内存量,以字节为单位。

OSNiceTime

CPU 核心运行较高优先级的用户空间代码所占用的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSNiceTimeCPU_N

CPU 核心运行较高优先级的用户空间代码所占用的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSNiceTimeNormalized

该值类似于 OSNiceTime,但除以 CPU 核心数,以[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

OSOpenFiles

主机上打开文件的总数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSProcessesBlocked

阻塞等待 I/O 完成的线程数(man procfs)。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSProcessesCreated

创建的进程数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSProcessesRunning

操作系统可运行(正在运行或准备运行)的线程数。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。

OSSoftIrqTime

CPU 上运行软件中断请求所花费的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的值较高可能表明系统上运行的软件效率低下。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSSoftIrqTimeCPU_N

CPU 上运行软件中断请求所花费的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。此指标的值较高可能表明系统上运行的软件效率低下。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSSoftIrqTimeNormalized

该值类似于 OSSoftIrqTime,但除以 CPU 核心数,以[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

OSStealTime

在虚拟化环境中运行时,CPU 在其他操作系统中花费的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。并非所有虚拟化环境都提供此指标,并且大多数环境都不提供。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSStealTimeCPU_N

在虚拟化环境中运行时,CPU 在其他操作系统中花费的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。并非所有虚拟化环境都提供此指标,并且大多数环境都不提供。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSStealTimeNormalized

该值类似于 OSStealTime,但除以 CPU 核心数,以[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

OSSystemTime

CPU 核心运行操作系统内核(系统)代码所占用的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSSystemTimeCPU_N

CPU 核心运行操作系统内核(系统)代码所占用的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSSystemTimeNormalized

该值类似于 OSSystemTime,但除以 CPU 核心数,以[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

OSThreadsRunnable

操作系统内核调度程序看到的“可运行”线程总数。

OSThreadsTotal

操作系统内核调度程序看到的线程总数。

OSUptime

主机服务器(运行 ClickHouse 的机器)的正常运行时间(以秒为单位)。

OSUserTime

CPU 核心运行用户空间代码所占用的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这也包括 CPU 由于 CPU 内部原因(内存负载、管道停顿、分支预测错误、运行另一个 SMT 核心)而未充分利用的时间。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSUserTimeCPU_N

CPU 核心运行用户空间代码所占用的时间比例。这是一个系统范围的指标,它包括主机上的所有进程,而不仅仅是 clickhouse-server。这也包括 CPU 由于 CPU 内部原因(内存负载、管道停顿、分支预测错误、运行另一个 SMT 核心)而未充分利用的时间。单个 CPU 核心的值将介于[0..1]. 所有 CPU 内核的值计算为它们的总和[0..num cores].

OSUserTimeNormalized

该值类似于 OSUserTime,但除以 CPU 核心数,以[0..1]间隔,与内核数量无关。这允许您在一个集群中跨多个服务器平均此指标的值,即使内核数量不均匀,并且仍然获得平均资源利用率指标。

PostgreSQLThreads

PostgreSQL 兼容性协议服务器中的线程数。

QueryCacheBytes

查询缓存的总大小(以字节为单位)。

QueryCacheEntries

查询缓存中的条目总数。

ReplicasMaxAbsoluteDelay

在复制表中,最新复制部分与仍待复制的最新数据部分之间最大的时间差(以秒为单位)。值过高表示副本没有数据。

ReplicasMaxInsertsInQueue

在复制表中,队列中 INSERT 操作的最大数量(仍待复制)。

ReplicasMaxMergesInQueue

在复制表中,队列中合并操作的最大数量(仍待应用)。

ReplicasMaxQueueSize

在复制表中,队列大小的最大值(以 get、merge 等操作的数量为单位)。

ReplicasMaxRelativeDelay

在复制表中,副本延迟与同一表的最新副本的延迟之间的最大差值。

ReplicasSumInsertsInQueue

在复制表中,队列中 INSERT 操作的数量总和(仍待复制)。

ReplicasSumMergesInQueue

在复制表中,队列中合并操作的数量总和(仍待应用)。

ReplicasSumQueueSize

在复制表中,队列大小的总和(以 get、merge 等操作的数量为单位)。

TCPThreads

TCP 协议(无 TLS)服务器中的线程数。

Temperature_N

相应设备的温度(以 ℃ 为单位)。传感器可能会返回不切实际的值。来源:/sys/class/thermal

Temperature_name

相应硬件监控器和相应传感器报告的温度(以 ℃ 为单位)。传感器可能会返回不切实际的值。来源:/sys/class/hwmon

TotalBytesOfMergeTreeTables

存储在所有 MergeTree 家族表中的字节总数(已压缩,包括数据和索引)。

TotalPartsOfMergeTreeTables

所有 MergeTree 家族表中的数据部分总数。大于 10 000 的数字将对服务器启动时间产生负面影响,并且可能表明分区键的选择不合理。

TotalPrimaryKeyBytesInMemory

主键值使用的内存总量(以字节为单位)(仅考虑活动部分)。

TotalPrimaryKeyBytesInMemoryAllocated

为主键值保留的内存总量(以字节为单位)(仅考虑活动部分)。

TotalRowsOfMergeTreeTables

存储在所有 MergeTree 家族表中的行(记录)总数。

UncompressedCacheBytes

未压缩缓存的总大小(以字节为单位)。未压缩缓存通常不会提高性能,应该尽量避免。

UncompressedCacheCells

未压缩缓存中的条目总数。每个条目代表一个解压缩的数据块。未压缩缓存通常不会提高性能,应该尽量避免。

Uptime

服务器正常运行时间(以秒为单位)。它包括在接受连接之前花费在服务器初始化上的时间。

jemalloc.active

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.allocated

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.dirty_purged

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.muzzy_purged

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pactive

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pdirty

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pmuzzy

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_runs

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_threads

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.run_intervals

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.epoch

jemalloc(Jason Evans 的内存分配器)统计信息的内部增量更新号,用于所有其他 jemalloc 指标。

jemalloc.mapped

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.metadata

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.metadata_thp

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.resident

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.retained

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

jemalloc.prof.active

低级内存分配器(jemalloc)的内部指标。请参见 https://jemalloc.net/jemalloc.3.html

另请参阅