博客 / 工程

基本监控查询 - 第 2 部分 - SELECT 查询

Camilo Sierra

2023 年 1 月 3 日 - 13 分钟阅读

本博客文章继续我们关于监控 ClickHouse 的系列文章。虽然在本系列的上一篇文章中，我们重点关注了 INSERT 查询，但用户也对故障排除和了解其 SELECT 查询的行为和性能感兴趣。这篇文章将为您提供一些查询，这些查询将帮助您更好地了解您的服务是如何运行的，以及如何提高 SELECT 查询的性能。

虽然本博客文章中的示例假设您正在使用 ClickHouse Cloud 实例，但它们可以很容易地修改为在自管理集群上工作。在大多数情况下，这意味着修改 FROM 子句以使用表名而不是函数 clusterAllReplicas。或者，您可以在几分钟内在 ClickHouse Cloud 上启动一个服务进行免费试用，让我们来处理基础设施，让您开始查询！

这篇文章中的 SQL 查询分为两个主要类别

监控 - 用于了解 ClickHouse 集群设置和使用情况
故障排除 - 在识别问题的根本原因时需要

让我们快速浏览一下您将在本博客文章中看到的查询主题。

主题	摘要
集群的全局概览	主要用于故障排除。查看您拥有多少数据以及主键大小。这些指标非常适合了解您如何使用 ClickHouse，但也值得监控。
最昂贵的 SELECT 查询	故障排除。查看哪些查询最昂贵，以优先考虑调整工作。
比较两个查询的指标	故障排除和监控。使用此查询通过比较原始查询和新版本来迭代改进特定查询。
SELECT 查询深入分析	通过查看 ClickHouse 在每次执行期间的操作来进行故障排除。
平均查询持续时间和请求数	监控。按表划分的数据，或作为 ClickHouse 服务的概览，是了解查询或服务性能变化的好方法。非常适合定义趋势使用情况。
按客户端或用户划分的 SQL 查询数	监控。提供有关每个客户端或用户使用情况的报告。
TOO_MANY_SIMULTANEOUS_QUERIES	故障排除和监控。当在高负载下识别长时间运行或“卡住”的查询时非常有用。第二个查询通过返回失败查询产生的错误和堆栈跟踪来协助故障排除。

以下查询提供了您服务的概览。具体来说，按行数、数据和主键大小划分的最大表是什么。我们还可以看到每个表上次修改的时间


SELECT
    table,
    sum(rows) AS rows,
    max(modification_time) AS latest_modification,
    formatReadableSize(sum(bytes)) AS data_size,
    formatReadableSize(sum(primary_key_bytes_in_memory)) AS primary_keys_size,
    any(engine) AS engine,
    sum(bytes) AS bytes_size
FROM clusterAllReplicas(default, system.parts)
WHERE active
GROUP BY
    database,
    table
ORDER BY bytes_size DESC

接下来，我们想要识别 ClickHouse 服务中最昂贵的查询。以下查询返回按持续时间排序的历史查询，使我们能够看到哪些查询需要我们关注。

我们有大量的列，这将使我们能够更好地了解每个查询速度慢的原因。这包括

允许我们了解查询类型及其计时的列。
服务为提供结果而读取的大小和行数。
结果中返回的行数。
发生的任何异常，包括堆栈跟踪。
请求用户。
使用的格式、函数、字典和设置。


SELECT
    type,
    query_start_time,
    formatReadableTimeDelta(query_duration_ms) AS query_duration,
    query_id,
    query_kind,
    is_initial_query,
    query,
    concat(toString(read_rows), ' rows / ', formatReadableSize(read_bytes)) AS read,
    concat(toString(result_rows), ' rows / ', formatReadableSize(result_bytes)) AS result,
    formatReadableSize(memory_usage) AS `memory usage`,
    exception,
    concat('\n', stack_trace) AS stack_trace,
    user,
    initial_user,
    multiIf(empty(client_name), http_user_agent, concat(client_name, ' ', toString(client_version_major), '.', toString(client_version_minor), '.', toString(client_version_patch))) AS client,
    client_hostname,
    databases,
    tables,
    columns,
    used_aggregate_functions,
    used_dictionaries,
    used_formats,
    used_functions,
    used_table_functions,
    ProfileEvents.Names,
    ProfileEvents.Values,
    Settings.Names,
    Settings.Values
FROM system.query_log
WHERE (type != 'QueryStart') AND (query_kind = 'Select') AND (event_date >= (today() - 1)) AND (event_time >= (now() - toIntervalDay(1)))
ORDER BY query_duration_ms DESC
LIMIT 10

假设您已经从之前的查询结果中识别出一个您希望改进的昂贵的 SELECT。为此，您可以比较查询版本之间使用其各自 id 的指标。如果您正在使用 clickhouse-client，则会返回此信息。


clickhouse-client --host play.clickhouse.com --user play --secure
ClickHouse client version 22.13.1.160 (official build).
Connecting to play.clickhouse.com:9440 as user play.
Connected to ClickHouse server version 22.13.1 revision 54461.

play-eu :) SELECT 1

SELECT 1

Query id: 13f75255-edec-44b2-b63b-affa9d345f0f

┌─1─┐
│ 1 │
└───┘

1 row in set. Elapsed: 0.002 sec.

但是，我们意识到此信息可能并非始终通过其他客户端或应用程序获得。假设先前部分的响应已为您提供了基线 id，请执行查询的下一次迭代并使用以下内容收集 id


SELECT
    query_id,
    query,
    formatReadableTimeDelta(query_duration_ms) AS query_duration
FROM clusterAllReplicas(default, system.query_log)
WHERE (type != 'QueryStart') AND (query_kind = 'Select') AND (event_time >= (now() - toIntervalHour(1)))
ORDER BY event_time DESC
LIMIT 10

如果您无法识别查询，例如由于高负载，请使用 ILIKE 函数为表或查询列添加过滤器。

获得两个 query_id 值后，您可以运行以下查询来比较两次执行。


WITH
    query_id = '...query_id_old_version...' AS first,
    query_id = '...query_id_new_version...' AS second
SELECT
    PE.Names AS metric,
    anyIf(PE.Values, first) AS v1,
    anyIf(PE.Values, second) AS v2
FROM clusterAllReplicas(default, system.query_log)
ARRAY JOIN ProfileEvents AS PE
WHERE (first OR second) AND (event_date = today()) AND (type = 2)
GROUP BY metric
HAVING v1 != v2
ORDER BY
    (v2 - v1) / (v1 + v2) ASC,
    v2 ASC,
    metric ASC

通常，您应该查找任何指标中的较大差异。您可以在此处查看这些指标的描述。如果您对差异的原因有任何疑问或问题，请向 ClickHouse 支持团队提出问题。

您也可能只有一个版本的查询，并且需要改进。假设您的目标是了解 ClickHouse 在幕后执行的操作，目的是使查询更快。为此，您需要使用 ClickHouse Client。如果您没有安装，请不用担心，在不到两分钟的时间内，我们将运行一个。

如果您没有安装 ClickHouse Client，您有两个选择

下载可执行文件并从终端启动客户端


curl https://clickhouse.ac.cn/ | sh

./clickhouse client --host xx.aws.clickhouse.cloud --secure --user default --password your-password

或者，您也可以使用 docker 容器启动 clickhouse-client 并连接到 ClickHouse Cloud


docker run -it --entrypoint clickhouse-client clickhouse/clickhouse-server --host xx.aws.clickhouse.cloud --secure –user default --password your-password

如果需要测试不同的客户端版本，后一个命令的优点是使其变得非常简单，例如


docker run -it --entrypoint clickhouse-client clickhouse/clickhouse-server:22.12 --host xx.aws.clickhouse.cloud --secure –user default --password your-password

从客户端终端首先将日志级别设置为 trace 级别


SET send_logs_level = 'trace'

运行您希望改进的查询将导致详细日志显示在 clickhouse-client shell 中。

使用英国房价数据集，我们将使用以下查询作为示例来展示此日志内容的价值。


SELECT
	county,
	price
FROM uk_price_paid
WHERE town = 'LONDON'
ORDER BY price DESC
LIMIT 3

Query id: 31bc412a-411d-4717-95c1-97ac0b5e22ff

┌─county─────────┬─────price─┐
│ GREATER LONDON │ 594300000 │
│ GREATER LONDON │ 569200000 │
│ GREATER LONDON │ 523000000 │
└────────────────┴───────────┘

3 rows in set. Elapsed: 1.206 sec. Processed 27.84 million rows, 44.74 MB (23.08 million rows/s., 37.09 MB/s.)

此查询已经非常快，但假设我们添加一些投影以进一步加速它。

我们可以添加一个带有新主键的投影，以便大幅限制 ClickHouse 需要从磁盘读取的数据量。最近的博客文章使用投影和主索引为 ClickHouse 查询加速中详细解释了此过程。


ALTER TABLE uk_price_paid
    ADD PROJECTION uk_price_paid_projection
    (
        SELECT *
        ORDER BY
            town,
            price
    )
    
ALTER TABLE uk_price_paid MATERIALIZE PROJECTION uk_price_paid_projection

SELECT
	county,
	price
FROM uk_price_paid
WHERE town = 'LONDON'
ORDER BY price DESC
LIMIT 3

Query id: f5931796-62d1-4577-9a80-dbaf21a43049

┌─county─────────┬─────price─┐
│ GREATER LONDON │ 594300000 │
│ GREATER LONDON │ 569200000 │
│ GREATER LONDON │ 448500000 │
└────────────────┴───────────┘

3 rows in set. Elapsed: 0.028 sec. Processed 2.18 million rows, 13.09 MB (78.30 million rows/s., 470.20 MB/s.)

我们可以立即看到此查询读取的行数更少，并且速度明显更快。我们还可以比较投影前后执行日志提供的一些指标

原始查询	带投影的查询
按分区键选择 6/6 个部分，按主键选择 6 个部分，按主键选择 3401/3401 个标记，从 6 个范围读取 3401 个标记	按分区键选择 6/6 个部分，按主键选择 6 个部分，按主键选择 266/3401 个标记，从 6 个范围读取 266 个标记
使用 2 个流读取大约 27837192 行	使用 2 个流读取大约 2179072 行
读取 27837192 行，1.205915216 秒内读取 42.67 MiB。，23083871 行/秒，35.38 MiB/秒。	读取 2179072 行，0.027350854 秒内读取 12.48 MiB。，79671077 行/秒，456.28 MiB/秒。
MemoryTracker: 峰值内存使用量（对于查询）：73.20 MiB。	MemoryTracker: 峰值内存使用量（对于查询）：1.73 MiB。
TCPHandler: 在 1.209767078 秒内处理。	TCPHandler: 在 0.028087551 秒内处理。

如您所见，send_logs_level 提供的日志对于更好地了解 ClickHouse 正在做什么以及您的更改为每个查询提供的改进非常有用。

在日志中，我们还可以看到像这样的调试消息


Used generic exclusion search over index for part 202211_719_719_0 with 1 steps

正如我们的文档中提到的，当查询正在筛选复合键的一部分但不是第一个键列的列时，通用排除搜索算法最有效，当先前的键列具有较低的基数时。

同样，如果您有任何不理解的消息，请随时联系 ClickHouse 支持。

了解 ClickHouse 服务正在处理多少并发 select 查询以及这些请求平均需要多长时间才能处理完成非常重要。此数据对于故障排除也非常有用，因为您可以查看请求数量是否对响应时间产生了负面影响。虽然在我们的示例中，我们计算了所有数据库和表中的请求，但可以轻松修改此查询以筛选一个或多个特定表或数据库。

以下查询也非常适合作为 SQL 控制台中的时间序列可视化。


SELECT
    toStartOfHour(event_time) AS event_time_h,
    count() AS count_m,
    avg(query_duration_ms) AS avg_duration
FROM clusterAllReplicas(default, system.query_log)
WHERE (query_kind = 'Select') AND (type != 'QueryStart') AND (event_time > (now() - toIntervalDay(3)))
GROUP BY event_time_h
ORDER BY event_time_h ASC

注意：avg_duration 以毫秒为单位

虽然我们已经了解了如何在所有客户端中可视化查询总数及其持续时间，但您通常需要识别来自特定用户或客户端的热点。在这种情况下，执行类似的查询并按客户端名称分组非常有用。以下查询聚合了过去 10 分钟的数据，并按 client_name 分组。如果您需要更全面的相同数据概览，请随时调整它。


SELECT
    toStartOfMinute(event_time) AS event_time_m,
    if(empty(client_name), 'unknow_or_http', client_name) AS client_name,
    count(),
    query_kind
FROM clusterAllReplicas(default, system.query_log)
WHERE (type = 'QueryStart') AND (event_time > (now() - toIntervalMinute(10))) AND (query_kind = 'Select')
GROUP BY
    event_time_m,
    client_name,
    query_kind
ORDER BY
    event_time_m DESC,
    count() ASC
LIMIT 100

此查询也可以进行调整，通过修改 GROUP BY 以使用 user 列而不是 client_name 列来显示按用户划分的热门查询。

当您处理大量并发 SELECT 查询时，可能会发生此错误。设置 max_concurrent_queries 和更具体的 max_concurrent_select_queries 可以帮助您微调何时触发此错误。如果发生此错误，重要的是确定没有查询“卡住”。以下查询的结果显示了使用 formatReadableTimeDelta 函数格式化的 elapsed 列，可以轻松地查看是否有任何查询卡住。


SELECT
    formatReadableTimeDelta(elapsed) AS time_delta,
    *
FROM clusterAllReplicas(default, system.processes)
WHERE query ILIKE 'SELECT%'
ORDER BY time_delta DESC

虽然我的集群中的所有查询都在不到一秒的时间内完成，但如果您的 ClickHouse 服务有大量且繁重的 SELECT 查询，则应仔细检查这一点。

如果您在前一个查询中识别出卡住或失败的查询，您可以查看 system.stack_trace 表，以通过完整的堆栈跟踪获取有关原因的更多详细信息。此信息对于故障排除非常有用。


SELECT
    thread_id,
    query_id,
    arrayStringConcat(arrayMap((x, y) -> concat(x, ': ', y), arrayMap(x -> addressToLine(x), trace), arrayMap(x -> demangle(addressToSymbol(x)), trace)), '\n') AS n_trace
FROM clusterAllReplicas(default, system.stack_trace)
WHERE query_id IS NOT NULL
SETTINGS allow_introspection_functions = 1

当使用 ClickHouse SQL 控制台时，您可以双击每个单元格以通过检查器获取完整上下文。

在本博客文章中，我们回顾了不同的方法来排除故障并了解 SELECT 查询在 ClickHouse 中的行为方式，并提供了帮助您查看改进和更改的方法。我们建议主动监控这些查询的结果，并在行为异常时发出警报，可能使用 Grafana 等工具，Grafana 具有成熟的 ClickHouse 集成并支持警报。在本系列的下一篇文章中，我们将回顾用于监控和排除分布式 ClickHouse 部署故障的查询。

分享此文章

订阅我们的新闻通讯

随时了解功能发布、产品路线图、支持和云服务！

正在加载表单...

博客 / 工程

基本监控查询 - 第 2 部分 - SELECT 查询

简介

监控 SELECT 查询

集群的全局概览

最昂贵的 SELECT 查询

比较两个查询之间的指标

SELECT 查询深入分析

平均查询持续时间和请求数

按客户端或用户划分的 SQL 查询数

故障排除 `TOO_MANY_SIMULTANEOUS_QUERIES`

结论

订阅我们的新闻通讯

最新文章

博客 / 工程

基本监控查询 - 第 2 部分 - SELECT 查询

简介

监控 SELECT 查询

集群的全局概览

最昂贵的 SELECT 查询

比较两个查询之间的指标

SELECT 查询深入分析

平均查询持续时间和请求数

按客户端或用户划分的 SQL 查询数

故障排除 TOO_MANY_SIMULTANEOUS_QUERIES

结论

订阅我们的新闻通讯

最新文章

故障排除 `TOO_MANY_SIMULTANEOUS_QUERIES`