跳至主要内容

StripeLog

此引擎属于 Log 引擎家族。查看 Log 引擎家族 文章中关于 Log 引擎的通用属性及其差异。

当您需要编写许多包含少量数据(少于 100 万行)的表时,请使用此引擎。

创建表

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
column1_name [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
column2_name [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
...
) ENGINE = StripeLog

查看 CREATE TABLE 查询的详细描述。

写入数据

StripeLog 引擎将所有列存储在一个文件中。对于每个 INSERT 查询,ClickHouse 将数据块追加到表文件的末尾,逐个写入列。

对于每个表,ClickHouse 将写入以下文件:

  • data.bin - 数据文件。
  • index.mrk - 带有标记的文件。标记包含插入的每个数据块的每列的偏移量。

StripeLog 引擎不支持 ALTER UPDATEALTER DELETE 操作。

读取数据

带标记的文件允许 ClickHouse 并行读取数据。这意味着 SELECT 查询将以不可预测的顺序返回行。使用 ORDER BY 子句对行进行排序。

使用示例

创建表

CREATE TABLE stripe_log_table
(
timestamp DateTime,
message_type String,
message String
)
ENGINE = StripeLog

插入数据

INSERT INTO stripe_log_table VALUES (now(),'REGULAR','The first regular message')
INSERT INTO stripe_log_table VALUES (now(),'REGULAR','The second regular message'),(now(),'WARNING','The first warning message')

我们使用了两个 INSERT 查询在 data.bin 文件中创建了两个数据块。

ClickHouse 在选择数据时使用多个线程。每个线程读取一个单独的数据块,并在完成时独立返回结果行。因此,输出中行块的顺序在大多数情况下与输入中相同块的顺序不匹配。例如

SELECT * FROM stripe_log_table
┌───────────timestamp─┬─message_type─┬─message────────────────────┐
│ 2019-01-18 14:27:32 │ REGULAR │ The second regular message │
│ 2019-01-18 14:34:53 │ WARNING │ The first warning message │
└─────────────────────┴──────────────┴────────────────────────────┘
┌───────────timestamp─┬─message_type─┬─message───────────────────┐
│ 2019-01-18 14:23:43 │ REGULAR │ The first regular message │
└─────────────────────┴──────────────┴───────────────────────────┘

对结果进行排序(默认情况下按升序排序)

SELECT * FROM stripe_log_table ORDER BY timestamp
┌───────────timestamp─┬─message_type─┬─message────────────────────┐
│ 2019-01-18 14:23:43 │ REGULAR │ The first regular message │
│ 2019-01-18 14:27:32 │ REGULAR │ The second regular message │
│ 2019-01-18 14:34:53 │ WARNING │ The first warning message │
└─────────────────────┴──────────────┴────────────────────────────┘