命名集合

ClickHouse Cloud 中不支持

命名集合提供了一种存储键值对集合的方式，用于配置与外部源的集成。您可以将命名集合与字典、表、表函数和对象存储一起使用。

命名集合可以通过 DDL 或在配置文件中配置，并在 ClickHouse 启动时应用。它们简化了对象的创建，并对没有管理权限的用户隐藏凭据。

命名集合中的键必须与相应函数、表引擎、数据库等的参数名称匹配。在下面的示例中，参数列表链接到每种类型。

在命名集合中设置的参数可以在 SQL 中被覆盖，这在下面的示例中显示。可以使用 [NOT] OVERRIDABLE 关键字和 XML 属性和/或配置选项 allow_named_collection_override_by_default 来限制此功能。

危险

如果允许覆盖，则没有管理权限的用户可能能够找出您尝试隐藏的凭据。如果您使用命名集合是为了这个目的，您应该禁用 allow_named_collection_override_by_default (默认情况下是启用的)。

在系统数据库中存储命名集合

DDL 示例

CREATE NAMED COLLECTION name AS
key_1 = 'value' OVERRIDABLE,
key_2 = 'value2' NOT OVERRIDABLE,
url = 'https://connection.url/'

在上面的例子中

key_1 始终可以被覆盖。
key_2 永远不能被覆盖。
url 是否可以被覆盖取决于 allow_named_collection_override_by_default 的值。

使用 DDL 创建命名集合的权限

要使用 DDL 管理命名集合，用户必须具有 named_control_collection 权限。可以通过向 /etc/clickhouse-server/users.d/ 添加文件来分配此权限。该示例为用户 default 提供了 access_management 和 named_collection_control 权限

/etc/clickhouse-server/users.d/user_default.xml
<clickhouse>
  <users>
    <default>
      <password_sha256_hex>65e84be33532fb784c48129675f9eff3a682b27168c0ea744b2cf58ee02337c5</password_sha256_hex replace=true>
      <access_management>1</access_management>
      <named_collection_control>1</named_collection_control>
    </default>
  </users>
</clickhouse>

提示

在上面的示例中，password_sha256_hex 值是密码的 SHA256 哈希的十六进制表示。用户 default 的此配置具有属性 replace=true，因为在默认配置中设置了纯文本 password，并且不可能为用户同时设置纯文本密码和 sha256 hex 密码。

命名集合的存储

命名集合可以存储在本地磁盘上或 ZooKeeper/Keeper 中。默认情况下使用本地存储。它们也可以使用与磁盘加密相同的算法进行加密存储，其中默认使用 aes_128_ctr。

要配置命名集合存储，您需要指定一个 type。可以是 local 或 keeper/zookeeper。对于加密存储，您可以使用 local_encrypted 或 keeper_encrypted/zookeeper_encrypted。

要使用 ZooKeeper/Keeper，我们还需要在配置文件中的 named_collections_storage 部分设置一个 path (ZooKeeper/Keeper 中的路径，命名集合将存储在此处)。以下示例使用加密和 ZooKeeper/Keeper

<clickhouse>
  <named_collections_storage>
    <type>zookeeper_encrypted</type>
    <key_hex>bebec0cabebec0cabebec0cabebec0ca</key_hex>
    <algorithm>aes_128_ctr</algorithm>
    <path>/named_collections_path/</path>
    <update_timeout_ms>1000</update_timeout_ms>
  </named_collections_storage>
</clickhouse>

可选配置参数 update_timeout_ms 默认等于 5000。

在配置文件中存储命名集合

XML 示例

/etc/clickhouse-server/config.d/named_collections.xml
<clickhouse>
     <named_collections>
        <name>
            <key_1 overridable="true">value</key_1>
            <key_2 overridable="false">value_2</key_2>
            <url>https://connection.url/</url>
        </name>
     </named_collections>
</clickhouse>

在上面的例子中

key_1 始终可以被覆盖。
key_2 永远不能被覆盖。
url 是否可以被覆盖取决于 allow_named_collection_override_by_default 的值。

修改命名集合

使用 DDL 查询创建的命名集合可以使用 DDL 进行更改或删除。使用 XML 文件创建的命名集合可以通过编辑或删除相应的 XML 进行管理。

修改 DDL 命名集合

更改或添加集合 collection2 的键 key1 和 key3 (这不会更改这些键的 overridable 标志的值)

ALTER NAMED COLLECTION collection2 SET key1=4, key3='value3'

更改或添加键 key1 并允许始终覆盖它

ALTER NAMED COLLECTION collection2 SET key1=4 OVERRIDABLE

从 collection2 中删除键 key2

ALTER NAMED COLLECTION collection2 DELETE key2

更改或添加键 key1 并删除集合 collection2 的键 key3

ALTER NAMED COLLECTION collection2 SET key1=4, DELETE key3

要强制键使用 overridable 标志的默认设置，您必须删除并重新添加该键。

ALTER NAMED COLLECTION collection2 DELETE key1;
ALTER NAMED COLLECTION collection2 SET key1=4;

删除 DDL 命名集合 `collection2`:

DROP NAMED COLLECTION collection2

用于访问 S3 的命名集合

参数的描述请参见s3 表函数。

DDL 示例

CREATE NAMED COLLECTION s3_mydata AS
access_key_id = 'AKIAIOSFODNN7EXAMPLE',
secret_access_key = 'wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY',
format = 'CSV',
url = 'https://s3.us-east-1.amazonaws.com/yourbucket/mydata/'

XML 示例

<clickhouse>
    <named_collections>
        <s3_mydata>
            <access_key_id>AKIAIOSFODNN7EXAMPLE</access_key_id>
            <secret_access_key>wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY</secret_access_key>
            <format>CSV</format>
            <url>https://s3.us-east-1.amazonaws.com/yourbucket/mydata/</url>
        </s3_mydata>
    </named_collections>
</clickhouse>

s3() 函数和 S3 表命名集合示例

以下两个示例都使用相同的命名集合 s3_mydata

s3() 函数

INSERT INTO FUNCTION s3(s3_mydata, filename = 'test_file.tsv.gz',
   format = 'TSV', structure = 'number UInt64', compression_method = 'gzip')
SELECT * FROM numbers(10000);

提示

上面 s3() 函数的第一个参数是集合的名称 s3_mydata。如果没有命名集合，则访问密钥 ID、密钥、格式和 URL 都将在每次调用 s3() 函数时传递。

S3 表

CREATE TABLE s3_engine_table (number Int64)
ENGINE=S3(s3_mydata, url='https://s3.us-east-1.amazonaws.com/yourbucket/mydata/test_file.tsv.gz', format = 'TSV')
SETTINGS input_format_with_names_use_header = 0;

SELECT * FROM s3_engine_table LIMIT 3;
┌─number─┐
│      0 │
│      1 │
│      2 │
└────────┘

用于访问 MySQL 数据库的命名集合

参数的描述请参见mysql。

DDL 示例

CREATE NAMED COLLECTION mymysql AS
user = 'myuser',
password = 'mypass',
host = '127.0.0.1',
port = 3306,
database = 'test',
connection_pool_size = 8,
replace_query = 1

XML 示例

<clickhouse>
    <named_collections>
        <mymysql>
            <user>myuser</user>
            <password>mypass</password>
            <host>127.0.0.1</host>
            <port>3306</port>
            <database>test</database>
            <connection_pool_size>8</connection_pool_size>
            <replace_query>1</replace_query>
        </mymysql>
    </named_collections>
</clickhouse>

mysql() 函数、MySQL 表、MySQL 数据库和字典命名集合示例

以下四个示例都使用相同的命名集合 mymysql

mysql() 函数

SELECT count() FROM mysql(mymysql, table = 'test');

┌─count()─┐
│       3 │
└─────────┘

注意

命名集合未指定 table 参数，因此在函数调用中指定为 table = 'test'。

MySQL 表

CREATE TABLE mytable(A Int64) ENGINE = MySQL(mymysql, table = 'test', connection_pool_size=3, replace_query=0);
SELECT count() FROM mytable;

┌─count()─┐
│       3 │
└─────────┘

注意

DDL 覆盖了命名集合中 connection_pool_size 的设置。

MySQL 数据库

CREATE DATABASE mydatabase ENGINE = MySQL(mymysql);

SHOW TABLES FROM mydatabase;

┌─name───┐
│ source │
│ test   │
└────────┘

MySQL 字典

CREATE DICTIONARY dict (A Int64, B String)
PRIMARY KEY A
SOURCE(MYSQL(NAME mymysql TABLE 'source'))
LIFETIME(MIN 1 MAX 2)
LAYOUT(HASHED());

SELECT dictGet('dict', 'B', 2);

┌─dictGet('dict', 'B', 2)─┐
│ two                     │
└─────────────────────────┘

用于访问 PostgreSQL 数据库的命名集合

参数的描述请参见postgresql。此外，还有别名

username 代表 user
db 代表 database。

参数 addresses_expr 在集合中使用，而不是 host:port。该参数是可选的，因为还有其他可选参数：host、hostname、port。以下伪代码解释了优先级

CASE
    WHEN collection['addresses_expr'] != '' THEN collection['addresses_expr']
    WHEN collection['host'] != ''           THEN collection['host'] || ':' || if(collection['port'] != '', collection['port'], '5432')
    WHEN collection['hostname'] != ''       THEN collection['hostname'] || ':' || if(collection['port'] != '', collection['port'], '5432')
END

创建示例

CREATE NAMED COLLECTION mypg AS
user = 'pguser',
password = 'jw8s0F4',
host = '127.0.0.1',
port = 5432,
database = 'test',
schema = 'test_schema'

配置示例

<clickhouse>
    <named_collections>
        <mypg>
            <user>pguser</user>
            <password>jw8s0F4</password>
            <host>127.0.0.1</host>
            <port>5432</port>
            <database>test</database>
            <schema>test_schema</schema>
        </mypg>
    </named_collections>
</clickhouse>

使用命名集合和 postgresql 函数的示例

SELECT * FROM postgresql(mypg, table = 'test');

┌─a─┬─b───┐
│ 2 │ two │
│ 1 │ one │
└───┴─────┘


SELECT * FROM postgresql(mypg, table = 'test', schema = 'public');

┌─a─┐
│ 1 │
│ 2 │
│ 3 │
└───┘

使用命名集合和引擎为 PostgreSQL 的数据库的示例

CREATE TABLE mypgtable (a Int64) ENGINE = PostgreSQL(mypg, table = 'test', schema = 'public');

SELECT * FROM mypgtable;

┌─a─┐
│ 1 │
│ 2 │
│ 3 │
└───┘

注意

当创建表时，PostgreSQL 从命名集合复制数据。集合中的更改不会影响现有表。

使用命名集合和引擎为 PostgreSQL 的数据库的示例

CREATE DATABASE mydatabase ENGINE = PostgreSQL(mypg);

SHOW TABLES FROM mydatabase

┌─name─┐
│ test │
└──────┘

使用命名集合和源为 POSTGRESQL 的字典的示例

CREATE DICTIONARY dict (a Int64, b String)
PRIMARY KEY a
SOURCE(POSTGRESQL(NAME mypg TABLE test))
LIFETIME(MIN 1 MAX 2)
LAYOUT(HASHED());

SELECT dictGet('dict', 'b', 2);

┌─dictGet('dict', 'b', 2)─┐
│ two                     │
└─────────────────────────┘

用于访问远程 ClickHouse 数据库的命名集合

参数的描述请参见remote。

配置示例

CREATE NAMED COLLECTION remote1 AS
host = 'remote_host',
port = 9000,
database = 'system',
user = 'foo',
password = 'secret',
secure = 1

<clickhouse>
    <named_collections>
        <remote1>
            <host>remote_host</host>
            <port>9000</port>
            <database>system</database>
            <user>foo</user>
            <password>secret</password>
            <secure>1</secure>
        </remote1>
    </named_collections>
</clickhouse>

由于 remoteSecure，连接不需要 secure，但它可以用于字典。

使用命名集合和 `remote`/`remoteSecure` 函数的示例

SELECT * FROM remote(remote1, table = one);
┌─dummy─┐
│     0 │
└───────┘

SELECT * FROM remote(remote1, database = merge(system, '^one'));
┌─dummy─┐
│     0 │
└───────┘

INSERT INTO FUNCTION remote(remote1, database = default, table = test) VALUES (1,'a');

SELECT * FROM remote(remote1, database = default, table = test);
┌─a─┬─b─┐
│ 1 │ a │
└───┴───┘

使用命名集合和源为 ClickHouse 的字典的示例

CREATE DICTIONARY dict(a Int64, b String)
PRIMARY KEY a
SOURCE(CLICKHOUSE(NAME remote1 TABLE test DB default))
LIFETIME(MIN 1 MAX 2)
LAYOUT(HASHED());

SELECT dictGet('dict', 'b', 1);
┌─dictGet('dict', 'b', 1)─┐
│ a                       │
└─────────────────────────┘

用于访问 Kafka 的命名集合

参数的描述请参见Kafka。

DDL 示例

CREATE NAMED COLLECTION my_kafka_cluster AS
kafka_broker_list = 'localhost:9092',
kafka_topic_list = 'kafka_topic',
kafka_group_name = 'consumer_group',
kafka_format = 'JSONEachRow',
kafka_max_block_size = '1048576';

XML 示例

<clickhouse>
    <named_collections>
        <my_kafka_cluster>
            <kafka_broker_list>localhost:9092</kafka_broker_list>
            <kafka_topic_list>kafka_topic</kafka_topic_list>
            <kafka_group_name>consumer_group</kafka_group_name>
            <kafka_format>JSONEachRow</kafka_format>
            <kafka_max_block_size>1048576</kafka_max_block_size>
        </my_kafka_cluster>
    </named_collections>
</clickhouse>

使用命名集合和 Kafka 表的示例

以下两个示例都使用相同的命名集合 my_kafka_cluster

CREATE TABLE queue
(
    timestamp UInt64,
    level String,
    message String
)
ENGINE = Kafka(my_kafka_cluster)

CREATE TABLE queue
(
    timestamp UInt64,
    level String,
    message String
)
ENGINE = Kafka(my_kafka_cluster)
SETTINGS kafka_num_consumers = 4,
         kafka_thread_per_consumer = 1;

用于备份的命名集合

有关参数的描述，请参见备份和恢复。

DDL 示例

BACKUP TABLE default.test to S3(named_collection_s3_backups, 'directory')

XML 示例

<clickhouse>
    <named_collections>
        <named_collection_s3_backups>
            <url>https://my-s3-bucket.s3.amazonaws.com/backup-S3/</url>
            <access_key_id>ABC123</access_key_id>
            <secret_access_key>Abc+123</secret_access_key>
        </named_collection_s3_backups>
    </named_collections>
</clickhouse>

在系统数据库中存储命名集合​

DDL 示例​

使用 DDL 创建命名集合的权限​

命名集合的存储​

在配置文件中存储命名集合​

XML 示例​

修改命名集合​

修改 DDL 命名集合​

删除 DDL 命名集合 collection2:​

用于访问 S3 的命名集合​

DDL 示例​

XML 示例​

s3() 函数和 S3 表命名集合示例​

s3() 函数​

S3 表​

用于访问 MySQL 数据库的命名集合​

DDL 示例​

XML 示例​

mysql() 函数、MySQL 表、MySQL 数据库和字典命名集合示例​

mysql() 函数​

MySQL 表​

MySQL 数据库​

MySQL 字典​

用于访问 PostgreSQL 数据库的命名集合​

使用命名集合和 postgresql 函数的示例​

使用命名集合和引擎为 PostgreSQL 的数据库的示例​

使用命名集合和引擎为 PostgreSQL 的数据库的示例​

使用命名集合和源为 POSTGRESQL 的字典的示例​

用于访问远程 ClickHouse 数据库的命名集合​

使用命名集合和 remote/remoteSecure 函数的示例​

使用命名集合和源为 ClickHouse 的字典的示例​

用于访问 Kafka 的命名集合​

DDL 示例​

XML 示例​

使用命名集合和 Kafka 表的示例​

用于备份的命名集合​

DDL 示例​

XML 示例​

在系统数据库中存储命名集合

DDL 示例

使用 DDL 创建命名集合的权限

命名集合的存储

在配置文件中存储命名集合

XML 示例

修改命名集合

修改 DDL 命名集合

删除 DDL 命名集合 `collection2`:

用于访问 S3 的命名集合

DDL 示例

XML 示例

s3() 函数和 S3 表命名集合示例

s3() 函数

S3 表

用于访问 MySQL 数据库的命名集合

DDL 示例

XML 示例

mysql() 函数、MySQL 表、MySQL 数据库和字典命名集合示例

mysql() 函数

MySQL 表

MySQL 数据库

MySQL 字典

用于访问 PostgreSQL 数据库的命名集合

使用命名集合和 postgresql 函数的示例

使用命名集合和引擎为 PostgreSQL 的数据库的示例

使用命名集合和引擎为 PostgreSQL 的数据库的示例

使用命名集合和源为 POSTGRESQL 的字典的示例

用于访问远程 ClickHouse 数据库的命名集合

使用命名集合和 `remote`/`remoteSecure` 函数的示例

使用命名集合和源为 ClickHouse 的字典的示例

用于访问 Kafka 的命名集合

DDL 示例

XML 示例

使用命名集合和 Kafka 表的示例

用于备份的命名集合

DDL 示例

XML 示例