MySQL 表引擎
MySQL 引擎允许您对存储在远程 MySQL 服务器上的数据执行 SELECT
和 INSERT
查询。
创建表
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
...
) ENGINE = MySQL({host:port, database, table, user, password[, replace_query, on_duplicate_clause] | named_collection[, option=value [,..]]})
SETTINGS
[ connection_pool_size=16, ]
[ connection_max_tries=3, ]
[ connection_wait_timeout=5, ]
[ connection_auto_close=true, ]
[ connect_timeout=10, ]
[ read_write_timeout=300 ]
;
查看 CREATE TABLE 查询的详细描述。
表结构可能与原始 MySQL 表结构不同
- 列名应与原始 MySQL 表中的列名相同,但您可以使用其中的一部分列,并且可以按任何顺序使用。
- 列类型可能与原始 MySQL 表中的类型不同。ClickHouse 会尝试将值转换为 ClickHouse 数据类型。
- external_table_functions_use_nulls 设置定义了如何处理可空列。默认值:1。如果为 0,则表函数不会创建可空列,而是插入默认值而不是空值。这也适用于数组内部的 NULL 值。
注意
MySQL 表引擎目前在 ClickHouse 的 macOS 构建版本中不可用(问题)。
引擎参数
host:port
— MySQL 服务器地址。database
— 远程数据库名称。table
— 远程表名称。user
— MySQL 用户。password
— 用户密码。replace_query
— 将INSERT INTO
查询转换为REPLACE INTO
的标志。如果replace_query=1
,则查询会被替换。on_duplicate_clause
— 添加到INSERT
查询中的ON DUPLICATE KEY on_duplicate_clause
表达式。示例:INSERT INTO t (c1,c2) VALUES ('a', 2) ON DUPLICATE KEY UPDATE c2 = c2 + 1
,其中on_duplicate_clause
是UPDATE c2 = c2 + 1
。查看 MySQL 文档,了解哪些on_duplicate_clause
可以与ON DUPLICATE KEY
子句一起使用。要指定on_duplicate_clause
,您需要将0
传递给replace_query
参数。如果同时传递replace_query = 1
和on_duplicate_clause
,ClickHouse 会生成异常。
也可以使用命名集合传递参数。在这种情况下,host
和 port
应该分别指定。建议在生产环境中使用此方法。
简单的 WHERE
子句(例如 =, !=, >, >=, <, <=
)在 MySQL 服务器上执行。
其余条件和 LIMIT
抽样约束仅在对 MySQL 的查询完成后在 ClickHouse 中执行。
支持多个副本,它们必须由 |
列出。例如
CREATE TABLE test_replicas (id UInt32, name String, age UInt32, money UInt32) ENGINE = MySQL(`mysql{2|3|4}:3306`, 'clickhouse', 'test_replicas', 'root', 'clickhouse');
使用示例
在 MySQL 中创建表
mysql> CREATE TABLE `test`.`test` (
-> `int_id` INT NOT NULL AUTO_INCREMENT,
-> `int_nullable` INT NULL DEFAULT NULL,
-> `float` FLOAT NOT NULL,
-> `float_nullable` FLOAT NULL DEFAULT NULL,
-> PRIMARY KEY (`int_id`));
Query OK, 0 rows affected (0,09 sec)
mysql> insert into test (`int_id`, `float`) VALUES (1,2);
Query OK, 1 row affected (0,00 sec)
mysql> select * from test;
+------+----------+-----+----------+
| int_id | int_nullable | float | float_nullable |
+------+----------+-----+----------+
| 1 | NULL | 2 | NULL |
+------+----------+-----+----------+
1 row in set (0,00 sec)
使用普通参数在 ClickHouse 中创建表
CREATE TABLE mysql_table
(
`float_nullable` Nullable(Float32),
`int_id` Int32
)
ENGINE = MySQL('localhost:3306', 'test', 'test', 'bayonet', '123')
或使用命名集合
CREATE NAMED COLLECTION creds AS
host = 'localhost',
port = 3306,
database = 'test',
user = 'bayonet',
password = '123';
CREATE TABLE mysql_table
(
`float_nullable` Nullable(Float32),
`int_id` Int32
)
ENGINE = MySQL(creds, table='test')
从 MySQL 表中检索数据
SELECT * FROM mysql_table
┌─float_nullable─┬─int_id─┐
│ ᴺᵁᴸᴸ │ 1 │
└────────────────┴────────┘
设置
默认设置效率不高,因为它们甚至不会重用连接。这些设置可以让您增加服务器每秒运行的查询数量。
connection_auto_close
允许在查询执行后自动关闭连接,即禁用连接重用。
可能的值
- 1 — 允许自动关闭连接,因此禁用连接重用
- 0 — 不允许自动关闭连接,因此启用连接重用
默认值:1
。
connection_max_tries
设置带故障转移的池的重试次数。
可能的值
- 正整数。
- 0 — 带故障转移的池没有重试。
默认值:3
。
connection_pool_size
连接池的大小(如果所有连接都在使用中,则查询将等待直到释放一些连接)。
可能的值
- 正整数。
默认值:16
。
connection_wait_timeout
等待空闲连接的超时时间(以秒为单位)(如果已有 connection_pool_size 个活动连接),0 - 不等待。
可能的值
- 正整数。
默认值:5
。
connect_timeout
连接超时时间(以秒为单位)。
可能的值
- 正整数。
默认值:10
。
read_write_timeout
读/写超时时间(以秒为单位)。
可能的值
- 正整数。
默认值:300
。