mysql
允许对存储在远程 MySQL 服务器上的数据执行 SELECT
和 INSERT
查询。
语法
mysql({host:port, database, table, user, password[, replace_query, on_duplicate_clause] | named_collection[, option=value [,..]]})
参数
host:port
— MySQL 服务器地址。database
— 远程数据库名称。table
— 远程表名称。user
— MySQL 用户。password
— 用户密码。replace_query
— 将INSERT INTO
查询转换为REPLACE INTO
的标志。可能的取值0
- 查询将作为INSERT INTO
执行。1
- 查询将作为REPLACE INTO
执行。
on_duplicate_clause
— 添加到INSERT
查询的ON DUPLICATE KEY on_duplicate_clause
表达式。只能与replace_query = 0
一起指定(如果您同时传递replace_query = 1
和on_duplicate_clause
,ClickHouse 会生成异常)。例如:INSERT INTO t (c1,c2) VALUES ('a', 2) ON DUPLICATE KEY UPDATE c2 = c2 + 1;
这里的on_duplicate_clause
是UPDATE c2 = c2 + 1
。请参阅 MySQL 文档以查找可以使用ON DUPLICATE KEY
子句使用的on_duplicate_clause
。
参数也可以使用 命名集合 传递。在这种情况下,host
和 port
应分别指定。建议在生产环境中使用此方法。
目前,诸如 =, !=, >, >=, <, <=
之类的简单 WHERE
子句在 MySQL 服务器上执行。
其余条件和 LIMIT
抽样约束仅在对 MySQL 的查询完成后在 ClickHouse 中执行。
支持多个副本,必须通过 |
列出。例如
SELECT name FROM mysql(`mysql{1|2|3}:3306`, 'mysql_database', 'mysql_table', 'user', 'password');
或
SELECT name FROM mysql(`mysql1:3306|mysql2:3306|mysql3:3306`, 'mysql_database', 'mysql_table', 'user', 'password');
返回值
一个与原始 MySQL 表具有相同列的表对象。
注意
在 INSERT
查询中,为了区分表函数 mysql(...)
和带有列名列表的表名,您必须使用关键字 FUNCTION
或 TABLE FUNCTION
。请参阅下面的示例。
示例
MySQL 中的表
mysql> CREATE TABLE `test`.`test` (
-> `int_id` INT NOT NULL AUTO_INCREMENT,
-> `float` FLOAT NOT NULL,
-> PRIMARY KEY (`int_id`));
mysql> INSERT INTO test (`int_id`, `float`) VALUES (1,2);
mysql> SELECT * FROM test;
+--------+-------+
| int_id | float |
+--------+-------+
| 1 | 2 |
+--------+-------+
从 ClickHouse 中选择数据
SELECT * FROM mysql('localhost:3306', 'test', 'test', 'bayonet', '123');
或使用 命名集合
CREATE NAMED COLLECTION creds AS
host = 'localhost',
port = 3306,
database = 'test',
user = 'bayonet',
password = '123';
SELECT * FROM mysql(creds, table='test');
┌─int_id─┬─float─┐
│ 1 │ 2 │
└────────┴───────┘
替换和插入
INSERT INTO FUNCTION mysql('localhost:3306', 'test', 'test', 'bayonet', '123', 1) (int_id, float) VALUES (1, 3);
INSERT INTO TABLE FUNCTION mysql('localhost:3306', 'test', 'test', 'bayonet', '123', 0, 'UPDATE int_id = int_id + 1') (int_id, float) VALUES (1, 4);
SELECT * FROM mysql('localhost:3306', 'test', 'test', 'bayonet', '123');
┌─int_id─┬─float─┐
│ 1 │ 3 │
│ 2 │ 4 │
└────────┴───────┘
将数据从 MySQL 表复制到 ClickHouse 表
CREATE TABLE mysql_copy
(
`id` UInt64,
`datetime` DateTime('UTC'),
`description` String,
)
ENGINE = MergeTree
ORDER BY (id,datetime);
INSERT INTO mysql_copy
SELECT * FROM mysql('host:port', 'database', 'table', 'user', 'password');
或者,如果仅根据当前最大 ID 从 MySQL 复制增量批次
INSERT INTO mysql_copy
SELECT * FROM mysql('host:port', 'database', 'table', 'user', 'password')
WHERE id > (SELECT max(id) from mysql_copy);
另请参阅