Power BI
Power BI 可以使用 ODBC 驱动程序 或 ClickHouse 原生连接器 加载来自 ClickHouse Cloud 或本地部署的数据。这两种方法都支持加载模式,但后者还支持直接查询模式,从而无需加载整个表。
本教程将指导您完成使用这两种方法之一加载数据的过程。
ClickHouse 原生连接器
1. 收集您的连接详细信息
要使用 HTTP(S) 连接到 ClickHouse,您需要以下信息
主机和端口:通常,使用 TLS 时端口为 8443,不使用 TLS 时端口为 8123。
数据库名称:默认情况下,有一个名为
default
的数据库,请使用要连接到的数据库的名称。用户名和密码:默认情况下,用户名为
default
。请使用适合您用例的用户名。
您的 ClickHouse Cloud 服务的详细信息可在 ClickHouse Cloud 控制台中找到。选择您要连接的服务,然后单击**连接**。
选择**HTTPS**,详细信息可在 curl
命令示例中找到。
如果您使用的是自管理的 ClickHouse,则连接详细信息由您的 ClickHouse 管理员设置。
2. 安装 ClickHouse ODBC 客户端
从 此处下载最新的 ClickHouse ODBC 版本。执行提供的 .msi
安装程序并按照向导操作。“调试符号”是可选的,因此您可以保留所有默认设置。
驱动程序安装完成后,您可以验证安装是否成功:在“开始”菜单中搜索 ODBC,然后选择“ODBC 数据源**(64 位)**”。
确保列出了 ClickHouse 驱动程序。
如果您尚未安装 Power BI,请 下载并安装 Power BI Desktop。
3. 安装 ClickHouse 原生连接器
- 为自定义连接器创建以下目录“[文档]\Power BI Desktop\Custom Connectors”目录。
- 从 发行版部分下载原生连接器的最新版本(.mez 文件),并将其放置在您在上一步中创建的目录中。
- 打开 Power BI 并启用未签名连接器的加载:文件 -> 选项和设置 -> 选项 -> 安全 -> 数据扩展 -> 允许任何扩展加载,无需警告或验证。
- 重新启动 Power BI。
4. 将数据导入 Power BI
在 Power BI Desktop 开始屏幕上,单击“获取数据”。
搜索“ClickHouseConnector (Beta)”
选择连接器,然后填写以下框
- 服务器(必填字段) - 您的实例域名/地址。确保添加它时没有前缀/后缀。
- 端口(必填字段) - 您的实例端口。
- 数据库 - 您的数据库名称。
- 选项 - ClickHouse ODBC GitHub 页面中列出的任何 ODBC 选项
- 数据连接模式 - 选择直接查询以直接查询 ClickHouse。如果您负载较小,可以选择导入模式,所有数据都将加载到 Power BI 中。
- 指定用户名和密码
最后,您应该在导航器视图中看到数据库和表。选择所需的表,然后单击“加载”以从 ClickHouse 导入数据。
导入完成后,您的 ClickHouse 数据应该像往常一样在 Power BI 中可用。
Power BI 服务
对于云使用,请参阅 Microsoft 关于如何 将自定义数据连接器与本地数据网关一起使用 的文档。
ODBC 驱动程序
按照上面原生连接器部分的步骤 1 和 2 操作。
3. 创建新的用户 DSN
驱动程序安装完成后,可以创建 ODBC 数据源。在“开始”菜单中搜索 ODBC,然后选择“ODBC 数据源(64 位)”。
我们需要在此处添加一个新的用户 DSN。单击左侧的“添加”按钮。
选择 ODBC 驱动程序的 Unicode 版本。
填写连接详细信息。“主机”字段不应包含协议(即省略 http:// 或 https:// 部分)。如果您使用的是 ClickHouse Cloud 或您的本地部署启用了 SSL,请在“SSLMode”字段中键入 require。“超时”字段值以秒为单位设置,如果省略,则默认值为 30 秒。
4. 将数据导入 Power BI
如果您尚未安装 Power BI,请 下载并安装 Power BI Desktop。
在 Power BI Desktop 开始屏幕上,单击“获取数据”。
选择“其他” -> “ODBC”。
从列表中选择您之前创建的数据源。
如果您在数据源创建期间指定了所有凭据,则它应该立即连接。否则,系统将提示您指定用户名和密码。
最后,您应该在导航器视图中看到数据库和表。选择所需的表,然后单击“加载”以从 ClickHouse 导入数据。
导入完成后,您的 ClickHouse 数据应该像往常一样在 Power BI 中可用。
无符号整数类型(如 UInt64 或更大)不会自动加载到数据集中,因为 Int64 是 Power BI 支持的最大整数类型。
要正确导入数据,在点击导航器中的“加载”按钮之前,请先点击“转换数据”。
在此示例中,pageviews
表有一个 UInt64 列,默认情况下将其识别为“二进制”。“转换数据”打开 Power Query 编辑器,我们可以在其中重新分配列的类型,例如将其设置为文本。
完成后,单击左上角的“关闭并应用”,然后继续加载数据。