格式设置
这些设置是从 源代码 自动生成的。
bool_false_representation
类型: 字符串
默认值: false
在 TSV/CSV/Vertical/Pretty 格式中表示 false 布尔值的文本。
bool_true_representation
类型: 字符串
默认值: true
在 TSV/CSV/Vertical/Pretty 格式中表示 true 布尔值的文本。
column_names_for_schema_inference
类型: 字符串
默认值
在没有列名的格式的模式推断中使用的列名列表。格式:'column1,column2,column3,...'
cross_to_inner_join_rewrite
类型: 无符号64位整数
默认值: 1
如果在 WHERE 部分存在连接表达式,则使用 inner join 而不是逗号/交叉连接。值:0 - 不重写,1 - 如果逗号/交叉连接可能,则应用,2 - 强制重写所有逗号连接,交叉 - 如果可能
date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands
类型: 布尔值
默认值: 0
动态修剪 datetime64 值的尾随零,以将输出刻度调整为 [0, 3, 6],分别对应于“秒”、“毫秒”和“微秒”
date_time_input_format
类型: 日期时间输入格式
默认值: basic
允许选择日期和时间文本表示形式的解析器。
此设置不适用于 日期和时间函数。
可能的值
-
'best_effort'
— 启用扩展解析。ClickHouse 可以解析基本的
YYYY-MM-DD HH:MM:SS
格式和所有 ISO 8601 日期和时间格式。例如,'2018-06-08T01:02:03.000Z'
。 -
'basic'
— 使用基本解析器。ClickHouse 只能解析基本的
YYYY-MM-DD HH:MM:SS
或YYYY-MM-DD
格式。例如,2019-08-20 10:18:56
或2019-08-20
。
云默认值:'best_effort'
。
另请参阅
date_time_output_format
类型: 日期时间输出格式
默认值: simple
允许选择日期和时间文本表示形式的不同输出格式。
可能的值
-
simple
- 简单输出格式。ClickHouse 输出日期和时间
YYYY-MM-DD hh:mm:ss
格式。例如,2019-08-20 10:18:56
。计算根据数据类型的时区(如果存在)或服务器时区执行。 -
iso
- ISO 输出格式。ClickHouse 以 ISO 8601
YYYY-MM-DDThh:mm:ssZ
格式输出日期和时间。例如,2019-08-20T10:18:56Z
。请注意,输出为 UTC(Z
表示 UTC)。 -
unix_timestamp
- Unix 时间戳输出格式。ClickHouse 以 Unix 时间戳 格式输出日期和时间。例如
1566285536
。
另请参阅
date_time_overflow_behavior
类型: 日期时间溢出行为
默认值: ignore
定义当 Date, Date32, DateTime, DateTime64 或整数转换为 Date、Date32、DateTime 或 DateTime64 但值无法在结果类型中表示时的行为。
可能的值
ignore
— 静默忽略溢出。结果未定义。throw
— 在发生溢出时抛出异常。saturate
— 饱和结果。如果该值小于目标类型可以表示的最小值,则结果将选择为最小的可表示值。如果该值大于目标类型可以表示的最大值,则结果将选择为最大的可表示值。
默认值:ignore
。
dictionary_use_async_executor
类型: 布尔值
默认值: 0
在多个线程中执行用于读取字典源的管道。仅支持具有本地 CLICKHOUSE 源的字典。
errors_output_format
类型: 字符串
默认值: CSV
将错误写入文本输出的方法。
exact_rows_before_limit
类型: 布尔值
默认值: 0
启用后,ClickHouse 将为 rows_before_limit_at_least 统计信息提供确切的值,但代价是必须完全读取 limit 之前的数据
format_avro_schema_registry_url
类型: URI
默认值
对于 AvroConfluent 格式:Confluent Schema Registry URL。
format_binary_max_array_size
类型: 无符号64位整数
默认值: 1073741824
RowBinary 格式中 Array 允许的最大大小。它可以防止在数据损坏的情况下分配大量内存。0 表示没有限制
format_binary_max_string_size
类型: 无符号64位整数
默认值: 1073741824
RowBinary 格式中 String 允许的最大大小。它可以防止在数据损坏的情况下分配大量内存。0 表示没有限制
format_capn_proto_enum_comparising_mode
类型: CapnProto枚举比较模式
默认值: by_values
如何映射 ClickHouse Enum 和 CapnProto Enum
format_capn_proto_use_autogenerated_schema
类型: 布尔值
默认值: 1
当未设置 format_schema 时,使用自动生成的 CapnProto 模式
format_csv_allow_double_quotes
类型: 布尔值
默认值: 1
如果设置为 true,则允许字符串使用双引号。
format_csv_allow_single_quotes
类型: 布尔值
默认值: 0
如果设置为 true,则允许字符串使用单引号。
format_csv_delimiter
类型: 字符
默认值: ,
在 CSV 数据中被视为分隔符的字符。如果使用字符串进行设置,则字符串的长度必须为 1。
format_csv_null_representation
类型: 字符串
默认值: \N
CSV 格式中的自定义 NULL 表示形式
format_custom_escaping_rule
类型: 转义规则
默认值: Escaped
字段转义规则(用于 CustomSeparated 格式)
format_custom_field_delimiter
类型: 字符串
默认值
字段之间的分隔符(用于 CustomSeparated 格式)
format_custom_result_after_delimiter
类型: 字符串
默认值
结果集之后的后缀(用于 CustomSeparated 格式)
format_custom_result_before_delimiter
类型: 字符串
默认值
结果集之前的前缀(用于 CustomSeparated 格式)
format_custom_row_after_delimiter
类型: 字符串
默认值
最后一列字段之后的分隔符(用于 CustomSeparated 格式)
format_custom_row_before_delimiter
类型: 字符串
默认值
第一列字段之前的分隔符(用于 CustomSeparated 格式)
format_custom_row_between_delimiter
类型: 字符串
默认值
行之间的分隔符(用于 CustomSeparated 格式)
format_display_secrets_in_show_and_select
类型: 布尔值
默认值: 0
启用或禁用在 SHOW
和 SELECT
查询中显示表、数据库、表函数和字典的密钥。
希望查看密钥的用户还必须启用 display_secrets_in_show_and_select
服务器设置,并具有 displaySecretsInShowAndSelect
权限。
可能的值
- 0 — 禁用。
- 1 — 启用。
format_json_object_each_row_column_for_object_name
类型: 字符串
默认值
将用于在 JSONObjectEachRow 格式中存储/写入对象名称的列的名称。列类型应为 String。如果值为空,则默认名称 row_{i}
将用于对象名称。
input_format_json_compact_allow_variable_number_of_columns
允许 JSONCompact/JSONCompactEachRow 输入格式的行中存在可变数量的列。忽略行中多余的列(如果行具有比预期更多的列),并将缺少的列视为默认值。
默认禁用。
output_format_markdown_escape_special_characters
启用后,转义 Markdown 中的特殊字符。
Common Mark 定义了以下可以被转义的特殊字符:
! " # $ % & ' ( ) * + , - . / : ; < = > ? @ [ \ ] ^ _ ` { | } ~
可能的值
- 0 — 禁用。
- 1 — 启用。
input_format_json_empty_as_default
启用后,将 JSON 中的空输入字段替换为默认值。对于复杂的默认表达式,也必须启用 input_format_defaults_for_omitted_fields
。
可能的值
- 0 — 禁用。
- 1 — 启用。
format_protobuf_use_autogenerated_schema
类型: 布尔值
默认值: 1
当未设置 format_schema 时,使用自动生成的 Protobuf
format_regexp
类型: 字符串
默认值
正则表达式(用于 Regexp 格式)
format_regexp_escaping_rule
类型: 转义规则
默认值: Raw
字段转义规则(用于 Regexp 格式)
format_regexp_skip_unmatched
类型: 布尔值
默认值: 0
跳过正则表达式不匹配的行(用于 Regexp 格式)
format_schema
类型: 字符串
默认值
当您使用需要模式定义的格式(例如 Cap’n Proto 或 Protobuf)时,此参数非常有用。该值取决于格式。
format_template_resultset
类型: 字符串
默认值
包含结果集格式字符串的文件路径(用于 Template 格式)
format_template_resultset_format
类型: 字符串
默认值
结果集的格式字符串(用于 Template 格式)
format_template_row
类型: 字符串
默认值
包含行格式字符串的文件路径(用于 Template 格式)
format_template_row_format
类型: 字符串
默认值
行的格式字符串(用于 Template 格式)
format_template_rows_between_delimiter
类型: 字符串
默认值
行之间的分隔符(用于 Template 格式)
format_tsv_null_representation
类型: 字符串
默认值: \N
TSV 格式中的自定义 NULL 表示形式
input_format_allow_errors_num
类型: 无符号64位整数
默认值: 0
设置从文本格式(CSV、TSV 等)读取时可接受的最大错误数。
默认值为 0。
始终将其与 input_format_allow_errors_ratio
配对使用。
如果在读取行时发生错误,但错误计数器仍小于 input_format_allow_errors_num
,则 ClickHouse 会忽略该行并继续处理下一行。
如果 input_format_allow_errors_num
和 input_format_allow_errors_ratio
都超出,ClickHouse 将抛出异常。
input_format_allow_errors_ratio
类型: 浮点数
默认值: 0
设置从文本格式(CSV、TSV 等)读取时允许的最大错误百分比。错误百分比设置为 0 到 1 之间的浮点数。
默认值为 0。
始终将其与 input_format_allow_errors_num
配对使用。
如果在读取行时发生错误,但错误计数器仍小于 input_format_allow_errors_ratio
,则 ClickHouse 会忽略该行并继续处理下一行。
如果 input_format_allow_errors_num
和 input_format_allow_errors_ratio
都超出,ClickHouse 将抛出异常。
input_format_allow_seeks
类型: 布尔值
默认值: 1
允许在 ORC/Parquet/Arrow 输入格式中读取时进行查找。
默认启用。
input_format_arrow_allow_missing_columns
类型: 布尔值
默认值: 1
允许在读取 Arrow 输入格式时缺少列
input_format_arrow_case_insensitive_column_matching
类型: 布尔值
默认值: 0
将 Arrow 列与 CH 列匹配时忽略大小写。
input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference
类型: 布尔值
默认值: 0
在格式 Arrow 的模式推断中跳过具有不支持类型的列
input_format_avro_allow_missing_fields
类型: 布尔值
默认值: 0
对于 Avro/AvroConfluent 格式:当在模式中找不到字段时,使用默认值而不是错误
input_format_avro_null_as_default
类型: 布尔值
默认值: 0
对于 Avro/AvroConfluent 格式:在 null 和非 Nullable 列的情况下插入默认值
input_format_binary_decode_types_in_binary_format
类型: 布尔值
默认值: 0
在 RowBinaryWithNamesAndTypes 输入格式中以二进制格式读取数据类型,而不是类型名称
input_format_binary_read_json_as_string
类型: 布尔值
默认值: 0
在 RowBinary 输入格式中将 JSON 数据类型 的值读取为 JSON String 值。
input_format_bson_skip_fields_with_unsupported_types_in_schema_inference
类型: 布尔值
默认值: 0
在格式 BSON 的模式推断中跳过具有不支持类型的字段。
input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference
类型: 布尔值
默认值: 0
在格式 CapnProto 的模式推断中跳过具有不支持类型的列
input_format_csv_allow_cr_end_of_line
类型: 布尔值
默认值: 0
如果设置为 true,则允许在行尾出现 \r,但不后跟 \n
input_format_csv_allow_variable_number_of_columns
类型: 布尔值
默认值: 0
忽略 CSV 输入中多余的列(如果文件具有比预期更多的列)并将 CSV 输入中缺少的字段视为默认值
input_format_csv_allow_whitespace_or_tab_as_delimiter
类型: 布尔值
默认值: 0
允许在 CSV 字符串中使用空格和制表符(\t)作为字段分隔符
input_format_csv_arrays_as_nested_csv
类型: 布尔值
默认值: 0
从 CSV 读取 Array 时,期望其元素已在嵌套 CSV 中序列化,然后放入字符串中。示例:'[""Hello"", ""world"", ""42"""" TV""]'。数组周围的大括号可以省略。
input_format_csv_deserialize_separate_columns_into_tuple
类型: 布尔值
默认值: 1
如果设置为 true,则可以将在 CSV 格式中写入的单独列反序列化为 Tuple 列。
input_format_csv_detect_header
类型: 布尔值
默认值: 1
自动检测 CSV 格式中带有名称和类型的标头
input_format_csv_empty_as_default
类型: 布尔值
默认值: 1
将 CSV 输入中的空字段视为默认值。
input_format_csv_enum_as_number
类型: 布尔值
默认值: 0
将 CSV 格式中插入的枚举值视为枚举索引
input_format_csv_skip_first_lines
类型: 无符号64位整数
默认值: 0
跳过 CSV 格式数据开头指定的行数
input_format_csv_skip_trailing_empty_lines
类型: 布尔值
默认值: 0
跳过 CSV 格式中的尾随空行
input_format_csv_trim_whitespaces
类型: 布尔值
默认值: 1
修剪 CSV 字符串开头和结尾的空格和制表符 (\t) 字符
input_format_csv_try_infer_numbers_from_strings
类型: 布尔值
默认值: 0
如果启用,在模式推断期间,ClickHouse 将尝试从字符串字段推断数字。如果 CSV 数据包含带引号的 UInt64 数字,则此功能很有用。
默认禁用。
input_format_csv_try_infer_strings_from_quoted_tuples
类型: 布尔值
默认值: 1
将输入数据中带引号的元组解释为 String 类型的值。
input_format_csv_use_best_effort_in_schema_inference
类型: 布尔值
默认值: 1
使用一些调整和启发式方法来推断 CSV 格式中的模式
input_format_csv_use_default_on_bad_values
类型: 布尔值
默认值: 0
允许在 CSV 字段反序列化失败时为列设置默认值,以处理错误值
input_format_custom_allow_variable_number_of_columns
类型: 布尔值
默认值: 0
忽略 CustomSeparated 输入中多余的列(如果文件列数超出预期),并将 CustomSeparated 输入中缺失的字段视为默认值
input_format_custom_detect_header
类型: 布尔值
默认值: 1
自动检测 CustomSeparated 格式中带有名称和类型的标头
input_format_custom_skip_trailing_empty_lines
类型: 布尔值
默认值: 0
跳过 CustomSeparated 格式中末尾的空行
input_format_defaults_for_omitted_fields
类型: 布尔值
默认值: 1
当执行 INSERT
查询时,将省略的输入列值替换为相应列的默认值。此选项适用于 JSONEachRow(以及其他 JSON 格式)、CSV、TabSeparated、TSKV、Parquet、Arrow、Avro、ORC、Native 格式以及带有 WithNames
/WithNamesAndTypes
后缀的格式。
启用此选项后,扩展的表元数据将从服务器发送到客户端。这会消耗服务器上额外的计算资源,并可能降低性能。
可能的值
- 0 — 禁用。
- 1 — 启用。
input_format_force_null_for_omitted_fields
类型: 布尔值
默认值: 0
强制使用 null 值初始化省略的字段
input_format_hive_text_allow_variable_number_of_columns
类型: 布尔值
默认值: 1
忽略 Hive Text 输入中多余的列(如果文件列数超出预期),并将 Hive Text 输入中缺失的字段视为默认值
input_format_hive_text_collection_items_delimiter
类型: 字符
默认值:
Hive Text 文件中集合(数组或映射)项之间的分隔符
input_format_hive_text_fields_delimiter
类型: 字符
默认值:
Hive Text 文件中字段之间的分隔符
input_format_hive_text_map_keys_delimiter
类型: 字符
默认值:
Hive Text 文件中映射键/值对之间的分隔符
input_format_import_nested_json
类型: 布尔值
默认值: 0
启用或禁用插入带有嵌套对象的 JSON 数据。
支持的格式
可能的值
- 0 — 禁用。
- 1 — 启用。
另请参阅
- 嵌套结构的使用 与
JSONEachRow
格式。
input_format_ipv4_default_on_conversion_error
类型: 布尔值
默认值: 0
IPv4 的反序列化将使用默认值,而不是在转换错误时抛出异常。
默认禁用。
input_format_ipv6_default_on_conversion_error
类型: 布尔值
默认值: 0
IPV6 的反序列化将使用默认值,而不是在转换错误时抛出异常。
默认禁用。
input_format_json_compact_allow_variable_number_of_columns
类型: 布尔值
默认值: 0
忽略 JSONCompact(EachRow) 输入中多余的列(如果文件列数超出预期),并将 JSONCompact(EachRow) 输入中缺失的字段视为默认值
input_format_json_defaults_for_missing_elements_in_named_tuple
类型: 布尔值
默认值: 1
解析命名元组时,为 JSON 对象中缺失的元素插入默认值。此设置仅在启用 input_format_json_named_tuples_as_objects
设置时有效。
默认启用。
input_format_json_empty_as_default
类型: 布尔值
默认值: 0
将 JSON 输入中的空字段视为默认值。
input_format_json_ignore_unknown_keys_in_named_tuple
类型: 布尔值
默认值: 1
忽略命名元组的 JSON 对象中未知的键。
默认启用。
input_format_json_ignore_unnecessary_fields
类型: 布尔值
默认值: 1
忽略不必要的字段,并且不解析它们。启用此功能可能不会对格式无效或具有重复字段的 json 字符串抛出异常
input_format_json_infer_incomplete_types_as_strings
类型: 布尔值
默认值: 1
允许对在模式推断期间的数据样本中仅包含 Null
/{}
/[]
的 JSON 键使用 String 类型。在 JSON 格式中,任何值都可以作为 String 读取,并且我们可以通过为具有未知类型的键使用 String 类型来避免在模式推断期间出现类似 Cannot determine type for column 'column_name' by first 25000 rows of data, most likely this column contains only Nulls or empty Arrays/Maps
的错误。
示例
SET input_format_json_infer_incomplete_types_as_strings = 1, input_format_json_try_infer_named_tuples_from_objects = 1;
DESCRIBE format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');
SELECT * FROM format(JSONEachRow, '{"obj" : {"a" : [1,2,3], "b" : "hello", "c" : null, "d" : {}, "e" : []}}');
结果
┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj │ Tuple(a Array(Nullable(Int64)), b Nullable(String), c Nullable(String), d Nullable(String), e Array(Nullable(String))) │ │ │ │ │ │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘
┌─obj────────────────────────────┐
│ ([1,2,3],'hello',NULL,'{}',[]) │
└────────────────────────────────┘
默认启用。
input_format_json_max_depth
类型: 无符号64位整数
默认值: 1000
JSON 中字段的最大深度。这不是一个严格的限制,不必精确应用。
input_format_json_named_tuples_as_objects
类型: 布尔值
默认值: 1
将命名元组列解析为 JSON 对象。
默认启用。
input_format_json_read_arrays_as_strings
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将 JSON 数组解析为字符串。
示例
SET input_format_json_read_arrays_as_strings = 1;
SELECT arr, toTypeName(arr), JSONExtractArrayRaw(arr)[3] from format(JSONEachRow, 'arr String', '{"arr" : [1, "Hello", [1,2,3]]}');
结果
┌─arr───────────────────┬─toTypeName(arr)─┬─arrayElement(JSONExtractArrayRaw(arr), 3)─┐
│ [1, "Hello", [1,2,3]] │ String │ [1,2,3] │
└───────────────────────┴─────────────────┴───────────────────────────────────────────┘
默认启用。
input_format_json_read_bools_as_numbers
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将布尔值解析为数字。
默认启用。
input_format_json_read_bools_as_strings
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将布尔值解析为字符串。
默认启用。
input_format_json_read_numbers_as_strings
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将数字解析为字符串。
默认启用。
input_format_json_read_objects_as_strings
类型: 布尔值
默认值: 1
允许在 JSON 输入格式中将 JSON 对象解析为字符串。
示例
SET input_format_json_read_objects_as_strings = 1;
CREATE TABLE test (id UInt64, obj String, date Date) ENGINE=Memory();
INSERT INTO test FORMAT JSONEachRow {"id" : 1, "obj" : {"a" : 1, "b" : "Hello"}, "date" : "2020-01-01"};
SELECT * FROM test;
结果
┌─id─┬─obj──────────────────────┬───────date─┐
│ 1 │ {"a" : 1, "b" : "Hello"} │ 2020-01-01 │
└────┴──────────────────────────┴────────────┘
默认启用。
input_format_json_throw_on_bad_escape_sequence
类型: 布尔值
默认值: 1
如果 JSON 字符串在 JSON 输入格式中包含错误的转义序列,则抛出异常。如果禁用,错误的转义序列将保持原样在数据中。
默认启用。
input_format_json_try_infer_named_tuples_from_objects
类型: 布尔值
默认值: 1
如果启用,在模式推断期间,ClickHouse 将尝试从 JSON 对象推断命名元组。生成的命名元组将包含来自样本数据的所有相应 JSON 对象的所有元素。
示例
SET input_format_json_try_infer_named_tuples_from_objects = 1;
DESC format(JSONEachRow, '{"obj" : {"a" : 42, "b" : "Hello"}}, {"obj" : {"a" : 43, "c" : [1, 2, 3]}}, {"obj" : {"d" : {"e" : 42}}}')
结果
┌─name─┬─type───────────────────────────────────────────────────────────────────────────────────────────────┬─default_type─┬─default_expression─┬─comment─┬─codec_expression─┬─ttl_expression─┐
│ obj │ Tuple(a Nullable(Int64), b Nullable(String), c Array(Nullable(Int64)), d Tuple(e Nullable(Int64))) │ │ │ │ │ │
└──────┴────────────────────────────────────────────────────────────────────────────────────────────────────┴──────────────┴────────────────────┴─────────┴──────────────────┴────────────────┘
默认启用。
input_format_json_try_infer_numbers_from_strings
类型: 布尔值
默认值: 0
如果启用,在模式推断期间,ClickHouse 将尝试从字符串字段推断数字。如果 JSON 数据包含带引号的 UInt64 数字,这将非常有用。
默认禁用。
input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects
类型: 布尔值
默认值: 0
在命名元组从对象推断期间,如果 JSON 对象中存在歧义路径,则使用 String 类型而不是异常
input_format_json_validate_types_from_metadata
类型: 布尔值
默认值: 1
对于 JSON/JSONCompact/JSONColumnsWithMetadata 输入格式,如果此设置设置为 1,则输入数据中元数据中的类型将与表中相应列的类型进行比较。
默认启用。
input_format_max_bytes_to_read_for_schema_inference
类型: 无符号64位整数
默认值: 33554432
用于自动模式推断的最大数据字节数。
input_format_max_rows_to_read_for_schema_inference
类型: 无符号64位整数
默认值: 25000
用于自动模式推断的最大数据行数。
input_format_msgpack_number_of_columns
类型: 无符号64位整数
默认值: 0
插入的 MsgPack 数据中的列数。用于从数据自动进行模式推断。
input_format_mysql_dump_map_column_names
类型: 布尔值
默认值: 1
通过名称匹配 MySQL 转储中的表列和 ClickHouse 表中的列
input_format_mysql_dump_table_name
类型: 字符串
默认值
要从中读取数据的 MySQL 转储中的表名
input_format_native_allow_types_conversion
类型: 布尔值
默认值: 1
允许 Native 输入格式中的数据类型转换
input_format_native_decode_types_in_binary_format
类型: 布尔值
默认值: 0
在 Native 输入格式中以二进制格式读取数据类型,而不是类型名称
input_format_null_as_default
类型: 布尔值
默认值: 1
如果这些字段的数据类型不是 nullable,则启用或禁用使用 默认值 初始化 NULL 字段。如果列类型不可为空且禁用此设置,则插入 NULL
会导致异常。如果列类型可为空,则 NULL
值将按原样插入,而与此设置无关。
此设置适用于大多数输入格式。
对于复杂的默认表达式,也必须启用 input_format_defaults_for_omitted_fields
。
可能的值
- 0 — 将
NULL
插入不可为空的列会导致异常。 - 1 —
NULL
字段使用默认列值初始化。
input_format_orc_allow_missing_columns
类型: 布尔值
默认值: 1
在读取 ORC 输入格式时允许缺少列
input_format_orc_case_insensitive_column_matching
类型: 布尔值
默认值: 0
在将 ORC 列与 CH 列匹配时忽略大小写。
input_format_orc_dictionary_as_low_cardinality
类型: 布尔值
默认值: 1
在读取 ORC 文件时,将 ORC 字典编码的列视为 LowCardinality 列。
input_format_orc_filter_push_down
类型: 布尔值
默认值: 1
读取 ORC 文件时,根据 WHERE/PREWHERE 表达式、ORC 元数据中的 min/max 统计信息或布隆过滤器跳过整个条带或行组。
input_format_orc_reader_time_zone_name
类型: 字符串
默认值: GMT
ORC 行读取器的时间zone名称,默认的 ORC 行读取器的时间zone是 GMT。
input_format_orc_row_batch_size
类型: Int64
默认值: 100000
读取 ORC 条带时的批次大小。
input_format_orc_skip_columns_with_unsupported_types_in_schema_inference
类型: 布尔值
默认值: 0
在 ORC 格式的模式推断中跳过具有不支持类型的列
input_format_orc_use_fast_decoder
类型: 布尔值
默认值: 1
使用更快的 ORC 解码器实现。
input_format_parquet_allow_missing_columns
类型: 布尔值
默认值: 1
在读取 Parquet 输入格式时允许缺少列
input_format_parquet_bloom_filter_push_down
类型: 布尔值
默认值: 0
读取 Parquet 文件时,根据 WHERE 表达式和 Parquet 元数据中的布隆过滤器跳过整个行组。
input_format_parquet_case_insensitive_column_matching
类型: 布尔值
默认值: 0
在将 Parquet 列与 CH 列匹配时忽略大小写。
input_format_parquet_enable_row_group_prefetch
类型: 布尔值
默认值: 1
在 parquet 解析期间启用行组预取。目前,只有单线程解析可以预取。
input_format_parquet_filter_push_down
类型: 布尔值
默认值: 1
读取 Parquet 文件时,根据 WHERE/PREWHERE 表达式和 Parquet 元数据中的 min/max 统计信息跳过整个行组。
input_format_parquet_local_file_min_bytes_for_seek
类型: 无符号64位整数
默认值: 8192
本地读取(文件)执行查找所需的最小字节数,而不是在 Parquet 输入格式中读取并忽略
input_format_parquet_max_block_size
类型: 无符号64位整数
默认值: 65409
parquet 读取器的最大块大小。
input_format_parquet_prefer_block_bytes
类型: 无符号64位整数
默认值: 16744704
parquet 读取器输出的平均块字节数
input_format_parquet_preserve_order
类型: 布尔值
默认值: 0
避免在从 Parquet 文件读取时重新排序行。通常会使速度慢很多。
input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference
类型: 布尔值
默认值: 0
在 Parquet 格式的模式推断中跳过具有不支持类型的列
input_format_parquet_use_native_reader
类型: 布尔值
默认值: 0
读取 Parquet 文件时,使用本机读取器而不是 arrow 读取器。
input_format_protobuf_flatten_google_wrappers
类型: 布尔值
默认值: 0
为常规非嵌套列启用 Google wrappers,例如,String 列 'str' 的 google.protobuf.StringValue 'str'。对于 Nullable 列,空 wrappers 被识别为默认值,缺失的被识别为 null
input_format_protobuf_skip_fields_with_unsupported_types_in_schema_inference
类型: 布尔值
默认值: 0
在 Protobuf 格式的模式推断中跳过具有不支持类型的字段
input_format_record_errors_file_path
类型: 字符串
默认值
用于记录读取文本格式(CSV、TSV)时错误的文件的路径。
input_format_skip_unknown_fields
类型: 布尔值
默认值: 1
启用或禁用跳过插入额外数据。
写入数据时,如果输入数据包含目标表中不存在的列,ClickHouse 会抛出异常。如果启用跳过,ClickHouse 不会插入额外数据,也不会抛出异常。
支持的格式
- JSONEachRow(以及其他 JSON 格式)
- BSONEachRow(以及其他 JSON 格式)
- TSKV
- 所有带有 WithNames/WithNamesAndTypes 后缀的格式
- MySQLDump
- Native
可能的值
- 0 — 禁用。
- 1 — 启用。
input_format_try_infer_dates
类型: 布尔值
默认值: 1
如果启用,ClickHouse 将尝试在文本格式的模式推断中从字符串字段推断 Date
类型。如果输入数据中列的所有字段都成功解析为日期,则结果类型将为 Date
,如果至少一个字段未解析为日期,则结果类型将为 String
。
默认启用。
input_format_try_infer_datetimes
类型: 布尔值
默认值: 1
如果启用,ClickHouse 将尝试在文本格式的模式推断中从字符串字段推断 DateTime64
类型。如果输入数据中列的所有字段都成功解析为日期时间,则结果类型将为 DateTime64
,如果至少一个字段未解析为日期时间,则结果类型将为 String
。
默认启用。
input_format_try_infer_datetimes_only_datetime64
类型: 布尔值
默认值: 0
当启用 input_format_try_infer_datetimes 时,仅推断 DateTime64 但不推断 DateTime 类型
input_format_try_infer_exponent_floats
类型: 布尔值
默认值: 0
在文本格式(JSON 除外,其中始终推断指数数字)的模式推断中,尝试推断指数表示法中的浮点数
input_format_try_infer_integers
类型: 布尔值
默认值: 1
如果启用,ClickHouse 将尝试在文本格式的模式推断中推断整数而不是浮点数。如果输入数据中列的所有数字都是整数,则结果类型将为 Int64
,如果至少一个数字是浮点数,则结果类型将为 Float64
。
默认启用。
input_format_try_infer_variants
类型: 布尔值
默认值: 0
如果启用,当列/数组元素存在多种可能的类型时,ClickHouse 将尝试在文本格式的模式推断中推断 Variant
类型。
可能的值
- 0 — 禁用。
- 1 — 启用。
input_format_tsv_allow_variable_number_of_columns
类型: 布尔值
默认值: 0
忽略 TSV 输入中多余的列(如果文件列数超出预期),并将 TSV 输入中缺失的字段视为默认值
input_format_tsv_crlf_end_of_line
类型: 布尔值
默认值: 0
如果设置为 true,文件函数将读取 TSV 格式,其中行尾符为 \r\n 而不是 \n。
input_format_tsv_detect_header
类型: 布尔值
默认值: 1
自动检测 TSV 格式中带有名称和类型的标头
input_format_tsv_empty_as_default
类型: 布尔值
默认值: 0
将 TSV 输入中的空字段视为默认值。
input_format_tsv_enum_as_number
类型: 布尔值
默认值: 0
将 TSV 格式中插入的枚举值视为枚举索引。
input_format_tsv_skip_first_lines
类型: 无符号64位整数
默认值: 0
跳过 TSV 格式数据开头指定数量的行
input_format_tsv_skip_trailing_empty_lines
类型: 布尔值
默认值: 0
跳过 TSV 格式中末尾的空行
input_format_tsv_use_best_effort_in_schema_inference
类型: 布尔值
默认值: 1
使用一些调整和启发式方法来推断 TSV 格式的模式
input_format_values_accurate_types_of_literals
类型: 布尔值
默认值: 1
对于 Values 格式:当使用模板解析和解释表达式时,检查文字的实际类型以避免可能的溢出和精度问题。
input_format_values_deduce_templates_of_expressions
类型: 布尔值
默认值: 1
对于 Values 格式:如果字段无法通过流式解析器解析,则运行 SQL 解析器,推导出 SQL 表达式的模板,尝试使用模板解析所有行,然后解释所有行的表达式。
input_format_values_interpret_expressions
类型: 布尔值
默认值: 1
对于 Values 格式:如果字段无法通过流式解析器解析,则运行 SQL 解析器并尝试将其解释为 SQL 表达式。
input_format_with_names_use_header
类型: 布尔值
默认值: 1
启用或禁用在插入数据时检查列顺序。
为了提高插入性能,如果您确定输入数据的列顺序与目标表中的列顺序相同,我们建议禁用此检查。
支持的格式
- CSVWithNames
- CSVWithNamesAndTypes
- TabSeparatedWithNames
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNames
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNames
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNames
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNames
- CustomSeparatedWithNamesAndTypes
可能的值
- 0 — 禁用。
- 1 — 启用。
input_format_with_types_use_header
类型: 布尔值
默认值: 1
控制格式解析器是否应检查输入数据中的数据类型是否与目标表中的数据类型匹配。
支持的格式
- CSVWithNamesAndTypes
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNamesAndTypes
可能的值
- 0 — 禁用。
- 1 — 启用。
insert_distributed_one_random_shard
类型: 布尔值
默认值: 0
当没有分布式键时,启用或禁用随机分片插入到 Distributed 表中。
默认情况下,当插入到具有多个分片的 Distributed
表中时,如果不存在分布式键,ClickHouse 服务器将拒绝任何插入请求。当 insert_distributed_one_random_shard = 1
时,允许插入,并且数据在所有分片中随机转发。
可能的值
- 0 — 如果存在多个分片且未给出分布式键,则拒绝插入。
- 1 — 当未给出分布式键时,在所有可用分片中随机完成插入。
interval_output_format
类型: IntervalOutputFormat
默认值: numeric
允许选择间隔类型文本表示的不同输出格式。
可能的值
-
kusto
- KQL 样式输出格式。ClickHouse 以 KQL 格式 输出间隔。例如,
toIntervalDay(2)
将格式化为2.00:00:00
。请注意,对于长度可变的间隔类型(即IntervalMonth
和IntervalYear
),会考虑每个间隔的平均秒数。 -
numeric
- 数字输出格式。ClickHouse 将间隔输出为其底层数字表示形式。例如,
toIntervalDay(2)
将格式化为2
。
另请参阅
output_format_arrow_compression_method
类型: ArrowCompression
默认值: lz4_frame
Arrow 输出格式的压缩方法。支持的编解码器:lz4_frame、zstd、none(未压缩)
output_format_arrow_fixed_string_as_fixed_byte_array
类型: 布尔值
默认值: 1
对于 FixedString 列,使用 Arrow FIXED_SIZE_BINARY 类型而不是 Binary。
output_format_arrow_low_cardinality_as_dictionary
类型: 布尔值
默认值: 0
启用将 LowCardinality 类型作为 Dictionary Arrow 类型输出
output_format_arrow_string_as_string
类型: 布尔值
默认值: 1
对于 String 列,使用 Arrow String 类型而不是 Binary
output_format_arrow_use_64_bit_indexes_for_dictionary
类型: 布尔值
默认值: 0
始终为 Arrow 格式中的字典索引使用 64 位整数
output_format_arrow_use_signed_indexes_for_dictionary
类型: 布尔值
默认值: 1
为 Arrow 格式中的字典索引使用有符号整数
output_format_avro_codec
类型: 字符串
默认值
用于输出的压缩编解码器。可能的值:“null”、“deflate”、“snappy”、“zstd”。
output_format_avro_rows_in_file
类型: 无符号64位整数
默认值: 1
每个文件中的最大行数(如果存储允许)
output_format_avro_string_column_pattern
类型: 字符串
默认值
对于 Avro 格式:要选择为 AVRO 字符串的 String 列的正则表达式。
output_format_avro_sync_interval
类型: 无符号64位整数
默认值: 16384
同步间隔(字节)。
output_format_binary_encode_types_in_binary_format
类型: 布尔值
默认值: 0
在 RowBinaryWithNamesAndTypes 输出格式中,以二进制格式写入数据类型而不是类型名称
output_format_binary_write_json_as_string
类型: 布尔值
默认值: 0
在 RowBinary 输出格式中,将 JSON 数据类型的值作为 JSON String 值写入。
output_format_bson_string_as_string
类型: 布尔值
默认值: 0
对于 String 列,使用 BSON String 类型而不是 Binary。
output_format_csv_crlf_end_of_line
类型: 布尔值
默认值: 0
如果设置为 true,CSV 格式的行尾符将为 \r\n 而不是 \n。
output_format_csv_serialize_tuple_into_separate_columns
类型: 布尔值
默认值: 1
如果设置为 true,则 CSV 格式中的元组将序列化为单独的列(即,它们在元组中的嵌套将丢失)
output_format_decimal_trailing_zeros
类型: 布尔值
默认值: 0
打印 Decimal 值时输出尾随零。例如,1.230000 而不是 1.23。
默认禁用。
output_format_json_array_of_rows
类型: 布尔值
默认值: 0
启用在 JSONEachRow 格式中将所有行作为 JSON 数组输出的功能。
可能的值
- 1 — ClickHouse 将所有行作为数组输出,
JSONEachRow
格式中的每一行都是一个元素。 - 0 — ClickHouse 在
JSONEachRow
格式中单独输出每一行。
启用设置的查询示例
查询
SET output_format_json_array_of_rows = 1;
SELECT number FROM numbers(3) FORMAT JSONEachRow;
结果
[
{"number":"0"},
{"number":"1"},
{"number":"2"}
]
禁用设置的查询示例
查询
SET output_format_json_array_of_rows = 0;
SELECT number FROM numbers(3) FORMAT JSONEachRow;
结果
{"number":"0"}
{"number":"1"}
{"number":"2"}
output_format_json_escape_forward_slashes
类型: 布尔值
默认值: 1
控制 JSON 输出格式中字符串输出的正斜杠转义。 这旨在与 JavaScript 兼容。 不要与始终转义的反斜杠混淆。
默认启用。
output_format_json_named_tuples_as_objects
类型: 布尔值
默认值: 1
将命名元组列序列化为 JSON 对象。
默认启用。
output_format_json_pretty_print
类型: 布尔值
默认值: 1
启用后,JSON 输出格式的值将以美观格式打印。
默认启用。
output_format_json_quote_64bit_floats
类型: 布尔值
默认值: 0
控制在 JSON* 格式输出 64 位 浮点数时是否加引号。
默认禁用。
output_format_json_quote_64bit_integers
类型: 布尔值
默认值: 1
控制在 JSON 格式中输出 64 位或更大的 整数(如 UInt64
或 Int128
)时是否加引号。 默认情况下,此类整数用引号括起来。 此行为与大多数 JavaScript 实现兼容。
可能的值
- 0 — 整数输出时不带引号。
- 1 — 整数用引号括起来。
output_format_json_quote_decimals
类型: 布尔值
默认值: 0
控制 JSON 输出格式中小数是否加引号。
默认禁用。
output_format_json_quote_denormals
类型: 布尔值
默认值: 0
在 JSON 输出格式中启用 +nan
、-nan
、+inf
、-inf
输出。
可能的值
- 0 — 禁用。
- 1 — 启用。
示例
考虑以下表 account_orders
┌─id─┬─name───┬─duration─┬─period─┬─area─┐
│ 1 │ Andrew │ 20 │ 0 │ 400 │
│ 2 │ John │ 40 │ 0 │ 0 │
│ 3 │ Bob │ 15 │ 0 │ -100 │
└────┴────────┴──────────┴────────┴──────┘
当 output_format_json_quote_denormals = 0
时,查询在输出中返回 null
值
SELECT area/period FROM account_orders FORMAT JSON;
{
"meta":
[
{
"name": "divide(area, period)",
"type": "Float64"
}
],
"data":
[
{
"divide(area, period)": null
},
{
"divide(area, period)": null
},
{
"divide(area, period)": null
}
],
"rows": 3,
"statistics":
{
"elapsed": 0.003648093,
"rows_read": 3,
"bytes_read": 24
}
}
当 output_format_json_quote_denormals = 1
时,查询返回
{
"meta":
[
{
"name": "divide(area, period)",
"type": "Float64"
}
],
"data":
[
{
"divide(area, period)": "inf"
},
{
"divide(area, period)": "-nan"
},
{
"divide(area, period)": "-inf"
}
],
"rows": 3,
"statistics":
{
"elapsed": 0.000070241,
"rows_read": 3,
"bytes_read": 24
}
}
output_format_json_skip_null_value_in_named_tuples
类型: 布尔值
默认值: 0
当将命名元组列序列化为 JSON 对象时,跳过值为 null 的键值对。 仅当 output_format_json_named_tuples_as_objects 为 true 时才有效。
output_format_json_validate_utf8
类型: 布尔值
默认值: 0
控制 JSON 输出格式中 UTF-8 序列的验证,不影响格式 JSON/JSONCompact/JSONColumnsWithMetadata,它们始终验证 UTF-8。
默认禁用。
output_format_markdown_escape_special_characters
类型: 布尔值
默认值: 0
转义 Markdown 中的特殊字符
output_format_msgpack_uuid_representation
类型: MsgPackUUIDRepresentation
默认值: ext
在 MsgPack 格式中输出 UUID 的方式。
output_format_native_encode_types_in_binary_format
类型: 布尔值
默认值: 0
在 Native 输出格式中,以二进制格式写入数据类型而不是类型名称
output_format_native_write_json_as_string
类型: 布尔值
默认值: 0
将 JSON 列的数据作为包含 JSON 字符串的 String 列写入,而不是默认的 native JSON 序列化。
output_format_orc_compression_method
类型: ORCCompression
默认值: zstd
ORC 输出格式的压缩方法。 支持的编解码器:lz4、snappy、zlib、zstd、none(未压缩)
output_format_orc_dictionary_key_size_threshold
类型: Double
默认值: 0
对于 ORC 输出格式中的字符串列,如果不同值的数量大于非空行总数的这个比例,则关闭字典编码。 否则启用字典编码
output_format_orc_row_index_stride
类型: 无符号64位整数
默认值: 10000
ORC 输出格式中的目标行索引步幅
output_format_orc_string_as_string
类型: 布尔值
默认值: 1
对于 String 列,使用 ORC String 类型而不是 Binary
output_format_orc_writer_time_zone_name
类型: 字符串
默认值: GMT
ORC 写入器的时间zone 名称,默认 ORC 写入器的时间 zone 为 GMT。
output_format_parquet_batch_size
类型: 无符号64位整数
默认值: 1024
每隔这么多行检查页大小。 如果您的列的平均值大小超过几 KB,请考虑减小此值。
output_format_parquet_compliant_nested_types
类型: 布尔值
默认值: 1
在 parquet 文件 schema 中,对于列表元素,使用名称 'element' 而不是 'item'。 这是 Arrow 库实现的遗留产物。 通常会提高兼容性,但可能与某些旧版本的 Arrow 不兼容。
output_format_parquet_compression_method
类型: ParquetCompression
默认值: zstd
Parquet 输出格式的压缩方法。 支持的编解码器:snappy、lz4、brotli、zstd、gzip、none(未压缩)
output_format_parquet_data_page_size
类型: 无符号64位整数
默认值: 1048576
目标页大小(字节),压缩前。
output_format_parquet_datetime_as_uint32
类型: 布尔值
默认值: 0
将 DateTime 值作为原始 unix 时间戳(读取为 UInt32)写入,而不是转换为毫秒(读取为 DateTime64(3))。
output_format_parquet_fixed_string_as_fixed_byte_array
类型: 布尔值
默认值: 1
对于 FixedString 列,使用 Parquet FIXED_LENGTH_BYTE_ARRAY 类型而不是 Binary。
output_format_parquet_parallel_encoding
类型: 布尔值
默认值: 1
在多个线程中执行 Parquet 编码。 需要 output_format_parquet_use_custom_encoder。
output_format_parquet_row_group_size
类型: 无符号64位整数
默认值: 1000000
目标行组大小(行)。
output_format_parquet_row_group_size_bytes
类型: 无符号64位整数
默认值: 536870912
目标行组大小(字节),压缩前。
output_format_parquet_string_as_string
类型: 布尔值
默认值: 1
对于 String 列,使用 Parquet String 类型而不是 Binary。
output_format_parquet_use_custom_encoder
类型: 布尔值
默认值: 1
使用更快的 Parquet 编码器实现。
output_format_parquet_version
类型: ParquetVersion
默认值: 2.latest
Parquet 输出格式的版本。 支持的版本:1.0、2.4、2.6 和 2.latest(默认)
output_format_parquet_write_page_index
类型: 布尔值
默认值: 1
添加将页索引写入 parquet 文件的功能。
output_format_pretty_color
类型: UInt64Auto
默认值: auto
在 Pretty 格式中使用 ANSI 转义序列。 0 - 禁用,1 - 启用,'auto' - 如果是终端则启用。
output_format_pretty_display_footer_column_names
类型: 无符号64位整数
默认值: 1
如果表行很多,则在页脚中显示列名。
可能的值
- 0 — 页脚中不显示列名。
- 1 — 如果行数大于或等于 output_format_pretty_display_footer_column_names_min_rows 设置的阈值(默认为 50),则在页脚中显示列名。
示例
查询
SELECT *, toTypeName(*) FROM (SELECT * FROM system.numbers LIMIT 1000);
结果
┌─number─┬─toTypeName(number)─┐
1. │ 0 │ UInt64 │
2. │ 1 │ UInt64 │
3. │ 2 │ UInt64 │
...
999. │ 998 │ UInt64 │
1000. │ 999 │ UInt64 │
└─number─┴─toTypeName(number)─┘
output_format_pretty_display_footer_column_names_min_rows
类型: 无符号64位整数
默认值: 50
设置启用 output_format_pretty_display_footer_column_names 设置时,将显示带有列名的页脚的最小行数。
output_format_pretty_fallback_to_vertical
类型: 布尔值
默认值: 1
如果启用,且表宽但行数少,则 Pretty 格式会像 Vertical 格式一样输出它。 有关此行为的详细调整,请参阅 output_format_pretty_fallback_to_vertical_max_rows_per_chunk
和 output_format_pretty_fallback_to_vertical_min_table_width
。
output_format_pretty_fallback_to_vertical_max_rows_per_chunk
类型: 无符号64位整数
默认值: 100
只有当块中的记录数不超过指定值时,才会激活回退到 Vertical 格式(请参阅 output_format_pretty_fallback_to_vertical
)。
output_format_pretty_fallback_to_vertical_min_table_width
类型: 无符号64位整数
默认值: 250
只有当表中列的长度之和至少为指定值,或者至少一个值包含换行符时,才会激活回退到 Vertical 格式(请参阅 output_format_pretty_fallback_to_vertical
)。
output_format_pretty_grid_charset
类型: 字符串
默认值: UTF-8
用于打印网格边框的字符集。 可用字符集:ASCII、UTF-8(默认)。
output_format_pretty_highlight_digit_groups
类型: 布尔值
默认值: 1
如果启用且输出是终端,则使用下划线突出显示对应于千、百万等数字的每个数字组。
output_format_pretty_highlight_trailing_spaces
类型: 布尔值
默认值: 1
如果启用且输出是终端,则使用灰色和下划线突出显示尾随空格。
output_format_pretty_max_column_name_width_cut_to
类型: 无符号64位整数
默认值: 24
如果列名太长,则将其截断为此长度。 如果列名长度超过 output_format_pretty_max_column_name_width_cut_to
加上 output_format_pretty_max_column_name_width_min_chars_to_cut
,则会截断列名。
output_format_pretty_max_column_name_width_min_chars_to_cut
类型: 无符号64位整数
默认值: 4
如果列名太长,则要截断的最小字符数。 如果列名长度超过 output_format_pretty_max_column_name_width_cut_to
加上 output_format_pretty_max_column_name_width_min_chars_to_cut
,则会截断列名。
output_format_pretty_max_column_pad_width
类型: 无符号64位整数
默认值: 250
在 Pretty 格式中,填充列中所有值的最大宽度。
output_format_pretty_max_rows
类型: 无符号64位整数
默认值: 10000
Pretty 格式的行数限制。
output_format_pretty_max_value_width
类型: 无符号64位整数
默认值: 10000
在 Pretty 格式中显示的值的最大宽度。 如果大于此值 - 将会被截断。 值 0 表示 - 永不截断。
output_format_pretty_max_value_width_apply_for_single_value
类型: 无符号64位整数
默认值: 0
仅当块中不是单个值时,才截断值(请参阅 output_format_pretty_max_value_width
设置)。 否则,完全输出它,这对于 SHOW CREATE TABLE
查询很有用。
output_format_pretty_multiline_fields
类型: 布尔值
默认值: 1
如果启用,Pretty 格式将在表格单元格内呈现多行字段,以便保留表格的轮廓。 如果未启用,它们将按原样呈现,可能会使表格变形(保持关闭的一个好处是复制粘贴多行值会更容易)。
output_format_pretty_row_numbers
类型: 布尔值
默认值: 1
为美观的输出格式在每行之前添加行号
output_format_pretty_single_large_number_tip_threshold
类型: 无符号64位整数
默认值: 1000000
如果块由超过此值(0 除外)的单个数字组成,则在表格右侧打印可读的数字提示
output_format_pretty_squash_consecutive_ms
类型: 无符号64位整数
默认值: 50
等待下一个块最多指定的毫秒数,并将其压缩到上一个块之前再写入。 这避免了频繁输出太小的块,但仍然允许以流式方式显示数据。
output_format_pretty_squash_max_wait_ms
类型: 无符号64位整数
默认值: 1000
如果自上次输出以来经过的时间超过指定的毫秒数,则以 pretty 格式输出挂起的块。
output_format_protobuf_nullables_with_google_wrappers
类型: 布尔值
默认值: 0
当使用 Google wrappers 序列化 Nullable 列时,将默认值序列化为空 wrappers。 如果关闭,则不会序列化默认值和 null 值
output_format_schema
类型: 字符串
默认值
将在 Cap’n Proto 或 Protobuf 格式中自动生成的 schema 保存到文件的路径。
output_format_sql_insert_include_column_names
类型: 布尔值
默认值: 1
在 INSERT 查询中包含列名
output_format_sql_insert_max_batch_size
类型: 无符号64位整数
默认值: 65409
一个 INSERT 语句中的最大行数。
output_format_sql_insert_quote_names
类型: 布尔值
默认值: 1
使用 '`' 字符引用列名
output_format_sql_insert_table_name
类型: 字符串
默认值: table
输出 INSERT 查询中的表名
output_format_sql_insert_use_replace
类型: 布尔值
默认值: 0
使用 REPLACE 语句而不是 INSERT
output_format_tsv_crlf_end_of_line
类型: 布尔值
默认值: 0
如果设置为 true,则 TSV 格式的行尾将为 \r\n 而不是 \n。
output_format_values_escape_quote_with_quote
类型: 布尔值
默认值: 0
如果为 true,则用 '' 转义 ',否则用 \' 引起来
output_format_write_statistics
类型: 布尔值
默认值: 1
在合适的输出格式中写入有关读取的行数、字节数、经过的时间的统计信息。
默认启用
precise_float_parsing
类型: 布尔值
默认值: 0
首选更精确(但速度较慢)的浮点数解析算法
regexp_dict_allow_hyperscan
类型: 布尔值
默认值: 1
允许使用 Hyperscan 库的 regexp_tree 字典。
regexp_dict_flag_case_insensitive
类型: 布尔值
默认值: 0
对 regexp_tree 字典使用不区分大小写的匹配。 可以在单个表达式中使用 (?i) 和 (?-i) 覆盖。
regexp_dict_flag_dotall
类型: 布尔值
默认值: 0
允许 '.' 匹配 regexp_tree 字典的换行符。
rows_before_aggregation
类型: 布尔值
默认值: 0
启用后,ClickHouse 将为 rows_before_aggregation 统计信息提供确切值,表示聚合之前读取的行数
schema_inference_hints
类型: 字符串
默认值
要用作无 schema 格式的 schema 推断提示的列名和类型列表。
示例
查询
desc format(JSONEachRow, '{"x" : 1, "y" : "String", "z" : "0.0.0.0" }') settings schema_inference_hints='x UInt8, z IPv4';
结果
x UInt8
y Nullable(String)
z IPv4
如果 schema_inference_hints
格式不正确,或者存在拼写错误或错误的数据类型等... 将忽略整个 schema_inference_hints。
schema_inference_make_columns_nullable
类型: UInt64Auto
默认值: 1
控制在 schema 推断中将推断类型设为 Nullable
。 如果启用此设置,则所有推断类型都将为 Nullable
;如果禁用,则推断类型永远不会为 Nullable
;如果设置为 auto
,则仅当列在 schema 推断期间解析的样本中包含 NULL
,或者文件元数据包含有关列可空性的信息时,推断类型才为 Nullable
。
schema_inference_mode
类型: SchemaInferenceMode
默认值: default
Schema 推断的模式。 'default' - 假设所有文件都具有相同的 schema,并且可以从任何文件推断 schema,'union' - 文件可以具有不同的 schema,并且结果 schema 应该是所有文件的 schema 的联合
show_create_query_identifier_quoting_rule
类型: IdentifierQuotingRule
默认值: when_necessary
设置 SHOW CREATE query 中标识符的引用规则
show_create_query_identifier_quoting_style
类型: IdentifierQuotingStyle
默认值: Backticks
设置 SHOW CREATE query 中标识符的引用样式
type_json_skip_duplicated_paths
类型: 布尔值
默认值: 0
启用后,在将 JSON 对象解析为 JSON 类型期间,重复路径将被忽略,并且只会插入第一个路径,而不是引发异常
validate_experimental_and_suspicious_types_inside_nested_types
类型: 布尔值
默认值: 1
验证在 Array/Map/Tuple 等嵌套类型内部是否使用了实验性和可疑类型