Contents

1 Введение
2 Краткий обзор терминов Parts и Partitions для таблицы ClickHouse с Engine MergeTree()
- 2.1 Схема того, как производится мержинг частей таблицы без партицирования и с партицированием
  - 2.1.1 Почему частые и мелкие по объему вставки данных вредны?
- 2.2 Как посмотреть Parts и Partitions через sql в таблице system.parts?
3 Пример хранения данных в таблице data_mart без партицирования
4 Пример хранения данных в таблице data_mart с партицированием (Partition By)
5 Какие выводы можно сделать из проведенных экспериментов
6 Использованные материалы для подготовки статьи по ClickHouse

Введение

В этой статье я опишу, как данные хранятся в таблице MergeTree при наличии партиций и их отсутствии.

Эта статья — углубленный разбор хранения данных одного движка MergeTree.

Чтобы познакомиться подробнее с Архитектурой ClickHouse — рекомендую другую свою статью «Заметки про ClickHouse. Tutorial 101 — Большая подборка информации».

Краткий обзор терминов Parts и Partitions для таблицы ClickHouse с Engine MergeTree()

Партиция – это набор записей в таблице, объединенных по какому-либо критерию. Например, партиция может быть по месяцу, по дню или по типу события. Данные для разных партиций хранятся отдельно. Это позволяет оптимизировать работу с данными, так как при обработке запросов будет использоваться только необходимое подмножество из всевозможных данных.

Подписывайся на мой канал "Data Engineering" в телеграме

Parts — части таблицы, в которой хранятся строки. Одна часть = одна папка со столбцами.

Partitions являются виртуальными объектами. У них нет физического представления. Но можно сказать, что эти parts принадлежат одной партиции.

Select не важно знать о partitions.

Select не знает о ключах партицирования (partitioning keys).

ПОТОМУ ЧТО каждая part имеет специальные файлы minmax_{PARTITIONING_KEY_COLUMN}.idx. Эти файлы содержат минимальные и максимальные значения этих столбцов в этой part. Кроме того, значения minmax_ хранятся в памяти в виде списка parts (вектор c++).

Не рекомендуется делать слишком гранулированное партиционирование – то есть задавать партиции по столбцу, в котором будет слишком большой разброс значений (речь идет о порядке более тысячи партиций). Это приведет к скоплению большого числа файлов и файловых дескрипторов в системе, что может значительно снизить производительность запросов SELECT.

Основная идея механизма хранения MergeTree состоит в том, чтобы записывать новые данные в неизменяемые блоки, называемые parts (кусками или частями), а затем асинхронно объединять эти небольшие parts данных в более крупные parts до определенного размера. Запись небольших блоков хороша для записи, но плоха для чтения, поэтому фоновое слияние создает более крупные parts для оптимизации производительности чтения.

Part — это автономное подмножество данных и индексов таблицы, включающее различные файлы. Данные хранятся в столбчатом формате: либо в одном файле, либо в одном файле на столбец. Директория отдельной part содержит (пример):

/var/lib/clickhouse/data/default/data_mart/all_1_6_1
├── City.bin
├── City.cmrk2
├── Client.bin
├── Client.cmrk2
├── Date.bin
├── Date.cmrk2
├── Product.bin
├── Product.cmrk2
├── checksums.txt
├── columns.txt
├── count.txt
├── default_compression_codec.txt
├── metadata_version.txt
├── metric_1.bin
├── metric_1.cmrk2
├── metric_2.bin
├── metric_2.cmrk2
├── metric_3.bin
├── metric_3.cmrk2
├── metric_4.bin
├── metric_4.cmrk2
├── primary.cidx
├── serialization.json
├── timeseries.bin
└── timeseries.cmrk2

/var/lib/clickhouse/data/default/data_mart/all_1_6_1

├── City.bin

├── City.cmrk2

├── Client.bin

├── Client.cmrk2

├── Date.bin

├── Date.cmrk2

├── Product.bin

├── Product.cmrk2

├── checksums.txt

├── columns.txt

├── count.txt

├── default_compression_codec.txt

├── metadata_version.txt

├── metric_1.bin

├── metric_1.cmrk2

├── metric_2.bin

├── metric_2.cmrk2

├── metric_3.bin

├── metric_3.cmrk2

├── metric_4.bin

├── metric_4.cmrk2

├── primary.cidx

├── serialization.json

├── timeseries.bin

└── timeseries.cmrk2

Column data files (Файлы данных столбца). Части могут находиться в компактном режиме, когда все данные столбцов хранятся в одном файле .bin, или в расширенном режиме, по одному файлу .bin на каждый столбец.
Primary index (Первичный индекс) состоит из файла idx и файла меток.
Необязательный индекс partitioning-key MinMax index
Необязательные вторичные индексы или secondary indexes (с idx и файлом меток для каждого вторичного индекса).
Файлы метаданных.
Projections. Аналогично концепции материализованного представления, но хранится в виде скрытой таблицы в подкаталоге со всеми теми же типами файлов, что и родительская таблица (bin, idx и т.д.).

Каждая таблица ClickHouse имеет первичный ключ (primary key) и ключ сортировки (sorting key).
Если пользователь опускает первичный ключ в инструкции CREATE TABLE, ключ сортировки действует как первичный ключ. Данные организованы на диске внутри части (part) в соответствии с порядком ключей сортировки.
Первичный индекс является sparse index (разреженным индексом): он не включает в себя все строки, содержащиеся в части (part). Вместо этого он создает одну запись индекса для каждой N-й строки (по умолчанию это 8192 строки), а каждый блок из N строк называется гранулой. Index entries известны как метки (marks).
Granule (Гранула) — это наименьший блок данных, который механизм запросов ClickHouse считывает с диска. Подобно тому, как блочное устройство может читать блоки размером 4 КБ, ClickHouse считывает гранулы как наименьшую единицу данных (в векторизованном виде). Такое векторизованное чтение гранул происходит чрезвычайно быстро, поскольку стоимость десериализации невелика, поскольку представление в памяти и на диске во многих случаях одинаково. Гранулы также можно сжимать для уменьшения размера на диске.

Чтобы найти данные в файлах данных столбцов (файлах .bin), каждый индексный файл сопровождается файлом меток, который включает указатели от ключевых меток индекса на смещения в файлах данных столбцов.

Схема того, как производится мержинг частей таблицы без партицирования и с партицированием

В фоновом режиме ClickHouse объединяет части данных для более эффективного хранения. Каждая part имеет свой собственный первичный индекс, позволяющий эффективно сканировать и определять, где находятся значения внутри частей. Когда части объединяются, первичные индексы объединенной части также объединяются.

По мере увеличения количества parts запросы неизбежно замедляются из-за необходимости оценивать больше индексов и читать больше файлов.

Когда данные вставляются в ClickHouse, он создает один или несколько блоков (частей).

Движок MergeTree выбирает части для слияния на основе некоторых эвристик. Он должен сбалансировать некоторые конкурирующие проблемы, такие как:

Ограничение усиления записи (регулярное объединение больших частей или объединение больших частей с мелкими частями приведет к более высокому усилению записи).
Ограничение количества частей (большое количество частей отрицательно повлияет на производительность чтения).

Почему частые и мелкие по объему вставки данных вредны?

ClickHouse предъявляет такое же требование, чтобы гарантировать, что объединение фоновых частей не отстает от создания частей переднего плана. Основной механизм, который ClickHouse использует для защиты от усиления чтения, — это ограничение количества активных частей, разрешенных для любого данного partition.

Он имеет два порога, которые действуют на уровне раздела:

Как только первый порог, parts_to_delay_insert, достигнут, сервер начинает искусственно замедлять вставки, давая фоновым слияниям шанс наверстать упущенное.
По умолчанию 1000.
Как только достигается второй порог, parts_to_throw_insert, сервер активно отклоняет запросы на вставку и обновление.
По умолчанию 3000.

Общее количество частей также может быть ограничено пороговым значением max_parts_in_total, нарушение которого приведет к тому, что сервер(ы) отклонит вставки и обновления.

Чтобы гарантировать, что фоновое слияние может идти в ногу с созданием новых деталей, приложениям ClickHouse рекомендуется выполнять менее частые и более крупные массовые вставки, а не более частые и меньшие вставки.

Как посмотреть Parts и Partitions через sql в таблице system.parts?

Таблица семейства MergeTree в ClickHouse состоит из parts. Parts, partitions и другие параметры таблицы описаны в системной таблице system.parts.

Что значат некоторые поля в таблице system.parts:

partition (String) – имя партиции.
name (String) – имя part (куска).
part_type (String) — формат хранения данных в part. Формат хранения данных определяется настройками min_bytes_for_wide_part и min_rows_for_wide_part таблицы MergeTree. Возможные значения:
- Wide — каждая колонка хранится в отдельном файле.
- Compact — все колонки хранятся в одном файле.
active (UInt8) – признак активности. Если кусок активен, то он используется таблицей, в противном случает он будет удален. Неактивные куски остаются после слияний.
marks (UInt64) – количество засечек. Чтобы получить примерное количество строк в куске, умножьте marks на гранулированность индекса (обычно 8192).
rows (UInt64) – количество строк.
bytes_on_disk (UInt64) – общий размер всех файлов кусков данных в байтах.
data_compressed_bytes (UInt64) – общий размер сжатой информации в куске данных. Размер всех дополнительных файлов (например, файлов с засечками) не учитывается.
data_uncompressed_bytes (UInt64) – общий размер распакованной информации куска данных. Размер всех дополнительных файлов (например, файлов с засечками) не учитывается.
remove_time (DateTime) – время, когда кусок стал неактивным.
min_date (Date) – минимальное значение ключа даты в куске данных.
max_date (Date) – максимальное значение ключа даты в куске данных.
partition_id (String) – ID партиции.
level (UInt32) — глубина дерева слияний. Если слияний не было, то level=0.
database (String) – имя базы данных.
table (String) – имя таблицы.
engine (String) – имя движка таблицы, без параметров.
path (String) – абсолютный путь к папке с файлами кусков данных.
disk (String) – имя диска, на котором находится кусок данных.

Пример запроса к system.parts в ClickHouse:

SELECT
	database,
	table,
	engine,
	path,
	name,
	partition,
	part_type,
	active,
	marks,
	rows,
	partition_id,
	min_block_number,
	max_block_number,
	level,
	primary_key_bytes_in_memory,
	primary_key_bytes_in_memory_allocated,
	removal_state,
	visible
FROM system.parts
WHERE database = 'default'
and table = 'data_mart';

SELECT

database,

table,

engine,

path,

name,

partition,

part_type,

active,

marks,

rows,

partition_id,

min_block_number,

max_block_number,

level,

primary_key_bytes_in_memory,

primary_key_bytes_in_memory_allocated,

removal_state,

visible

FROM system.parts

WHERE database = 'default'

and table = 'data_mart';

Результат по таблице с неудаленными parts:

database|table    |engine   |path                                                                         |name     |partition|part_type|active|marks|rows  |partition_id|min_block_number|max_block_number|level|primary_key_bytes_in_memory|primary_key_bytes_in_memory_allocated|removal_state                           |visible|
--------+---------+---------+-----------------------------------------------------------------------------+---------+---------+---------+------+-----+------+------------+----------------+----------------+-----+---------------------------+-------------------------------------+----------------------------------------+-------+
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_1_1_0/|all_1_1_0|tuple()  |Compact  |     0|   13|100000|all         |               1|               1|    0|                        761|                                17664|Part hasn't reached removal time yet    |      0|
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_1_6_1/|all_1_6_1|tuple()  |Wide     |     1|   75|600000|all         |               1|               6|    1|                       4494|                                21504|Cleanup thread hasn't seen this part yet|      1|
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_2_2_0/|all_2_2_0|tuple()  |Compact  |     0|   13|100000|all         |               2|               2|    0|                        750|                                17664|Part hasn't reached removal time yet    |      0|
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_3_3_0/|all_3_3_0|tuple()  |Compact  |     0|   13|100000|all         |               3|               3|    0|                        762|                                17664|Part hasn't reached removal time yet    |      0|
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_4_4_0/|all_4_4_0|tuple()  |Compact  |     0|   13|100000|all         |               4|               4|    0|                        794|                                17664|Part hasn't reached removal time yet    |      0|
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_5_5_0/|all_5_5_0|tuple()  |Compact  |     0|   13|100000|all         |               5|               5|    0|                        767|                                17664|Part hasn't reached removal time yet    |      0|
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_6_6_0/|all_6_6_0|tuple()  |Compact  |     0|   13|100000|all         |               6|               6|    0|                        764|                                17664|Part hasn't reached removal time yet    |      0|
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_7_7_0/|all_7_7_0|tuple()  |Compact  |     1|   13|100000|all         |               7|               7|    0|                        767|                                17664|Cleanup thread hasn't seen this part yet|      1|
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_8_8_0/|all_8_8_0|tuple()  |Compact  |     1|   13|100000|all         |               8|               8|    0|                        787|                                17664|Cleanup thread hasn't seen this part yet|      1|
default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_9_9_0/|all_9_9_0|tuple()  |Compact  |     1|   13|100000|all         |               9|               9|    0|                        806|                                17664|Cleanup thread hasn't seen this part yet|      1|

--------+---------+---------+-----------------------------------------------------------------------------+---------+---------+---------+------+-----+------+------------+----------------+----------------+-----+---------------------------+-------------------------------------+----------------------------------------+-------+

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_1_1_0/|all_1_1_0|tuple() |Compact | 0| 13|100000|all | 1| 1| 0| 761| 17664|Part hasn't reached removal time yet | 0|

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_1_6_1/|all_1_6_1|tuple() |Wide | 1| 75|600000|all | 1| 6| 1| 4494| 21504|Cleanup thread hasn't seen this part yet| 1|

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_2_2_0/|all_2_2_0|tuple() |Compact | 0| 13|100000|all | 2| 2| 0| 750| 17664|Part hasn't reached removal time yet | 0|

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_3_3_0/|all_3_3_0|tuple() |Compact | 0| 13|100000|all | 3| 3| 0| 762| 17664|Part hasn't reached removal time yet | 0|

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_4_4_0/|all_4_4_0|tuple() |Compact | 0| 13|100000|all | 4| 4| 0| 794| 17664|Part hasn't reached removal time yet | 0|

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_5_5_0/|all_5_5_0|tuple() |Compact | 0| 13|100000|all | 5| 5| 0| 767| 17664|Part hasn't reached removal time yet | 0|

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_6_6_0/|all_6_6_0|tuple() |Compact | 0| 13|100000|all | 6| 6| 0| 764| 17664|Part hasn't reached removal time yet | 0|

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_7_7_0/|all_7_7_0|tuple() |Compact | 1| 13|100000|all | 7| 7| 0| 767| 17664|Cleanup thread hasn't seen this part yet| 1|

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_8_8_0/|all_8_8_0|tuple() |Compact | 1| 13|100000|all | 8| 8| 0| 787| 17664|Cleanup thread hasn't seen this part yet| 1|

default |data_mart|MergeTree|/var/lib/clickhouse/store/698/698d9e8a-bb70-4bfe-8f77-baf2a5ed138d/all_9_9_0/|all_9_9_0|tuple() |Compact | 1| 13|100000|all | 9| 9| 0| 806| 17664|Cleanup thread hasn't seen this part yet| 1|

Пример хранения данных в таблице data_mart без партицирования

В рамках первого примера, я создам таблицу без ключа партицирования:

CREATE TABLE data_mart (
    timeseries DateTime,
    Date Date,
    City String,
    Client String,
    Product String,
    metric_1 Float64,
    metric_2 Float64,
    metric_3 Float64,
    metric_4 Float64
)
ENGINE = MergeTree
ORDER BY (Date, City, Client, Product)
;

CREATE TABLE data_mart (

timeseries DateTime,

Date Date,

City String,

Client String,

Product String,

metric_1 Float64,

metric_2 Float64,

metric_3 Float64,

metric_4 Float64

)

ENGINE = MergeTree

ORDER BY (Date, City, Client, Product)

;

Будет создана таблица с Engine MergeTree с сортировкой данных по колонкам Date, City, Client, Product и первичным ключом по полям, которые указаны в ORDER BY разделе.

Код генерации данных в ClickHouse и их вставки через Google Colab

Ссылка на Google Colab «1. ClickHouse генерация dataframe и вставка 1.3 млн строк без партиций.ipynb»

!pip install clickhouse_connect faker

import pandas as pd
import numpy as np
from faker import Faker
import random
from datetime import datetime, timedelta
import clickhouse_connect
from dateutil.relativedelta import relativedelta

# Создание клиента для подключения к ClickHouse
client = clickhouse_connect.get_client(host='31.129.97.202', port='8123', user='default', password= '111')

# creating a table in ClickHouse
create_table_sql = """
CREATE TABLE data_mart (
    timeseries DateTime,
    Date Date,
    City String,
    Client String,
    Product String,
    metric_1 Float64,
    metric_2 Float64,
    metric_3 Float64,
    metric_4 Float64
)
ENGINE = MergeTree
ORDER BY (Date, City, Client, Product)
;
"""

client.command('DROP TABLE IF EXISTS data_mart')
client.command(create_table_sql)

print('Таблица data_mart создана в ClickHouse')

# Инициализация Faker для генерации случайных данных
fake = Faker()

def generate_dataframe(num_rows, start_date, end_date):
    print(f"num_rows = {num_rows}. Generate DataFrame for period: {start_date} to {end_date}")

    # Генерация случайных данных для датафрейма
    data = {
        'Date': [fake.date_between_dates(date_start=start_date, date_end=end_date) for _ in range(num_rows)],
        'City': [fake.city() for _ in range(num_rows)],
        'Client': [fake.name() for _ in range(num_rows)],
        'Product': [fake.word() for _ in range(num_rows)],
    }

    # Генерация случайных значений для метрик
    for i in range(1, 5):
        data[f'metric_{i}'] = np.round(np.random.uniform(low=i, high=i*20, size=num_rows)/np.random.uniform(low=1, high=i), 2)

    # Создание датафрейма
    df = pd.DataFrame(data)

    # creating a timeseries field
    df['timeseries'] = pd.to_datetime(df['Date'])

    print('Dataframe сгенерирован')

    # Sending data to ClickHouse
    client.insert_df('data_mart', df)

    print('Данные вставлены в таблицу data_mart')

# Начальная и конечная дата
start_date = datetime(2020, 1, 1)
end_date = datetime.today().replace(hour=0, minute=0, second=0, microsecond=0)

# Задаем количество строк в датафрейме
num_rows = 100000

# Вставка N раз по num_rows строк
for i in range(1, 14):
    print(f"*** Вставка данных № {i}")
    generate_dataframe(num_rows, start_date, end_date)

# Check count of rows in the table
result_df = client.query_df('SELECT count(1) FROM data_mart')

!pip install clickhouse_connect faker

import pandas as pd

import numpy as np

from faker import Faker

import random

from datetime import datetime, timedelta

import clickhouse_connect

from dateutil.relativedelta import relativedelta

# Создание клиента для подключения к ClickHouse

client = clickhouse_connect.get_client(host='31.129.97.202', port='8123', user='default', password= '111')

# creating a table in ClickHouse

create_table_sql = """

CREATE TABLE data_mart (

timeseries DateTime,

Date Date,

City String,

Client String,

Product String,

metric_1 Float64,

metric_2 Float64,

metric_3 Float64,

metric_4 Float64

)

ENGINE = MergeTree

ORDER BY (Date, City, Client, Product)

;

"""

client.command('DROP TABLE IF EXISTS data_mart')

client.command(create_table_sql)

print('Таблица data_mart создана в ClickHouse')

# Инициализация Faker для генерации случайных данных

fake = Faker()

def generate_dataframe(num_rows, start_date, end_date):

print(f"num_rows = {num_rows}. Generate DataFrame for period: {start_date} to {end_date}")

# Генерация случайных данных для датафрейма

data = {

'Date': [fake.date_between_dates(date_start=start_date, date_end=end_date) for _ in range(num_rows)],

'City': [fake.city() for _ in range(num_rows)],

'Client': [fake.name() for _ in range(num_rows)],

'Product': [fake.word() for _ in range(num_rows)],

}

# Генерация случайных значений для метрик

for i in range(1, 5):

data[f'metric_{i}'] = np.round(np.random.uniform(low=i, high=i*20, size=num_rows)/np.random.uniform(low=1, high=i), 2)

# Создание датафрейма

df = pd.DataFrame(data)

# creating a timeseries field

df['timeseries'] = pd.to_datetime(df['Date'])

print('Dataframe сгенерирован')

# Sending data to ClickHouse

client.insert_df('data_mart', df)

print('Данные вставлены в таблицу data_mart')

# Начальная и конечная дата

start_date = datetime(2020, 1, 1)

end_date = datetime.today().replace(hour=0, minute=0, second=0, microsecond=0)

# Задаем количество строк в датафрейме

num_rows = 100000

# Вставка N раз по num_rows строк

for i in range(1, 14):

print(f"*** Вставка данных № {i}")

generate_dataframe(num_rows, start_date, end_date)

# Check count of rows in the table

result_df = client.query_df('SELECT count(1) FROM data_mart')

Вставка данных и слежение за тем, что происходит в таблице с Parts

На gif хорошо видно, что сначала вставляются parts со статусом active = 1 и с типом part_type = Compact. Когда количество частей доходит до 6, все эти части мержатся в одну часть с типом part_type = Wide. У остальных частей active меняется со значения 1 на значение 0.

После того, как вставка завершится и пройдет некоторое время, неактивные части будут удалены.

В итоге останется следующая картинка:

Подписывайся на мой канал "Data Engineering" в телеграме

Обратите внимание, что две части в формате Wide, а одна в формате Compact.

Итоговый результат и описание хранения данных ClickHouse MergeTree Table на диске

схема

Директория detached содержит parts (куски), отсоединенные от таблицы с помощью запроса DETACH. Поврежденные куски также попадают в эту директорию – они не удаляются с сервера.

Сервер не использует куски из директории detached. Вы можете в любое время добавлять, удалять, модифицировать данные в директории detached — сервер не будет об этом знать, пока вы не сделаете запрос ATTACH.

Полный набор директорий и файлов для таблицы data_mart без партиций выглядит следующим образом (после выполнения всех этапов merging parts):

/var/lib/clickhouse/data/default/data_mart
│
├── all_13_13_0
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── data.bin
│         ├── data.cmrk3
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── primary.cidx
│         └── serialization.json
├── all_1_6_1
│         ├── City.bin
│         ├── City.cmrk2
│         ├── Client.bin
│         ├── Client.cmrk2
│         ├── Date.bin
│         ├── Date.cmrk2
│         ├── Product.bin
│         ├── Product.cmrk2
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── metric_1.bin
│         ├── metric_1.cmrk2
│         ├── metric_2.bin
│         ├── metric_2.cmrk2
│         ├── metric_3.bin
│         ├── metric_3.cmrk2
│         ├── metric_4.bin
│         ├── metric_4.cmrk2
│         ├── primary.cidx
│         ├── serialization.json
│         ├── timeseries.bin
│         └── timeseries.cmrk2
├── all_7_12_1
│         ├── City.bin
│         ├── City.cmrk2
│         ├── Client.bin
│         ├── Client.cmrk2
│         ├── Date.bin
│         ├── Date.cmrk2
│         ├── Product.bin
│         ├── Product.cmrk2
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── metric_1.bin
│         ├── metric_1.cmrk2
│         ├── metric_2.bin
│         ├── metric_2.cmrk2
│         ├── metric_3.bin
│         ├── metric_3.cmrk2
│         ├── metric_4.bin
│         ├── metric_4.cmrk2
│         ├── primary.cidx
│         ├── serialization.json
│         ├── timeseries.bin
│         └── timeseries.cmrk2
├── detached
└── format_version.txt

/var/lib/clickhouse/data/default/data_mart

│

├── all_13_13_0

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── data.bin

│ ├── data.cmrk3

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── primary.cidx

│ └── serialization.json

├── all_1_6_1

│ ├── City.bin

│ ├── City.cmrk2

│ ├── Client.bin

│ ├── Client.cmrk2

│ ├── Date.bin

│ ├── Date.cmrk2

│ ├── Product.bin

│ ├── Product.cmrk2

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── metric_1.bin

│ ├── metric_1.cmrk2

│ ├── metric_2.bin

│ ├── metric_2.cmrk2

│ ├── metric_3.bin

│ ├── metric_3.cmrk2

│ ├── metric_4.bin

│ ├── metric_4.cmrk2

│ ├── primary.cidx

│ ├── serialization.json

│ ├── timeseries.bin

│ └── timeseries.cmrk2

├── all_7_12_1

│ ├── City.bin

│ ├── City.cmrk2

│ ├── Client.bin

│ ├── Client.cmrk2

│ ├── Date.bin

│ ├── Date.cmrk2

│ ├── Product.bin

│ ├── Product.cmrk2

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── metric_1.bin

│ ├── metric_1.cmrk2

│ ├── metric_2.bin

│ ├── metric_2.cmrk2

│ ├── metric_3.bin

│ ├── metric_3.cmrk2

│ ├── metric_4.bin

│ ├── metric_4.cmrk2

│ ├── primary.cidx

│ ├── serialization.json

│ ├── timeseries.bin

│ └── timeseries.cmrk2

├── detached

└── format_version.txt

Пример хранения данных в таблице data_mart с партицированием (Partition By)

В этом разделе будет создана таблица с ключом партицирования в формате YYYYMM (т.е. год месяц):

CREATE TABLE data_mart_with_partition (
    timeseries DateTime,
    Date Date,
    City String,
    Client String,
    Product String,
    metric_1 Float64,
    metric_2 Float64,
    metric_3 Float64,
    metric_4 Float64
)
ENGINE = MergeTree
PARTITION BY toYYYYMM(Date)
ORDER BY (Date, City, Client, Product)
;

CREATE TABLE data_mart_with_partition (

timeseries DateTime,

Date Date,

City String,

Client String,

Product String,

metric_1 Float64,

metric_2 Float64,

metric_3 Float64,

metric_4 Float64

)

ENGINE = MergeTree

PARTITION BY toYYYYMM(Date)

ORDER BY (Date, City, Client, Product)

;

Код генерации данных в ClickHouse и их вставки через Google Colab с Partition By

Ссылка на Google Colab «2. ClickHouse генерация dataframe и вставка 1 млн строк с партициями.ipynb»

!pip install clickhouse_connect faker

import pandas as pd
import numpy as np
from faker import Faker
import random
from datetime import datetime, timedelta
import clickhouse_connect
from dateutil.relativedelta import relativedelta

# Создание клиента для подключения к ClickHouse
client = clickhouse_connect.get_client(host='31.129.97.202', port='8123', user='default', password= '111')

# creating a table in ClickHouse
create_table_sql = """
CREATE TABLE data_mart_with_partition (
    timeseries DateTime,
    Date Date,
    City String,
    Client String,
    Product String,
    metric_1 Float64,
    metric_2 Float64,
    metric_3 Float64,
    metric_4 Float64
)
ENGINE = MergeTree
PARTITION BY toYYYYMM(Date)
ORDER BY (Date, City, Client, Product)
;
"""

client.command('DROP TABLE IF EXISTS data_mart_with_partition')
client.command(create_table_sql)

print('Таблица data_mart_with_partition создана в ClickHouse')

# Инициализация Faker для генерации случайных данных
fake = Faker()

def generate_dataframe(num_rows, start_date, end_date):
    print(f"num_rows = {num_rows}. Generate DataFrame for period: {start_date} to {end_date}")

    # Генерация случайных данных для датафрейма
    data = {
        'Date': [fake.date_between_dates(date_start=start_date, date_end=end_date) for _ in range(num_rows)],
        'City': [fake.city() for _ in range(num_rows)],
        'Client': [fake.name() for _ in range(num_rows)],
        'Product': [fake.word() for _ in range(num_rows)],
    }

    # Генерация случайных значений для метрик
    for i in range(1, 5):
        data[f'metric_{i}'] = np.round(np.random.uniform(low=i, high=i*20, size=num_rows)/np.random.uniform(low=1, high=i), 2)

    # Создание датафрейма
    df = pd.DataFrame(data)

    # creating a timeseries field
    df['timeseries'] = pd.to_datetime(df['Date'])

    print('Dataframe сгенерирован')

    # Sending data to ClickHouse
    client.insert_df('data_mart_with_partition', df)

    print('Данные вставлены в таблицу data_mart_with_partition')

# Начальная и конечная дата
start_date = datetime(2024, 1, 1)
end_date = datetime(2024, 2, 29)

# Задаем количество строк в датафрейме
num_rows = 100000

# Вставка N раз по num_rows строк
for i in range(1, 11):
    print(f"*** Вставка данных № {i}")
    generate_dataframe(num_rows, start_date, end_date)

# Check count of rows in the table
result_df = client.query_df('SELECT count(1) FROM data_mart_with_partition')
print()
print(result_df)

!pip install clickhouse_connect faker

import pandas as pd

import numpy as np

from faker import Faker

import random

from datetime import datetime, timedelta

import clickhouse_connect

from dateutil.relativedelta import relativedelta

# Создание клиента для подключения к ClickHouse

client = clickhouse_connect.get_client(host='31.129.97.202', port='8123', user='default', password= '111')

# creating a table in ClickHouse

create_table_sql = """

CREATE TABLE data_mart_with_partition (

timeseries DateTime,

Date Date,

City String,

Client String,

Product String,

metric_1 Float64,

metric_2 Float64,

metric_3 Float64,

metric_4 Float64

)

ENGINE = MergeTree

PARTITION BY toYYYYMM(Date)

ORDER BY (Date, City, Client, Product)

;

"""

client.command('DROP TABLE IF EXISTS data_mart_with_partition')

client.command(create_table_sql)

print('Таблица data_mart_with_partition создана в ClickHouse')

# Инициализация Faker для генерации случайных данных

fake = Faker()

def generate_dataframe(num_rows, start_date, end_date):

print(f"num_rows = {num_rows}. Generate DataFrame for period: {start_date} to {end_date}")

# Генерация случайных данных для датафрейма

data = {

'Date': [fake.date_between_dates(date_start=start_date, date_end=end_date) for _ in range(num_rows)],

'City': [fake.city() for _ in range(num_rows)],

'Client': [fake.name() for _ in range(num_rows)],

'Product': [fake.word() for _ in range(num_rows)],

}

# Генерация случайных значений для метрик

for i in range(1, 5):

data[f'metric_{i}'] = np.round(np.random.uniform(low=i, high=i*20, size=num_rows)/np.random.uniform(low=1, high=i), 2)

# Создание датафрейма

df = pd.DataFrame(data)

# creating a timeseries field

df['timeseries'] = pd.to_datetime(df['Date'])

print('Dataframe сгенерирован')

# Sending data to ClickHouse

client.insert_df('data_mart_with_partition', df)

print('Данные вставлены в таблицу data_mart_with_partition')

# Начальная и конечная дата

start_date = datetime(2024, 1, 1)

end_date = datetime(2024, 2, 29)

# Задаем количество строк в датафрейме

num_rows = 100000

# Вставка N раз по num_rows строк

for i in range(1, 11):

print(f"*** Вставка данных № {i}")

generate_dataframe(num_rows, start_date, end_date)

# Check count of rows in the table

result_df = client.query_df('SELECT count(1) FROM data_mart_with_partition')

print()

print(result_df)

Вставка данных и слежение за тем, что происходит в таблице с Parts

При вставке данных в таблицу MergeTree с партициями появляется последовательно не 1 part, а столько, сколько в Insert данных есть партиций. Для наглядности я сделал всего 2 партиции в генерируемых данных (т.е. партиция 202401 и партиция 202402), поэтому на следующей gif видно появление частей парами:

По мере того, как появляются партиции, при достижении определенного числа партиций происходит объединение Compact частей в Wide части.

Итоговый результат и описание хранения данных ClickHouse MergeTree Table на диске

Схема хранения данных в Parts в случае, если используются партиции: почти все тоже самое, кроме одного — внутри директории одной части содержатся два дополнительных файла:

partition.dat —
minmax_Date.idx —

Сначала удалятся неактивные части и картинка приобретет вид:

Итоговый результат после того, как все parts будут смержены и неактивные parts будут удалены:

Полный набор всех файлов для таблицы data_mart_with_partition выглядит следующим образом (снимок файлов в директориях parts выполнен, когда не все части смержены, чтобы показать различие Compact и Wide parts):

/var/lib/clickhouse/data/default/data_mart_with_partition
│ 
├── 202401_13_13_0
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── data.bin
│         ├── data.cmrk3
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         └── serialization.json
├── 202401_16_16_0
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── data.bin
│         ├── data.cmrk3
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         └── serialization.json
├── 202401_18_18_0
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── data.bin
│         ├── data.cmrk3
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         └── serialization.json
├── 202401_1_12_1
│         ├── City.bin
│         ├── City.cmrk2
│         ├── Client.bin
│         ├── Client.cmrk2
│         ├── Date.bin
│         ├── Date.cmrk2
│         ├── Product.bin
│         ├── Product.cmrk2
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── metric_1.bin
│         ├── metric_1.cmrk2
│         ├── metric_2.bin
│         ├── metric_2.cmrk2
│         ├── metric_3.bin
│         ├── metric_3.cmrk2
│         ├── metric_4.bin
│         ├── metric_4.cmrk2
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         ├── serialization.json
│         ├── timeseries.bin
│         └── timeseries.cmrk2
├── 202401_20_20_0
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── data.bin
│         ├── data.cmrk3
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         └── serialization.json
├── 202402_14_14_0
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── data.bin
│         ├── data.cmrk3
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         └── serialization.json
├── 202402_15_15_0
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── data.bin
│         ├── data.cmrk3
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         └── serialization.json
├── 202402_17_17_0
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── data.bin
│         ├── data.cmrk3
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         └── serialization.json
├── 202402_19_19_0
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── data.bin
│         ├── data.cmrk3
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         └── serialization.json
├── 202402_2_11_1
│         ├── City.bin
│         ├── City.cmrk2
│         ├── Client.bin
│         ├── Client.cmrk2
│         ├── Date.bin
│         ├── Date.cmrk2
│         ├── Product.bin
│         ├── Product.cmrk2
│         ├── checksums.txt
│         ├── columns.txt
│         ├── count.txt
│         ├── default_compression_codec.txt
│         ├── metadata_version.txt
│         ├── metric_1.bin
│         ├── metric_1.cmrk2
│         ├── metric_2.bin
│         ├── metric_2.cmrk2
│         ├── metric_3.bin
│         ├── metric_3.cmrk2
│         ├── metric_4.bin
│         ├── metric_4.cmrk2
│         ├── minmax_Date.idx
│         ├── partition.dat
│         ├── primary.cidx
│         ├── serialization.json
│         ├── timeseries.bin
│         └── timeseries.cmrk2
├── detached
└── format_version.txt

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

/var/lib/clickhouse/data/default/data_mart_with_partition

│

├── 202401_13_13_0

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── data.bin

│ ├── data.cmrk3

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ └── serialization.json

├── 202401_16_16_0

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── data.bin

│ ├── data.cmrk3

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ └── serialization.json

├── 202401_18_18_0

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── data.bin

│ ├── data.cmrk3

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ └── serialization.json

├── 202401_1_12_1

│ ├── City.bin

│ ├── City.cmrk2

│ ├── Client.bin

│ ├── Client.cmrk2

│ ├── Date.bin

│ ├── Date.cmrk2

│ ├── Product.bin

│ ├── Product.cmrk2

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── metric_1.bin

│ ├── metric_1.cmrk2

│ ├── metric_2.bin

│ ├── metric_2.cmrk2

│ ├── metric_3.bin

│ ├── metric_3.cmrk2

│ ├── metric_4.bin

│ ├── metric_4.cmrk2

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ ├── serialization.json

│ ├── timeseries.bin

│ └── timeseries.cmrk2

├── 202401_20_20_0

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── data.bin

│ ├── data.cmrk3

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ └── serialization.json

├── 202402_14_14_0

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── data.bin

│ ├── data.cmrk3

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ └── serialization.json

├── 202402_15_15_0

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── data.bin

│ ├── data.cmrk3

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ └── serialization.json

├── 202402_17_17_0

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── data.bin

│ ├── data.cmrk3

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ └── serialization.json

├── 202402_19_19_0

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── data.bin

│ ├── data.cmrk3

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ └── serialization.json

├── 202402_2_11_1

│ ├── City.bin

│ ├── City.cmrk2

│ ├── Client.bin

│ ├── Client.cmrk2

│ ├── Date.bin

│ ├── Date.cmrk2

│ ├── Product.bin

│ ├── Product.cmrk2

│ ├── checksums.txt

│ ├── columns.txt

│ ├── count.txt

│ ├── default_compression_codec.txt

│ ├── metadata_version.txt

│ ├── metric_1.bin

│ ├── metric_1.cmrk2

│ ├── metric_2.bin

│ ├── metric_2.cmrk2

│ ├── metric_3.bin

│ ├── metric_3.cmrk2

│ ├── metric_4.bin

│ ├── metric_4.cmrk2

│ ├── minmax_Date.idx

│ ├── partition.dat

│ ├── primary.cidx

│ ├── serialization.json

│ ├── timeseries.bin

│ └── timeseries.cmrk2

├── detached

└── format_version.txt

Какие выводы можно сделать из проведенных экспериментов

Использование партиций увеличивает число parts на диске.
Partitions позволяют манипулировать данными в таблице через открепление, прикрепление партиций, а также обмен партиций между таблицами.
Если ключ партицирования завязан не на LowCardinality и вставки данных будут частыми и мелкими порциями данных — велика вероятность, что весь процесс встанет.
Использование партиций вероятно приведет к снижению скорости чтения таблицы. То есть Select будет работать медленнее. Опять же все зависит от целей каждой отдельной таблицы в хранилище. Витрины данных идеально делать с минимальным набором частей. То есть подумайте о стратегии обновлении данных и моделировании данных (точнее бизнес-витрин). Если данных немного, идеально партицирование не делать. Если данных много и нужны операции над партициями — думайте о Low Cardinality Dimensions.

Использованные материалы для подготовки статьи по ClickHouse

Serverless ClickHouse Cloud — ASDS Chapter 5 (Part 1)