Обновление ClickHouse и миграция с ZooKeeper на ClickHouse Keeper: практическое руководство

Введение

ClickHouse давно используется как одна из самых быстрых аналитических СУБД для работы с большими объёмами данных. Многие кластеры строились на базе ZooKeeper, который отвечал за координацию реплик. Но в новых версиях появился ClickHouse Keeper — встроенный аналог ZooKeeper, полностью совместимый по протоколу, но более простой в эксплуатации и управлении.

Я недавно прошёл путь обновления боевого кластера ClickHouse и полного отказа от ZooKeeper в пользу ClickHouse Keeper. В этой статье я подробно разберу шаги, примеры конфигураций и нюансы, которые важно учитывать.

Исходная инфраструктура

До миграции у нас было:

3 ноды ClickHouse (Ubuntu 16.04.7, ClickHouse 22.2.2.1);
Zookeeper 3.4.8, установленный локально на каждой ноде;
кластер с репликацией и ~2.2 ТБ данных на сервер.

План миграции

Поднять новые ноды на Debian 12 с последним релизом ClickHouse.
Добавить новые ноды в существующий кластер и синхронизировать данные.
Развернуть и протестировать ClickHouse Keeper.
Перенести конфигурацию с ZooKeeper на Keeper.
Перевести реплики и вывести старые сервера из эксплуатации.

Настройки ZooKeeper (старый вариант)

В config.xml на старых нодах ClickHouse была секция:


<zookeeper>
    <node index="1">
        <host>node1</host>
        <port>2181</port>
    </node>
    <node index="2">
        <host>node2</host>
        <port>2181</port>
    </node>
    <node index="3">
        <host>node3</host>
        <port>2181</port>
    </node>
</zookeeper>

Настройки ClickHouse Keeper (новый вариант)

Теперь вместо ZooKeeper используем встроенный Keeper.
Пример конфига keeper.xml:


<clickhouse>
    <keeper_server>
        <tcp_port>9181</tcp_port>
        <server_id>1</server_id>
        <log_storage_path>/var/lib/clickhouse/coordination/log</log_storage_path>
        <snapshot_storage_path>/var/lib/clickhouse/coordination/snapshots</snapshot_storage_path>

        <raft_configuration>
            <server>
                <id>1</id>
                <hostname>node1</hostname>
                <port>9444</port>
            </server>
            <server>
                <id>2</id>
                <hostname>node2</hostname>
                <port>9444</port>
            </server>
            <server>
                <id>3</id>
                <hostname>node3</hostname>
                <port>9444</port>
            </server>
        </raft_configuration>
    </keeper_server>
</clickhouse>

После этого в config.xml указываем:


<zookeeper>
    <node index="1">
        <host>node1</host>
        <port>9181</port>
    </node>
    <node index="2">
        <host>node2</host>
        <port>9181</port>
    </node>
    <node index="3">
        <host>node3</host>
        <port>9181</port>
    </node>
</zookeeper>

Таким образом, ClickHouse будет подключаться уже к встроенному Keeper.

Пример настройки `system.clusters`

Файл clusters.xml (или в config.d/clusters.xml):


<yandex>
    <remote_servers>
        <cluster_3s>
            <shard>
                <internal_replication>true</internal_replication>
                <replica>
                    <host>node1</host>
                    <port>9000</port>
                </replica>
                <replica>
                    <host>node2</host>
                    <port>9000</port>
                </replica>
                <replica>
                    <host>node3</host>
                    <port>9000</port>
                </replica>
            </shard>
        </cluster_3s>
    </remote_servers>
</yandex>

Проверка работы Keeper

Проверяем статус Keeper:


SELECT * FROM system.zookeeper WHERE path = '/';

Проверяем реплики:


SELECT table, is_readonly, total_replicas, active_replicas
FROM system.replicas;

Проверяем кворум:


SELECT * FROM system.clusters WHERE cluster = 'cluster_3s';

Реплицируемая таблица

Пример создания таблицы в кластере:


CREATE TABLE replicated_table
(
    EventDate Date,
    UserId UInt64,
    CountryId UInt32,
    Sign Int8
)
ENGINE = ReplicatedMergeTree(
    '/clickhouse/tables/{shard}/replicated_table',
    '{replica}'
)
PARTITION BY toYYYYMM(EventDate)
ORDER BY (EventDate, UserId);

Итоги миграции

После полного перевода кластера на ClickHouse Keeper мы получили:

отказ от отдельного ZooKeeper;
упрощённую инфраструктуру (меньше сервисов для поддержки);
стабильную репликацию;
более простой мониторинг через системные таблицы ClickHouse.

🤝 Услуги опытных и квалифицированных системных администраторов

🔧 Обеспечим бесперебойную работу серверов и IT-инфраструктуры.

⚙️ Настроим, восстановим и оптимизируем системы для максимальной производительности и надёжности.

🕐 Оперативная поддержка, мы всегда на связи!

Перейти на сайт
Написать в Telegram

Системное администрирование без паники

Поиск по этому блогу

Обновление ClickHouse и миграция с ZooKeeper на ClickHouse Keeper: практическое руководство

Введение

Исходная инфраструктура

План миграции

Настройки ZooKeeper (старый вариант)

Настройки ClickHouse Keeper (новый вариант)

Пример настройки `system.clusters`

Проверка работы Keeper

Реплицируемая таблица

Итоги миграции

Комментарии

Отправить комментарий

Популярные сообщения из этого блога

Настройка и подключение IPSec в Windows

Debian 10: Подключение и Настройка Архивных Репозиториев для Работы

Debian 11: настройка сети и имени хоста /etc/network/interfaces, NetworkManager и systemd-networkd

Системное администрирование без паники

Обновление ClickHouse и миграция с ZooKeeper на ClickHouse Keeper: практическое руководство

Введение

Исходная инфраструктура

План миграции

Настройки ZooKeeper (старый вариант)

Настройки ClickHouse Keeper (новый вариант)

Пример настройки system.clusters

Проверка работы Keeper

Реплицируемая таблица

Итоги миграции

Комментарии

Отправить комментарий

Популярные сообщения из этого блога

Настройка и подключение IPSec в Windows

Debian 10: Подключение и Настройка Архивных Репозиториев для Работы

Debian 11: настройка сети и имени хоста /etc/network/interfaces, NetworkManager и systemd-networkd

Пример настройки `system.clusters`