Подключение BladePipe к ClickHouse
BladePipe — это инструмент для сквозной интеграции данных в реальном времени с субсекундной задержкой, обеспечивающий бесперебойный поток данных между платформами.
ClickHouse — один из готовых коннекторов BladePipe, который позволяет пользователям автоматически передавать данные из различных источников в ClickHouse. На этой странице пошагово показано, как загружать данные в ClickHouse в реальном времени.
Поддерживаемые источники
В настоящее время BladePipe поддерживает интеграцию данных в ClickHouse из следующих источников:
- MySQL/MariaDB/AuroraMySQL
- Oracle
- PostgreSQL/AuroraPostgreSQL
- MongoDB
- Kafka
- PolarDB-MySQL
- OceanBase
- TiDB
В дальнейшем планируется поддержка дополнительных источников.
Загрузите и запустите BladePipe
-
Войдите в BladePipe Cloud.
-
Следуйте инструкциям в Install Worker (Docker) или Install Worker (Binary), чтобы загрузить и установить воркер BladePipe.
Либо вы можете загрузить и развернуть BladePipe Enterprise.
Добавьте ClickHouse как целевую систему
-
BladePipe поддерживает ClickHouse версии
20.12.3.3и выше. -
Чтобы использовать ClickHouse как целевую систему, убедитесь, что у пользователя есть разрешения SELECT, INSERT и общие DDL-разрешения.
-
В BladePipe нажмите "DataSource" > "Add DataSource".
-
Выберите
ClickHouse, заполните настройки, указав хост и порт ClickHouse, имя пользователя и пароль, затем нажмите "Test Connection".
-
Нажмите "Add DataSource" внизу страницы — экземпляр ClickHouse будет добавлен.
Добавьте MySQL как источник
В этом руководстве в качестве источника используется экземпляр MySQL, и показан процесс загрузки данных из MySQL в ClickHouse.
Чтобы использовать MySQL как источник, убедитесь, что у пользователя есть необходимые разрешения.
-
В BladePipe нажмите "DataSource" > "Add DataSource".
-
Выберите
MySQL, заполните настройки, указав хост и порт MySQL, имя пользователя и пароль, затем нажмите "Test Connection".
-
Нажмите "Add DataSource" внизу страницы — экземпляр MySQL будет добавлен.
Создайте конвейер
-
В BladePipe нажмите "DataJob" > "Create DataJob".
-
Выберите добавленные экземпляры MySQL и ClickHouse и нажмите "Test Connection", чтобы убедиться, что BladePipe подключен к ним. Затем выберите базы данных для переноса.

-
Для типа DataJob выберите "Incremental" вместе с опцией "Full Data".

-
Выберите таблицы для репликации.

-
Выберите столбцы для репликации.

-
Подтвердите создание DataJob — после этого DataJob запустится автоматически.

Проверка данных
- Остановите запись данных в экземпляр MySQL и дождитесь завершения слияния данных в ClickHouse.
Примечание
Поскольку время автоматического слияния в ClickHouse непредсказуемо, вы можете запустить слияние вручную, выполнив команду
OPTIMIZE TABLE xxx FINAL;. Обратите внимание, что ручное слияние может завершиться неудачно.
В качестве альтернативы можно выполнить команду CREATE VIEW xxx_v AS SELECT * FROM xxx FINAL;, чтобы создать представление и выполнять запросы к нему для гарантии полного слияния данных.
:::
- Создайте задание проверки данных (Verification DataJob). После завершения задания проверьте результаты, чтобы убедиться, что данные в ClickHouse идентичны данным в MySQL.
