Конференция завершена. Ждем вас на РИТ++ в следующий раз!

Использование materialized views, Aggregatiing* таблиц и *State функций в ClickhouseБазы данных

Программный комитет ещё не принял решения по этому докладу
Константин Игнатов
Qrator Labs CZ s.r.o.

Выпускник МГТУ им. Баумана и Высшей Школы Экономики.
Инженер-разработчик в отделе исследований Qrator Labs.

@podshumok
Тезисы

AggregatingMergeTree таблицы — это один из самых мощных инструментов Clickhouse. Но в то же время, пожалуй, один из самых сложных в понимании и применении. Эти движки (engines) реализуют концепцию состояния агрегатной функции и соответствующие принципы, которым посвящён доклад.

Мы на примерах рассмотрим, как эти принципы используется для решения нескольких видов задач, как то:
- автоматический сбор метрик при сохранении "сырых" данных (например, каких-либо структурированных логов);
- обработка данных: распределённая или же отложенная (то есть распределённая во времени).

Во всех этих случаях подразумевается, что с исходными ("сырыми") данными мы в будущем иметь дело не хотим — либо они быстро ротируются, либо вообще не сохраняются, либо занимают слишком много места для того, чтобы даже Clickhouse мог их прочитать и обработать за приемлемое время.
Почему? Например, потому что нам нужен результат за секунду, в то время как, даже при идеальных условиях и несмотря на сжатие, одно только чтение нужной части данных с диска займёт несколько минут.

Для всего перечисленного я покажу варианты схем таблиц и запросов, и мы обсудим, как это всё работает, и какие можно встретить подводные камни.

Другие доклады секции Базы данных