Конференция завершена. Ждем вас на РИТ++ в следующий раз!

Elasticsearch: тюнинг аналитического кластераБазы данных

Программный комитет ещё не принял решения по этому докладу
Андрей Григорьев
Фрилансер

Был сисадмином и NOC, разработчиком и DevOps. Работал в государственных учреждениях, в Яндексе, в успешных и не очень стартапах. Текущая область интересов - Data Engineering и Machine Learning.

http://t.me/eigrad
Тезисы

Архитектура кластера, зачем использовать разные ноды для разных ролей. Выбор схемы именования индексов и расчет количества шардов на основе имеющихся аппаратных ресурсов, требований к производительности, количества данных и их природы.

Увеличиваем скорость заливки данных:
- подстройка параметров хранения и индексации
- использование альтернативного формата сериализации в запросах
- выполняем работу за Elasticsearch - лезем в исходники за информацией

Другие доклады секции Базы данных