Подходы к реализации шардинга в современных [No]SQL-системахБазы данных

Доклад принят в программу конференции

Picodata

Основатель Picodata.

Тезисы

В докладе попытаюсь сравнить архитектуру и технические решения, используемые в современных SQL- и NoSQL-системах, в частности, Couchbase, MongoDB, Cassandra, CockroachDB и, конечно, Tarantool.

Как разбиваются данные - по диапазону, хэш-функции или bucket id? Как выбирается размер бакета? Какая хэш-функция используется? Как происходит перебалансировка при переполнении? Где хранится информация о распределении данных и их текущим местоположении? Есть ли выделенный программный компонент для роутинга запросов, или роутинг осуществляется самими узлами хранения? Ответы на эти вопросы, а также на вопрос, почему разработчики приняли то или иное решение, плюсы и минусы различных подходов я раскрою в своём докладе.

P.S. Несколько лет назад мы с Алексеем Рыбаком делали совместный доклад про шардинг с использованием MySQL или PostgreSQL. Видео и слайды доклада можно найти здесь: https://www.youtube.com/watch?v=MhGO7BBqSBU&t=2317s
https://habrahabr.ru/company/oleg-bunin/blog/313366/

Новый доклад - на старую тему, но совсем с другой стороны: я буду рассказывать про устройство готовых решений, а не про то, как приготовить решение самому.

MongoDB

Tarantool

Базы данных / другое

Подходы к реализации шардинга в современных [No]SQL-системахБазы данных

Другие доклады секции Базы данных