{"time":1747302610951,"blocks":[{"id":"m80MlJEX7x","type":"poll","data":{"id":"6825b699fac7efc67365b0f8"}},{"id":"244dupziLT","type":"paragraph","data":{"text":"Когда данных становится слишком много для одного сервера, на помощь приходит шардинг — способ разбить базу на части и разложить их по разным машинам. Это помогает масштабироваться, ускоряет запросы и снижает нагрузку. Но вместе с плюсами шардинг приносит и новые сложности: как искать данные, как проводить транзакции между серверами, как считать агрегаты. Сегодня разбираемся, как всё устроено, какие бывают подходы к шардингу и что нужно учесть при его внедрении."}},{"id":"8vmcDddSMW","type":"header2","data":{"text":"Как работает database sharding","level":2},"tunes":{}},{"id":"HMoepHGEXu","type":"paragraph","data":{"text":"Database sharding (шардирование базы данных) — это техника горизонтального масштабирования, при которой большая база разделяется на несколько частей. Их называют шардами. Эти шарды распределяются по другим серверам и связываются в одну систему. Рассмотрим подробнее."}},{"id":"SPWW31qnuk","type":"header3","data":{"text":"Принцип: разбиение данных на независимые сегменты (шарды)","level":3},"tunes":{}},{"id":"IimIOfLk-j","type":"paragraph","data":{"text":"Каждый шард работает как отдельная независимая база данных. Ключевым элементом здесь выступает ключ шардирования (shard key). Это правила, которые определяют, в какой именно шард попадёт конкретная строка данных."}},{"id":"cMPR-mtDkP","type":"paragraph","data":{"text":"Например, мы можем задать правило: если у нас есть user_id и его значение меньше тысячи, то данные попадают в шард 1, если значение больше тысячи, то в шард 2."}},{"id":"7b3940b9-aa27-4774-97bf-a161498c3c16","type":"banner-blank","data":{}},{"id":"ADcrD87JDS","type":"paragraph","data":{"text":"Главная цель такого разделения — добиться независимости шардов. В идеале запрос, касающийся данных одного пользователя (или одного документа, заказа и т. д.), должен обрабатываться только одним шардом."}},{"id":"uP-0LReEdc","type":"paragraph","data":{"text":"Так, мы можем параллельно обрабатывать много запросов и увеличивать пропускную способность системы."}},{"id":"M4ypQsYSwJ","type":"header3","data":{"text":"Общая архитектура: клиент — роутер — шард","level":3},"tunes":{}},{"id":"wwgBXT74Vz","type":"paragraph","data":{"text":"Чтобы приложение могло понять, в какой шард отправить запрос, нужна особая архитектура."}},{"id":"ljYbyGiIDd","type":"paragraph","data":{"text":"Клиент: Программа на стороне пользователя, которая отправляет стандартный запрос к базе данных (например, SELECT * FROM users WHERE user_id = 123)."}},{"id":"s1Jlkp6MIc","type":"paragraph","data":{"text":"Маршрутизатор запросов или роутер (Query Router): Это что-то вроде посредника между клиентом и шардом, который выполняет роль диспетчера. Он принимает запрос, при помощи sharding ключа определяет, что это за данные, в какой шард и с какой целью их надо отправить. Далее он отправляет запрос на нужный шард."}},{"id":"xrLwvzjSz8","type":"paragraph","data":{"text":"Шард (Shard): Получает запрос, выполняет и возвращает результат обратно маршрутизатору, который затем передаёт его клиенту."}},{"id":"3hWPfE0cuc","type":"code","data":{"code":"[ Клиент (не требует сложной логики работы с шардами)]\n |\n v\n[ Роутер (Маршрутизатор) ]\n |\n ┌───────┬────────┐\n v v v \n[ Шард 1 ][ Шард 2 ][ Шард 3 ]","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"G6S8gadTrH","type":"paragraph","data":{"text":"Благодаря такой архитектуре мы можем «скрыть» database sharding на стороне клиента и обеспечить централизованное управление запросами. Не надо сильно заморачиваться с кодом и архитектурой приложений, ведь вся логика будет на серверах."}},{"id":"x7EfSEF6vg","type":"header3","data":{"text":"Основные компоненты: шард, маршрутизатор, реплика-сеты","level":3},"tunes":{}},{"id":"_4lp2ERLAv","type":"paragraph","data":{"text":"Мы уже рассмотрели, что такое шарды и маршрутизаторы, теперь обратим внимание на реплика-сеты. Это сервера с копией данных шардов. Если главный сервер шарда выходит из строя, одна из реплик автоматически берёт на себя его роль. Так, мы можем повысить отказоустойчивость нашей системы."}},{"id":"c5514e23-802d-44c9-9004-c985f230274f","type":"banner-blank","data":{}},{"id":"Tkngy8Vbwg","type":"paragraph","data":{"text":"Ещё в этой схеме обычно применяют серверы конфигурации. Это отдельный компонент, который хранит метаданные о шардах. Он содержит информацию о том, какие диапазоны ключей или хеши какому шарду соответствуют. Маршрутизаторы периодически обращаются к серверам конфигурации, чтобы получить актуальную карту распределения данных и лучше понять, в какой шард направить тот или иной запрос."}},{"id":"Bl_POMf_32","type":"code","data":{"code":"[ Клиент ]\n |\n v\n[ Роутер (маршрутизатор) ]\n |\n v \n[ Конфигурационный сервер ] (запрос карты шардов)\n |\n v\n┌────────────────────────────────────────────┐\n│ Шард 1 Шард 2 Шард 3 │\n│ (реплика-сеты) (реплика-сеты) (реплика-сеты) │\n│ │\n│ ┌───────────────┐ ┌───────────────┐ ┌───────────────┐\n│ │ Primary │ │ Primary │ │ Primary │\n│ Replica 1 Replica 1 Replica 1 \n│ │ Replica 2 │ │ Replica 2 │ │ Replica 2 │\n│ └───────────────┘ └───────────────┘ └───────────────┘\n└────────────────────────────────────────────┘\n","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"98UGKK44rz","type":"header2","data":{"text":"Виды шардинга","level":2},"tunes":{}},{"id":"GqhYX1P7pQ","type":"paragraph","data":{"text":"Существует много вариантов, как разбить базу данных на шарды. Этот выбор будет зависеть от множества факторов: структуры данных, типичных запросов, требований к производительности и сложности управления. Разберём основные виды шардинга."}},{"id":"MYa_MwIlr8","type":"header3","data":{"text":"Горизонтальный sharding (по строкам): самый популярный","level":3},"tunes":{}},{"id":"CFg5nBojGZ","type":"paragraph","data":{"text":"При горизонтальном шардинге мы «нарезаем» нашу базу данных по строкам. Допустим, у нас таблица с клиентами. Мы задаём диапазон ключу шардирования с user_id от 1 до 1 000 000. Данные в этом диапазоне, построчно будут храниться в шадре 1. Если user_id попадает в диапазон от 1 000 001 до 2 000 000, то эти данные отправляем на шадр 2. И так далее."}},{"id":"LpwVO9fQb2","type":"image","data":{"alt":"Что такое Sharding","title":"Горизонтальный шардинг","caption":"Горизонтальный шардинг","file":{"url":"https://media.tproger.ru/user-uploads/105039/2025-04-30/ced7c0e7-fcbb-4f28-870b-91682a38f689.png","id":49097},"stretched":false,"withBackground":false,"withBorder":false,"width":1536,"height":1024,"optimizedFile":{"original":"https://media.tproger.ru/user-uploads/105039/2025-04-30/ced7c0e7-fcbb-4f28-870b-91682a38f689.png","alt":"Как работает Sharding в базах данных? 1","dimensions":{"width":1536,"height":1024},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/ZH3MuHph8RvukpcZJmWgfyhT7pZva74UzHD5m8qiZa0/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9jZWQ3YzBlNy1mY2JiLTRmMjgtODcwYi05MTY4MmEzOGY2ODkucG5n","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/_b6SW0Oy21dAsvjlzc-fpF2WzEcCPFfdNTWC_uxr4T4/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9jZWQ3YzBlNy1mY2JiLTRmMjgtODcwYi05MTY4MmEzOGY2ODkucG5n","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/2EQScSrJCGpYZ8GNKdSE0_Clz4M_7_tYOcNicK8ZPGE/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9jZWQ3YzBlNy1mY2JiLTRmMjgtODcwYi05MTY4MmEzOGY2ODkucG5n","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/zaaEVYXPk_QvTLohVo5F16iYHPOBNZmXUslGh3-UtHg/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9jZWQ3YzBlNy1mY2JiLTRmMjgtODcwYi05MTY4MmEzOGY2ODkucG5n","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/HMqUYJToEY9rfMcKnDsoADubV3pbx96puan8DR3mnOo/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9jZWQ3YzBlNy1mY2JiLTRmMjgtODcwYi05MTY4MmEzOGY2ODkucG5n","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/USjjpHdi5txCgIRojZ8047Pl_2uJsTdXHNePf7HGCa4/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9jZWQ3YzBlNy1mY2JiLTRmMjgtODcwYi05MTY4MmEzOGY2ODkucG5n","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/aED_4B4TOLUjbBAUhgTEbOOULuDMeeazBqU2Dw10jqU/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9jZWQ3YzBlNy1mY2JiLTRmMjgtODcwYi05MTY4MmEzOGY2ODkucG5n","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/wrH4rDeRHWXanp3Ug6GsuT1KjjZf1PzELLDCBqfawlU/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9jZWQ3YzBlNy1mY2JiLTRmMjgtODcwYi05MTY4MmEzOGY2ODkucG5n","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"Na2TfuqA-z","type":"paragraph","data":{"text":"Благодаря этому способу мы можем равномерно распределять данные, и нам будет проще масштабировать систему при помощи создания новых шадров и добавления серверов."}},{"id":"DFh0pArHyh","type":"paragraph","data":{"text":"Горизонтальный sharding — идеальный вариант, когда основная проблема — это огромное количество строк в таблицах и высокая нагрузка на чтение/запись."}},{"id":"d4Tv5GI7fz","type":"header3","data":{"text":"Вертикальный шардинг (по столбцам): разделение по функциональности","level":3},"tunes":{}},{"id":"bUxXINe6dZ","type":"paragraph","data":{"text":"Если горизонтальный шардинг режет таблицу поперёк (по строкам), то вертикальный — вдоль, разделяя столбцы. Таблица делится на несколько с меньшим количеством столбцов. Обычно они группируются по частоте использования или по смысловой нагрузке. Например, в таблице юзеров можно выделить часто запрашиваемые user_id, username, email в одну таблицу, а редко используемые — biography, preferences, last_login_details — в другую. "}},{"id":"sWAx5T7qDi","type":"code","data":{"code":" +---------------------------------------------------------------+\n | Таблица users |\n | user_id | username | email | biography | preferences | login |\n +---------------------------------------------------------------+\n ↘ ↙\n +-------------------------+ +----------------------------------------+\n | user_id | username | email | biography | preferences | login |\n | (шард с частыми запросам) | |(шард с редкими запросами) |\n +-------------------------+ +----------------------------------------+\n\n","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"B_lhtmxHhQ","type":"paragraph","data":{"text":"Это полезно, когда у таблицы очень много столбцов или когда группы столбцов имеют совершенно разные паттерны доступа. Мы можем улучшить производительность запросов, так как они работают с таблицами меньшей ширины."}},{"id":"vhM2dPzKD0","type":"header3","data":{"text":"Directory-based sharding: использование хеш-таблицы маршрутов","level":3},"tunes":{}},{"id":"cOV_-4IPIG","type":"paragraph","data":{"text":"При горизонтальном и вертикальном шардинге маршрутизатор часто сам, при помощи специальных функций, определяет, какие данные в какой шадр отправить. Это не всегда удобно. При таком подходе мало гибкости. Поэтому был придуман вид шардинга, который опирается на хеш-таблицы и называется directory-based. Его суть в том, что мы создаём централизованный каталог, который связывает наши ключи шардирования и шарды."}},{"id":"Mh66e6vX9W","type":"paragraph","data":{"text":"Вот пример того, как это работает:"}},{"id":"HlZkHNFPnl","type":"image","data":{"alt":"Как работает шардинг в базах данных","title":"Directory-based sharding","caption":"Directory-based sharding","file":{"url":"https://media.tproger.ru/user-uploads/105039/2025-04-30/8dc151d5-591c-4a6c-8564-898afc26aaa1.png","id":49098},"stretched":false,"withBackground":false,"withBorder":false,"width":1536,"height":1024,"optimizedFile":{"original":"https://media.tproger.ru/user-uploads/105039/2025-04-30/8dc151d5-591c-4a6c-8564-898afc26aaa1.png","alt":"Как работает Sharding в базах данных? 2","dimensions":{"width":1536,"height":1024},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/qQMN75kaBsmsoe9ZNekjwmt-iFbQhoJIa3QwDlGSNFE/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC84ZGMxNTFkNS01OTFjLTRhNmMtODU2NC04OThhZmMyNmFhYTEucG5n","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/bsdTtanlq7dyn-XDdXt6PLTmlrmxaRhPCw3AusFB790/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC84ZGMxNTFkNS01OTFjLTRhNmMtODU2NC04OThhZmMyNmFhYTEucG5n","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/khSxijDf6x-HDTa6v9_1PxA3POWePOTDnjIrN6rU9Ag/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC84ZGMxNTFkNS01OTFjLTRhNmMtODU2NC04OThhZmMyNmFhYTEucG5n","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/iuMzwMeXTjWSG1yq7P3G-EsyfQVldLmz2kCOb44DGKE/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC84ZGMxNTFkNS01OTFjLTRhNmMtODU2NC04OThhZmMyNmFhYTEucG5n","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/ofhicd0I1zp6wI6DHBDJZwN4kTTMo4gDkh7egJ6JhIA/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC84ZGMxNTFkNS01OTFjLTRhNmMtODU2NC04OThhZmMyNmFhYTEucG5n","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/XiPt2mf5Ny4A0dgxi_1cbpAtdhZGS4WQyZ-oGqGMiF0/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC84ZGMxNTFkNS01OTFjLTRhNmMtODU2NC04OThhZmMyNmFhYTEucG5n","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/oUTAqi49xNqWMA294rHPKjo3cgHOOh7nkKI9EZN95hI/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC84ZGMxNTFkNS01OTFjLTRhNmMtODU2NC04OThhZmMyNmFhYTEucG5n","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/-DNfMhuTQSkXJiNoxUux5FbwrSYB2QARELFgmx-mVpk/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC84ZGMxNTFkNS01OTFjLTRhNmMtODU2NC04OThhZmMyNmFhYTEucG5n","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"5Q8qyuBp5A","type":"list","data":{"style":"unordered","items":["Клиентское приложение отправляет запрос (например, получить данные для order_id = 98765).","Маршрутизатор запросов перехватывает его.","Маршрутизатор обращается к каталогу: с запросом, где найти order_id = 98765.","Каталог ищет в своей таблице соответствий правило, под которое подпадает order_id = 98765. Для быстрого поиска он часто использует эффективные структуры данных, такие как хеш-таблицы или B-деревья (это внутренняя деталь реализации самого каталога).","Допустим, каталог находит правило «Диапазон order_id 90000-99999 → Shard-3» и сообщает это маршрутизатору.","Маршрутизатор перенаправляет исходный запрос на Shard-3."]}},{"id":"FFR0Iae9d2","type":"paragraph","data":{"text":"При таком подходе удобнее перемещать данные между шардами, изолировать их и менять логику."}},{"id":"0vS8DCtC4W","type":"header3","data":{"text":"Range-based sharding: разбиение по диапазонам значений","level":3},"tunes":{}},{"id":"CnIBBVBKkY","type":"paragraph","data":{"text":"По сути, это тот же горизонтальный sharding с разбиением данных на кусочки по строкам при помощи диапазонов."}},{"id":"yUA5WpCvVX","type":"paragraph","data":{"text":"Администратор системы (или автоматизированный инструмент) определяет границы диапазонов для ключа шардинга. Маршрутизатор получает запрос, смотрит на значение этого ключа и сравнивает его с известными диапазонами, чтобы определить целевой шард."}},{"id":"XOEWdp6SDG","type":"paragraph","data":{"text":"Этот способ простой, логичный и отлично подходит для работы с данными за определённый период. Но у него есть проблема. Допустим, мы запустили форум и проводим шардирование по трём ключам:"}},{"id":"vU1r0XTap_","type":"list","data":{"style":"unordered","items":["id от 1 до 1000 — шард 1;","id от 1001 до 2000— шард 2;","id от 2001 до 3000 — шард 3."]}},{"id":"TBjgQfO9xD","type":"paragraph","data":{"text":"Когда пользователи начнут регистрироваться, у нас будет активен шард 1, потом шард 2. Далее вся нагрузка перейдёт на шард 3. Они не будут одновременно равномерно работать. Это может стать проблемой при оптимизации."}},{"id":"llfG7_zNT6","type":"header3","data":{"text":"Hash-based sharding: равномерное распределение по хешу ключа","level":3},"tunes":{}},{"id":"ZrEY08D-Zn","type":"paragraph","data":{"text":"Этот подход помогает добиться максимально равномерного распределения нагрузки по всем шардам. Работает следующим образом:"}},{"id":"997aa819-ad96-470a-b206-a877970e7bb2","type":"banner-blank","data":{}},{"id":"u3h6KqbRwN","type":"paragraph","data":{"text":"Берём значение ключа для конкретной строки данных (например, user_id = 2001)."}},{"id":"ZwYXAmUPdg","type":"paragraph","data":{"text":"Применяем к нему хеш-функцию. Хеш-функция (например, MD5, SHA-1, MurmurHash) — это алгоритм, который превращает входные данные (наш user_id) в строку или число фиксированной длины (хэш), которое выглядит почти случайно. Даже небольшое изменение на входе (например, user_id = 2001 и user_id = 2002) обычно даёт совершенно разные хеши."}},{"id":"q_C1xk9mHU","type":"paragraph","data":{"text":"Вычисляем номер шарда. Чаще всего делим значение хеша на количество шардов и берём остаток от деления. Например, 548291 % 3 = 2. Далее в зависимости от остатка распределяем данные по шардам. Значение с остатком 2 пойдёт в шард 2, если остаток 1, то в шард 1 и так далее."}},{"id":"qa3ppxRYHG","type":"image","data":{"alt":"Что такое Sharding","title":"Hash-based sharding","caption":"Hash-based sharding","file":{"url":"https://media.tproger.ru/user-uploads/105039/2025-04-30/bb6c10d3-0c7a-4499-ab9a-11d2d3c34be0.jpg","id":49099},"stretched":false,"withBackground":false,"withBorder":false,"width":1671,"height":809,"optimizedFile":{"original":"https://media.tproger.ru/user-uploads/105039/2025-04-30/bb6c10d3-0c7a-4499-ab9a-11d2d3c34be0.jpg","alt":"Как работает Sharding в базах данных? 3","dimensions":{"width":1671,"height":809},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/5v3sB6677qkZZssrYkA_pXuS9Lqq5yvZtCPtQBzZsYI/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9iYjZjMTBkMy0wYzdhLTQ0OTktYWI5YS0xMWQyZDNjMzRiZTAuanBn","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/GKgkmrUMicr_8qrk5nCOa_QKuZaHhQyL5OsKcJRAc7I/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9iYjZjMTBkMy0wYzdhLTQ0OTktYWI5YS0xMWQyZDNjMzRiZTAuanBn","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/w2_lAI6FbOmTMZZxWQvYVJvUFAM5stQgqgnOz6NlFqg/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9iYjZjMTBkMy0wYzdhLTQ0OTktYWI5YS0xMWQyZDNjMzRiZTAuanBn","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/4ieEAqJJsuBH826KV3C96N3UYxekpigxD5-HeGihmvw/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9iYjZjMTBkMy0wYzdhLTQ0OTktYWI5YS0xMWQyZDNjMzRiZTAuanBn","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/Ns6o3LGzAtfrCXoJNaZNXkRyki_zmex0_Gq3jKuhR7Y/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9iYjZjMTBkMy0wYzdhLTQ0OTktYWI5YS0xMWQyZDNjMzRiZTAuanBn","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/9YvyAU97cvi7yjLo_f-uhJJ9vnTj2sBaeFBr1gd8l_4/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9iYjZjMTBkMy0wYzdhLTQ0OTktYWI5YS0xMWQyZDNjMzRiZTAuanBn","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/9G0HVVimg1dKaqCIPq_cv54DnYvV7XevnzU-LS81H1g/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9iYjZjMTBkMy0wYzdhLTQ0OTktYWI5YS0xMWQyZDNjMzRiZTAuanBn","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/pWpjmevF8KqCyZWVHjkSXF5-AXa3a8Hx3TbSGzwoqDM/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC9iYjZjMTBkMy0wYzdhLTQ0OTktYWI5YS0xMWQyZDNjMzRiZTAuanBn","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"vVO_MUBjYt","type":"paragraph","data":{"text":"Так мы получаем более равномерное распределение данных. Но из минусов — в такой базе сложно обрабатывать диапазоны и добавлять новые шарды в систему."}},{"id":"vn6u-1nWcC","type":"header2","data":{"text":"Примеры реализации","level":2},"tunes":{}},{"id":"7GCRDyR4sa","type":"header3","data":{"text":"MongoDB: встроенная поддержка шардинга","level":3},"tunes":{}},{"id":"C12CS7lJou","type":"paragraph","data":{"text":"MongoDB — это NoSQL база данных, которая была разработана с закосом на горизонтальное масштабирование. То есть она адаптирована к тому, чтобы работать на нескольких серверах и расширять это число по мере необходимости. Поэтому sharding здесь доступен из коробки, нам не надо заморачиваться со внешними расширениями."}},{"id":"P2wYzuBU13","type":"paragraph","data":{"text":"Рассмотрим пример, как настроить sharding и работать с ним:"}},{"id":"CUg6zGIvFx","type":"code","data":{"code":"// Шаг 1: Добавляем первый шард в кластер\nsh.addShard(\"rsShard1/shard1-node1.example.com:27017\");\n\n// Шаг 2: Выбираем базу данных и включаем для нее шардирование\nuse socialApp;\nsh.enableSharding(\"socialApp\");\n\n// Шаг 3: Шардируем коллекцию \"users\" по ключу user_id (Range-based)\nsh.shardCollection(\"socialApp.users\", { \"user_id\": 1 });\n\n// --- Sharding настроен. Теперь работаем с данными: ---\n\n// Шаг 4: Добавляем пользователей\ndb.users.insertMany([\n { user_id: 1, name: \"Алиса\", country: \"RU\" },\n { user_id: 2, name: \"Боб\", country: \"US\" },\n { user_id: 1000001, name: \"Чарли\", country: \"DE\" }\n]);\n\n// Шаг 5: Запрашиваем одного пользователя\ndb.users.findOne({ user_id: 1 });","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"yDwk4bwev1","type":"list","data":{"style":"unordered","items":["sh.addShard() — добавляем сервер в кластер как шард. MongoDB понимает, что может использовать этот сервер для хранения части данных.","use socialApp; sh.enableSharding(\"socialApp\") — переключаемся на базу данных «socialApp». При помощи команды sh.enableSharding() разрешаем шардинг в этой БД.","sh.shardCollection(\"socialApp.users\", { \"user_id\": 1 }) — применяем sharding к коллекции users. Мы указываем полное имя коллекции (socialApp.users) и ключ шарда ({ \"user_id\": 1 }). Цифра 1 означает, что мы используем шардинг по диапазонам. Эти диапазоны не нужно задавать вручную, MongoDB определяет их самостоятельно.","db.users.insertMany([...]) — вставляем данные в коллекцию users. MongoDB автоматически определяет, на какой шард поместить каждого пользователя.","db.users.findOne({ user_id: 1 }) — запрашиваем данные пользователя user_id = 1. Mongos сам определит, на каком шарде они находятся."]}},{"id":"VrtdNIE5Bx","type":"header3","data":{"text":"PostgreSQL + Citus","level":3},"tunes":{}},{"id":"Z9OFiNMmCd","type":"paragraph","data":{"text":"В PostgreSQL нет поддержки встроенного шардинга, поэтому приходится устанавливать на сервер Citus. Это популярное расширение, которое как раз добавляет возможности горизонтального масштабирования и шардинга. Оно превращает кластер стандартных серверов PostgreSQL в распределённую базу данных."}},{"id":"kSsEtaOX-d","type":"paragraph","data":{"text":"Посмотрим на пример использования SQL-команд для настройки шардинга с помощью Citus:"}},{"id":"l8cn99Cn9L","type":"code","data":{"code":"-- Шаг 1: Включаем расширение Citus для текущей базы данных\nCREATE EXTENSION citus;\n\n-- Шаг 2: Создаем таблицу для логов на узле-координаторе\nCREATE TABLE app_logs (\n log_id bigserial,\n service_name text NOT NULL, -- Ключ шардирования\n user_id int, -- Оставим для схожести, хотя может быть нерелевантно\n log_time timestamptz DEFAULT now(),\n message text,\n PRIMARY KEY (log_id, service_name) -- Ключ шардирования в PK\n);\n\n-- Шаг 3: Превращаем таблицу в распределенную (шардируем по service_name)\nSELECT create_distributed_table('app_logs', 'service_name');\n\n-- --- Таблица 'app_logs' теперь распределена. Работаем с данными: ---\n\n-- Шаг 4: Вставляем записи логов\nINSERT INTO app_logs (service_name, user_id, message) VALUES\n('auth-service', 12345, 'Login successful'),\n('payment-service', 67890, 'Payment processed'),\n('auth-service', 12345, 'Token refreshed'); -- Еще одна запись для auth-service\n\n-- Шаг 5: Запрашиваем логи для конкретного сервиса\nSELECT * FROM app_logs WHERE service_name = 'auth-service' LIMIT 10;\n\n-- Шаг 6: Запрашиваем количество логов по сервисам (аналогично старому GROUP BY)\nSELECT service_name, count(*) FROM app_logs GROUP BY service_name;","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"IbxvKeewtv","type":"list","data":{"style":"unordered","items":["CREATE EXTENSION citus; — активируем Citus в текущей базе данных.","CREATE TABLE app_logs (...) — создаём таблицу app_logs на узле-координаторе точно так же, как создали бы обычную таблицу в PostgreSQL.","SELECT create_distributed_table('app_logs', 'service_name'); — при помощи этой команды включаем sharding. Citus понимает, что таблицу app_logs нужно распределить по рабочим узлам, используя поле service_name как ключ шардинга. Citus по умолчанию применяет Hash-based sharding, то есть, равномерно распределяет по шардам при помощи хеш-функций.","INSERT INTO app_logs — добавляем данные логов. Citus перехватывает запрос, вычисляет хеш от значения service_name для каждой строки и распределяет данные по шардам.","SELECT ... FROM app_logs — запрашиваем данные. Если фильтруем по service_name (как в первом SELECT), Citus направит запрос на нужный шард."]}},{"id":"liXGWY_8j4","type":"header3","data":{"text":"MySQL + Vitess","level":3},"tunes":{}},{"id":"_eqKpBG1Z3","type":"paragraph","data":{"text":"MySQL — ещё одна система управления базами данных, у которой по умолчанию нет поддержки шардинга. Ситуацию спасает Vitess. Это система кластеризации баз данных — что-то вроде сторонней платформы, которая помогает организовать работу в рамках кластера. "}},{"id":"vUAEBVQRX5","type":"paragraph","data":{"text":"Vitess вместо прямых команд для шардинга определяет его правила в отдельном JSON-файле, который называется VSchema (Vitess Schema)."}},{"id":"QRzmGEy4jl","type":"paragraph","data":{"text":"Допустим, у нас есть база данных commerce. Вот как она выглядит в виде кода:"}},{"id":"1xahAeo9zD","type":"code","data":{"code":"-- Примерная структура таблицы 'orders' в MySQL\n-- (Эту таблицу нужно создать на всех MySQL-шардах)\nCREATE TABLE orders (\n order_id BIGINT NOT NULL AUTO_INCREMENT, -- Или управляется Vitess Sequence\n customer_id BIGINT NOT NULL, -- Ключ шардирования\n product_id BIGINT,\n order_date DATETIME DEFAULT CURRENT_TIMESTAMP,\n total_amount DECIMAL(10, 2),\n status VARCHAR(50),\n -- Другие поля заказа...\n\n PRIMARY KEY (order_id),\n INDEX idx_customer (customer_id) -- Индекс по ключу шардирования важен\n) ENGINE=InnoDB;","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"wa7IrPLVhV","type":"paragraph","data":{"text":"А вот так она выглядит в виде таблицы:"}},{"id":"RdvmFe0kK1","type":"image","data":{"alt":"Как работает шардинг в базах данных","title":"Пример структуры базы данных","caption":"Пример структуры базы данных","file":{"url":"https://media.tproger.ru/user-uploads/105039/2025-04-30/1dd751fd-aa6e-49f1-9883-6431fa53b08f.png","id":49100},"stretched":false,"withBackground":false,"withBorder":false,"width":976,"height":273,"optimizedFile":{"original":"https://media.tproger.ru/user-uploads/105039/2025-04-30/1dd751fd-aa6e-49f1-9883-6431fa53b08f.png","alt":"Как работает Sharding в базах данных? 4","dimensions":{"width":976,"height":273},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/w2geKEbwVPx8BThdfFdjel6UPLYEROFZ988022HOku0/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC8xZGQ3NTFmZC1hYTZlLTQ5ZjEtOTg4My02NDMxZmE1M2IwOGYucG5n","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/2wqsVJ8T_ZvUlMMMKcG0kXi5O56Ywvtf8X5K-d28OQs/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC8xZGQ3NTFmZC1hYTZlLTQ5ZjEtOTg4My02NDMxZmE1M2IwOGYucG5n","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/MOA8YdBKp6fnYWHs_5wYrS4r7h1OmuEoaXb8jQD2_rg/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC8xZGQ3NTFmZC1hYTZlLTQ5ZjEtOTg4My02NDMxZmE1M2IwOGYucG5n","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/49KSZie6wzibwrI-MBDGHF-ngJiMalPkOtkkvkIw8HY/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC8xZGQ3NTFmZC1hYTZlLTQ5ZjEtOTg4My02NDMxZmE1M2IwOGYucG5n","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/MuyNaKAeMzTsSZE1vf8P6XLYClNDhSsklvNycYUA9vI/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC8xZGQ3NTFmZC1hYTZlLTQ5ZjEtOTg4My02NDMxZmE1M2IwOGYucG5n","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/CB55sRyGOv0S9L7awCyLp2cQcmCrlOVjivz_9Cb8vYc/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC8xZGQ3NTFmZC1hYTZlLTQ5ZjEtOTg4My02NDMxZmE1M2IwOGYucG5n","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/tbDU3NZ44Txinsxchdd1zGFoeWmNlEUwtyQnZnFBvWk/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC8xZGQ3NTFmZC1hYTZlLTQ5ZjEtOTg4My02NDMxZmE1M2IwOGYucG5n","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/hWNZchnWV7QsIiYpcz5rI4F78zz4vd3cRS6N8wlAKKg/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VzZXItdXBsb2Fkcy8xMDUwMzkvMjAyNS0wNC0zMC8xZGQ3NTFmZC1hYTZlLTQ5ZjEtOTg4My02NDMxZmE1M2IwOGYucG5n","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"id":"e1Wtl8QFM8","type":"paragraph","data":{"text":"В базе данных есть таблица orders, её мы и хотим шардировать по customer_id при помощи хеширования (hash-based sharding). "}},{"id":"T-fpW_cjB5","type":"paragraph","data":{"text":"Файл VSchema (vschema.json) может выглядеть примерно так:"}},{"id":"wecTGUUpOa","type":"code","data":{"code":"// --- Пример VSchema для шардирования таблицы orders ---\n{\n \"sharded\": true, // Указываем, что Keyspace 'commerce' шардирован\n \"vindexes\": {\n // Определяем \"виртуальный индекс\" (vindex) для ключа шардирования\n \"hash_customer_id\": {\n \"type\": \"hash\" // Используем стандартный хэш-индекс Vitess\n }\n },\n \"tables\": {\n // Определяем правила для таблицы \"orders\"\n \"orders\": {\n // Указываем, какой vindex использовать для шардирования\n \"column_vindexes\": [\n {\n \"column\": \"customer_id\", // Шардируем по этому столбцу\n \"name\": \"hash_customer_id\" // Используем хэш-индекс для customer_id\n }\n ]\n // Опционально: Настройка автоинкремента через Vitess Sequence\n // \"auto_increment\": {\n // \"column\": \"order_id\",\n // \"sequence\": \"orders_seq\"\n // }\n }\n // Могут быть определения для других таблиц (products, customers и т.д.)\n }\n}","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"w3hE43JZV2","type":"list","data":{"style":"unordered","items":["\"sharded\": true — указываем, что база данных шардирована.","\"vindexes\" — определяем hash_index типа hash, который будет использовать хеш-функцию для распределения.","\"tables\" — описываются правила для конкретных таблиц.","\"orders\" — настраиваем таблицу orders.","\"column_vindexes\" — определяем, какой столбец является ключом (\"column\": \"customer_id\") и какой vindex (\"name\": \"hash_customer_id\") использовать для него."]}},{"id":"7DoSypgREX","type":"header2","data":{"text":"Проблемы шардирования","level":2},"tunes":{}},{"id":"la8RYOksIa","type":"header3","data":{"text":"Перераспределение шардов (resharding)","level":3},"tunes":{}},{"id":"vBS9MQ8ldN","type":"paragraph","data":{"text":"Со временем может потребоваться изменить количество шардов или способ разделения данных. Например, добавить серверы для увеличения мощности или изменить ключ шардирования. Этот процесс называется решардингом."}},{"id":"5qlS8x0XQz","type":"paragraph","data":{"text":"При решардинге часто приходится перегонять большие объёмы данных между серверами. Если используется хеш-шардинг, и мы меняем количество шардов, то пересчитываются ключи, по которым распределяются данные."}},{"id":"AJyUYLH7_C","type":"paragraph","data":{"text":"Например, раньше у нас было 4 шарда. Мы брали user_id, например 9, делили на 4 и получали остаток — 1. Значит, данные шли на шард номер 1. После масштабирования стало 5 шардов, и 9 % 5 = 4 — теперь те же данные должны храниться на шардe 4."}},{"id":"S7xWKth-kX","type":"paragraph","data":{"text":"Такое перемещение затратно по ресурсам: грузит сеть, диски, может занять часы или даже дни. Иногда для этого приходится останавливать запись, что делает процесс ещё рискованнее."}},{"id":"xzpp7Wus7f","type":"header3","data":{"text":"Неравномерная нагрузка (hot shards)","level":3},"tunes":{}},{"id":"5EGlgL2Ijs","type":"paragraph","data":{"text":"Вспомним вид шардирования Range-based sharding. Это когда мы разбиваем данные по диапазонам. У нас был пример выше с форумом и шардингом user_id:"}},{"id":"75HWEDyrmv","type":"list","data":{"style":"unordered","items":["id от 1 до 1000 — шард 1;","id от 1001 до 2000— шард 2;","id от 2001 до 3000 — шард 3."]}},{"id":"utMUGM8TQR","type":"paragraph","data":{"text":"Мы столкнулись с проблемой, что шард 1 и шард 2 после завершения диапазонов простаивали, а вся новая нагрузка приходилась на шард 3."}},{"id":"b522dae5-4118-4715-b536-dca0fbedca24","type":"banner-blank","data":{}},{"id":"W0Z_JzhgtR","type":"paragraph","data":{"text":"Такую проблему называют горячим шардом (hot shards). Производительность всей системы начинает зависеть от самого загруженного шарда. Преимущества шардирования снижаются."}},{"id":"jx9TpAoFp_","type":"paragraph","data":{"text":"Чтобы этого избежать, приходится либо более въедливо продумывать ключи шардирования, либо вручную разделять слишком нагруженный шард."}},{"id":"h4LabIY1yy","type":"header3","data":{"text":"Сложности с глобальными транзакциями и агрегациями","level":3},"tunes":{}},{"id":"VjYJK93w8n","type":"paragraph","data":{"text":"Допустим, нужно перевести деньги со счёта А на счёт Б — операция состоит из двух шагов: списание и зачисление. Транзакция позволяет объединить их в единое целое: либо всё выполнится, либо ничего. Это защищает от потери данных и ошибок. В классических базах данных за это отвечают принципы ACID — они гарантируют надёжность в пределах одного сервера."}},{"id":"EDBWbsGjvz","type":"paragraph","data":{"text":"Но если счёт А находится на одном шарде, а счёт Б — на другом, стандартная транзакция не сработает. Между независимыми серверами нельзя просто так обеспечить ACID-гарантии. Для этого нужны сложные и медленные механизмы координации, например двухфазный коммит (2PC). Либо приходится идти на компромисс и использовать eventual consistency — когда данные приходят в согласованное состояние с небольшой задержкой. Например, деньги уже списались, но ещё не зачислились."}},{"id":"lBTtWLCBP4","type":"paragraph","data":{"text":"Аналогичная проблема и с агрегациями: посчитать сумму продаж или число пользователей уже не получится одной SQL-командой. Каждый шард сначала считает свою часть, а потом результат нужно собрать и объединить — это требует дополнительной координации и может усложниться при фильтрации или группировках."}},{"id":"busjitlD9W","type":"header3","data":{"text":"Сложность управления и мониторинга","level":3},"tunes":{}},{"id":"T6MrCqKxSd","type":"paragraph","data":{"text":"Шардированный кластер — это распределённая система, управлять которой сложнее, чем одним сервером."}},{"id":"966b7871-e5fd-4093-a17f-5837e286d5e8","type":"banner-blank","data":{}},{"id":"6ZQ0ZZ1Jgt","type":"paragraph","data":{"text":"Больше компонентов: Вместо одной базы данных появляется множество шардов (часто с репликами), маршрутизаторы запросов, серверы конфигурации. Всё это нужно настраивать, обновлять и обслуживать."}},{"id":"GKFuYczGI5","type":"paragraph","data":{"text":"Мониторинг: Требуется отслеживать состояние каждого шарда, равномерность распределения нагрузки, задержки в сети, работу маршрутизаторов. Нужны более сложные инструменты мониторинга."}},{"id":"RPj6oURIeW","type":"paragraph","data":{"text":"Отладка: Найти источник проблемы в распределённой системе сложнее. Ошибка может быть где угодно: в приложении, маршрутизаторе, на одном из шардов или в сети."}},{"id":"EBzpxv12bQ","type":"paragraph","data":{"text":"Резервное копирование: Создание согласованных резервных копий и восстановление данных со множеством независимых шардов требует более сложных процедур."}},{"id":"ADntTa2svW","type":"header2","data":{"text":"Когда стоит применять Sharding","level":2},"tunes":{}},{"id":"ieAe1Dnswy","type":"header3","data":{"text":"Рост объёма данных и нагрузок","level":3},"tunes":{}},{"id":"kT_w4SSqoN","type":"paragraph","data":{"text":"Sharding стоит применять, если БД сильно разрослась, хранить её на одном сервере становится сложно и дорого. Серверу приходится обрабатывать много данных, и поэтому увеличивается время отклика."}},{"id":"v54ak-jDxY","type":"paragraph","data":{"text":"Иногда серверу приходится одновременно читать и записывать слишком много запросов. Система становится перегруженной, пользователи замечают задержки и нестабильную работу. Здесь тоже поможет sharding."}},{"id":"6K7q098WSR","type":"header3","data":{"text":"Не справляется один сервер/реплика","level":3},"tunes":{}},{"id":"c5iuZiPSzz","type":"paragraph","data":{"text":"Допустим, у нас один сервер и он не справляется с запросами и большими данными. Конечно, мы можем заняться вертикальным масштабированием, поставить CPU производительнее, добавить больше ОЗУ и так далее. Однако у этого подхода есть ограничения. Во-первых, каким бы мощным ни был бы сервер, он со временем упрётся в потолок своей производительности. Во-вторых, иногда дешевле купить несколько новых серверов помощнее, чем прокачивать старый. Поэтому создание кластера и распределение в нём нагрузки при помощи шардинга — часто более выигрышное решение, чем один сервер."}},{"id":"RLxrLPSpqB","type":"header3","data":{"text":"Потребность в геораспределённости или отказоустойчивости","level":3},"tunes":{}},{"id":"tLvTIqY2R5","type":"paragraph","data":{"text":"Если пользователи находятся в разных частях света, то деление данных и хранение ближе к ним может ускорить работу приложения. Мы можем при помощи шардинга размещать данные в разных дата-центрах, ближе к определённым группам пользователей. Например, так делает Youtube. Компания размещает свои сервера в разных странах, чтобы видео прогружались быстрее и в более высоком качестве."}},{"id":"f6eff245-5ef1-468c-a311-3f2519428ac8","type":"banner-blank","data":{}},{"id":"ayNxWgQZk4","type":"paragraph","data":{"text":"Мы можем хранить все данные и обрабатывать запросы на одном сервере и сделать его реплику с копией данных. Если этот сервер падает, то его заменяет реплика. Но что, если эта реплика тоже упадёт? Тогда нам и помогает sharding с репликацией. В случае сбоев отвалятся только отдельные серверы с некоторыми наборами данных. Конечно, здесь тоже, в теории, можно положить весь кластер, включая реплики, но сделать это сложнее."}},{"id":"x50m4FxeZj","type":"paragraph","data":{"text":"Шардирование — полезный инструмент при работе с СУБД. А узнать про большее число подобных инструментов можно в нашем телеграм канале! "}}],"version":"2.25.0"}

Ошибка в настройках сайта