{"blocks":[{"type":"paragraph","data":{"text":"В данной статье я хочу показать ход размышлений при проектировании базы данных. Я считаю что объяснить процесс намного важнее чем показать готовую структуру. Также хочу отметить что не претендую на истину в конечной инстанции, это только мои рассуждения и если Вы найдете их ошибочными или недостаточно хорошими – пожалуйста дайте мне знать в комментариях под статьей."}},{"type":"paragraph","data":{"text":"Итак, приступим."}},{"type":"paragraph","data":{"text":"Перед тем, как приступить к проектированию базы данных, следует разобраться в предметной базе, то есть понять из каких элементом состоит наш бизнес и как нам представить его в виде набора связанных таблиц. Будьте готовы к тому что в процессе придется вносить коррективы в уже имеющуюся структуру в случае выявления новых закономерностей."}},{"id":"16b025bd-5b8a-4126-95f8-1d3eef9341f1","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Итак, как сказано в заголовке, мы имеем кинотеатр. Допустим наш кинотеатр имеет несколько залов. Каждый зал характеризуется названием, количеством мест, типом экрана (обычный или стерео) возможно в дальнейшем мы выявим другие необходимые нам параметры залов, но для начала этого будет достаточно."}},{"type":"paragraph","data":{"text":"Создадим таблицу halls, в данной статье для примеров я буду использовать синтаксис PostgreSQL поэтому первый запрос будет следующим:"}},{"type":"code","data":{"code":"create table halls (\n id serial primary key,\n name text,\n seats_count int,\n screen_type ?\n);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Рассмотрим структуру подробнее:"}},{"type":"list","data":{"items":["id имеет тип serial – это самый простой способ использовать авто инкремент кроме этого поле будет являться первичным ключом к строкам таблицы. (Надеюсь это понятно. Если нет пишите в комментах),","name типа text если вы будете писать для MySQL, то скорее всего вам стоит использовать varchar, но в PostgreSQL эти типы почти идентичны, а само слово text короче,","seats_count – integer как же иначе? К тому же нам скорее всего придётся выполнять арифметические операции над этим полем (например посчитать суммарную вместимость залов)(если вы заметили я придерживаюсь snake notation в названии столбцов. Это не принципиально если Вам больше нравится camelCase Вы вольны использовать её, только будьте последовательны и не смешивайте разные типы в одном проекте),","screen_type – тут я поставил знак вопроса. Почему? Дело в том что я могу использовать тип text и заносить строки ‘regular’ или ‘stereo’ могу создать свой тип данных состоящий из этих двух значений или создать дополнительную таблицу – справочник.Рассмотрим все варианты:","Использовать текст – просто, наглядно, требует задания ограничений на поле:"],"style":"unordered"}},{"type":"code","data":{"code":"create table halls (\n id serial primary key,\n name text,\n seats_count int,\n screen_type text check (screen_type in ('regular', 'stereo'))\n);\n\ninsert into halls (name, seats_count, screen_type) values ('Blue', 25, 'regular');\ninsert into halls (name, seats_count, screen_type) values ('Gold', 15, '3d');\n\nselect * from halls;","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Если Вы проверите данный код на SQLize.online то увидите что данная конструкция предотвращает вставку неправильных значений. Недостатком такого подхода является что для добавления нового типа зала потребуется менять структуру таблицы. В нашем случае удалять и создавать заново ограничение колонки. В примере ниже код для добавления зала с 3d:"}},{"type":"code","data":{"code":"alter table halls drop constraint halls_screen_type_check;\nalter table halls add constraint halls_screen_type_check \n check (screen_type in ('regular', 'stereo', '3d'));","language":"sql lazy-code"}},{"type":"list","data":{"items":["Другой способ – использовать таблицу справочник. В этом случае сначала создаем таблицу screen_types заносим в неё строки ‘regular’ и ‘stereo’ а в таблице залов будем использовать числовое поле screen_type связанное внешним ключом со справочником:"],"style":"unordered"}},{"type":"code","data":{"code":"create table screen_types (\n id serial primary key,\n name text\n);\n\ninsert into screen_types (name) values ('regular'), ('stereo');\n\ncreate table halls (\n id serial primary key,\n name text,\n seets_count int,\n screen_type int references screen_types(id)\n);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"В этом варианте мы не имеем проблем с добавлением типа экрана, однако при добавлении зала должны помнить числовые индексы типов экранов и при выборке данных использовать `join`."}},{"type":"code","data":{"code":"insert into halls (name, seets_count, screen_type) values ('Blue', 25, 1);\ninsert into halls (name, seets_count, screen_type) values ('Gold', 15, 2);\n\nselect halls.id, halls.name, seets_count, screen_types.name as screen_type\nfrom halls\njoin screen_types on screen_types.id = halls.screen_type;","language":"sql lazy-code"}},{"type":"list","data":{"items":["Третий способ – создание своего типа:"],"style":"unordered"}},{"type":"code","data":{"code":"create type screen_type AS ENUM ('regular', 'stereo', '3d');\n\ncreate table halls (\n id serial primary key,\n name text,\n seets_count int,\n screen_type screen_type\n);\n\ninsert into halls (name, seets_count, screen_type) values ('Blue', 25, 'regualr');\ninsert into halls (name, seets_count, screen_type) values ('Gold', 15, '3d');\n\nselect * from halls;","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Добавление нового типа выполняется командой `alter type`"}},{"type":"code","data":{"code":"alter type screen_type add value '4d';","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Снова напомню что все вышеприведенные запросы могут быть проверенны онлайн на SQLize.online"}},{"type":"paragraph","data":{"text":"Выбор варианта зависит от нескольких причин. Как часто прогнозируется изменение типов, как много типов планируется иметь в базе и даже от Вашего опыта работы. Вариант с таблицей справочником – универсальный. Я в нашем случае остановлюсь на варианте текста с ограничением (типы экранов практически не меняются, если нужно будет добавить тип, то таблица залов будет содержать не более десятка залов, и ее изменение не займет много времени зато я получу экономию на объединениях таблиц)."}},{"type":"paragraph","data":{"text":"Если Вы не согласны с моим выбором – добро пожаловать в комменты. "}},{"type":"paragraph","data":{"text":"А мы продолжаем. Следующим базовым компонентом являются фильмы."}},{"type":"paragraph","data":{"text":"Первый набросок таблицы:"}},{"type":"code","data":{"code":"create table films (\n id serial primary key, -- первичный ключ\n title text, -- название фильма \n description text, -- краткое описание, сюжет\n release_year int, -- год выхода на экран\n duration int, -- длительность в минутах\n director int,\n genre int\n);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Если первые 5 полей вопросов не вызывают то что скажете по поводу режиссера? Я надеюсь Вы ответили – создаем таблицу справочник + внешний ключ. Я предлагаю назвать таблицу persons . Почему не directors спросите вы. Потому что возможно мы будем хранить список актеров и может оказаться что один и тот же человек будет выступать в нескольких ролях например быть режиссером фтльма и сам в нем сниматься. Так что это некий задел на будущее."}},{"type":"paragraph","data":{"text":"Так что создадим таблицу persons и не забудем задать ограничение в виде внешнего ключа между таблицами:"}},{"type":"code","data":{"code":"create table persons (\n id serial primary key,\n name text,\n year_of_birth int\n);\n\nalter table films \n add constraint film_director_fk \n foreign key (director) references persons(id);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Теперь посмотрим на поле genre Вы можете сказать поступим так же как с режиссерами. Однако я возражу, что редко какой фильм можно отнести к одному жанру поэтому мы построим отношение многие ко многим. Один фильм может относиться к нескольким категориям, и естественно к каждой категории относятся множество фильмов."}},{"type":"paragraph","data":{"text":"Создадим таблицу жанров и связующую таблицу между жанрами и фильмами:"}},{"type":"code","data":{"code":"create table genres (\n id serial primary key,\n genre text\n);\n\ncreate table film_genres (\n film int references films(id),\n genre int references genres(id),\n primary key (film, genre)\n);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Обратите внимание в таблице film_genres первичным ключом будет сочетание двух полей film и genre"}},{"id":"c393c98e-0691-427d-a1a7-83e7fc940754","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"После этого мы можем удалить столбец genre из таблицы films:"}},{"type":"code","data":{"code":"alter table films drop column genre;","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Таким образом мы формально закрепили данные о кинозалах и фильмах в структуре таблиц. "}},{"type":"paragraph","data":{"text":"Продолжим проектирование нашей базы. Что в бизнесе кинотеатра связывает залы и фильмы? Конечно сеансы."}},{"type":"code","data":{"code":"create table film_screenings (\n id serial primary key, \n film int references films(id), -- фильм\n hall int references halls(id), -- кинозал\n start_at timestamp, -- дата и время начала сеанса\n price numeric -- цена билета\n);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Пока достаточно просто. На что следует обратить внимание: столбец id имеет тип serial, то есть int + autoincrement Максимальное значение int в PostgreSQL – 2147483647 Прикинем если у нас будет 10 залов и в каждом мы будем крутить по 10 сеансов в день 365 дней в году 10*10*365 = 36500 в год."}},{"type":"code","data":{"code":"select 2147483647 / (10*10*365); -- 58835","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Получается больше чем 58 тысяч лет. Хватит даже если мы увеличим количество залов и сеансов в 10 раз."}},{"type":"paragraph","data":{"text":"Следующая таблица – билеты:"}},{"type":"code","data":{"code":"create table tickets (\n id uuid primary key default uuid_generate_v4(), \n screening int references film_screenings(id), -- сеанс\n row smallint, -- ряд\n seat smallint, -- место\n price numeric -- цена\n);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"В принципе достаточно стандартная структура таблицы. В чём её особенности, Во первых здесь я решил использовать тип uuid в качестве первичного ключа."}},{"type":"paragraph","data":{"text":"Тип данных uuid сохраняет универсальные уникальные идентификаторы (Universally Unique Identifiers, UUID) в случае PostgreSQL это будет строка вида a0eebc99-9c0b-4ef8-bb6d-6bb9bd380a11 Функция uuid_generate_v4() обеспечит нам генерацию уникальных идентификаторов при вставке новых строк."}},{"id":"544e28eb-41b1-4fc6-beeb-10718f09f79b","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Почему я выбрал этот тип вместо привычного serial? Дело в том что номер билета скорее всего будет отпечатан на бумажном носителе или представлен в электронной копии билета. То есть эта информация будет доступна вне нашей базы данных. В этом случае некто может получить внутреннюю информацию о нашем бизнесе, например покупая билеты каждое воскресенье можно получить информацию о недельных продажах. Кроме этого в случае недостаточной безопасности нашего вебсайта злоумышленник сможет получить доступ к данным чужих билетов просто итерируя id. В случае с uuid вероятность такого сценария близка к нулю."}},{"type":"paragraph","data":{"text":"Второй вопрос к таблице tickets это повторение поля price, которое уже существует в таблице сеансов film_screenings Дело в том что у этих пролей разная нагрузка. В случае сеанса – это рекомендованная цена, то есть цена которая будет указана на нашей афише. В случае билета это реальная сумма денег заплаченная за каждый конкретный билет. Она может отличаться от рекомендованной в случае льготных билетов или билетов купленных по промо акции."}},{"type":"paragraph","data":{"text":"Это поле из таблицы tickets мы будем использовать для подсчета наших финансовых показателей"}},{"type":"paragraph","data":{"text":"Во избежание коллизий я пожалуй переименую поле в таблице сеансов"}},{"type":"code","data":{"code":"alter table film_screenings rename column price to recomended_price;","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Следующее, что я хочу сделать – это защитить таблицу tickets от ввода ошибочных данных. Во-первых, объявим уникальный индекс по трем полям (screening, row and seat) это защитит нас от продажи двух билетов на одно и то же место в один сеанс."}},{"type":"code","data":{"code":"create unique index ticket_seat_unique on tickets (screening, row, seat);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Далее я хочу предотвратить “овербукинг” – то есть продажу большего количества билетов чем есть мест в зале. Так как это ограничение накладывается внешней таблицей то я не смогу использовать индексы или ограничения таблицы (По крайней мере я не знаю как это сделать. Если у Вас есть варианты – пишите в комментариях) Я для этой цели создам триггер."}},{"id":"58454010-f886-486f-9bcf-5221887808fc","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"В PostgreSQL триггер состоит из триггерной функции и самого триггера который её вызывает. Ниже мой код функции и сам триггер:"}},{"type":"code","data":{"code":"create function check_overbooking() returns trigger AS $$\n declare hall text;\n declare hall_seats_count int;\n declare tickets_sold int;\n begin\n -- найдем имя зала соответствующего билету\n -- и количество мест в нём\n\n select halls.name, seats_count into hall, hall_seats_count\n from halls \n join film_screenings on film_screenings.hall = halls.id \n where film_screenings.id = new.screening;\n\n -- подсчитаем количество уже проданных билетов\n\n select count(*) into tickets_sold \n from tickets where screening = new.screening;\n -- если свободных мест нет выкидываем исключение\n\n if (tickets_sold >= hall_seats_count) then \n raise exception 'The hall %d is full', hall;\n return null;\n end if; \n\n return new;\n end;\n$$ language plpgsql;\n\ncreate trigger check_overbooking\n before insert on tickets\n for each row\n execute function check_overbooking();","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Немного подумав, я решил что данный код не защитит нас от продажи билета на несуществующее место в зале и понял что недостаточно хранить количество мест в залах. Необходимо иметь таблицу с их конфигурацией."}},{"type":"paragraph","data":{"text":"Первое, что приходит в голову – добавить в таблицу halls колонки с количеством рядов и кресел. Однако в большинстве залов, где я бывал, количество мест в ряду может меняться от ряда к ряду. "}},{"type":"paragraph","data":{"text":"Наиболее оптимальным решением будет создание таблицы halls_seats со следующей структурой:"}},{"type":"code","data":{"code":"create table hall_seats (\n hall int references halls(id),\n row int,\n seats int,\n primary key (hall, row)\n);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Поле halls связано внешним ключом с релевантной таблицей, что не даст нам внести данные несуществующего зала. Первичный ключ по полям hall и row не даст дважды создать один ряд в том же зале."}},{"type":"paragraph","data":{"text":"Заполним таблицу в соответствии со схемой кинозала “Луч”:"}},{"type":"code","data":{"code":"insert into hall_seats values \n (1, 1, 5),(1, 2, 7),(1, 3, 6),(1, 4, 7),\n (1, 5, 7),(1, 6, 7),(1, 7, 7),(1, 8, 7),\n (1, 9, 6),(1, 10, 7),(1, 11, 10);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Ну и добавим индекс по полю hall для ускорения выборки данных из таблицы."}},{"type":"code","data":{"code":"create index hall_seats_hall_ix on hall_seats(hall);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"После этого вернемся на шаг назад и перепишем триггерную функцию ограничивающую продажу фиктивных билетов следующим образом:"}},{"type":"code","data":{"code":"create or replace function check_overbooking() returns trigger AS $func$\n declare seat_possible boolean;\n\n begin\n select true into seat_possible\n from hall_seats \n join film_screenings on film_screenings.hall = hall_seats.hall \n where \n film_screenings.id = new.screening and \n hall_seats.row = new.row and \n new.seat between 1 and hall_seats.seats; \n\n if (seat_possible is null or not seat_possible) then \n raise exception 'The seat % in row % not exists', new.seat, new.row;\n return null;\n end if;\n\n return new;\n end;\n$func$ language plpgsql;","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Запрос в этой функции вернет true только в случае если в зале соответствующем сеансу указанному на билете существует выбранное место в указанном ряду. Для проверки кода воспользуйтесь SQLize.online "}},{"id":"6e667d01-b0a1-4d25-9887-05f0752b5107","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Далее нам нужна еще одна проверка. Помните таблицу film_screenings где мы сохраняем сеансы. Так вот, хотелось бы избежать накладок в планировании так, чтобы не было возможности пересекающихся по времени сеансов в одном зале. "}},{"type":"paragraph","data":{"text":"В качестве исходных данных мы можем получить время начала предыдущего сеанса в зале, продолжительность фильма плюс запас времени (допустим в полчаса) на уборку зала и вход-выход кинозрителей."}},{"type":"paragraph","data":{"text":"Для решенияэтой проблемы я решил воспользоваться ограничением EXCLUDE предоставляемым PostgreSQL."}},{"type":"paragraph","data":{"text":"Кратко EXCLUDE похож на UNIQUE однако дает возможность использовать логику сложнее чем простое равенство. Например в нашем случае я воспользуюсь им для проверки не пересечения временных интервалов."}},{"type":"paragraph","data":{"text":"Помните в начале мы создали таблицу сеансов. Мне потребуется внести в нее небольшое изменение."}},{"type":"code","data":{"code":"create table film_screenings (\n id serial primary key, \n film int references films(id), -- фильм\n hall int references halls(id), -- кинозал\n start_at timestamp, -- дата и время начала сеанса\n recomended_price numeric -- рекомендованная цена билета\n);\n\n-- удаляю столбец start_at\nalter table film_screenings drop column start_at;\n\n-- добавляю колонку screening_time типа tstzrange\nalter table film_screenings add column screening_time tstzrange;","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"В коде выше, я удалил колонку start_at и вместо неё добавил screening_time. Я решил использовать тип tstzrange для того чтобы в одном поле хранить начало и конец сеанса. Кроме этого для данного типа можно воспользоваться ограничением EXCLUDE что я и сделал."}},{"type":"code","data":{"code":"alter table film_screenings\nadd constraint no_screening_time_overlap\nexclude using gist (\n screening_time WITH undefinedundefined -- check for overlapping ranges\n);","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Давайте убедимся что ограничение работает:"}},{"type":"code","data":{"code":"insert into film_screenings (film, hall, recomended_price, screening_time)\nvalues (1, 1, 39.99, '[\"2023-01-01 19:00:00\", \"2023-01-01 20:45:00\"]');\n\n-- Попробуем внести строку с перекрытием:\ninsert into film_screenings (film, hall, recomended_price, screening_time)\nvalues (1, 1, 39.99, '[\"2023-01-01 20:45:00\", \"2023-01-01 23:00:00\"]');\n\n-- и ожидаемо получаем ошибку:\n/*\n+==========================================================================================================================================================================================+\n| insert into film_screenings (film, hall, recomended_price, screening_time) |\n| values (1, 1, 39.99, '[\"2023-01-01 20:45:00\", \"2023-01-01 23:00:00\"]') |\n+==========================================================================================================================================================================================+\n| ERROR: conflicting key value violates exclusion constraint \"no_screening_time_overlap\" |\n| DETAIL: Key (screening_time)=([\"2023-01-01 20:45:00+00\",\"2023-01-01 23:00:00+00\"]) conflicts with existing key (screening_time)=([\"2023-01-01 19:00:00+00\",\"2023-01-01 20:45:00+00\"]). |\n+------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+\n*/","language":"sql lazy-code"}},{"type":"paragraph","data":{"text":"Этим мы гарантируем консистентность данных в таблице сеансов."}},{"type":"paragraph","data":{"text":"Таким образом мы завершили проектирование базы данных для нашего небольшого бизнеса. Если в ходе прочтения у Вас возникли вопросы вы можете задать их в моём чате. "}},{"type":"paragraph","data":{"text":"Если Вам понравилась статья, Вы можете поддержать автора."}}]}

Ошибка в настройках сайта