11 задач по SQL с собеседований на позицию Data Engineer

Question 1

Ответ

Answer

Вопрос с подвохом. Тут нет однозначного ответа, отработает или нет. Всё зависит от списка полей в таблице. Символ * эквивалентен перечислению всех полей таблицы. Если в таблице будет всего одно поле с названием id, то запрос отработает. Иначе — нет, потому что при наличии в таблице нескольких полей символ * будет означать перечисление всех полей, что в SQL требует перечисления искомого в конструкции GROUP BY. Либо кандидат должен уточнить, какие поля есть в таблице, дабы однозначно ответить на вопрос.

Question 2

Ответ

Answer

Да, отработает. В SQL допускается перечисление не всех полей в разделе SELECT, если мы группируемся по нескольким полям. В данном примере группировка выполняется по двум полям, а выводится на экран одно поле. А вот наоборот сделать уже нельзя.

Question 3

Ответ

Answer

Да, отработает. В SQL можно в разделе having указывать поле, по которому выполняется группировка. Несмотря на то, что на практике такое условие редко используется, подобный запрос можно выполнить. Чаще всего разработчики в конструкции having используют агрегирующую функцию — например, having count(*) >0. Эта задача рассчитана на то, чтобы сбить с толку. Кандидат, хорошо знающий язык SQL, ответит на вопрос уверенно, в то время как неопытный засомневается. Хотя могут быть исключения.

Question 4

Ответ

Answer

Нет, не отработает. Опытный data-инженер знает, что row_number() — это часть аналитической функции, которая не может быть применена сама по себе. Аналитические функции используются только в конcтрукциях SELECT или ORDER BY.

Question 5

Ответ

Answer

Здесь всё очень просто. При вставке строчек в таблицу количество полей при объявлении не соответствует количеству вставляемых значений в конструкции values. Это должен знать даже начинающий SQL-разработчик.

Question 6

Ответ

Answer

Здесь тоже всё просто — запрос не отработает. Конструкция having не может использоваться при удалении строк. Она используется только при операции SELECT и чаще всего вместе с группировкой строк (GROUP BY). Эта задачка рассчитана на новичков. Опытный SQLщик сразу ответит на вопрос.

Question 7

Ответ

Answer

Тоже довольно простой вопрос. Разработчик, постоянно работающий с базами данных, сразу ответит, что будет ошибка. В запросе не хватает ключевого слова table, т.е. должно быть truncate table TABLE1. Также можно задать дополнительный вопрос: чем отличается truncate table TABLE1 от delete from TABLE1? Truncate — это DDL-операция, т.е. операция изменения объекта в базе. Она выполняется намного быстрее. Delete — это операция DML, т.е. операция с данными внутри таблицы. Опытный разработчик должен знать нюансы SQL.

Question 8

Ответ

Answer

Вопрос нацелен на то, чтобы сбить с толку кандидата. На практике при операции join в большинстве случаев выполняется жесткое сопоставление одного поля в одной таблице с другим полем во второй. Например, t.field1 = tt.field1. В данном же случае запрос отработает. В этом примере выполняется сначала декартово произведение всех строк одной таблице со всем строками другой и затем применяется условие, что tt.field1 = 1. Такое написание допустимо, хотя и редко где применяется. Неопытные data-инженеры часто впадают в ступор на этой задаче.

Question 9

Ответ

Answer

Да, отработает. Классический пример аналитической функции, внутри которой сначала выполняется группировка (partition by), потом выполняется сортировка (order by) и применяется агрегирующая функция. В данном случае все написано правильно. Этот вопрос проверяет у кандидата знание оконных функций.

Question 10

Ответ

Answer

Да, отработает. Такое написание синтаксиса допускается в SQL. В этом случае выполняется декартово произведение всех строк одной таблицы со всеми строками другой. Если её обогатить ещё конструкцией where с сопоставлением полей в таблицах table1 и table2, то получится классический inner join. На самом деле, это старый синтаксис внутреннего соединения таблиц. Обычно вместо нее рекомендуется использовать inner join или cross join из соображений оптимизации запросов.

Question 11

Ответ

Answer

Да, вернет. Причина в последнем условии null is null. Оно указано правильно. Дело в том, что при операции сравнения (=, <> , > , <) значения null c каким-либо числом или полем всегда возвращается значение FALSE. Т.е. синтаксический запрос написан правильно и не упадет, но он отсекает строки.

NULL в базах данных — это специальное значение, которое может быть записано в поле таблицы. NULL соответствует понятию «пустое поле», т.е. «поле, не содержащее никакого значения». Но его нельзя сравнивать константой. NULL можно сравнивать только через оператор is т.е. null is null или field1 is null.