{"blocks":[{"type":"paragraph","data":{"text":"Расказывает Рювен Лёрнер, преподаватель"}},{"type":"separator","data":{"text":"***"}},{"type":"paragraph","data":{"text":"Многие слышали о функции zip в Python, а кто-то даже регулярно ей пользуется. Сегодня мы (из интереса и для общего развития) опишем, как можно реализовать её самому с помощью list comprehensions."}},{"type":"paragraph","data":{"text":"Для начала поясню, что вообще делает функция zip, для тех, кто с ней раньше не сталкивался:"}},{"type":"code","data":{"code":">>> s = 'abc'\r\n>>> t = (10, 20, 30)\r\n\r\n>>> zip(s,t)\r\n[('a', 10), ('b', 20), ('c', 30)]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"То есть функция берёт на вход несколько списков и создаёт из них список (в Python 3 создаётся не list, а специальный zip-объект) кортежей, такой, что первый элемент полученного списка содержит кортеж из первых элементов всех списков-аргументов. Таким образом, если ей передать три списка, то она отработает следующим образом:"}},{"type":"code","data":{"code":">>> s = 'abc'\r\n>>> t = (10, 20, 30)\r\n>>> u = (-5, -10, -15)\r\n\r\n>>> list(zip(s,t,u))\r\n[('a', 10, -5), ('b', 20, -10), ('c', 30, -15)]","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"В общем-то, функция отработает даже для одного iterable-объекта, результатом будет последовательность из кортежей, в каждом из которых будет по одному элементу. Но это, пожалуй, не самый распространенный способ применения zip. Я часто использую zip, например, для создания словарей:"}},{"type":"code","data":{"code":">>> names = ['Tom', 'Dick', 'Harry']\r\n>>> ages = [50, 35, 60]\r\n\r\n>>> dict(zip(names, ages)) \r\n\r\n{'Harry': 60, 'Dick': 35, 'Tom': 50}","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"Это весьма удобно, не находите? Каждый раз, когда я рассказываю о zip на своих уроках, у меня спрашивают о том, что будет, если в функцию передать массивы разной длины. Ответ простой — победит более короткий:"}},{"type":"code","data":{"code":">>> s = 'abc'\r\n>>> t = (10, 20, 30, 40)\r\n>>> list(zip(s,t))\r\n[('a', 10), ('b', 20), ('c', 30)]","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"Однако, если вам необходимо, чтобы для каждого из элементов более длинного массива в результирующем списке был создан кортеж из одного элемента, вы можете использовать zip_longest из пакета itertools."}},{"id":"5daade77-afe0-40b4-baef-7df8db937307","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Есть одна возможность в Python, которая мне нравится даже больше, чем zip. Это списковое включение (англ. list comprehension). Именно поэтому, когда один из студентов недавно спросил меня, можем ли мы реализовать zip сами с помощью списковых включений, я просто не смог устоять."}},{"type":"paragraph","data":{"text":"Как же нам этого добиться? Начнём с первого, что приходит на ум:"}},{"type":"code","data":{"code":"[(s[i], t[i]) # создаём кортеж из двух элементов\r\n for i in range(len(s))] # для индексов от 0 до len(s) - 1","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"В общем-то всё! Это работает. Но есть несколько моментов, которые всё же стоит доработать в этом методе."}},{"type":"paragraph","data":{"text":"Во-первых, оригинальная функция могла работать с массивами разной длины. Поэтому вместо range(len(s)) нам стоит использовать range(len(x)), где x — наиболее короткая последовательность. Для этого достаточно поместить все последовательности в один список, отсортировать этот список по длине элементов и выяснить длину элемента, оказавшегося под нулевым индексом:"}},{"type":"code","data":{"code":">>> s = 'abcd'\r\n>>> t = (10, 20, 30)\r\n\r\n>>> sorted((s,t), key=len)\r\n[(10, 20, 30), 'abcd']","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"Совмещаем это с предыдущим кодом:"}},{"type":"code","data":{"code":">>> s = 'abcd'\r\n>>> t = (10, 20, 30)\r\n\r\n>>> sorted((s,t), key=len)\r\n[(10, 20, 30), 'abcd']","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"Это ещё не все доработки, а выражение уже получается слишком длинным. Пожалуй, выяснение наименьшей длины стоит вынести в отдельную функцию (заодно сделаем так, чтобы она вычисляла наикратчайшую последовательность из неограниченного количества аргументов):"}},{"type":"code","data":{"code":">>> def shortest_sequence_range(*args):\r\n return range(len(sorted(args, key=len)[0]))\r\n\r\n>>> [(s[i], t[i]) \r\n for i in shortest_sequence_range(s,t) ]","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"Что осталось теперь? Как уже говорилось выше, Python 3 создаёт не список, а специальный zip-объект, возвращая итератор от него. Это сделано для того, чтобы код не ломался при обработке исключительно длинных последовательностей. Это можно реализовать, но уже не с помощью спискового включения (которое всегда возвращает список), а с помощью генератора. К счастью, для этого достаточно поменять квадратные скобки на круглые:"}},{"type":"code","data":{"code":">>> def shortest_sequence_range(*args):\r\n return range(len(sorted(args, key=len)[0]))\r\n\r\n>>> g = ((s[i], t[i])\r\n for i in shortest_sequence_range(s,t) )\r\n\r\n>>> for item in g:\r\n print(item)\r\n('a', 10)\r\n('b', 20)\r\n('c', 30)","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"Готово! Мы реализовали свой полностью рабочий zip. Вы можете потренироваться и самостоятельно подумать, как ещё можно улучшить этот алгоритм."}}]}

Ошибка в настройках сайта