{"blocks":[{"type":"paragraph","data":{"text":"В статье описан пошаговый рефакторинг кода с помощью тестов. Рефакторинг опасен при работе с непротестированным или устаревшим кодом, но тестирование поможет уменьшить количество внедряемых багов и при определённой доле везения избежать их вовсе."}},{"type":"paragraph","data":{"text":"Рефакторинг не для слабаков и требует двойных усилий: 1) нужно понимать код, который написал кто-то другой или ты сам в прошлом; 2) с умом упрощать или переносить куски кода (читай улучшать код). В рефакторинге, как и в программировании, есть свой свод правил и приёмов, который можно описать как смесь из техники, интуиции, опыта и риска."}},{"type":"paragraph","data":{"text":"Всё-таки программирование – это искусство."}},{"type":"header2","data":{"level":2,"text":"Исходные данные"}},{"type":"paragraph","data":{"text":"В качестве примера будем использовать сервис, предоставляющий API и отдающий данные в формате JSON, а именно список из элементов, как показано здесь:"}},{"type":"code","data":{"code":"{\r\n \"age\": 20,\r\n \"surname\": \"Frazier\",\r\n \"name\": \"John\",\r\n \"salary\": \"£28943\"\r\n}","language":"json lazy-code"}},{"type":"paragraph","data":{"text":"После того, как мы преобразуем объект JSON в питоновскую структуру, то получим набор словарей, где коллекция age – целое число, остальные – строки."}},{"id":"3de87db8-397f-4aec-8049-544a73f695f4","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Потом кто-то дописал класс, который рассчитывает некоторые статистические данные по исходным. Класс называется DataStats и содержит единственный метод stats(), входными параметрами которого являются данные, полученная от сервиса (JSON), и два целых числа iage и isalary. Согласно документации, эти параметры – исходный возраст и исходная зарплата, используемые для вычисления среднегодовой надбавки к зарплате."}},{"type":"paragraph","data":{"text":"Код класса:"}},{"type":"code","data":{"code":"import math\r\nimport json\r\n\r\n\r\nclass DataStats:\r\n\r\n def stats(self, data, iage, isalary):\r\n # iage and isalary are the starting age and salary used to\r\n # compute the average yearly increase of salary.\r\n\r\n # Compute average yearly increase\r\n average_age_increase = math.floor(\r\n sum([e['age'] for e in data])/len(data)) - iage\r\n average_salary_increase = math.floor(\r\n sum([int(e['salary'][1:]) for e in data])/len(data)) - isalary\r\n\r\n yearly_avg_increase = math.floor(\r\n average_salary_increase/average_age_increase)\r\n\r\n # Compute max salary\r\n salaries = [int(e['salary'][1:]) for e in data]\r\n threshold = '£' + str(max(salaries))\r\n\r\n max_salary = [e for e in data if e['salary'] == threshold]\r\n\r\n # Compute min salary\r\n salaries = [int(d['salary'][1:]) for d in data]\r\n min_salary = [e for e in data if e['salary'] ==\r\n '£{}'.format(str(min(salaries)))]\r\n\r\n return json.dumps({\r\n 'avg_age': math.floor(sum([e['age'] for e in data])/len(data)),\r\n 'avg_salary': math.floor(sum(\r\n [int(e['salary'][1:]) for e in data])/len(data)),\r\n 'avg_yearly_increase': yearly_avg_increase,\r\n 'max_salary': max_salary,\r\n 'min_salary': min_salary\r\n })","language":"python lazy-code"}},{"type":"header2","data":{"level":2,"text":"Цель"}},{"type":"paragraph","data":{"text":"Легко заметить некоторые проблемы в классе, описанном выше. Самые заметные:"}},{"type":"list","data":{"items":["Класс использует один метод и не содержит __init__(). Его можно заменить на единственную функцию без потери функционала.","Метод stats() слишком большой и выполняет много разрозненных задач, что усложняет последующую отладку.","Много повторяющегося кода, по крайней мере несколько строк очень похожи. Например, две очень похожих операции '£' + str(max(salaries)) и '£{}'.format(str(min(salaries))), или две строки начинаются с salaries =, или несколько конструкторов списков."],"style":"unordered"}},{"type":"paragraph","data":{"text":"Мы собираемся использовать этот код в нашем Amazing New Project™, так что хотелось бы исправить эти недостатки.
Однако класс работает идеально, используется в производстве долгие годы и не содержит известных багов. Мы хотим написать код лучше, сохраняя при этом функционал, то есть сделать рефакторинг."}},{"type":"header2","data":{"level":2,"text":"Путь"}},{"type":"paragraph","data":{"text":"Я хочу показать, как безопасно отрефакторить такой класс, используя тесты. Этот способ отличается от разработки через тестирование (TDD), хотя они похожи. Используемый класс разрабатывался без помощи TDD, и для него нет никаких тестов, но тем не менее их можно использовать, чтобы удостовериться, что работа класса осталась прежней. Такой способ стоит называть рефакторинг через тестирование (TDR – test driven refactoring)."}},{"type":"paragraph","data":{"text":"Идея TDR проста. В первую очередь, разрабатываются тесты, которые проверяют работу какого-то кода, лучше маленькой части с чётко определённой областью деятельности и выходными данными. Позднее юнит-тестирование, которое симулирует, что автор кода должен был сделать (кхм, это же ты несколько месяцев назад…)."}},{"type":"paragraph","data":{"text":"Как только юнит-тесты будут готовы, можно смело редактировать код, зная, что работа новой версии кода будет такой же, как и у предыдущей. Как можно догадаться, эффективность метода напрямую зависит от качества написанных юнит-тестов, именно поэтому рефакторинг сложен."}},{"type":"header2","data":{"level":2,"text":"Предостережения"}},{"type":"paragraph","data":{"text":"Прежде чем начнём наш первый рефакторинг, выскажу два замечания. Первое: код в примере легко отрефакторить. Здесь нет необходимости соблюдать принципы ООП, но я пошел этим путём, чтобы продемонстрировать технику рефакторинга для упаковщиков."}},{"id":"0e94211e-c8ee-4408-bd93-3d8ffeda7abd","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Второе: в чистом TDD не рекомендуется тестировать внутренние методы, которые не формируют публичные API объекта. В целом, мы выделяем такие объекты, добавляя нижнее подчёркивание перед названием. Причина в том, что TDD подразумевает, что объекты формируются исходя из ООП, которое рассматривает объекты как результат его работы, а не как структуру. Таким образом, в тестировании нас интересуют публичные методы."}},{"type":"paragraph","data":{"text":"Однако стоит отметить, что иногда сложно сделать публичный метод, так как в методе запутанная логика, которую мы хотим протестировать. По моему мнению, совет по TDD должен звучать так: «Тестируйте внутренние методы, только если в них содержится неочевидная логика»."}},{"type":"paragraph","data":{"text":"Когда же идёт рефакторинг, мы разбираем существующую структуру и чаще всего преобразуем её в набор приватных методов, помогающих выделять и обобщать части программного кода. Мой совет, в таких случаях стоит тестировать полученные методы, это позволяет быть более уверенным в том, что ты сделал. С опытом придёт понимание, какие тесты нужны, а какие можно опустить."}},{"type":"header2","data":{"level":2,"text":"Подготовка к тестированию"}},{"type":"paragraph","data":{"text":"Клонируем этот репозиторий и создаём виртуальную рабочую среду. Активируем её и устанавливаем необходимые пакеты."}},{"type":"paragraph","data":{"text":"pip install -r requirements.txt"}},{"id":"9612cc15-f665-4021-9e4c-c74e4cc340e6","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Репозиторий уже содержит конфигурационный файл для pytest, который нужно модифицировать, чтобы избежать ввода вашей виртуальной среды. В нём нужно поправить параметр norecursedirs, добавив имя виртуальной среды, которая только что была создана. Я обычно даю имя виртуальное среде с префиксом venv, поэтому её название имеет вид venv*."}},{"type":"paragraph","data":{"text":"На данном этапе из родительской директории репозитория, которая содержит pytest.ini, должна запускаться команда pytest -svv, результат будет походить на то, что представлено ниже:"}},{"type":"code","data":{"code":"========================== test session starts ==========================\r\nplatform linux -- Python 3.5.3, pytest-3.1.2, py-1.4.34, pluggy-0.4.0\r\ncachedir: .cache\r\nrootdir: datastats, inifile: pytest.ini\r\nplugins: cov-2.5.1\r\ncollected 0 items\r\n\r\n====================== no tests ran in 0.00 seconds ======================","language":"bash lazy-code"}},{"type":"paragraph","data":{"text":"Этот репозиторий содержит две ветки. В ветке master, в которой вы сейчас находитесь, содержится начальная настройка, в ветке develop – конечный результат рефакторинга. Каждый шаг из этого поста имеет свой коммит с соответствующими правками."}},{"type":"header2","data":{"level":2,"text":"Шаг 1. Тестируем конечный результат"}},{"type":"paragraph","data":{"text":"Коммит: 27a1d8c"}},{"type":"paragraph","data":{"text":"Когда начинаешь рефакторить систему, вне зависимости от её размера, нужно обязательно протестировать конечный результат её работы. В этом случае систему стоит рассматривать как чёрный ящик (т.е. вы не знаете, что находится внутри) и проверить внешнее поведение. В этом случае можно написать тест, который инициализирует класс и запускает метод с тестовыми данными, возможно реальными, и проверяет выходные данные. Естественно, мы напишем тест с действующими выходными данными, возвращаемыми методом, поэтому тест проходит автоматически."}},{"type":"paragraph","data":{"text":"Запросив данные у сервера, мы получаем следующее:"}},{"type":"code","data":{"code":"test_data = [\r\n {\r\n \"id\": 1,\r\n \"name\": \"Laith\",\r\n \"surname\": \"Simmons\",\r\n \"age\": 68,\r\n \"salary\": \"£27888\"\r\n },\r\n {\r\n \"id\": 2,\r\n \"name\": \"Mikayla\",\r\n \"surname\": \"Henry\",\r\n \"age\": 49,\r\n \"salary\": \"£67137\"\r\n },\r\n {\r\n \"id\": 3,\r\n \"name\": \"Garth\",\r\n \"surname\": \"Fields\",\r\n \"age\": 70,\r\n \"salary\": \"£70472\"\r\n }\r\n]","language":"json lazy-code"}},{"type":"paragraph","data":{"text":"и, вызвав метод stats() с выходными данными, где iage = 20 и isalary = 20000, получим следующий JSON:"}},{"type":"code","data":{"code":"{\r\n \"avg_age\": 62,\r\n \"avg_salary\": 55165,\r\n \"avg_yearly_increase\": 837,\r\n \"max_salary\": [{\r\n \"id\": 3,\r\n \"name\": \"Garth\",\r\n \"surname\": \"Fields\",\r\n \"age\": 70,\r\n \"salary\": \"£70472\"\r\n }],\r\n \"min_salary\": [{\r\n \"id\": 1,\r\n \"name\": \"Laith\",\r\n \"surname\": \"Simmons\",\r\n \"age\": 68,\r\n \"salary\": \"£27888\"\r\n }]\r\n}","language":"json lazy-code"}},{"type":"paragraph","data":{"text":"Предупреждение: в примере я использую очень короткий список реальных данных (3 словаря). В реальном рефакторинге я бы использовал много разнообразных данных, чтобы быть уверенным, что это не пограничный случай."}},{"id":"7604a516-c661-4231-bcc4-a173d7c686fa","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Тест:"}},{"type":"code","data":{"code":"import json\r\n\r\nfrom datastats.datastats import DataStats\r\n\r\n\r\ndef test_json():\r\n test_data = [\r\n {\r\n \"id\": 1,\r\n \"name\": \"Laith\",\r\n \"surname\": \"Simmons\",\r\n \"age\": 68,\r\n \"salary\": \"£27888\"\r\n },\r\n {\r\n \"id\": 2,\r\n \"name\": \"Mikayla\",\r\n \"surname\": \"Henry\",\r\n \"age\": 49,\r\n \"salary\": \"£67137\"\r\n },\r\n {\r\n \"id\": 3,\r\n \"name\": \"Garth\",\r\n \"surname\": \"Fields\",\r\n \"age\": 70,\r\n \"salary\": \"£70472\"\r\n }\r\n ]\r\n\r\n ds = DataStats()\r\n\r\n assert ds.stats(test_data, 20, 20000) == json.dumps(\r\n {\r\n 'avg_age': 62,\r\n 'avg_salary': 55165,\r\n 'avg_yearly_increase': 837,\r\n 'max_salary': [{\r\n \"id\": 3,\r\n \"name\": \"Garth\",\r\n \"surname\": \"Fields\",\r\n \"age\": 70,\r\n \"salary\": \"£70472\"\r\n }],\r\n 'min_salary': [{\r\n \"id\": 1,\r\n \"name\": \"Laith\",\r\n \"surname\": \"Simmons\",\r\n \"age\": 68,\r\n \"salary\": \"£27888\"\r\n }]\r\n }\r\n )","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Как было сказано ранее, тест явно проходит, так как был искусственно сконструирован из результатов работы неизменённого кода.
Ну что ж, этот тест очень важен! Сейчас мы знаем, что если своими изменениями кода мы нарушим его алгоритм работы, то хотя бы один тест не пройдёт."}},{"type":"header2","data":{"level":2,"text":"Шаг 2. Избавляемся от JSON"}},{"type":"paragraph","data":{"text":"Коммит: 65e2997"}},{"type":"paragraph","data":{"text":"Метод возвращает данные в формате JSON и, посмотрев код, можно заметить, что форматирование происходит с помощью функции json.dumps()."}},{"type":"paragraph","data":{"text":"Структура кода, где code_part_2 зависит от code_part_1:"}},{"type":"code","data":{"code":"class DataStats:\r\n\r\n def stats(self, data, iage, isalary):\r\n [code_part_1]\r\n\r\n return json.dumps({\r\n [code_part_2]\r\n })","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Первый рефакторинг будет происходить следующим образом:"}},{"type":"list","data":{"items":["Мы напишем тест test__stats() для метода _stats(), который будет возвращать данные в формате питоновской структуры. Позже можно будет вручную сформировать JSON или выполнить json.loads() в питоновском скрипте. Тест не проходит.","Мы продублируем код метода stats(), который выводит данные в новый метод _stats(). Тест проходит."],"style":"ordered"}},{"type":"code","data":{"code":"class DataStats:\r\n\r\n def _stats(parameters):\r\n [code_part_1]\r\n\r\n return [code_part_2]\r\n\r\n def stats(self, data, iage, isalary):\r\n [code_part_1]\r\n\r\n return json.dumps({\r\n [code_part_2]\r\n })","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Уберём дублирующийся код в stats() и заменим его вызовом _stats():"}},{"type":"code","data":{"code":"class DataStats:\r\n\r\n def _stats(parameters):\r\n [code_part_1]\r\n\r\n return [code_part_2]\r\n\r\n def stats(self, data, iage, isalary):\r\n return json.dumps(\r\n self._stats(data, iage, isalary)\r\n )","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Сейчас мы сможем отрефакторить первоначальный тест test_json(), который мы написали, но это более сложные изменения, и я оставлю их для другого раздела."}},{"type":"paragraph","data":{"text":"Сейчас код нашего класса выглядит следующим образом:"}},{"type":"code","data":{"code":"class DataStats:\r\n\r\n def _stats(self, data, iage, isalary):\r\n # iage and isalary are the starting age and salary used to\r\n # compute the average yearly increase of salary.\r\n\r\n # Compute average yearly increase\r\n average_age_increase = math.floor(\r\n sum([e['age'] for e in data])/len(data)) - iage\r\n average_salary_increase = math.floor(\r\n sum([int(e['salary'][1:]) for e in data])/len(data)) - isalary\r\n\r\n yearly_avg_increase = math.floor(\r\n average_salary_increase/average_age_increase)\r\n\r\n # Compute max salary\r\n salaries = [int(e['salary'][1:]) for e in data]\r\n threshold = '£' + str(max(salaries))\r\n\r\n max_salary = [e for e in data if e['salary'] == threshold]\r\n\r\n # Compute min salary\r\n salaries = [int(d['salary'][1:]) for d in data]\r\n min_salary = [e for e in data if e['salary'] ==\r\n '£{}'.format(str(min(salaries)))]\r\n\r\n return {\r\n 'avg_age': math.floor(sum([e['age'] for e in data])/len(data)),\r\n 'avg_salary': math.floor(sum(\r\n [int(e['salary'][1:]) for e in data])/len(data)),\r\n 'avg_yearly_increase': yearly_avg_increase,\r\n 'max_salary': max_salary,\r\n 'min_salary': min_salary\r\n }\r\n\r\n def stats(self, data, iage, isalary):\r\n return json.dumps(\r\n self._stats(data, iage, isalary)\r\n )","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"И у нас есть два теста, проверяющих правильность его выполнения."}},{"type":"header2","data":{"level":2,"text":"Шаг 3. Рефакторим тесты"}},{"type":"paragraph","data":{"text":"Коммит: d619017"}},{"type":"paragraph","data":{"text":"Очевидно, что список словарей test_data будет использован в каждом проводимом тесте, так что сейчас самое время перенести его в глобальную переменную. Нет смысла использовать фикстуру (fixture), так как тестовые данные статичны."}},{"type":"paragraph","data":{"text":"Также можно вынести выходные данные в глобальную переменную, но предстоящие тесты не используют весь выходной словарь, поэтому мы можем отложить это решение."}},{"type":"paragraph","data":{"text":"Теперь набор тестов выглядит так:"}},{"type":"code","data":{"code":"import json\r\n\r\nfrom datastats.datastats import DataStats\r\n\r\n\r\ntest_data = [\r\n {\r\n \"id\": 1,\r\n \"name\": \"Laith\",\r\n \"surname\": \"Simmons\",\r\n \"age\": 68,\r\n \"salary\": \"£27888\"\r\n },\r\n {\r\n \"id\": 2,\r\n \"name\": \"Mikayla\",\r\n \"surname\": \"Henry\",\r\n \"age\": 49,\r\n \"salary\": \"£67137\"\r\n },\r\n {\r\n \"id\": 3,\r\n \"name\": \"Garth\",\r\n \"surname\": \"Fields\",\r\n \"age\": 70,\r\n \"salary\": \"£70472\"\r\n }\r\n]\r\n\r\n\r\ndef test_json():\r\n\r\n ds = DataStats()\r\n\r\n assert ds.stats(test_data, 20, 20000) == json.dumps(\r\n {\r\n 'avg_age': 62,\r\n 'avg_salary': 55165,\r\n 'avg_yearly_increase': 837,\r\n 'max_salary': [{\r\n \"id\": 3,\r\n \"name\": \"Garth\",\r\n \"surname\": \"Fields\",\r\n \"age\": 70,\r\n \"salary\": \"£70472\"\r\n }],\r\n 'min_salary': [{\r\n \"id\": 1,\r\n \"name\": \"Laith\",\r\n \"surname\": \"Simmons\",\r\n \"age\": 68,\r\n \"salary\": \"£27888\"\r\n }]\r\n }\r\n )\r\n\r\n\r\ndef test__stats():\r\n\r\n ds = DataStats()\r\n\r\n assert ds._stats(test_data, 20, 20000) == {\r\n 'avg_age': 62,\r\n 'avg_salary': 55165,\r\n 'avg_yearly_increase': 837,\r\n 'max_salary': [{\r\n \"id\": 3,\r\n \"name\": \"Garth\",\r\n \"surname\": \"Fields\",\r\n \"age\": 70,\r\n \"salary\": \"£70472\"\r\n }],\r\n 'min_salary': [{\r\n \"id\": 1,\r\n \"name\": \"Laith\",\r\n \"surname\": \"Simmons\",\r\n \"age\": 68,\r\n \"salary\": \"£27888\"\r\n }]\r\n }","language":"python lazy-code"}},{"type":"header2","data":{"level":2,"text":"Шаг 4. Изолируем подсчёт среднего возраста"}},{"type":"paragraph","data":{"text":"Коммит: 9db1803"}},{"type":"paragraph","data":{"text":"В разработке ПО главной задачей является изолирование независимых функций. Таким образом, наш рефакторинг должен разбить существующий код на маленькие разделённые функции."}},{"id":"cd50dcce-978a-4c12-90ac-dc26130d4f0a","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Выходной словарь содержит пять ключей, которым соответствуют значения либо подсчитанные «на лету» (для avg_age и avg_salary), либо по коду метода (для avg_yearly_increase, max_salary и min_salary). Мы можем начать замену кода, который вычисляет значение каждого ключа выделенными методами, пытаясь изолировать алгоритмы."}},{"type":"paragraph","data":{"text":"Для изоляции кода нужно в первую очередь его продублировать, поместив копию в выделенный метод. Так как мы рефакторим с помощью тестов, то нулевым шагом будет написать тест для этого метода."}},{"type":"code","data":{"code":"def test__avg_age():\r\n\r\n ds = DataStats()\r\n\r\n assert ds._avg_age(test_data) == 62","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Мы знаем, что метод должен вернуть 62, поскольку это значение возвращает оригинальный метод stats(). Обратите внимание, что нет смысла передавать переменные iage и isalary, поскольку они не используются в исправленном коде."}},{"type":"paragraph","data":{"text":"Тест не пройден, так что мы можем послушно пойти и продублировать код, используемый для подсчёта avg_age:"}},{"type":"code","data":{"code":"def _avg_age(self, data):\r\n return math.floor(sum([e['age'] for e in data])/len(data))","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Как только тест проходит, мы можем заменить скопированный код в _stats() на вызов функции _avg_age():"}},{"type":"code","data":{"code":"return {\r\n 'avg_age': self._avg_age(data),\r\n 'avg_salary': math.floor(sum(\r\n [int(e['salary'][1:]) for e in data])/len(data)),\r\n 'avg_yearly_increase': yearly_avg_increase,\r\n 'max_salary': max_salary,\r\n 'min_salary': min_salary\r\n }","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Проверяем, проходит ли тест. Здорово! Мы изолировали первую функцию и написали уже три теста."}},{"type":"header2","data":{"level":2,"text":"Шаг 5. Изолируем подсчёт средней зарплаты"}},{"type":"paragraph","data":{"text":"Коммит: 4122201"}},{"id":"4205acc6-fa9a-46d0-8c4a-bf6f2ff9a7fc","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Ключ avg_salary работает так же, как и avg_age с другим кодом. Таким образом, процесс рефакторинга такой же, как и в предыдущем шаге, а результатом будет новый тест test__avg_salary():"}},{"type":"code","data":{"code":"def test__avg_salary():\r\n\r\n ds = DataStats()\r\n\r\n assert ds._avg_salary(test_data) == 55165","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Новый метод _avg_salary():"}},{"type":"code","data":{"code":"def _avg_salary(self, data):\r\n return math.floor(sum([int(e['salary'][1:]) for e in data])/len(data))","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"Новый вид возвращаемого значения:"}},{"type":"code","data":{"code":"return {\r\n 'avg_age': self._avg_age(data),\r\n 'avg_salary': self._avg_salary(data),\r\n 'avg_yearly_increase': yearly_avg_increase,\r\n 'max_salary': max_salary,\r\n 'min_salary': min_salary\r\n }","language":"python lazy-code"}},{"type":"header2","data":{"level":2,"text":"Шаг 6. Изолируем алгоритм ежегодного повышения зарплаты"}},{"type":"paragraph","data":{"text":"Коммит: 4005145"}},{"type":"paragraph","data":{"text":"Оставшиеся три ключа подсчитываются алгоритмами, которые длиннее одной строки и не могут быть записаны напрямую в описание словаря. Однако процесс рефакторинга не особо изменяется: как и раньше мы сначала тестируем вспомогательный метод, затем определяем его посредством дублирования и, наконец, вызываем вспомогательный метод, удаляя продублированный код."}},{"type":"paragraph","data":{"text":"Для среднегодового повышения зарплаты у нас новый тест:"}},{"type":"code","data":{"code":"def test__avg_yearly_increase():\r\n\r\n ds = DataStats()\r\n\r\n assert ds._avg_yearly_increase(test_data, 20, 20000) == 837","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Новый метод, который проходит тест:"}},{"type":"code","data":{"code":"def _avg_yearly_increase(self, data, iage, isalary):\r\n # iage and isalary are the starting age and salary used to\r\n # compute the average yearly increase of salary.\r\n\r\n # Compute average yearly increase\r\n average_age_increase = math.floor(\r\n sum([e['age'] for e in data])/len(data)) - iage\r\n average_salary_increase = math.floor(\r\n sum([int(e['salary'][1:]) for e in data])/len(data)) - isalary\r\n\r\n return math.floor(average_salary_increase/average_age_increase)","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Новая версия метода _stats():"}},{"type":"code","data":{"code":"def _stats(self, data, iage, isalary):\r\n # Compute max salary\r\n salaries = [int(e['salary'][1:]) for e in data]\r\n threshold = '£' + str(max(salaries))\r\n\r\n max_salary = [e for e in data if e['salary'] == threshold]\r\n\r\n # Compute min salary\r\n salaries = [int(d['salary'][1:]) for d in data]\r\n min_salary = [e for e in data if e['salary'] ==\r\n '£{}'.format(str(min(salaries)))]\r\n\r\n return {\r\n 'avg_age': self._avg_age(data),\r\n 'avg_salary': self._avg_salary(data),\r\n 'avg_yearly_increase': self._avg_yearly_increase(\r\n data, iage, isalary),\r\n 'max_salary': max_salary,\r\n 'min_salary': min_salary\r\n }","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Обратите внимание, что мы не решаем проблему дублирования кода, кроме того, что вводим для рефакторинга. Первое, к чему мы стремимся, это полностью изолировать независимые функции."}},{"type":"header2","data":{"level":2,"text":"Шаг 7. Изолируем подсчёт максимальной и минимальной зарплаты"}},{"type":"paragraph","data":{"text":"Коммит: 17b2413"}},{"type":"paragraph","data":{"text":"Во время рефакторинга все следует делать поочерёдно, но ради краткости я покажу результат двух шагов за раз. Читателям я рекомендую выполнить их как самостоятельные шаги, как я и сделал при написании кода, который публикую ниже."}},{"type":"paragraph","data":{"text":"Новые тесты:"}},{"type":"code","data":{"code":"def test__max_salary():\r\n\r\n ds = DataStats()\r\n\r\n assert ds._max_salary(test_data) == [{\r\n \"id\": 3,\r\n \"name\": \"Garth\",\r\n \"surname\": \"Fields\",\r\n \"age\": 70,\r\n \"salary\": \"£70472\"\r\n }]\r\n\r\n\r\ndef test__min_salary():\r\n\r\n ds = DataStats()\r\n\r\n assert ds._min_salary(test_data) == [{\r\n \"id\": 1,\r\n \"name\": \"Laith\",\r\n \"surname\": \"Simmons\",\r\n \"age\": 68,\r\n \"salary\": \"£27888\"\r\n }]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Новые методы в классе DataStats:"}},{"type":"code","data":{"code":"def _max_salary(self, data):\r\n # Compute max salary\r\n salaries = [int(e['salary'][1:]) for e in data]\r\n threshold = '£' + str(max(salaries))\r\n\r\n return [e for e in data if e['salary'] == threshold]\r\n\r\n def _min_salary(self, data):\r\n # Compute min salary\r\n salaries = [int(d['salary'][1:]) for d in data]\r\n return [e for e in data if e['salary'] ==\r\n '£{}'.format(str(min(salaries)))]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"И метод _stats() сейчас очень короткий:"}},{"type":"code","data":{"code":"def _stats(self, data, iage, isalary):\r\n return {\r\n 'avg_age': self._avg_age(data),\r\n 'avg_salary': self._avg_salary(data),\r\n 'avg_yearly_increase': self._avg_yearly_increase(\r\n data, iage, isalary),\r\n 'max_salary': self._max_salary(data),\r\n 'min_salary': self._min_salary(data)\r\n }","language":"python lazy-code"}},{"type":"header2","data":{"level":2,"text":"Шаг 8. Избавляемся от повторяющегося кода"}},{"type":"paragraph","data":{"text":"Коммит: b559a5c"}},{"type":"paragraph","data":{"text":"Сейчас, когда у нас есть главные тесты, мы можем изменять код различных вспомогательных методов. Они достаточно малы, что позволяет делать изменения без написания дополнительных тестов. Это применимо к данному случаю, но в общем нет такого понятия как «достаточно маленький» так же, как нет реального определения «юнит теста». Вообще, вы должны быть уверены, что изменяемая часть кода покрыта тестами. Если это не так, то следует добавить один или несколько тестов, пока вы не почувствуете себя достаточно уверенно."}},{"id":"104e073a-ec08-41c0-8f22-7b517c9f6ef4","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Два метода _max_salary() и _min_salary() имеют много общего кода, хоть и второй более краткий."}},{"type":"code","data":{"code":"def _max_salary(self, data):\r\n # Compute max salary\r\n salaries = [int(e['salary'][1:]) for e in data]\r\n threshold = '£' + str(max(salaries))\r\n\r\n return [e for e in data if e['salary'] == threshold]\r\n\r\n def _min_salary(self, data):\r\n # Compute min salary\r\n salaries = [int(d['salary'][1:]) for d in data]\r\n return [e for e in data if e['salary'] ==\r\n '£{}'.format(str(min(salaries)))]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Я начну с того, что объявлю пороговую переменную threshold во второй функции. После любых изменений я запускаю тесты, чтобы проверить что внешнее поведение кода не изменилось."}},{"type":"code","data":{"code":"def _max_salary(self, data):\r\n # Compute max salary\r\n salaries = [int(e['salary'][1:]) for e in data]\r\n threshold = '£' + str(max(salaries))\r\n\r\n return [e for e in data if e['salary'] == threshold]\r\n\r\n def _min_salary(self, data):\r\n # Compute min salary\r\n salaries = [int(d['salary'][1:]) for d in data]\r\n threshold = '£{}'.format(str(min(salaries)))\r\n\r\n return [e for e in data if e['salary'] == threshold]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Теперь очевидно, что функции, кроме min() и max(), одинаковы. Они до сих пор используют разные имена переменных и разный код для формирования порога, так что в первую очередь я их сравняю, скопировав код из _min_salary() в _max_salary() и изменив min() на max()."}},{"type":"code","data":{"code":"def _max_salary(self, data):\r\n # Compute max salary\r\n salaries = [int(d['salary'][1:]) for d in data]\r\n threshold = '£{}'.format(str(max(salaries)))\r\n\r\n return [e for e in data if e['salary'] == threshold]\r\n\r\n def _min_salary(self, data):\r\n # Compute min salary\r\n salaries = [int(d['salary'][1:]) for d in data]\r\n threshold = '£{}'.format(str(min(salaries)))\r\n\r\n return [e for e in data if e['salary'] == threshold]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Теперь я могу создать ещё одну вспомогательную функцию _select_salary(), которая продублирует этот код и примет в качестве одного из аргументов функцию, используемую вместо min() или max(). Как я делал ранее, я сначала дублирую код, а затем убираю повторы, заменяя их на вызов новой функции."}},{"type":"code","data":{"code":"def _select_salary(self, data, func):\r\n salaries = [int(d['salary'][1:]) for d in data]\r\n threshold = '£{}'.format(str(func(salaries)))\r\n\r\n return [e for e in data if e['salary'] == threshold]\r\n\r\n def _max_salary(self, data):\r\n return self._select_salary(data, max)\r\n\r\n def _min_salary(self, data):\r\n return self._select_salary(data, min)","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Затем я заметил дублирующийся код в _avg_salary() и _select_salary():"}},{"type":"code","data":{"code":"def _avg_salary(self, data):\r\n return math.floor(sum([int(e['salary'][1:]) for e in data])/len(data))\r\n\r\n\r\n def _select_salary(self, data, func):\r\n salaries = [int(d['salary'][1:]) for d in data]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Я решил вынести общий алгоритм в метод _salaries(). Как и раньше, я сначала написал тест:"}},{"type":"code","data":{"code":"def test_salaries():\r\n\r\n ds = DataStats()\r\n\r\n assert ds._salaries(test_data) == [27888, 67137, 70472]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Затем применил метод:"}},{"type":"code","data":{"code":"def _salaries(self, data):\r\n return [int(d['salary'][1:]) for d in data]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"И в итоге заменил дублирующийся код вызовом нового метода:"}},{"type":"code","data":{"code":"def _salaries(self, data):\r\n return [int(d['salary'][1:]) for d in data]\r\n\r\n\r\n def _select_salary(self, data, func):\r\n threshold = '£{}'.format(str(func(self._salaries(data))))\r\n\r\n return [e for e in data if e['salary'] == threshold]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Пока я делал изменения, я заметил, что функция _avg_yearly_increase() содержит такой же код и исправил её."}},{"type":"code","data":{"code":"def _avg_yearly_increase(self, data, iage, isalary):\r\n # iage and isalary are the starting age and salary used to\r\n # compute the average yearly increase of salary.\r\n\r\n # Compute average yearly increase\r\n average_age_increase = math.floor(\r\n sum([e['age'] for e in data])/len(data)) - iage\r\n average_salary_increase = math.floor(\r\n sum(self._salaries(data))/len(data)) - isalary\r\n\r\n return math.floor(average_salary_increase/average_age_increase)","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"В этот момент было бы полезно входные данные поместить внутри класса и использовать как self.data, вместо того, чтобы передавать её во всех методах класса. Однако это нарушит API класса, так как в текущий момент DataStats инициализирован без данных. Позже я покажу, как вводить изменения, которые могут нарушить API и коротко обрисую проблему. Сейчас же я продолжу изменять класс без изменений внешнего интерфейса."}},{"type":"paragraph","data":{"text":"Похоже, что age имеет такую же проблему с повторением кода, как и salary, поэтому таким же образом я введу метод _ages() и изменю методы _avg_age() и _avg_yearly_increase()."}},{"type":"paragraph","data":{"text":"Кстати, говоря о _avg_yearly_increase(), код данного метода дублируется в методах _avg_age() и _avg_salary(), так что стоит его заменить вызовами двух функций. Поскольку я перемещаю код между существующими методами, мне не нужны дальнейшие тесты."}},{"type":"code","data":{"code":"def _avg_yearly_increase(self, data, iage, isalary):\r\n # iage and isalary are the starting age and salary used to\r\n # compute the average yearly increase of salary.\r\n\r\n # Compute average yearly increase\r\n average_age_increase = self._avg_age(data) - iage\r\n average_salary_increase = self._avg_salary(data) - isalary\r\n\r\n return math.floor(average_salary_increase/average_age_increase)","language":"python lazy-code"}},{"type":"header2","data":{"level":2,"text":"Шаг 9. Рефакторинг повышенной сложности"}},{"type":"paragraph","data":{"text":"Коммит: cc0b0a1"}},{"type":"paragraph","data":{"text":"У начального класса не было метода __init__() и, таким образом, отсутствовала часть инкапсуляции ООП. Не было причин оставлять класс, так как метод stats() можно было легко извлечь и представить в виде простой функции."}},{"id":"ae17b6e2-f81b-48c7-b4b1-41d2a5b8a65f","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Это стало более очевидно, когда мы отрефакторили метод, потому что сейчас у нас есть 10 методов, которые принимают data как параметр. Было бы неплохо загрузить входные данные во время инициализации метода, а затем получать доступ к ним как self.data. Это значительно улучшит читаемость класса и оправдает его существование."}},{"type":"paragraph","data":{"text":"Однако, если мы добавим метод, требующий параметры, мы изменим API класса, нарушив совместимость с любым другим кодом, который его импортирует и использует. Поскольку мы хотим сохранить API без изменений, нам нужно придумать обходной путь, который позволит использовать преимущества нового чистого класса, но в то же время не нарушит API. Это не всегда достижимо, но в этом случае проблему поможет решить адаптер (или упаковщик)."}},{"type":"paragraph","data":{"text":"Цель состоит в том, чтобы текущий класс сделать соответствующим новому API, а затем написать упаковщик, который адаптирует этот класс под требования старого API. Стратегия не очень отличается от той, что мы использовали ранее, только в этот раз мы будем работать с классами, а не методами. Огромным усилием моего воображения я назвал новый класс NewDataStats. Простите, но иногда нужно просто сделать работу."}},{"id":"9a8b01a6-a321-46d2-9f61-eed14b4da024","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Первым делом, как это часто бывает с рефакторингом, будет продублировать код, а когда мы вставим новый код, нам нужны будут тесты, которые его проверят. Тесты будут такие же, как и ранее, поскольку новый класс должен выполнять тот же функционал, что и раньше, так что я просто создал новый файл test_newdatastats.py и начал создавать первый тест test_init()."}},{"type":"code","data":{"code":"import json\r\n\r\nfrom datastats.datastats import NewDataStats\r\n\r\n\r\ntest_data = [\r\n {\r\n \"id\": 1,\r\n \"name\": \"Laith\",\r\n \"surname\": \"Simmons\",\r\n \"age\": 68,\r\n \"salary\": \"£27888\"\r\n },\r\n {\r\n \"id\": 2,\r\n \"name\": \"Mikayla\",\r\n \"surname\": \"Henry\",\r\n \"age\": 49,\r\n \"salary\": \"£67137\"\r\n },\r\n {\r\n \"id\": 3,\r\n \"name\": \"Garth\",\r\n \"surname\": \"Fields\",\r\n \"age\": 70,\r\n \"salary\": \"£70472\"\r\n }\r\n]\r\n\r\n\r\ndef test_init():\r\n\r\n ds = NewDataStats(test_data)\r\n\r\n assert ds.data == test_data","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Этот тест не проходит, и код, реализующий класс, очень прост:"}},{"type":"code","data":{"code":"class NewDataStats:\r\n\r\n def __init__(self, data):\r\n self.data = data","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Теперь я могу начать повторяющийся процесс:"}},{"type":"list","data":{"items":["Я скопирую один тест из DataStats и адаптирую его для NewDataStats.","Я скопирую код из DataStats в NewDataStats, адаптируя его под новое API, и удостоверюсь, что он проходит тест."],"style":"ordered"}},{"type":"paragraph","data":{"text":"Итеративное удаление методов из DataStats и замена их вызовом из NewDataStats будут излишними. В следующем разделе я покажу, почему и как этого можно избежать."}},{"type":"paragraph","data":{"text":"Пример результата тестов для NewDataStats:"}},{"type":"code","data":{"code":"def test_ages():\r\n\r\n ds = NewDataStats(test_data)\r\n\r\n assert ds._ages() == [68, 49, 70]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"И код, который проходит тест:"}},{"type":"code","data":{"code":"def _ages(self):\r\n return [d['age'] for d in self.data]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"После этого я заметил, что сейчас методы похожие на _ages() не нуждаются в входных параметрах, я могу преобразовать их в свойства, соответственно меняя тесты."}},{"type":"code","data":{"code":"@property\r\n def _ages(self):\r\n return [d['age'] for d in self.data]","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"Настало время заменить методы в DataStats вызовом из NewDataStats. Мы можем это сделать пошагово, метод за методом, но что нам на самом деле нужно, так это заменить метод stats()."}},{"type":"code","data":{"code":"def stats(self, data, iage, isalary):\r\n nds = NewDataStats(data)\r\n return nds.stats(iage, isalary)","language":"python lazy-code"}},{"type":"paragraph","data":{"text":"И поскольку все другие методы больше не используются, мы можем безопасно удалить их, не боясь, что тесты не пройдут. В случае с тестами, удаление методов приведёт к тому, что многие тесты DataStats не пройдут, так что их тоже следует удалить."}},{"type":"code","data":{"code":"class DataStats:\r\n\r\n def stats(self, data, iage, isalary):\r\n nds = NewDataStats(data)\r\n return nds.stats(iage, isalary)","language":"python lazy-code"}},{"type":"header2","data":{"level":2,"text":"Послесловие"}},{"type":"paragraph","data":{"text":"Если вам интересна тема рефакторинга, то стоит почитать классику – Мартин Фаулер «РЕФАКТОРИНГ. Улучшение существующего кода», в этой книге собран набор шаблонов рефакторинга. Справочный язык – Java, но шаблоны легко применяются и на Python."}}]}

Ошибка в настройках сайта