{"blocks":[{"type":"paragraph","data":{"text":"Память — одна из самых сложных тем в информатике, но понимание устройства памяти компьютера позволяет разрабатывать более эффективные программы, а для более низкоуровневого программирования, например, при разработке ОС, это понимание и вовсе является обязательным."}},{"type":"paragraph","data":{"text":"В этой статье будет рассмотрена модель памяти с высокоуровневой точки зрения — виды памяти, аллокаторы, сборщик мусора."}},{"type":"header2","data":{"level":2,"text":"Виды памяти"}},{"type":"paragraph","data":{"text":"Существует 3 типа памяти: статический, автоматический и динамический."}},{"type":"paragraph","data":{"text":"Статический — выделение памяти до начала исполнения программы. Такая память доступна на протяжении всего времени выполнения программы. Во многих языках для размещения объекта в статической памяти достаточно задекларировать его в глобальной области видимости."}},{"type":"code","data":{"code":"int id = 150; // определение статической глобальной переменной\r\n\r\nint main()\r\n{\r\n std::cout << id + 8; // её использование\r\n}","language":"cpp lazy-code"}},{"type":"paragraph","data":{"text":"Автоматический, также известный как «размещение на стеке», — самый основной, автоматически выделяет аргументы и локальные переменные функции, а также прочую метаинформацию при вызове функции и освобождает память при выходе из неё."}},{"type":"paragraph","data":{"text":"Стек, как структура данных, работает по принципу LIFO («последним пришёл — первым ушёл»). Другими словами, добавлять и удалять значения в стеке можно только с одной и той же стороны."}},{"type":"paragraph","data":{"text":"Автоматическая память работает именно на основе стека, чтобы вызванная из любой части программы функция не затёрла уже используемую автоматическую память, а добавила свои данные в конец стека, увеличивая его размер. При завершении этой функции её данные будут удалены с конца стека, уменьшая его размер. Длина стека останется той же, что и до вызова функции, а у вызывающей функции указатель на конец стека будет указывать на тот же адрес."}},{"type":"paragraph","data":{"text":"Проще всего это понять из примера на С++:"}},{"type":"code","data":{"code":"int main()\r\n{\r\n int a = 3;\r\n int result = factorial(a);\r\n std::cout << result;\r\n}\r\n\r\nint factorial(int n) \r\n{\r\n if (n <= 1) return 1; \r\n return n * factorial(n - 1); \r\n}","language":"cpp lazy-code"}},{"type":"paragraph","data":{"text":"Стек при вызове последней рекурсивной функции будет выглядеть следующим образом:"}},{"type":"image","data":{"file":{"id":90989,"url":"https://media.tproger.ru/uploads/2018/09/afF0f85_68w.jpg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":880,"height":640,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2018/09/afF0f85_68w.jpg","alt":"Модель памяти в языках программирования 1","dimensions":{"width":880,"height":640},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/XS0FDpAhU18ZJAYSofOTslG27apsxTrlpT8n-rq_gPQ/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOS9hZkYwZjg1XzY4dy5qcGc","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/zjbtmKrlG85OA86F6j2nI_wBuPpSxhFhZzNK4H0TJZg/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOS9hZkYwZjg1XzY4dy5qcGc","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/0pUtNKRmo2FlvuhYzALKNlONdRYS3bl-N_WW8DTbBMc/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOS9hZkYwZjg1XzY4dy5qcGc","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/ko_P4H5I9W9j9LP74DEiVDUcDMoIJcLYXzDEHKB4v4E/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOS9hZkYwZjg1XzY4dy5qcGc","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/ZMWKgWSREOiTNvsp7aLOAMhSt7lx34zhaOdmVA2WdoI/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOS9hZkYwZjg1XzY4dy5qcGc","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/_SOny9BNmtF6eHKD_oA7W8cscfiVfPFnLsCycqhZK_E/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOS9hZkYwZjg1XzY4dy5qcGc","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/fEG7nloiM3PiPDt5Byq0a2LNji_1TXGm711cLG7Qx4I/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOS9hZkYwZjg1XzY4dy5qcGc","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/3TTHPBkidZDbKXlZ7zJcBsDW1WDWy6tBYvxjm548wIw/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOS9hZkYwZjg1XzY4dy5qcGc","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"paragraph","data":{"text":" "}},{"type":"paragraph","data":{"text":"Детали реализации автоматической памяти могут быть разными в зависимости от конкретной платформы. Например, кому очищать из стека метаинформацию функции и её аргументы: вызывающей функции или вызываемой? Как передавать результат: через стек или, что намного быстрее, через регистры процессора (память, расположенную прямо на кристалле процессора. В этой статье не рассматривается, т. к. в языках программирования высокого уровня зачастую нет прямого доступа к регистрам процессора). На все эти вопросы отвечает конкретная реализация calling convention — описание технических особенностей вызова подпрограмм, определяющее способы передачи параметров/результата функции и способы вызова/возврата из функции."}},{"type":"paragraph","data":{"text":"Таким образом, когда одна функция вызывает другую, последняя всегда в курсе, где ей взять свои аргументы: на конце стека. Но откуда ей знать, где конец стека? В процессоре для этого есть специальный регистр, хранящий указатель на конец стека. В большинстве случаев стек расположен ближе к концу виртуальной памяти и растёт в сторону начала."}},{"type":"paragraph","data":{"text":"Размер автоматической памяти, а он тоже фиксированный, определяется линковщиком (обычно — 1 мегабайт), максимальный размер зависит от конкретной системы и настроек компилятора/линковщика."}},{"type":"paragraph","data":{"text":"Если приложение выйдет за максимум автоматической памяти, его там может ждать Page Fault (сигнал SIGSEGV в POSIX-совместимых системах: Mac OS X, Linux, BSD и т. д.) — ошибка сегментации, приводящая к аварийному завершению программы."}},{"type":"paragraph","data":{"text":"Динамическая — выделение памяти из ОС по требованию приложения."}},{"type":"paragraph","data":{"text":"Автоматическая и статическая память выделяются единоразово перед запуском программы. При их нехватке, либо если модель LIFO не совсем подходит, используется динамическая память."}},{"type":"paragraph","data":{"text":"Приложение при необходимости может запросить у ОС дополнительную память через аллокатор или напрямую через системный вызов. Пример использования динамической памяти с помощью аллокатора ниже на примере языка Си."}},{"type":"code","data":{"code":"char *i = malloc(sizeof(char)); // просим у аллокатора память для char \r\nif (i != NULL) // аллокатор может вернуть NULL (0) \r\n{ \r\n *i = 120; // делаем что-то с памятью, на которую указывает указатель i \r\n printf(\"Чтение символа из выделенной памяти: %c\\n\", *i); \r\n free(i); // возвращаем память обратно аллокатору \r\n}","language":"clike lazy-code"}},{"type":"paragraph","data":{"text":"После выделения памяти в распоряжение программы поступает указатель на начало выделенной памяти, который, в свою очередь, тоже должен где-то храниться: в статической, автоматической или также в динамической памяти. Для возвращения памяти обратно в аллокатор необходим только сам указатель. Попытка использования уже очищенной памяти может привести к завершению программы с сигналом SIGSEGV."}},{"type":"paragraph","data":{"text":"Языки сверхвысокого уровня используют динамическую память как основную: создают все или почти все объекты в динамической памяти, а на стеке или в статической памяти держат указатели на эти объекты."}},{"type":"paragraph","data":{"text":"Максимальный размер динамической памяти зависит от многих факторов: среди них ОС, процессор, аппаратная архитектура в целом, не говоря уже о самом очевидном — максимальном размере ОЗУ у конкретного устройства. Например x86_64 процессоры используют только 48 бит для адресации виртуальной памяти, что позволяет использовать до 256 ТБ памяти. В следующей статье про более низкоуровневую архитектуру памяти будет объяснено, почему не все 64 бита."}},{"type":"header2","data":{"level":2,"text":"Аллокатор"}},{"type":"paragraph","data":{"text":"У динамической памяти есть две явные проблемы. Во-первых, любое выделение/освобождение памяти в ОС — системный вызов, замедляющий работу программы. Решением этой проблемы является аллокатор."}},{"type":"paragraph","data":{"text":"Аллокатор — это часть программы, которая запрашивает память большими кусками напрямую у ОС через системные вызовы (в POSIX-совместимых ОС это mmap для выделения памяти и unmap — для освобождения), затем по частям отдаёт эту память приложению (в Си это могут быть функции malloc()/free()). Такой подход увеличивает производительность, но может вызвать фрагментацию памяти при длительной работе программы."}},{"type":"paragraph","data":{"text":"malloc()/free() и mmap/unmap — это не одно и то же. Первый является простейшим аллокатором в libc, второй является системным вызовом. В большинстве языков можно использовать только аллокатор по умолчанию, но в языках с более низкоуровневой моделью памяти можно использовать и другие аллокаторы."}},{"type":"paragraph","data":{"text":"Например, boost::pool аллокаторы, созданные для оптимальной работы с контейнерами (boost::pool_allocator для линейных (std::vector), boost::fast_pool_allocator для нелинейных (std::map, std::list)). Или аллокатор jemalloc, оптимизированный для решения проблем фрагментации и утилизации ресурсов CPU в многопоточных программах. Более подробно о jemalloc можно узнать из доклада с конференции C++ Russia 2018."}},{"type":"header2","data":{"level":2,"text":"Способы контроля динамической памяти"}},{"type":"paragraph","data":{"text":"Из-за сложности программ очень трудно определить, когда необходимо освобождать память в ОС, и это вторая явная проблема динамической памяти. Если забыть вызвать munmap() или free(), то произойдет следующая ситуация: приложению память уже не нужна, но ОС всё ещё будет считать, что эта память используется программой. Эту проблему называют «утечкой памяти». Существуют несколько способов автоматического или полуавтоматического решения этой проблемы:"}},{"type":"paragraph","data":{"text":"RAII (Получение ресурса есть инициализация) — в ООП — организация получения доступа к ресурсу в конструкторе, а освобождения — в деструкторе соответствующего класса. Достаточно реализовать управление памятью в конструкторах и деструкторах, а компилятор вызовет их автоматически. Например, немного урезанный класс String из статьи про Move-семантику. Выделяем память в конструкторе, очищаем в деструкторе:"}},{"type":"code","data":{"code":"class String \r\n{ \r\npublic: \r\n explicit String(const char *const c_string) \r\n { \r\n size = strlen(c_string) + 1; \r\n this->c_string = new char[size]; // выделяем память\r\n strcpy(this->c_string, c_string);\r\n }\r\n\r\n ~String() noexcept\r\n {\r\n delete[] c_string; // очищаем память\r\n }\r\n\r\nprivate:\r\n char *c_string;\r\n size_t size;\r\n};","language":"java lazy-code"}},{"type":"paragraph","data":{"text":"Умные указатели на основе RAII — указатели, автоматически владеющие динамической памятью, то есть автоматически освобождающие её, когда она больше не нужна. Умные указатели инкапсулируют только управление памятью объекта, но не сам объект, как, например, происходит в String, который инкапсулирует объект целиком. Примеры умных указателей ниже."}},{"type":"paragraph","data":{"text":"std::unique_ptr — класс уникального указателя, является единственным владельцем памяти и очищает её в своём деструкторе. Поэтому объекты класса std::unique_ptr не могут иметь копий, но могут быть перемещены. Подробнее о семантике перемещения в этой статье."}},{"type":"paragraph","data":{"text":"std::shared_ptr — класс общего указателя, использующий атомарный счётчик ссылок для подсчёта количества владельцев памяти. В конструкторе счётчик инкрементируется, в деструкторе — декрементируется. Как только счётчик становится равным нулю, память освобождается."}},{"type":"paragraph","data":{"text":"Но у std::shared_ptr есть проблема, например, когда объект A ссылается на объект B, а объект B ссылается на объект A. В таком случае у обоих объектов счётчик ссылок никогда не будет меньше 1 и произойдёт утечка памяти. Решений у этой проблемы два. Использование std::weak_ptr, который ссылается на объект, но без счётчика ссылок, и не может быть разыменован без предварительной конвертации в std::shared_ptr. Вторым решением этой проблемы является сборщик мусора."}},{"type":"paragraph","data":{"text":"Сборка мусора — одна из форм автоматического управления динамической памятью, которая помечает все доступные из стека или статической памяти динамически выделенные объекты. Объекты, до которых нельзя добраться через цепочку указателей, начиная с автоматической или статической памяти, т. е. не помеченные сборщиком мусора, очищаются."}},{"type":"paragraph","data":{"text":"Умные указатели и RAII используются в основном в относительно низкоуровневых языках, например, С++ или Swift. В более высокоуровневых языках обычно используется сборщик мусора (Java), хотя может применяться комбинация умного указателя и сборщика мусора (Python)."}},{"type":"paragraph","data":{"text":"У каждого способа управления динамической памятью есть свои плюсы и минусы. В основном приходится жертвовать производительностью программы ради скорости и простоты разработки, либо наоборот: высокая производительность, но и высокая требовательность к программистам, из-за чего вероятность ошибиться при разработке программы выше и медленней сам процесс."}}]}

Ошибка в настройках сайта