{"time":1742305812275,"blocks":[{"id":"x1HuIKGYLe","type":"paragraph","data":{"text":"Концепция happens-before как отношение частичного порядка между операциями чтения и записи в многопоточном приложении, вероятно, знакома каждому разработчику на Java. Как минимум такая тема постоянно всплывает на собеседованиях, и теорию, что характерно, все знают прекрасно. Однако на практике процесс переупорядочивания кода сопряжен с различными нюансами. Об этом — техлид IT_ONE Дмитрий Владимиров."}},{"id":"OiuixEsAU0","type":"header2","data":{"text":"История вопроса","level":2},"tunes":{}},{"id":"KVXRH47_Ns","type":"paragraph","data":{"text":"Вкратце вспомним процесс программирования. Код, который мы пишем на Java, превращается в байт-код. Тот попадает в виртуальную машину Java, а она, в свою очередь, производит машинный код, который выполняется на процессоре. В 2005 году на архитектуре x86 впервые появилась многоядерность. Возникла задача — найти оптимальный путь к выполнению кода. Для этого были придуманы различные переупорядочивания, которые можно разделить на три типа:"}},{"id":"_xbNvVh1Mx","type":"list","data":{"style":"unordered","items":["Sequential Consistency — запрещены все переупорядочивания (по сути — как написали, так и работает). ","Relaxed Consistency — разрешены некоторые переупорядочивания. ","Weak Consistency — разрешены все переупорядочивания."]}},{"id":"Q3TB5sMU-3","type":"paragraph","data":{"text":"В этом материале мы рассмотрим первый вариант (тут и далее приведены примеры на псевдокоде, до степени смешения похожем на Java). Возьмем такой пример:"}},{"id":"C3qWGFpFwp","type":"code","data":{"code":"private int a =1;\nprivate int b =2;\nprivate int r1 =a; // всегда 1\nprivate int r2 =b; // всегда 2","language":"java","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"BpfvPzu6GD","type":"paragraph","data":{"text":"Можно ли в этой последовательности совершить перестановку? Да, безусловно:"}},{"id":"-VNFi3TXKx","type":"code","data":{"code":"private int a =1;\nprivate int r1 =a; // всегда 1\nprivate int b =2;\nprivate int r2 =b; // всегда 2","language":"java","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"9zD0pTKY0l","type":"paragraph","data":{"text":"Можно переставить и по-другому, например:"}},{"id":"HAaOUzQyG8","type":"code","data":{"code":"private int b =2;\nprivate int a =1;\nprivate int r2 =b; // всегда 2\nprivate int r1 =a; // всегда 1","language":"java","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"Pym_8VQo0z","type":"paragraph","data":{"text":"Есть ли у нас какие-то гарантии, что результат выполнения программы при этом будет идентичным? Да, но существуют свои ограничения:"}},{"id":"FUUH_pW592","type":"list","data":{"style":"unordered","items":["Принцип as-if-serial: означает, что результат выполнения программы неотличим от порядка выполнения «как написано». Но только в одном потоке. ","Процессор не меняет итоговый результат выполнения — вторая гарантия. Но она актуальна только в рамках одного ядра.","Принцип cache coherence — означает, что все изменения в кэше ядра видны всем остальным ядрам процессора. Но эти изменения с кэшем происходят через некоторое время. Причин много: от организации доставки изменений до ограничения скорости света (да, это совсем короткий промежуток времени, но и им мы не можем пренебрегать)."]}},{"id":"tZvgUifTfF","type":"paragraph","data":{"text":"Посмотрим на этот фрагмент кода — идиому Dekker lock:"}},{"id":"sP70Liil3C","type":"code","data":{"code":"private int x;\n private int y;\n public int actor1() {\n x = 1;\n return y;\n }\n public int actor1() {\n y = 1;\n return x;\n }","language":"java","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"fK-_b6bj7K","type":"paragraph","data":{"text":"Здесь есть две переменные: x и y. В первом методе мы в x записываем 1 и читаем y, а во втором в y записываем 1 и читаем x. Важно, что записи происходят до чтений и перед любым чтением есть запись. Что произойдет, если мы это будем запускать в параллели, в достаточном объеме и в достаточной интенсивности? Мы можем получить на выходе две 1, разные варианты сочетаний 0 и 1 или, чисто теоретически, два 0. Потому что x и y по умолчанию равны 0, и может случиться перестановка операторов, то есть изменение хода выполнения программы."}},{"id":"88b6c6cf-5ecd-4fa2-8dde-830ef0c0cd6b","type":"banner-blank","data":{}},{"id":"9Aae7Z7KQU","type":"paragraph","data":{"text":"Через jcstress, фреймворк для нагрузочного тестирования Java-приложения, мы несколько раз запустили по 10 пачек автотестов. В итоге мы получили примерно 16-19% случаев, когда в результате выполнения кода вышло два 0. И менее 1% случаев, когда получились две 1."}},{"id":"fTA_hXCujn","type":"paragraph","data":{"text":"Таким образом, этот процесс рандомный. Очевидно, что происходят некие перестановки и правила as-if-serial недостаточно для многопоточности."}},{"id":"1Ybh_vEZeC","type":"paragraph","data":{"text":"Также замечу, что мы получили от 16 до 19 процентов абсолютно непредсказуемых результатов. Признайтесь, хоть кто-то ожидал увидеть два нуля? А они там случаются, и это не единичные случаи."}},{"id":"xW-9Hykfxm","type":"paragraph","data":{"text":"Конечно, мы можем добавить строгие требования и гарантии: работаем на такой-то архитектуре, запускаемся только так и никак иначе… Но тогда возникают сомнения в ключевом свойстве Java — «write once, run anywhere»."}},{"id":"4o3t6unz6L","type":"header2","data":{"text":"Магия JMM","level":2},"tunes":{}},{"id":"KRc6r8xvYX","type":"paragraph","data":{"text":"Для решения проблемы была создана Java Memory Model, которая предусматривает, что при выполнении определенных условий нам гарантируется порядок действий, консистентный с порядком в коде, а также видимость всех изменений."}},{"id":"5911d3ae-e76d-4421-a1e4-87a586a832ce","type":"banner-blank","data":{}},{"id":"WZ3XxWfaKf","type":"paragraph","data":{"text":"Базовое понятие JMM — Memory Ordering, наблюдаемый программой порядок, в котором происходят действия с памятью. Его наличие критично, так как программа ничего не знает об условиях, в которых ее запускают: о многопоточности, многоядерности, действии кэша, перестановках, оптимизации и так далее. Она может лишь сообщить, как взаимодействует с памятью. Свидетельство тому — описанный выше пример теста, который продемонстрировал, что действия с памятью все-таки были переупорядочены."}},{"id":"bF-WfJCeNj","type":"paragraph","data":{"text":"Это значит, что мы написали код по одному принципу, а с памятью работаем иначе. Поэтому нужно ввести еще одно понятие — Program Order, порядок действий в коде."}},{"id":"cnI7aNpK6C","type":"paragraph","data":{"text":"Как сохраняется порядок программы при работе в памяти? И валиден ли наблюдаемый Memory Order?"}},{"id":"9dLgbKCaUG","type":"paragraph","data":{"text":"JMM диктует нам очевидную вещь: если программа не синхронизирована, то разрешены все переупорядочивания. А если всё правильно синхронизировано, то запрещены."}},{"id":"mhnA3aPq8C","type":"paragraph","data":{"text":"Важно также, что если программа никак не синхронизирована, то порядок взаимодействия с памятью (memory order), который не консистентен с порядком выполнения программы (program order), валиден с точки зрения JMM. Ей всё равно, что мы написали и чего хотим: она работает в рамках своих понятий и может нам всё переставить — просто потому, что у нее есть такая возможность. А если программа правильно синхронизирована, валиден только консистентный порядок."}},{"id":"4kW4cVsjtF","type":"paragraph","data":{"text":"Вернемся к Dekker lock и перечислим возможные варианты чтения и записи:"}},{"id":"-gc2hu_LqJ","type":"code","data":{"code":"x=1, y=1, r1=y(=1), r2=x(=1)\nx=1, y=1, r2=x(=1), r1=y(=1)\nx=1, r1=y(=0), y=1, r2=x(=1)\ny=1, x=1, r1=y(=1), r2=x(=1)\ny=1, x=1, r1=x(=1), r2=y(=1)\ny=1, r2=x(=0), x=1, r1=y(=1)","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"sASZ1_w7nQ","type":"paragraph","data":{"text":"Как это читать? Слева направо. На примере первой строки: сначала в х записывается 1, потом в у записывается 1, потом в r1 записывается значение у, которое равно 1, потом в r2 записывается значение х, которое равно 1."}},{"id":"0f494431-9b73-456d-ba56-d6349cd7da48","type":"banner-blank","data":{}},{"id":"D8Kr8aZW8U","type":"paragraph","data":{"text":"А вот такой вариант, с точки зрения синхронизированной программы, невозможен, несмотря на то, что мы его видели при запуске jcstress:"}},{"id":"bPAINTaolD","type":"code","data":{"code":"r1=y(=0), r2=x(=0), y=1, x=1","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"MAhwmLxqv0","type":"paragraph","data":{"text":"Тут описано следующее: сначала в r1 записалось значение у, которое равно 0, потом в r2 записалось значение х, которое тоже было равно 0, а потом уже записали единицы в х и у — произошла перестановка порядка действий."}},{"id":"6E4MlEupdo","type":"paragraph","data":{"text":"Итак, Java Memory Model не гарантирует нам консистентного порядка в памяти. Что делать?"}},{"id":"7gYCX1Uu6X","type":"paragraph","data":{"text":"Давайте обратимся к определению. Java Memory Model — sequential consistency-data race free (SC-DRF) модель. Это означает, что мы получим консистентность, если избавимся от всех data race — событий, когда с общими данными работают несколько потоков, как минимум один из которых должен писать, и действия потоков не синхронизированы. Но как от них избавиться? Первый вариант — не писать данные, только читать. Вариант надежный, как швейцарские часы. Но более частый — связать все действия с общими данными в synchronization order или в happens-before order."}},{"id":"0cj_c5iSed","type":"paragraph","data":{"text":"Synchronization order можно добиться несколькими способами:"}},{"id":"eq9w-H66a2","type":"list","data":{"style":"unordered","items":["volatile: обещают, что переменная будет синхронизирована сразу после изменения; ","atomic: использовать некие объекты, обладающие свойством атомарности. Мы не видим промежуточные этапы, а только начало и конец; ","мониторы."]}},{"id":"at5PqC6ml_","type":"paragraph","data":{"text":"Итак, вернемся к нашему коду и для исправления добавим в него volatile:"}},{"id":"kxYWGU2VDi","type":"code","data":{"code":"private int x;\nprivate int y;\npublic int actor1() {\n x = 1;\n return y;\n}\npublic int actor1() {\n y = 1;\n return x;\n}","language":"java","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"4nPpKAHwXL","type":"paragraph","data":{"text":"Запустив аналогичные пачки автотестов, мы убеждаемся, что результат два 0 не встречается. То же самое мы получим, если удалим volatile в одной из строк (перед x или y)."}},{"id":"9_JHKd9AHK","type":"header2","data":{"text":"Happens-before в действии","level":2},"tunes":{}},{"id":"KJ-8muyth0","type":"paragraph","data":{"text":"Определение happens-before в JMM выглядит так: «Two actions can be ordered by a happens-before relationship. If one action happens-before another, then the first is visible to and ordered before the second». Речь здесь идет о двух действиях (операциях), которые выполняются в двух потоках и соотносятся друг с другом в соответствии с happens-before. Если одно действие случается до второго, то первое видно и выполняется."}},{"id":"b9faa7ea-0c46-4b08-8abc-90d7c779dc12","type":"banner-blank","data":{}},{"id":"OJMDV45USH","type":"paragraph","data":{"text":"Означает ли happens-before, что инструкции «под капотом» будут выполняться в том же порядке? Разумеется, нет. Это всё равно решают компилятор и процессор."}},{"id":"LeJbCRvgK2","type":"paragraph","data":{"text":"Например, здесь happens-before есть, и действия не связаны:"}},{"id":"zojjDkrslU","type":"code","data":{"code":"x=1\nr1=y","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"GyGA51DN6U","type":"paragraph","data":{"text":"Здесь тоже happens-before есть, но действия связаны:"}},{"id":"PwNLPPK7KZ","type":"code","data":{"code":"x=1\ny=x+1","language":"clike","lineNumbers":false,"startLineNumber":1,"stretched":false}},{"id":"kzTSbSRbxP","type":"paragraph","data":{"text":"Какие приемы помогут добиться синхронизации:"}},{"id":"2bKQmp33N3","type":"list","data":{"style":"unordered","items":["monitor lock, ","volatile, ","final thread action: последнее действие в треде выполняется до закрытия треда, ","thread start action: запуск треда происходит до первой команды в треде, ","thread interrupt action: сначала выполняется interrupt, и после него выполняется выход из треда, ","default initialization: действие происходит до первого обращения к параметру. "]}},{"id":"VPrAHrHzCT","type":"paragraph","data":{"text":"И самое главное здесь — свойство транзитивности (transitivity), ради которого весь сыр-бор на собеседованиях и затевается."}},{"id":"HhvW49xDeC","type":"paragraph","data":{"text":"Предположим, что у нас есть два действия x и y, связанные отношением happens-before, и два действия y и z, которые тоже связаны отношением happens-before."}},{"id":"qsG8FnOFjc","type":"paragraph","data":{"text":"Здесь мы получаем транзитивность: действия x и z тоже будут связаны отношением happens-before, даже в параллельных тредах."}},{"id":"jv-FrrRGGT","type":"paragraph","data":{"text":"В этом и заключается основное практическое преимущество happens-before."}},{"id":"jMMriZdBKN","type":"header2","data":{"text":"Итог","level":2},"tunes":{}},{"id":"KC1hBI9mBk","type":"paragraph","data":{"text":"Если вы хорошо понимаете механизмы и причины возникновения happens-before, то в вашем коде будет меньше багов. Всегда полезно представлять себе два взаимодействующих потока как два реальных потока вода, в которых есть некие пороги-препятствия, позволяющие «зацепиться» за них и сообщить в другой поток об изменениях."}}],"version":"2.25.0"}

Ошибка в настройках сайта