{"blocks":[{"type":"paragraph","data":{"text":"Некоторые разработчики удивляются, как однопоточный Node.js может конкурировать с многопоточным серверным софтом. Кажется нелогичным, что компании выбирают его в качестве backend. Для начала надо разобраться в том, что на самом деле подразумевается под однопоточностью Node."}},{"type":"paragraph","data":{"text":"JavaScript был создан для реализации простых web-задач вроде проверки формы или создания следа у курсора. Только в 2009 году Райан Дал (создатель Node.js) сделал возможным использование этого языка для написания backend-софта."}},{"type":"paragraph","data":{"text":"Backend-языки, поддерживающие многопоточность, имеют необходимые механизмы для синхронизации значений между потоками и другими поточно-ориентированными функциями. Для поддержки этого в JavaScript потребовалось бы изменить весь язык, что не входило в планы Дала. Пришлось создать обходной путь, чтобы простой JavaScript мог поддерживать многопоточность."}},{"type":"embed","data":{"link":"https://tproger.ru/translations/js-engine-macrotasks-microtasks"}},{"type":"header2","data":{"level":2,"text":"Как на самом деле работает Node.js"}},{"type":"paragraph","data":{"text":"Node.js использует два вида потоков:"}},{"type":"list","data":{"items":["основной поток, обрабатываемый циклом событий (Event Loop),","несколько вспомогательных потоков в пуле воркеров."],"style":"unordered"}},{"type":"paragraph","data":{"text":"Цикл обработки событий — это механизм, который принимает callback-функции и регистрирует их для выполнения в определённый момент в будущем. Он работает в том же потоке, что и сам код JavaScript. Когда операция блокирует поток, цикл событий также блокируется."}},{"type":"paragraph","data":{"text":"Пул воркеров — модель исполнения, вызывающая и обрабатывающая отдельные потоки. Затем они синхронно выполняют задачу и возвращают результат в цикл обработки событий. После цикл вызывает callback-функцию с указанным результатом."}},{"id":"f8431f09-2c58-4cf3-aa3f-0f17ad089dff","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Если коротко, то пул воркеров может заниматься асинхронными операциями ввода-вывода — прежде всего, взаимодействем с системным диском и сетью. Эта модель исполнения в основном используется модулями вроде fs (требовательного к скорости ввода-вывода) или crypto (требовательного к CPU). Пул воркеров реализован в libuv, что приводит к небольшой задержке всякий раз, когда Node требует связи между JavaScript и C ++, но эта задержка едва ощутима."}},{"type":"paragraph","data":{"text":"Используя оба эти механизма, можно написать следующий код:"}},{"type":"code","data":{"code":"fs.readFile(path.join(__dirname, './package.json'), (err, content) => {\r\n if (err) {\r\n return null;\r\n }\r\n\r\n console.log(content.toString());\r\n});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Модуль fs указывает пулу воркеров использовать один из его потоков для чтения содержимого файла и уведомления цикла обработки событий, когда это будет сделано. Цикл принимает предоставленную callback-функцию и выполняет её с содержимым файла."}},{"type":"paragraph","data":{"text":"Выше приведён пример неблокирующего кода. Пул воркеров прочитает файл и вызовет предоставленную функцию с результатом. Поскольку пул имеет собственные потоки, цикл обработки событий может продолжать исполнение в обычном режиме во время чтения файла."}},{"type":"paragraph","data":{"text":"Всё работает, пока нет необходимости синхронно выполнять какую-то сложную операцию. Любая функция, выполнение которой занимает слишком много времени, блокирует поток. Если в приложении много таких функций, оно может значительно снизить производительность сервера или вообще заморозить его работу в целом. В этом случае нет способа делегировать работу пулу воркеров."}},{"id":"49e9bbe5-8f98-4a9a-a9f9-a9417c71e22d","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Области, требующие сложных вычислений, — искусственный интеллект, машинное обучение или большие данные— не могли эффективно использовать Node.js из-за операций, блокирующих основной (и единственный) поток, что делало сервер неотзывчивым. Так было до появления Node.js v10.5.0, в котором была добавлена поддержка нескольких потоков."}},{"type":"header2","data":{"level":2,"text":"Знакомство с worker_threads"}},{"type":"paragraph","data":{"text":"Модуль worker_threads — это пакет, который позволяет создавать полнофункциональные многопоточные приложения Node.js."}},{"type":"paragraph","data":{"text":"Потоковый воркер (thread worker) — фрагмент кода (обычно извлекаемый из файла), созданный в отдельном потоке."}},{"type":"paragraph","data":{"text":"Для использования потоковых воркеров нужно импортировать модуль worker_threads. Начнём с создания функции, которая поможет создавать эти воркеры, а также рассмотрим их свойства."}},{"type":"code","data":{"code":"type WorkerCallback = (err: any, result?: any) => any;\r\n\r\nexport function runWorker(path: string, cb: WorkerCallback, workerData: object | null = null) {\r\n const worker = new Worker(path, { workerData });\r\n\r\n worker.on('message', cb.bind(null, null));\r\n worker.on('error', cb);\r\n\r\n worker.on('exit', (exitCode) => {\r\n if (exitCode === 0) {\r\n return null;\r\n }\r\n\r\n return cb(new Error(`Worker has stopped with code ${exitCode}`));\r\n });\r\n\r\n return worker;\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Для создания потокового воркера необходимо создать экземпляр класса Worker. В первом аргументе указываем путь к файлу, который содержит код воркера; во втором предоставляем объект, содержащий свойство с именем workerData. Это те данные, к которым поток будет иметь доступ при запуске, если того хочет разработчик."}},{"type":"paragraph","data":{"text":"Обратите внимание: независимо от того, используете ли вы сам JavaScript или что-то, что в него транспилируется (например TypeScript), путь всегда должен ссылаться на файлы с расширениями .js или .mjs."}},{"id":"7e159c3a-7576-4694-9d6e-caa320d0d22c","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Также стоит указать, почему используется callback-функция вместо возвращения промиса (promise), который будет передавать результат в resolve при запуске события message. Это связано с возможностью потоковых воркеров отправлять много событий message, а не только одно."}},{"type":"paragraph","data":{"text":"Связь между потоками основана на событиях. Это означает, что надо настроить обработчики, которые будут вызываться после отправки потоком данного события."}},{"type":"paragraph","data":{"text":"Рассмотрим наиболее распространённые события."}},{"type":"code","data":{"code":"worker.on('error', (error) => {});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Событие error генерируется, когда внутри воркера возникает необработанное исключение. Затем поток завершается, а ошибка становится первым аргументом в callback."}},{"type":"code","data":{"code":"worker.on('exit', (exitCode) => {});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Exit генерируется, когда воркер заканчивает своё выполнение. Если process.exit() вызывается внутри потока, exitCode будет предоставлен в callback. Если поток прерывается с помощью worker.terminate(), код будет 1."}},{"type":"code","data":{"code":"worker.on('online', () => {});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Online генерируется, когда воркер прекращает парсинг кода JavaScript и начинает его выполнение. Это событие используется нечасто, но в определённых случаях оно может быть информативным."}},{"type":"code","data":{"code":"worker.on('message', (data) => {});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Message генерируется, когда воркер отправляет данные в родительский поток."}},{"type":"header2","data":{"level":2,"text":"Обмен данными между потоками"}},{"type":"paragraph","data":{"text":"Для отправки данных другому потоку используется метод port.postMessage(). Он имеет следующую сигнатуру:"}},{"type":"code","data":{"code":"port.postMessage(data[, transferList])","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Объект port может быть или экземпляром parentPort, или экземпляром MessagePort — подробнее об этом позже."}},{"type":"header3","data":{"level":3,"text":"Аргумент data"}},{"type":"paragraph","data":{"text":"Первый аргумент данных — назовём его data — это объект, который копируется в другой поток. Он может содержать всё, что поддерживает алгоритм копирования."}},{"id":"b084b6cf-59b8-40e6-98d0-c763e22cb7d5","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Данные копируются алгоритмом структурированного клонирования."}},{"type":"paragraph","data":{"text":"Алгоритм не копирует функции, ошибки, дескрипторы свойств или цепочки прототипов. Следует также отметить, что копирование объектов таким способом отличается от JSON, потому что он может содержать циклические ссылки и типизированные массивы, а JSON не может."}},{"type":"paragraph","data":{"text":"Поддерживая копирование типизированных массивов, алгоритм позволяет разделять память между потоками."}},{"type":"header3","data":{"level":3,"text":"Разделение памяти между потоками"}},{"type":"paragraph","data":{"text":"Считается, что модули вроде cluster или child_process используют потоки уже давно. Это одновременно и верно и нет."}},{"type":"paragraph","data":{"text":"Cluster может создавать несколько процессов Node.js с одним главным процессом, маршрутизирующим запросы между ними. Кластеризация приложения позволяет эффективно увеличить пропускную способность сервера. Однако нельзя создать отдельный поток с модулем cluster."}},{"type":"paragraph","data":{"text":"Модуль child_process может создавать любой исполняемый файл независимо от типа файла. В этом модуле отсутствуют некоторые важные функции, которые есть у worker_threads."}},{"id":"0b0d7a4a-39ae-4e31-b6f1-92a668fc3a1f","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Потоковые воркеры являются более лёгкими и имеют тот же идентификатор процесса, что и их родительские потоки. Ещё они могут использовать память совместно со своими родительскими потоками. Это позволяет воркерам избежать сериализации больших входных данных и, как следствие, отправлять данные вперёд и назад более эффективно."}},{"type":"paragraph","data":{"text":"Рассмотрим пример разделения памяти между потоками. Чтобы память была разделена, экземпляры ArrayBuffer или SharedArrayBuffer должны быть отправлены другому потоку в качестве аргумента data или внутри него."}},{"type":"paragraph","data":{"text":"Пример воркера, который разделяет память со своим родительским потоком:"}},{"type":"code","data":{"code":"import { parentPort } from 'worker_threads';\r\n\r\nparentPort.on('message', () => {\r\n const numberOfElements = 100;\r\n const sharedBuffer = new SharedArrayBuffer(Int32Array.BYTES_PER_ELEMENT * numberOfElements);\r\n const arr = new Int32Array(sharedBuffer);\r\n\r\n for (let i = 0; i < numberOfElements; i += 1) {\r\n arr[i] = Math.round(Math.random() * 30);\r\n }\r\n\r\n parentPort.postMessage({ arr });\r\n});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Создаётся экземпляр SharedArrayBuffer с размером памяти, необходимым для хранения ста 32-битных целых чисел. Затем создаётся экземпляр Int32Array, который будет использовать буфер для хранения его структуры. После массив заполняется некоторыми случайными числами и отправляется в родительский поток."}},{"type":"paragraph","data":{"text":"В родительском потоке:"}},{"type":"code","data":{"code":"import path from 'path';\r\n\r\nimport { runWorker } from '../run-worker';\r\n\r\nconst worker = runWorker(path.join(__dirname, 'worker.js'), (err, { arr }) => {\r\n if (err) {\r\n return null;\r\n }\r\n\r\n arr[0] = 5;\r\n});\r\n\r\nworker.postMessage({});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Меняя значение arr[0] на 5, фактически изменяем его в обоих потоках."}},{"id":"51789ac9-d9a5-4530-af2a-5952c2563df6","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"При разделении памяти есть риск изменить значение в одном потоке, изменив его в другом. Но вместе с этим появляется хорошая особенность: значение не нужно сериализовывать, чтобы оно было доступно в другом потоке. Это значительно повышает эффективность. Просто не забывайте правильно управлять ссылками на данные, чтобы те в свою очередь не оставляли за собой мусор после завершения работы с ними."}},{"type":"paragraph","data":{"text":"Зачастую гораздо удобнее передавать между потоками не массив, а объект. Но, к сожалению, не существует SharedObjectBuffer или чего-либо подобного, но можно самим создать похожую структуру."}},{"type":"header3","data":{"level":3,"text":"Аргумент TransferList"}},{"type":"paragraph","data":{"text":"TransferList может содержать только ArrayBuffer и MessagePort. После передачи в другой поток их больше нельзя использовать в отправляющем потоке. Память перемещается в другой поток и, следовательно, недоступна в отправляющем."}},{"type":"paragraph","data":{"text":"Пока нет канала связи, нельзя передавать сетевые сокеты, включая их в TransferList."}},{"type":"header3","data":{"level":3,"text":"Создание канала связи"}},{"type":"paragraph","data":{"text":"Связь между потоками осуществляется через порты, которые являются экземплярами класса MessagePort. Они обеспечивают эту связь на основе событий."}},{"id":"76f5cc28-4d69-418d-b353-61c1f32ac54a","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Есть два способа использования портов для связи между потоками. Первый используется по умолчанию и проще, чем второй. В код воркера импортируется объект с именем parentPort из модуля worker_threads и используется .postMessage() для отправки сообщений в родительский поток."}},{"type":"paragraph","data":{"text":"Пример:"}},{"type":"code","data":{"code":"import { parentPort } from 'worker_threads';\r\nconst data = {\r\n // ...\r\n};\r\n\r\nparentPort.postMessage(data);","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"parentPort — это экземпляр MessagePort, который Node.js создал “за кулисами”, чтобы обеспечить связь с родительским потоком. Таким образом, можно общаться между потоками, используя объекты parentPort и worker."}},{"type":"paragraph","data":{"text":"Второй способ связи между потоками — создать MessageChannel и отправить его воркеру. Вот как можно создать новый MessagePort и поделиться им с потоковым воркером:"}},{"type":"code","data":{"code":"import path from 'path';\r\nimport { Worker, MessageChannel } from 'worker_threads';\r\n\r\nconst worker = new Worker(path.join(__dirname, 'worker.js'));\r\n\r\nconst { port1, port2 } = new MessageChannel();\r\n\r\nport1.on('message', (message) => {\r\n console.log('message from worker:', message);\r\n});\r\n\r\nworker.postMessage({ port: port2 }, [port2]);","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"После создания port1 и port2 настраиваем обработчики событий на port1 и отправляем port2 воркеру. Необходимо включить его в файл TransferList, чтобы он был передан рабочей стороне."}},{"type":"paragraph","data":{"text":"Теперь внутри воркера:"}},{"type":"code","data":{"code":"import { parentPort, MessagePort } from 'worker_threads';\r\n\r\nparentPort.on('message', (data) => {\r\n const { port }: { port: MessagePort } = data;\r\n\r\n port.postMessage('heres your message!');\r\n});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Таким образом, используется порт, который был отправлен родительским потоком."}},{"type":"paragraph","data":{"text":"Использование parentPort тоже является правильным подходом, но лучше создать новый MessagePort с экземпляром MessageChannel, а затем поделиться им с созданным воркером."}},{"id":"75e1dcd7-85bb-48a8-aa7a-ffa12afc9b94","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Обратите внимание, в примерах ниже для простоты используется parentPort."}},{"type":"header3","data":{"level":3,"text":"Два способа использования воркеров"}},{"type":"paragraph","data":{"text":"Первый — создать воркер, выполнить его код и отправить результат в родительский поток. При таком подходе каждый раз, когда появляется новая задача, надо заново создавать воркер."}},{"type":"paragraph","data":{"text":"Второй способ — создать воркер и настроить обработчики для события message. Каждый раз при запуске это событие выполняет свою работу и отправляет результат обратно в родительский поток, который сохраняет воркер для последующего использования."}},{"type":"paragraph","data":{"text":"Документация Node.js рекомендует второй подход, поскольку много усилий необходимо для создания потокового воркера, который требует создания виртуальной машины, парсинга и выполнения кода. Этот метод также намного эффективнее, чем постоянно создающиеся воркеры."}},{"type":"paragraph","data":{"text":"Такой подход называется пулом воркеров. Создаётся пул и воркеры находятся в ожидании события message, которое нужно для выполнения задания."}},{"type":"paragraph","data":{"text":"Пример файла, содержащего воркер, который создаётся, выполняется, а затем закрывается:"}},{"type":"code","data":{"code":"import { parentPort } from 'worker_threads';\r\n\r\nconst collection = [];\r\n\r\nfor (let i = 0; i < 10; i += 1) {\r\n collection[i] = i;\r\n}\r\n\r\nparentPort.postMessage(collection);","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"После отправки collection в родительский поток, воркер просто завершается."}},{"type":"paragraph","data":{"text":"А вот пример воркера, который может ждать в течение длительного периода времени, прежде чем ему будет дано задание:"}},{"type":"code","data":{"code":"import { parentPort } from 'worker_threads';\r\n\r\nparentPort.on('message', (data: any) => {\r\n const result = doSomething(data);\r\n\r\n parentPort.postMessage(result);\r\n});","language":"javascript lazy-code"}},{"type":"header2","data":{"level":2,"text":"Полезные свойства модуля worker_threads"}},{"type":"paragraph","data":{"text":"isMainThread"}},{"type":"paragraph","data":{"text":"Свойство имеет значение true, когда не работает внутри потока воркера. Если есть необходимость, можно включить простой оператор if в начале файла, чтобы убедиться, что он запускается только как воркер."}},{"id":"292c0cbb-ba25-4079-aa6e-76048903224c","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"workerData"}},{"type":"paragraph","data":{"text":"Несёт в себе данные, включённые в конструктор воркера созданным потоком."}},{"type":"code","data":{"code":"const worker = new Worker(path, { workerData });","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"В потоке воркера:"}},{"type":"code","data":{"code":"import { workerData } from 'worker_threads';\r\nconsole.log(workerData.property);","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"parentPort"}},{"type":"paragraph","data":{"text":"Экземпляр MessagePort, используется для связи с родительским потоком."}},{"type":"paragraph","data":{"text":"threadId"}},{"type":"paragraph","data":{"text":"Уникальный идентификатор, присвоенный воркеру."}},{"type":"header2","data":{"level":2,"text":"Реализация setTimeout"}},{"type":"paragraph","data":{"text":"setTimeout — это бесконечный цикл, который прерывает выполнение приложения. На практике он проверяет на каждой итерации, меньше ли сумма начальной даты и заданного количества миллисекунд, чем фактическая дата."}},{"type":"code","data":{"code":"import { parentPort, workerData } from 'worker_threads';\r\n\r\nconst time = Date.now();\r\n\r\nwhile (true) {\r\n if (time + workerData.time <= Date.now()) {\r\n parentPort.postMessage({});\r\n break;\r\n }\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Эта конкретная реализация создаёт поток, выполняет его код и затем завершает работу."}},{"type":"paragraph","data":{"text":"Реализуем код, который будет использовать этот воркер. Создадим стейт, в котором будут отслеживаться созданные воркеры:"}},{"type":"code","data":{"code":"const timeoutState: { [key: string]: Worker } = {};","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Функция, которая отвечает за создание потоковых воркеров и хранит их в стейт:"}},{"type":"code","data":{"code":"export function setTimeout(callback: (err: any) => any, time: number) {\r\n const id = uuidv4();\r\n\r\n const worker = runWorker(\r\n path.join(__dirname, './timeout-worker.js'),\r\n (err) => {\r\n if (!timeoutState[id]) {\r\n return null;\r\n }\r\n\r\n timeoutState[id] = null;\r\n\r\n if (err) {\r\n return callback(err);\r\n }\r\n\r\n callback(null);\r\n },\r\n {\r\n time,\r\n },\r\n );\r\n\r\n timeoutState[id] = worker;\r\n\r\n return id;\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Используем пакет UUID для создания уникального идентификатора воркера, затем задействуем определённую ранее вспомогательную функцию runWorker(), чтобы получить воркер. Передаём ему callback-функцию, которая запускается после отправки воркером некоторых данных. Сохраняем воркер в стейт и возвращаем id."}},{"type":"paragraph","data":{"text":"Внутри callback-функции нужно проверить, существует ли воркер в стейте, потому что есть возможность отменить его с помощью cancelTimeout(). Если он существует, удаляем его из стейта и вызываем callback, переданный в функцию setTimeout()."}},{"id":"ac179274-3bfa-4acb-bbc6-088a3969a342","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Функция cancelTimeout() использует метод .terminate(), чтобы принудительно остановить воркер и удалить его из стейта:"}},{"type":"code","data":{"code":"export function cancelTimeout(id: string) {\r\n if (timeoutState[id]) {\r\n timeoutState[id].terminate();\r\n\r\n timeoutState[id] = undefined;\r\n\r\n return true;\r\n }\r\n\r\n return false;\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Прим. если вам интересно, есть реализация метода setInterval(). Но он не имеет ничего общего с потоками (повторно используется код setTimeout()). Кроме того, существует небольшой тестовый код для проверки, насколько такой подход отличается от исходного. Вы можете просмотреть код здесь. Результаты:"}},{"type":"code","data":{"code":"native setTimeout { ms: 7004, averageCPUCost: 0.1416 }\r\nworker setTimeout { ms: 7046, averageCPUCost: 0.308 }","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Видно, что в setTimeout() есть небольшая задержка — около 40 мс — из-за создаваемого воркера. Средняя стоимость процессора также немного выше, но ничего страшного в этом нет (стоимость процессора — это среднее значение загрузки процессора за всё время процесса)."}},{"type":"paragraph","data":{"text":"Если бы можно было повторно использовать воркеры, задержка и загрузка ЦП снизилась бы. Поэтому рассмотрим, как реализовать собственный пул воркеров."}},{"type":"header2","data":{"level":2,"text":"Реализация пула воркеров"}},{"type":"paragraph","data":{"text":"Пул воркеров — это заданное количество ранее созданных воркеров, которые ожидают событие message. Как только событие происходит, воркеры выполняют работу и отправляют результат обратно."}},{"type":"paragraph","data":{"text":"Вот как можно создать пул воркеров из восьми рабочих потоков:"}},{"type":"code","data":{"code":"const pool = new WorkerPool(path.join(__dirname, './test-worker.js'), 8);","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Если вы знакомы с ограничением параллельных операций, то знаете, что логика здесь почти одинакова."}},{"id":"662cddc1-4417-41ba-9f39-00cf3d3da06d","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Из фрагмента выше видно, конструктору WorkerPool передаётся количество воркеров и путь для их появления."}},{"type":"code","data":{"code":"export class WorkerPool {\r\n private queue: QueueItem[] = [];\r\n private workersById: { [key: number]: Worker } = {};\r\n private activeWorkersById: { [key: number]: boolean } = {};\r\n\r\n public constructor(public workerPath: string, public numberOfThreads: number) {\r\n this.init();\r\n }\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Здесь есть дополнительные свойства вроде workerById и activeWorkersById, в которых можно сохранить существующие воркеры и их идентификаторы соответственно. Также есть queue (очередь), в которой можно сохранять объекты со следующей структурой:"}},{"type":"code","data":{"code":"type QueueCallback = (err: any, result?: N) => void;\r\n\r\ninterface QueueItem {\r\n callback: QueueCallback;\r\n getData: () => T;\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"callback — callback-функция в Node по умолчанию с ошибкой в качестве первого аргумента и возможным результатом в качестве второго. getData — это функция, передаваемая методу .run() пула воркеров (поясняется ниже), которая вызывается после начала обработки элемента. Данные, возвращаемые функцией getData(), будут переданы в рабочий поток."}},{"type":"paragraph","data":{"text":"Внутри метода .init() создаём воркеры и сохраняем их в стейтах:"}},{"type":"code","data":{"code":"private init() {\r\n if (this.numberOfThreads < 1) {\r\n return null;\r\n }\r\n\r\n for (let i = 0; i < this.numberOfThreads; i += 1) {\r\n const worker = new Worker(this.workerPath);\r\n\r\n this.workersById[i] = worker;\r\n this.activeWorkersById[i] = false;\r\n }\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Для избежания бесконечных циклов нужно убедиться, что количество потоков больше 1. Создаём необходимое число воркеров и сохраняем их по индексу в стейте workerById. Также сохраняем информацию, работают ли они в настоящее время, в стейте activeWorkersById, который всегда по умолчанию имеет значение false."}},{"type":"paragraph","data":{"text":"Реализуем метод .run() для настройки задачи, которая будет запущена, как только воркер станет доступен."}},{"type":"code","data":{"code":"public run(getData: () => T) {\r\n return new Promise((resolve, reject) => {\r\n const availableWorkerId = this.getInactiveWorkerId();\r\n\r\n const queueItem: QueueItem = {\r\n getData,\r\n callback: (error, result) => {\r\n if (error) {\r\n return reject(error);\r\n }\r\nreturn resolve(result);\r\n },\r\n };\r\n\r\n if (availableWorkerId === -1) {\r\n this.queue.push(queueItem);\r\n\r\n return null;\r\n }\r\n\r\n this.runWorker(availableWorkerId, queueItem);\r\n });\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Внутри функции, переданной в промис, проверяем, есть ли доступный для обработки данных воркер, вызывая .getInactiveWorkerId():"}},{"type":"code","data":{"code":"private getInactiveWorkerId(): number {\r\n for (let i = 0; i < this.numberOfThreads; i += 1) {\r\n if (!this.activeWorkersById[i]) {\r\n return i;\r\n }\r\n }\r\n\r\n return -1;\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Создаём queueItem, в котором сохраняем переданную методу .run() функцию getData() в качестве callback. В этом callback разрешаем (resolve) или отклоняем (reject) промис в зависимости от того, передал ли воркер callback."}},{"id":"e63ce221-f373-4a06-aba0-1c3800be1876","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"Если значение availableWorkerId равно -1, доступного воркера нет. В этом случае добавляем queueItem в queue. Если есть доступный воркер, вызываем метод .runWorker() для его выполнения.
В методе .runWorker() в стейте activeWorkersById необходимо установить, что воркер в данный момент используется. Также нужно настроить обработчики для событий message и error (после очистить их). И, наконец, отправить данные воркеру."}},{"type":"code","data":{"code":"const messageCallback = (result: N) => {\r\n queueItem.callback(null, result);\r\n\r\n cleanUp();\r\n };\r\n\r\n const errorCallback = (error: any) => {\r\n queueItem.callback(error);\r\n\r\n cleanUp();\r\n };\r\n\r\n const cleanUp = () => {\r\n worker.removeAllListeners('message');\r\n worker.removeAllListeners('error');\r\n\r\n this.activeWorkersById[workerId] = false;\r\n\r\n if (!this.queue.length) {\r\n return null;\r\n }\r\n\r\n this.runWorker(workerId, this.queue.shift());\r\n };\r\n\r\n worker.once('message', messageCallback);\r\n worker.once('error', errorCallback);\r\n\r\n worker.postMessage(await queueItem.getData());\r\n}","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Используя переданный workerId, получаем ссылку на воркер из стейта workerById. Внутри activeWorkersById устанавливаем в свойстве [workerId] значение true. Таким образом будет известно, что больше ничего не нужно запускать, пока воркер занят."}},{"type":"paragraph","data":{"text":"Создаём messageCallback() и errorCallback() для вызова событий message и error соответственно. Регистрируем указанные функции для обработки события и отправки данных воркеру."}},{"type":"paragraph","data":{"text":"Внутри функций вызываем callback в queueItem, а затем вызываем функцию cleanUp(). Убеждаемся, что обработчики событий удаляются, т. к. один и тот же воркер используется многократно. Если не удалить обработчики, произойдёт утечка памяти (память медленно исчерпается)."}},{"id":"15372277-d5ac-41da-b31e-c4f81c4736b0","type":"banner-blank","data":{}},{"type":"paragraph","data":{"text":"В стейте activeWorkersById устанавливаем для свойства [workerId] значение false и проверяем, пуста ли очередь. Если это не так, удаляем первый элемент из queue и снова вызываем воркер с другим queueItem."}},{"type":"paragraph","data":{"text":"Создадим воркер, который выполняет некоторые вычисления после получения данных в событии message:"}},{"type":"code","data":{"code":"import { isMainThread, parentPort } from 'worker_threads';\r\n\r\nif (isMainThread) {\r\n throw new Error('Its not a worker');\r\n}\r\n\r\nconst doCalcs = (data: any) => {\r\n const collection = [];\r\n\r\n for (let i = 0; i < 1000000; i += 1) {\r\n collection[i] = Math.round(Math.random() * 100000);\r\n }\r\n\r\n return collection.sort((a, b) => {\r\n if (a > b) {\r\n return 1;\r\n }\r\n\r\n return -1;\r\n });\r\n};\r\n\r\nparentPort.on('message', (data: any) => {\r\n const result = doCalcs(data);\r\n\r\n parentPort.postMessage(result);\r\n});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Потоковый воркер создаёт массив из 1 миллиона случайных чисел, а затем сортирует их."}},{"type":"paragraph","data":{"text":"Пример простого использования пула воркеров:"}},{"type":"code","data":{"code":"const pool = new WorkerPool<{ i: number }, number>(path.join(__dirname, './test-worker.js'), 8);\r\n\r\nconst items = [...new Array(100)].fill(null);\r\n\r\nPromise.all(\r\n items.map(async (_, i) => {\r\n await pool.run(() => ({ i }));\r\n\r\n console.log('finished', i);\r\n }),\r\n).then(() => {\r\n console.log('finished all');\r\n});","language":"javascript lazy-code"}},{"type":"paragraph","data":{"text":"Всё начиналось с создания пула из восьми воркеров. Затем был создан массив из 100 элементов и для каждого элемента запускалась задача в пуле воркеров. Первые восемь задач были выполнены немедленно, а остальные помещены в очередь и выполнены постепенно. Благодаря использованию пула воркеров не нужно каждый раз создавать воркер, что значительно повышает эффективность."}},{"type":"header2","data":{"level":2,"text":"Заключение"}},{"type":"paragraph","data":{"text":"worker_threads предоставляет простой способ добавить поддержку многопоточности в приложения. Передавая тяжёлые CPU-вычисления другим потокам, можно значительно увеличить пропускную способность сервера. Благодаря официальной поддержке потоков можно ожидать, что всё больше разработчиков и инженеров из различных областей (ИИ, машинное обучение и большие данные) начнут использовать Node.js."}},{"type":"embed","data":{"link":"https://tproger.ru/translations/evil-npm-modules"}}]}

Ошибка в настройках сайта