{"blocks":[{"type":"paragraph","data":{"text":"Разработчик Анимеш Карневар (Animesh Karnewar) создал нейросеть T2F, которая генерирует портреты на основе текстового описания лица человека. По словам автора, на создание алгоритма его вдохновило любопытство: он всегда хотел узнать, как герои книг выглядели бы в реальной жизни. Исходный код проекта доступен на GitHub."}},{"type":"image","data":{"file":{"id":87636,"url":"https://media.tproger.ru/uploads/2018/08/1Z0QcDTcPoUbnay7spajohg.jpeg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":1600,"height":1030,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2018/08/1Z0QcDTcPoUbnay7spajohg.jpeg","alt":"Нейросеть научилась создавать портрет человека по текстовому описанию 1","dimensions":{"width":1600,"height":1030},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/aTGr1DtVUAnwpPWHk3i0laGwdlLFsY5_r2uRZdDH-Os/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWjBRY0RUY1BvVWJuYXk3c3Bham9oZy5qcGVn","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/a9HWgwPKI194rQ37yPFwJ3HkvKLLqNAfEyQ7niw6ld4/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWjBRY0RUY1BvVWJuYXk3c3Bham9oZy5qcGVn","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/gT3JZOqrDTApVmILRcA4N2o1odWrNOheJ98g4xmYLrY/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWjBRY0RUY1BvVWJuYXk3c3Bham9oZy5qcGVn","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/FzumJijkUhr8GgtrwkGRByoEqTrwB4MK07gzFHMBWbo/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWjBRY0RUY1BvVWJuYXk3c3Bham9oZy5qcGVn","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/WSnFTBO1taER3IPq95lyxC-nhpStJJRbCml2AEC2u6s/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWjBRY0RUY1BvVWJuYXk3c3Bham9oZy5qcGVn","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/EoBHip949uQFePxvPoxi0eT-w_iqnWE2-XBYEV0ZOyQ/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWjBRY0RUY1BvVWJuYXk3c3Bham9oZy5qcGVn","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/3CCqruvw2V8LG90KDdKHmYvhKvUSDcGk8FqdxEuBCE8/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWjBRY0RUY1BvVWJuYXk3c3Bham9oZy5qcGVn","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/_yH0s0ix3tH_zyikR4XmW1BFG_UulLxoehGdp-gicwo/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWjBRY0RUY1BvVWJuYXk3c3Bham9oZy5qcGVn","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"header3","data":{"level":3,"text":"Набор данных и архитектура"}},{"type":"paragraph","data":{"text":"Карневар использовал набор данных Face2Text, который содержит 400 изображений с текстовым описанием каждого из них и дополнительной информацией. Например, некоторые из фотографий могут иметь пометку «Человек на картинке, вероятно, преступник». В основе F2T лежат архитектуры StackGAN и StackGAN++ для синтеза изображений из текста."}},{"type":"header3","data":{"level":3,"text":"Принцип работы"}},{"type":"paragraph","data":{"text":"Нейросеть с долгой краткосрочной памятью кодирует текстовое описание в суммарный вектор, одна часть которого представляет собой случайный гауссовский шум. Генеративно-состязательная сеть (GAN) использует его для поэтапного увеличения пространственного изображения. В результате получается максимально возможно четкая картинка."}},{"type":"image","data":{"file":{"id":87628,"url":"https://media.tproger.ru/uploads/2018/08/1YeetB9lWElT2ReqH_9MSTg.jpeg"},"alt":"","title":"","caption":"","stretched":false,"withBackground":false,"withBorder":false,"width":1000,"height":369,"optimizedFile":{"original":"https://media.tproger.ru/uploads/2018/08/1YeetB9lWElT2ReqH_9MSTg.jpeg","alt":"Нейросеть научилась создавать портрет человека по текстовому описанию 2","dimensions":{"width":1000,"height":369},"additionalSizes":{"srcSet":[{"url":"https://tproger.ru/signed_image/KsfDw5kIf7wp1gnv0YD9PlYjPyH2cDsBLwAmltUoAB0/rs:fill:766:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWWVldEI5bFdFbFQyUmVxSF85TVNUZy5qcGVn","dpr":1,"width":766},{"url":"https://tproger.ru/signed_image/odFspLU-lclmcFiBne3T1zhmAMcIDDolznr34eQIxZk/rs:fill:1532:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWWVldEI5bFdFbFQyUmVxSF85TVNUZy5qcGVn","dpr":1,"width":1532},{"url":"https://tproger.ru/signed_image/7duij0Krok75wd-e2-vlctzKE0hHlQqLehNLaWjaHZY/rs:fill:686:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWWVldEI5bFdFbFQyUmVxSF85TVNUZy5qcGVn","dpr":1,"width":686},{"url":"https://tproger.ru/signed_image/8V9jIe2irIsJ2RXOWXiJCL09RvW9ZpunUWUY_Eu5DkM/rs:fill:1372:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWWVldEI5bFdFbFQyUmVxSF85TVNUZy5qcGVn","dpr":1,"width":1372},{"url":"https://tproger.ru/signed_image/Mly9vGTpsuEt-gQb53sI90wg94jn041yQf0HACZDuCc/rs:fill:636:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWWVldEI5bFdFbFQyUmVxSF85TVNUZy5qcGVn","dpr":1,"width":636},{"url":"https://tproger.ru/signed_image/l81ZSu-qjJ_JsLLSAjw5gMjYCJDjiOvUeZ97vnC-gZA/rs:fill:1272:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWWVldEI5bFdFbFQyUmVxSF85TVNUZy5qcGVn","dpr":1,"width":1272},{"url":"https://tproger.ru/signed_image/wOSAMHM3yutPojkgDqvINe3fIfQCW0B54rF2eJN8Dqo/rs:fill:466:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWWVldEI5bFdFbFQyUmVxSF85TVNUZy5qcGVn","dpr":1,"width":466},{"url":"https://tproger.ru/signed_image/ZEOZD0Bhbqp2ggBCOLyW_3uRjKZEPtLjCFtvmJPQn-0/rs:fill:932:0:true/cb:vimg_2/f:webp/aHR0cHM6Ly9tZWRpYS50cHJvZ2VyLnJ1L3VwbG9hZHMvMjAxOC8wOC8xWWVldEI5bFdFbFQyUmVxSF85TVNUZy5qcGVn","dpr":1,"width":932}],"sizes":[{"media":"(min-width: 1441px)","size":"766px"},{"media":"(min-width: 1281px)","size":"686px"},{"media":"(min-width: 1281px)","size":"766px"},{"media":"(min-width: 961px)","size":"766px"},{"media":"(min-width: 671px)","size":"636px"},{"media":"(min-width: 500px)","size":"466px"}]}}}},{"type":"header3","data":{"level":3,"text":"Аналог T2F"}},{"type":"paragraph","data":{"text":"В январе 2018 года Microsoft представила «внимательную» GAN, которая который учитывает важные детали в описании, оценивает каждое слово и рисует изображение на их основе."}},{"type":"header3","data":{"level":3,"text":"Будущее"}},{"type":"paragraph","data":{"text":"Карневар считает, что T2F могут использовать правоохранительные органы для создания портретов преступников и жертв. Он продолжит развитие проекта и попробует обучить нейросеть на наборах данных Flicker8K и Coco."}},{"type":"paragraph","data":{"text":"В конце апреля 2018 года группа ученых из Microsoft и Киотского университета представила нейросеть, способная генерировать рифмы на основе изображений с подписями."}}]}

Ошибка в настройках сайта