Аргументы и функции, 15 февраля

Искусственные фейки

Ребята из OpenAI ненароком создали машину для производства фейковых новостей. Их алгоритм GPT-2 научился на основе одной-двух фраз, задающих тему, строить свою, довольно реалистичную историю. В блоге даже есть несколько любопытных примеров:

  • статья об учёных, обнаруживших в Андах стадо англоговорящих единорогов;
  • новость о Майли Сайрус, пойманной на магазинной краже;
  • художественный текст о Леголасе и Гимли, идущих в атаку на орков;
  • эссе о том, как переработка отходов вредит экономике, природе и здоровью людей.

Причём тексты адекватные, связные. Правда, некоторые были рождены не с первой попытки (и даже не с десятой), но качество итогового материала наводит на нехорошие мысли.

Вот отрывок одного из примеров (в вольном переводе):

«Перес [эволюционный биолог из университета Ла-Пас] и его друзья были ошеломлены — они увидели стадо единорогов. Эти существа были как на ладони, стояли так близко, что учёные могли коснуться их рогов.

Во время изучения этих загадочных созданий исследователи обнаружили, что, помимо прочего, те говорят на обычном английском. Перес заявил: „Мы также заметили, к примеру, что у них есть и общий язык, нечто вроде диалекта“.

По мнению доктора Переса, единороги зародились в Аргентине. Эти животные, согласно поверью, были потомками утерянной расы людей, живших там до прибытия в эту часть Южной Америки человеческих племён».

При пристальном взгляде на текст проступают странные слова и не совсем естественные конструкции. Но современный читатель знакомится с текстом по диагонали, так что проглотит все странности и не заметит.

Осознав возможности своего инструмента, разработчики решили не публиковать его исходный код полностью. Они выложили на GitHub упрощённую версию модели, чтобы коллеги-исследователи могли поиграться, посмотреть и подумать. Ещё доступен препринт научной статьи (PDF).

На самом деле, GPT-2 умеет много чего ещё: отвечать на общие вопросы и на вопросы по тексту, заканчивать предложения, выделять из текста суть.

Команда OpenAI хотела создать ИИ-модель общего назначения, не ограниченную какой-то одной задачей, но при этом достаточно эффективную по современным меркам. К сожалению, по точности работы она уступает однозадачным алгоритмам, но исследователи уверены, что это попровимо. Надо только взять датасет пошире да компьютер помощнее.

Нейросеть спит — работа идёт

Итальянские математики расширили модель нейронной сети Хопфилда, разделив работу на два режима: «спящий» и «бодрствующий». Во время «бодрствования» ИИ собирает данные и учится. Во время «сна» — избавляется от лишних связей и данных и упорядочивает нужные.

Говорят, что на практике это принесло плоды. Без цикла «сна» ёмкость нейросети достигала 0,14 битов на синапс. С введением «сна» показатель увеличился до максимально возможного для этого типа нейросетей — 1.

Иными словами, нейросеть будет работать эффективнее, если время от времени давать ей поспать.

Новости GitHub

Разработчики платформы смастерили «draft pull requests» — это такие ограниченные pull-запросы, с которыми можно кидать наброски кода или даже идеи простым текстом. По умолчанию их нельзя мёрджить — только если перевести в режим «готово для ревью».

Цель — дать возможность разработчикам пообсуждать ту или иную идею, которая в итоге может вырасти до полноценного pull-запроса.

Если предыдущие абзацы звучат для вас абракадаброй (или в теме вы откровенно плаваете), держите лонгрид про Git в целом и GitHub в частности. Рассказываем и показываем, как пользоваться. На пальцах и со скриншотами.

Продвинутая полиция

От этой новости сначала хочется прыснуть и народить с пяток мемов, а потом уже включить мозги.

«РБК» разведал, что мэрия Москвы собирается заказать для полицейских AR-очки с системой распознавания лиц. Чтобы «зырк» в толпу — и сразу пять лиц из федерального розыска приметил. В случае какой-нибудь антиутопии этот «зырк» бы пришёлся на митингующую толпу, а лица подсветились бы, скажем, не криминальные, но определённого рода нежелательные.

Но поговорим о технологиях. По словам источников «РБК», к разработке приложения для AR-очков уже привлекли Ntechlab. Это те самые ребята, которые создали FindFace для распознавания лиц, а потом ушли работать с властями и бизнесом (мы о них говорили в среду).

Недавно на отраслевом форуме «Технологии безопасности» они представили прототип — своё Android-приложение на очках японской фирмы Epson. Публичная презентация продукта назначена на октябрь. Ntechlab комментировать эту тему отказалась.

Напомним, что в Москве уже работает система распознавания лиц, даже с успехом помогает кого-то ловить. В частности, помогла установить личность и найти того самого похитителя картины Куинджи — это по словам замначальника ГУ московского МВД.

Одним словом, весь мир движется вперёд — почему бы вперёд не шагнуть и московской полиции.