ИИ распознаёт текстовую капчу за 0,05 секунды с помощью настольного ПК

Новости Отредактировано

Генеративно-состязательная сеть (GAN) обходит текстовую капчу почти со 100-процентной вероятностью. Злоумышленникам теперь проще атаковать сайты.

12К открытий12К показов

Появился алгоритм машинного обучения, который обходит текстовую капчу проще, быстрее и точнее предыдущих методов: он распознаёт её за 0,05 секунды с помощью настольного ПК. Разработали алгоритм учёные из Великобритании и Китая, используя GAN — генеративно-состязательную сеть.

Почему это опасно?

Обычные алгоритмы машинного обучения требуют миллионов образцов начальных данных для обучения. Ботов, собирающих изображения капч, легко распознать и заблокировать. Сам процесс обучения требователен к ресурсам.

Для нового алгоритма такого количества данных не требуется, а значит, злоумышленнику не нужно их собирать. Нейросеть нетребовательна к вычислительным ресурсам и легко тренируется — это снижает затраты на подготовку атаки.

Исследователи заявили, что их метод со 100-процентной точностью распознал капчи на таких сайтах, как Megaupload, Blizzard и Authorize.NET. На Amazon, PayPal, Yahoo и других ресурсах точность оказалась меньше, но тоже высокой.

ИИ распознаёт текстовую капчу за 0,05 секунды с помощью настольного ПК 1

Как защититься от угрозы?

Исследователи рекомендуют владельцам веб-сайтов применять альтернативные способы обнаружения ботов. Например, анализировать шаблоны поведения пользователей и местоположение устройств или использовать биометрические данные.

Как работает алгоритм?

Учёные из английского Ланкастерского и китайских Северо-Западного и Пекинского университетов использовали генеративно-состязательную сеть — GAN (Generative Adversarial Network). Этот класс ИИ-алгоритмов эффективен в сценариях, где нет большого количества обучающих данных.

GAN построен на основе двух конкурирующих нейронных сетей. Одна — генеративная — генерирует образцы, смешивая несколько исходных, а другая — дискриминативная — старается расшифровать их. Обе сети стремятся выиграть друг у друга. В процессе совместного конкурентного обучения они значительно улучшают качество своей работы без необходимости использования большого количества начальных данных.

Исследователи собрали всего 500 образцов от 11 сервисов капчи, используемых на 32 сайтах из топ-50 в рейтинге Alexa. На сбор разработчики потратили всего 2 часа. В процессе же обучения было «синтезировано» более 200 000 тысяч капч.

В октябре 2017 года компания Vicarious использовала рекурсивную кортикальную сеть (RCN, Recursive Cortical Network), имитирующую поведение человека, для обхода reCAPTCHA. Тогда же группа исследователей из Мэрилендского университета разработала алгоритм unCAPTCHA, способный обмануть reCAPTCHA с вероятностью 85 %.

12К открытий12К показов

Также рекомендуем

Epic добилась своего: Google откроет Android для сторонних магазинов и снизит комиссию до 9%

Epic победила Google: Android откроют для сторонних магазинов, а комиссии снизят до 9–20%. Изменения вступят в силу по всему миру

Где вести базу знаний по проекту: альтернативы Notion для айтишников в 2025

Обзор лучших альтернатив Notion для ведения базы знаний в IT-проектах в 2025 году. Сравнение функционала, интеграций и удобства для разработчиков и команд.

Количество кода от ИИ в российских компаниях увеличится втрое в ближайшее время

Объем ИИ-кода растёт: к 2027 году 25% строк будет написано нейросетями. Разработчики превращаются в архитекторов, а компании внедряют ИИ-инструменты

Вышла Fedora 43: новый веб-инсталлятор Anaconda WebUI и GNOME на Wayland. Разобрались, что нового

Вышла Fedora 43: новый веб-инсталлятор Anaconda WebUI, GNOME только на Wayland, RPM 6.0, ускоренный DNF и улучшенная безопасность