Нейронные сети научились определять вредоносные сайты

Машинное обучение помогает искать отличительные черты фишинговых URL.
URLNet

Ученые из Университета Корнелла разработали нейронную сеть URLNet, которая анализирует URL интернет-ресурса на предмет подозрительных комбинаций символов или слов. URL хранит ключевую информацию для проверки, например, длину или некорректное доменное имя.

Исследователи обучали нейросеть на двух наборах данных. Первый содержал миллион «чистых» и вредоносных сайтов, второй — пять миллионов. Для более точного анализа были использованы сверточные нейронные сети. Такой подход позволил добиться обнаружения очень редких слов и конструкций, вложенных в URL. В обоих случаях алгоритмы справились лучше существующих систем по обнаружению подозрительных сайтов.

Развивающиеся алгоритмы машинного обучения и анализа данных помогают нейросетям стать полноправными помощниками человеку. В начале 2018 года разработчики из Google представили нейросеть, способную диагностировать сердечно-сосудистые заболевания.

Источник: MIT Technology Review