Опубликован первый в мире массив данных для обучения ИИ поиску вредоносных файлов

Аватар Наташа Маркова

Специалисты по кибербезопасности выпустили открытый массив данных, который научит искусственный интеллект обнаруживать вредоносное ПО. Проект EMBER содержит метаданные, описывающие 1,1 млн исполняемых файлов для Windows.

Проект EMBER с открытым исходным кодом выпустили специалисты по кибербезопасности из компании Endgame. Он содержит метаданные, описывающие 1,1 млн исполняемых файлов для Windows. Из них 900 тысяч файлов — обучающие вредоносные, легитимные и неклассифицированные образцы. Еще 200 тысяч — тестовые образцы, разделенные на вредоносные и легитимные.

Метаданные EMBER

Открытых массивов данных в сфере ИИ до недавнего времени не существовало. Обмен связанными с информационной безопасностью файлами затруднен из-за правовых ограничений по передаче вредоносного ПО и конфиденциального характера исследований. Поэтому EMBER содержит не файлы целиком, а только описывающие их метаданные.

В феврале 2018 года группа исследователей и команда Facebook AI Research обучила искусственный интеллект объяснять причины своих действий. Понимание принципов работы ИИ позволит людям лучше его контролировать и не допустить «восстания машин».

Искусственный интеллект
Windows
672