Intel разработала инструмент HE-Transformer для анонимизации датасетов
Новости
HE-Transformer способна обрабатывать зашифрованные наборы данных. Разработка распространяется под открытой лицензией и уже доступна в репозитории.
507 открытий513 показов
На конференции NeurIPS 2018 в Монреале представитель Intel анонсировал технологию HE-Transformer. Инструмент предназначен для безопасной обработки датасетов, включающих персональные данные, и выпускается с открытым исходным кодом.
Зачем нужна технология HE-Transformer?
Работа нейронных сетей невозможна без обучающих наборов данных, на которых ИИ тренируется принимать решения. При этом некоторые датасеты содержат личную информацию людей. Например, наборы данных для обучения нейросетей, которые планируют использовать в медицине. В процессе разработки таких наборов специалистам приходится сталкиваться с проблемой хранения и обработки личной информации.
HE-Transformer взаимодействует с данными, используя алгоритм гомоморфного шифрования (homomorphic encryption, HE). Система обрабатывает зашифрованные файлы наборов и выдаваёт результат, идентичный тому, который получается при обработке не зашифрованных.
Готов ли инструмент к работе?
Разработку Intel уже можно использовать с ИИ-фреймфорком TensorFlow, а в будущем компания планирует реализовать поддержку PyTorch и MXNet. В качестве основы HE-Transformer использует шифровальную библиотеку SEAL, разработанную Microsoft и выпущенную под открытой лицензией чуть ранее.
Что обещает Intel?
Представитель компании заявил, что разработка позволит вывести на новый уровень производительность нейронных сетей, обрабатывающих зашифрованные данные с помощью модели TensorFlow с плавающей точкой.
Сама техника HE была разработана в IBM ещё в 2009 году, однако создатели HE-Transformer отмечают, что создание рабочего инструмента на базе этого алгоритма требует знаний в области ИИ и машинного обучения, а также понимания принципов шифрования и программного дизайна.
Разработчики нейронных сетей далеко не первые, кто столкнулся с конфликтом защиты личных данных и необходимости в обработке информации. Многие компании и создатели программного обеспечения собирают статистику о пользователях и ищут способ разрешения этого конфликта. Так, в октябре 2018 года Mozilla начала испытания собственной системы шифрования пользовательских данных Prio.
507 открытий513 показов