Энтузиаст спарсил 40 тысяч фотографий с сайта знакомств Tinder

У пользователей Tinder есть много причин загружать свои фото на сайт знакомств. Однако передача своей биометрической информации в общедоступную базу данных, предназначенную для обучения сверточных нейронных сетей, вероятно, не входила в их планы при регистрации в этой социальной сети.

Что произошло?

Пользователь Kaggle, платформы для машинного обучения, которую недавно приобрела Google, загрузил базу данных лиц, которую он получил, используя уязвимость в Tinder API. Она позволила скачать фотографии с 40 тысяч аккаунтов, принадлежащих пользователям социальной сети, находящимся в области залива Сан-Франциско — по 20 тысяч мужчин и женщин. Многие изображения находились в закрытом доступе.

База данных «Люди Tinder» (в настоящий момент удалена по требованию Tinder) состоит из 6 скачиваемых zip-файлов. Четыре из них содержат по 10 тысяч фото, а в двух оставшихся собраны по 500 изображений мужчин и женщин. Из некоторых профилей было скачано несколько фотографий, поэтому, вероятно, пострадало меньше 40 тысяч пользователей.

Кроме того, создатель базы данных, Стюарт Колианни, опубликовал исходный код парсера на GitHub.

Прим. ред. Если вы интересуетесь парсингом, прочитайте наше краткое руководство с примерами на Node.js.

Зачем он это сделал?

Стюарт описывает парсер как «простой скрипт для сохранения фото из профилей Tinder с целью создания базы данных лиц». Также он говорит, что создал эту программу, так как разочаровался в других подобных базах данных. По его словам, эта социальная сеть предоставляет «почти неограниченный доступ к информации, необходимой для создания такой базы данных», а сохранение фото из приложения позволяет «чрезвычайно эффективно собирать такие сведения».

За три дня базу данных скачали с Kaggle более 300 раз, и, конечно, никто не знает, в каких целях ее будут использовать.

Как отреагировал Tinder?

Официальный представитель заявил:

Мы серьезно относимся к безопасности и конфиденциальности информации наших пользователей и обладаем средствами и системами, которые позволяют этим данным оставаться внутри нашей платформы. Стоит отметить, что Tinder — это бесплатная сеть, которой пользуются более чем в 190 странах, и фото из аккаунтов доступны любому зарегистрированному пользователю. Мы постоянно работаем над улучшением качества работы с сетью и внедряем инструменты, которые не позволяют автоматически использовать наш API. В том числе мы выявляем и предотвращаем скачивание данных. Этот человек нарушил условия предоставления услуг (раздел 11), и мы примем соответствующие меры и проведем расследование.

На данный момент база данных «Люди Tinder» удалена с сайта Kaggle.

Источник: TechCrunch