Ученые предложили новый «тест Тьюринга» — отличать ИИ от человека по хамству

Новости

Концептуальненько

287 открытий3К показов

Группа исследователей из университетов Цюриха, Амстердама, Дьюка и Нью-Йорка выяснила: даже самые продвинутые языковые модели легко отличить от людей по чрезмерной вежливости.

В новой работе они предложили «компьютерный тест Тьюринга», который позволяет определять ИИ не по содержанию сообщений, а по отсутствию токсичности и спонтанных эмоций.

Слишком вежлив, чтобы быть человеком

Ученые проверили 9 крупных языковых моделей, включая Mistral 7B, Qwen 2.5 и Gemma 3, заставив их отвечать на реальные посты из Twitter/X, Reddit и Bluesky.

В результате, все модели писали слишком дружелюбно и аккуратно, тогда как живые пользователи чаще проявляли сарказм, раздражение и неформальность.

Автоматические классификаторы смогли распознать ИИ-ответы с точностью до 80%, даже после попыток оптимизации. Главный показатель — низкий уровень токсичности. Модели элементарно не умеют естественно «хамить» или спорить, как реальные люди в интернете.

Вежливость — враг реализма

Интересно, что обученные на специальных инструкциях модели оказались хуже в имитации человека, чем их «сырые» версии. Чем больше модель старалась быть полезной и корректной, тем легче было понять, что перед вами не человек.

Более того, увеличение размера модели не помогло — 70-миллиардная Llama 3.1 обманывала алгоритмы хуже, чем маленькие версии на 8 млрд параметров.

Новый «тест Тьюринга»

Ученые называют метод computational Turing test — это автоматизированный способ измерить «человечность» текста.

Иронично, что ИИ пока не научился вести себя по-человечески именно потому, что люди не всегда ведут себя корректно и красиво. Живой язык в интернете — это сарказм, агрессия, скука и противоречия.

А значит, чтобы пройти новый «тест Тьюринга», машинам, возможно, тоже придется научиться хамить.

287 открытий3К показов

Также рекомендуем

«Данные частных клиентов не пострадали»: Ростелеком раскрыл подробности свежей утечки

Ростелеком подтвердил утечку, связанную с подрядчиком. Пользователям советуют сменить пароли и включить 2FA. Данные частных лиц не затронуты

ИИ без регистрации и VPN: быстрый доступ к GPT, Claude и Gemini

Где найти доступ к GPT-4, Claude и Gemini без VPN и регистрации? Лучшие сервисы в России: от учебы и маркетинга до обработки изображений и создания ботов. Обзор 11 инструментов на каждый день.

Исследование использования нейросетей в контенте: мнения айти-индустрии

Исследование Tproger: 72% айтишников положительно относятся к ИИ в контенте. Узнайте, как 145 специалистов используют нейросети для генерации кода, идей и картинок, и какие модели предпочитают.

🔥 Google представила Pixel 9, 9 Pro, 9 Pro XL и 9 Pro Fold

Google представила новую серию смартфонов Pixel 9, включая модели Pixel 9, 9 Pro, 9 Pro XL и 9 Pro Fold. Устройства получили обновленный дизайн, процессоры Tensor G4 и новые ИИ-функции. Камеры улучшены до 50 Мп, а модели Pro оснащены 42 Мп селфи-камерами с автофокусом. Цены стартуют с $799.