arXiv банит авторов на год за непроверенные ИИ-тексты
Репозиторий устанавливает правило «одного удара»: галлюцинированные ссылки или следы промптов в тексте — и доступ к платформе закрыт на год.
Новости TprogerЕсли в вашем препринте на arXiv окажутся галлюцинированные ссылки или незачищенные диалоги с нейросетью — автор получит годовой бан. Репозиторий ввёл правило «одного удара»: халатное использование ИИ без проверки результатов означает, что доверять статье нельзя.
arXiv (произносится как «архив») — открытый репозиторий непрецензируемых препринтов в физике, математике, информатике, биологии и смежных областях. За 35 лет он стал главным каналом быстрого распространения научных результатов: исследователи публикуют черновики статей здесь ещё до того, как их примут в рецензируемый журнал.
Главное
arXiv вводит годичный бан для авторов, которые не проверили результаты генерации ИИ перед публикацией.
Доказательствами «халатности» считаются галлюцинированные ссылки и незачищенные диалоги с языковыми моделями в тексте.
Использование ИИ как такового не запрещено — запрещено снимать с себя ответственность за содержимое.
После бана последующие препринты автора обязаны сначала пройти рецензирование в признанном научном журнале.
Решение принимается только после подтверждения редакторов секции; у авторов есть право на апелляцию.
arXiv уже принимал меры против роста числа низкокачественных ИИ-текстов: новые авторы обязаны получить рекомендацию от признанного учёного, ранее публиковавшегося в репозитории. Теперь к этому добавилась новая политика.
Правило «одного удара»
Томас Дитерих (Thomas Dietterich) — руководитель раздела computer science на arXiv — опубликовал пост, в котором сформулировал новую позицию платформы: «Если в препринте есть неопровержимые свидетельства того, что авторы не проверили результаты генерации языковой модели, мы не можем доверять ничему в этой статье».
Свидетельствами некритичного использования ИИ Дитерих называет два типа артефактов:
- Галлюцинированные ссылки — цитаты несуществующих статей или статей с неправильными авторами, журналами и годами публикации.
- Следы диалога с моделью — оставшиеся в тексте инструкции к ИИ, ответные пометки модели или фрагменты чата, которые авторы не удалили.
Если авторы вставляют в работу неуместные выражения, плагиат, предвзятый контент, ошибки, неверные ссылки или вводящий в заблуждение материал, они несут за это полную ответственность — вне зависимости от того, как этот контент был сгенерирован.
Что грозит авторам на arXiv
При первом нарушении авторы получают годовой бан на arXiv. После снятия запрета все последующие препринты обязаны сначала пройти рецензирование и быть приняты в «авторитетное рецензируемое издание» — только после этого их можно загружать в репозиторий.
Дитерих рассказал 404 Media, что это правило «одного удара» (one-strike rule). При этом предусмотрена процедура: модератор должен зафиксировать нарушение, редактор секции — подтвердить доказательства, и только затем применяется санкция. Авторы могут оспорить решение.
Что не запрещено
Новая политика не является полным запретом на использование языковых моделей при написании научных статей. arXiv настаивает исключительно на том, чтобы авторы брали на себя полную ответственность за опубликованное содержимое: проверяли факты, ссылки, логику аргументов и соответствие научным стандартам.
ИИ-инструменты можно использовать для шлифовки текста, генерации черновиков или поиска формулировок — но финальную проверку всё равно обязан провести человек-автор.
Масштаб проблемы
Рост числа сфабрикованных цитат уже зафиксирован в рецензируемых научных журналах. Недавние исследования в области биомедицины показали, что число фиктивных ссылок растёт — и причиной, по мнению исследователей, стало широкое распространение языковых моделей. При этом проблема не ограничивается научной средой: использование ИИ-сгенерированных ссылок без проверки фиксируется и в журналистике, и в юридических документах.
Новая политика arXiv, по сути, устанавливает минимальную планку ответственности для всех авторов репозитория: доверяй, но проверяй — что бы ни сгенерировала языковая модель.
Частые вопросы
За что именно могут забанить на arXiv?
За публикацию материала, который явно свидетельствует о том, что авторы не проверили результаты ИИ. Конкретные признаки: галлюцинированные ссылки (несуществующие статьи или искажённые данные о реальных) и незачищенные фрагменты диалога с языковой моделью в тексте препринта.
Запрещено ли вообще использовать ИИ при подготовке статей?
Нет. arXiv не запрещает использование языковых моделей. Новое правило требует лишь, чтобы авторы несли полную ответственность за содержимое: проверяли ссылки, факты и логику аргументов вне зависимости от того, кто или что сгенерировало исходный текст.
Сколько длится бан и что происходит после него?
Первое нарушение влечёт годовой бан на публикацию препринтов в arXiv. После его снятия все последующие работы автора должны сначала пройти рецензирование и быть приняты авторитетным научным журналом — и только потом их можно загружать в репозиторий.
Кто принимает решение о бане?
Сначала модератор обнаруживает и фиксирует нарушение. Затем руководитель соответствующей секции (например, computer science) подтверждает доказательства. Только после этого санкция применяется. У авторов есть право на апелляцию.
Что такое arXiv и почему эта политика важна для науки?
arXiv — открытый репозиторий препринтов в точных и естественных науках, ключевая площадка для быстрого обмена результатами до прохождения формальной рецензии. Поскольку доверие к препринтам строится на предполагаемой добросовестности авторов, ненадёжные ссылки и ИИ-галлюцинации подрывают саму ценность репозитория как источника актуальных научных данных.
Выводы
arXiv делает принципиальный шаг: не запрещает ИИ как инструмент, но жёстко напоминает, что ответственность за содержимое всегда остаётся на авторе. Галлюцинированные ссылки и незачищенные инструкции к модели — красная черта, пересечение которой теперь стоит года без доступа к крупнейшему препринт-репозиторию мира.
Для исследователей, работающих с языковыми моделями, это означает одно: каждую ссылку нужно проверять вручную, каждое утверждение — сверять с источником, а следы генерации — убирать до отправки. Источник: TechCrunch.