ArXiv забороняє дослідникам подавати згенеровані штучним інтелектом несправні документи

ArXiv застосовує суворі покарання проти дослідників, які завантажують статті, повні контенту, створеного штучним інтелектом, із галюцинованими даними та неперевіреними результатами LLM.
ArXiv, одна з найбільш шанованих платформ для препринтів академічних досліджень, впроваджує суворіші заходи для боротьби зі зростаючою проблемою низькоякісного згенерованого штучним інтелектом вмісту, який переповнює її сервери. Академічна спільнота дедалі більше занепокоєна документами, які містять значну кількість того, що дослідники називають «помиями штучного інтелекту» — тексту, створеного великими мовними моделями без належної перевірки, перевірки чи контролю якості людьми.
Платформа оголосила про нову дисциплінарну політику, спрямовану на притягнення дослідників до відповідальності за цілісність своїх матеріалів. Відповідно до цих розширених інструкцій, автори, які подають документи з тим, що є «незаперечними доказами» того, що вони не змогли належним чином перевірити результати генерації LLM, зазнають серйозних наслідків. Такі докази включають галюциновані посилання — цитати на неіснуючі статті чи дослідження — і метакоментарі, випадково залишені системами штучного інтелекту, які слід було видалити під час редагування.
За словами Томаса Дітеріха, який очолює секцію інформатики ArXiv, дослідникам, визнаним винними у поданні такої неякісної роботи, буде заборонено завантажувати нові статті на платформу протягом цілого року. Це означає значну ескалацію зусиль ArXiv щодо модерування та демонструє прагнення платформи підтримувати наукові стандарти. The one-year ban serves as both a punishment and a deterrent to other researchers who might consider taking shortcuts in their academic submissions.
Окрім тимчасової заборони, ArXiv реалізував додаткову вимогу, яка зробить майбутні подання значно складнішими для рецидивістів. Коли дослідники знову отримають право подавати статті після однорічної призупинення, вони повинні будуть переконатися, що всі нові подання спочатку приймаються в «авторитетному рецензованому місці». Ця додаткова вимога фактично заважає дослідникам використовувати ArXiv як основне чи єдине місце для публікації своїх робіт, змушуючи їх проходити сувору експертну перевірку в відомих журналах, перш ніж ділитися своїми дослідженнями на платформі препринтів.
Цей підхід із подвійним покаранням відображає серйозність, з якою ArXiv дивиться на проблему академічного контенту, створеного ШІ. Платформа чітко виклала свою позицію в офіційних заявах: Кодекс поведінки організації чітко визначає, як автори повинні нести відповідальність за вміст, який вони публікують під своїм іменем. Підписуючи свої імена під документом, дослідники стверджують, що вони ретельно переглянули та перевірили кожен елемент своєї роботи, від методології до висновків і цитат.
Цей крок відбувається в той час, коли академічна спільнота бореться з безпрецедентними проблемами, пов’язаними зі штучним інтелектом. Оскільки великі мовні моделі стали більш складними та доступними, деякі дослідники почали використовувати їх для створення цілих розділів документів, іноді без належного контролю з боку людини. Хоча інструменти штучного інтелекту можуть бути цінними для розробки початкового вмісту, упорядкування ідей або навіть допомоги з оглядом літератури, вони також можуть генерувати переконливо звучачу, але повністю сфабриковану інформацію — явище, відоме як «галюцинація».
<зображення src="https://platform.theverge.com/wp-content/uploads/sites/2/2025/05/STKS511_AI_SLOP _C.jpg?quality=90&strip=all&crop=0.95588235294118%2C0%2C98.088235294118%2C100&w=2400" alt="Науковий дослідник перевіряє точність і цілісність дослідницьких статей, створених штучним інтелектом" />Особливо загострилася проблема галюцинаційних посилань. LLM може впевнено цитувати статтю, яка звучить правдоподібно, але ніколи не була написана, або приписувати цитати дослідникам, які ніколи не робили таких заяв. Для читачів, які нічого не підозрюють, ці фальшиві цитати можуть збити їх зі шляху, забруднивши майбутні дослідження, які будуватимуться на шахрайських посиланнях. Крім того, деякі дослідники виявили створені штучним інтелектом мета-коментарі — внутрішні примітки чи підказки системи — випадково залишені в остаточних версіях надісланих статей, що робить очевидним, що автор не зміг належним чином переглянути створений машиною вміст.
Механізм застосування ArXiv покладатиметься на пильність спільноти та перегляд модератором. Платформа заохочує колег-дослідників позначати підозрілі статті, а команда модераторів ArXiv розслідуватиме заяви про те, що статті містять докази неадекватної перевірки LLM. Враховуючи кількість статей, які надходять до ArXiv щодня (тисячі надходять щодня з усіх наукових дисциплін), це є серйозною справою, яка вимагатиме як технологічних рішень, так і людського судження.
Наслідки цієї політики виходять за межі окремих дослідників. Університетам, науково-дослідним установам і фінансовим агенціям, можливо, доведеться переглянути те, як вони оцінюють і стимулюють результати досліджень. Якщо дослідники зіткнуться зі суттєвими наслідками для представлення роботи, створеної штучним інтелектом, на основні платформи препринтів, виникне сильніший тиск щодо дотримання суворих стандартів. Зрештою це може принести користь усьому науковому підприємству, гарантуючи, що записи досліджень залишатимуться надійними та заслуговують довіри.
Однак політика також піднімає важливі питання про те, як відрізнити належне використання інструментів ШІ від недоречної неохайності. Багато дослідників на законних підставах використовують помічники AI для письма для покращення чіткості, граматики та організації. Ключова відмінність полягає в перевірці та підзвітності — дослідники, які використовують інструменти штучного інтелекту, повинні ретельно переглядати результати, перевіряти факти всіх тверджень і забезпечувати точність цитат. Політика ArXiv націлена на тих, хто явно не виконував цю перевірку, а не на тих, хто використовує ШІ як законний інструмент дослідження.
Оголошення було зустрінуте загальним схваленням академічної спільноти, хоча деякі висловили занепокоєння щодо реалізації та потенційних помилкових спрацьовувань. Як модератори остаточно доведуть, що автор «не перевіряв» контент, створений LLM? А як щодо крайніх випадків, коли текст, згенерований ШІ, виявляється точним? ArXiv повинен буде розробити чіткі вказівки та надати команді модераторів достатню підготовку, щоб приймати ці рішення чесно та послідовно.
У майбутньому ця політика може надихнути інші академічні платформи та журнали створити власні вказівки щодо контенту, створеного ШІ. Оскільки штучний інтелект все більше інтегрується в дослідницький процес, науковій спільноті потрібно буде розробити тонкі підходи, які використовуватимуть потенціал штучного інтелекту, одночасно захищаючи від його ризиків. Рішучі дії ArXiv є важливим кроком у цьому напрямку, посилаючи чітке повідомлення про те, що швидкі шляхи та недбалість мають реальні наслідки, і що цілісність наукового запису залишається першорядною.
Джерело: The Verge


