Современные языковые модели искусственного интеллекта (Ии) создают тексты, практически неотличимые от написанных человеком. Это вызывает обеспокоенность в образовании и бизнесе, где сложно определить авторство работы. Чтобы решить эту проблему, учёные из Университета Флориды разрабатывают метод «невидимого водяного знака» для текстов, созданных ИИ.
По словам руководителя исследования Юхэнга Бу, метод позволит надежно выявлять тексты, сгенерированные алгоритмами, даже если они были изменены или перефразированы. В отличие от традиционных детекторов, которые работают с переменным успехом, технология водяных знаков предусматривает скрытое внедрение специальных сигналов в текст, которые затем можно обнаружить при проверке.
Ранее исследователи из Университета Рединга (Великобритания) провели эксперимент, показавший, что 94% студенческих работ, написанных с помощью ИИ, не были выявлены. Это связано с тем, что модели искусственного интеллекта постоянно совершенствуются, делая обнаружение всё более сложным.
Разработанная технология водяных знаков учитывает два ключевых аспекта: сохранение качества текста и устойчивость к изменениям, таким как замена слов синонимами или изменение структуры предложений. Даже при значительной переработке текста заложенный в него «отпечаток» остается обнаруженным.
Некоторые компании, такие как Google, уже работают над внедрением подобных методов, но, как отмечает Бу, их система интегрирует водяные знаки в определенные части текста, что обеспечивает лучшее качество и защиту от удаления.
Основная сложность сейчас — организация хранения и проверки водяных знаков. Разработчики предлагают использовать систему закрытых ключей, доступных только платформе, создавшей текст. Это поможет обеспечить надежную верификацию авторства и предотвратить распространение фальшивого контента. Ученые надеются, что технология будет широко использоваться в образовании и цифровых медиа для проверки достоверности информации.