Чем сгенерированные тексты (пока еще) выдают себя?

Статьи

Я работаю с текстами каждый день и, честно, начала подозревать нейросети во всех грехах. Но недавно мне попался такой гладенький, такой «правильный» текст, что я сразу поняла — ИИ. И знаете, есть чёткие маркеры.

Даже самые продвинутые модели вроде GPT-4 выдают себя шаблонами. Потому что они обучены на миллионах однотипных текстов и не могут устоять перед клише.
Если вы хотите научиться отличать человека от бота — читайте дальше. Это навык, который пригодится каждому.

Пять синтаксических конструкций, которые нейросети обожают

Первая — «однако» в начале абзаца. Люди так не пишут, мы говорим «но» или «зато». Вторая — «кроме того». Третья — «стоит отметить». Четвёртая — «важно понимать». Пятая — «таким образом» перед выводом.

Если вы видите три из пяти в одном тексте — перед вами машина.
Я как-то попросила ChatGPT написать пост про кофе. И он начал каждый второй абзац с «однако». Я прям засмеялась. Человек бы сказал «но эспрессо бодрит лучше», а нейросеть — «однако следует отметить, что эспрессо обладает более выраженным тонизирующим эффектом».

Лексические маркеры: слова-паразиты ИИ

Нейросети обожают слова «является», «представляет собой», «обладает», «характеризуется». Человек скажет «это важно» — ИИ скажет «это представляет собой важный аспект». Ещё один маркер — идеальная гладкость. Ни одного короткого рубленого предложения, все абзацы одной длины, нет эмоций.

Проверьте себя: если текст звучит как лекция профессора-робота — скорее всего, сгенерировано.
Я всегда добавляю в свои посты сленг, междометия и иногда грамматические вольности. Нейросеть так не умеет — она боится ошибиться.

Как проверить текст за минуту: три быстрых теста

Тест первый: скопируйте подозрительную фразу в поиск. Если она встречается дословно на десятке сайтов — с вероятностью 90% это сгенерировано. Тест второй: найдите местоимение «мы» или «я». Нейросети пишут безлично: «можно заметить», а не «я заметила». Тест третий: проверьте на конкретику. ИИ даёт обобщения: «многие люди любят кофе». Человек напишет: «моя подруга пьёт по 5 чашек в день». Если-то текст прошёл все три теста и всё ещё кажется живым — возможно, автор просто очень старался быть правильным. Но я бы на вашем месте всё равно усомнилась.

В общем, нейросети пока не умеют быть людьми. И слава богу. Потому что живые тексты — с ошибками, эмоциями и неожиданными поворотами — останутся за нами. А вы часто сталкиваетесь с ИИ-текстами? Узнали? Или я слишком подозрительная? Делитесь в комментариях.

Часто задаваемые вопросы

Всегда ли можно отличить текст нейросети от человеческого?

Нет, короткие тексты (1-2 предложения) могут быть неотличимы. Но на объёме от абзаца — почти всегда есть маркеры.

Почему нейросети не используют сленг и междометия?

Используют, но редко. Их обучали на «чистых» текстах — новостях, учебниках, статьях. Сленг для них шум.

Может ли человек специально писать как ИИ?

Да, студенты или копирайтеры-новички. Но это заметно: слишком много штампов и отсутствие живого голоса.

Какие нейросети лучше всего маскируются под человека?

ChatGPT-4 и Claude 3. Они умеют добавлять ошибки и разговорные обороты, но опытный глаз всё равно заметит паттерны.

Кривцова Ольга

Меня зовут Ольга Петровна, я учитель русского языка и литературы в средней школе с многолетним опытом работы. За годы преподавания я убедилась, что даже самые сложные темы можно объяснить просто и понятно, если говорить с учениками на одном языке.

Оцените автора
Уроки русского языка
Добавить комментарий