Правила Яндекс и Google относительно ИИ-контента

Поисковые системы вынуждены реагировать на развитие искусственного интеллекта и его широкое применение. Google ещё в 2023 году заявил, что не запрещает ИИ-контент, но с некоторыми условиями. Такой контент должен:

  • Быть полезным пользователю
  • Соответствовать принципам E-E-A-T (авторитетности и экспертности)
  • Не быть предназначенным для манипуляции поисковой выдачей

Последнее – манипуляция поисковой выдачей, широкое понятие, под которое попадает многое и на практике это может трактоваться по-разному. Например, Google в большинстве случаев негативно оценивает следующие тексты, созданные с помощью нейронок:

  • Массовая генерация низкокачественного контента
  • Скрытый рерайт чужого текста без “добавочной ценности”
  • Тексты без структуры и экспертности

Больше деталей про отношение Google к ИИ-контенту доступно в официальной справке.

Яндекс не публиковал столь подробное руководство по ИИ-контенту как Google, но из практики известно и его отношение. Яндекс боролся с генерированными контентом еще до массового распространения искусственного интеллекта, поэтому создал алгоритмы для распознавания шаблонных и низкокачественных текстов:

  • Кракен
  • Вега
  • Палех

Вы можете изучить принципы работы каждого, так как этот подход по-прежнему актуален и для ИИ-текстов. Но каждый новый алгоритм распознает низкокачественные тексты лучше прежних.

Также Яндекс борется с “генеративным спамом” – созданием большого количества страниц на сайте с помощью ИИ-генераторов. Это касается всех сайтов, но, в частности, затрагивает интернет-магазины, которые генерируют страницы и карточки товаров. Одним из критериев выявления является не только качество самих страниц, но и взрывной рост количества URL на одном проекте.

В результате, ни Яндекс, ни Google напрямую не запрещают использование ИИ для создания контента, но относятся негативно к низкокачественному контенту. Обе поисковые системы приоритетно заботятся о пользе для посетителя, который переходит по результатам поиска, а также поисковики стремятся предоставить наиболее качественный ответ.

Важно – существуют десятки нейросетей, от общих как ChatGPT или Алиса от Яндекса, до точечных, как Retext, которые занимаются только текстами. Ни одна из нейросетей не умеет делать контент, который в 100% случаях можно использовать без доработок.

Помимо генерации текстов, нейросети умеют создавать картинки. Такое также является ИИ-контентом и может использоваться на сайтах. Google и Яндекс умеют неплохо вычислять графику, созданную в нейросетях. Это касается, в том числе, Claude и других популярных нейронок, включая ИИ от Google.

Поисковые системы не запрещают использовать ИИ-картинки, но это вычисляется и практически не дает трафика на сайт из Яндекс Картинок и Google Images. Это значит, что сгенерированную графику можно использовать на сайте, но сложно на её базе реализовать SEO-стратегию по привлечению трафика на картинки.

Что такое Human-in-the-loop (HITL)

Human-in-the-loop (HITL) – это принцип, согласно которому человек должен участвовать в процессе генерации и публикации ИИ-контента. Иногда такой подход создания материалов называют комбинированным, так как объединяются усилия искусственного интеллекта и живого редактора.

Например, в рамках принципа Human-in-the-loop человек обрабатывает текст:

  • Проверяет факты
  • Адаптирует текст под целевую аудиторию
  • Правит структуру
  • Добавляет экспертные вкрапления и примеры
  • Улучшает уникальность и стиль

Всё это укладывается в концепцию качественного текста – человек “доводит до ума” сгенерированный текст, чтобы он был действительно качественным. Без участия редактора любые сгенерированные тексты являются потенциальной угрозой для SEO.

Принцип Human-in-the-loop позволяет ускорить работу над текстом, но при этом не потерять в качестве. В результате текст получается быстрее и лучше, чем при написании в одиночку. И это в итоге делает лучше и для посетителя, так как страница существует и приносит пользу.

Как оценить качество текста

Яндекс и Google не раскрывают алгоритмов оценки текстов, однако существуют сторонние инструменты, позволяющие выявить использование ИИ.

Например, можно использовать ИИ-детектор от Text.ru. Это платный инструмент, который даже частично недоступен бесплатно. Стоимость проверки 1000 знаков – 2 рубля.

Инструмент позволяет проверить текст любого размера, но лучше справляется с объемными материалами. Например, на запрос в ChatGPT статьи про выбор тормозных колодок ИИ предлагает следующий текст:

Пример статьи на русском языке, сгенерированной в нейросети ChatGPT
Пример статьи на русском языке, сгенерированной в нейросети ChatGPT
Пример оценки в Text.ru для статьи, сгенерированной в нейросети ChatGPT
Пример оценки в Text.ru для статьи, сгенерированной в нейросети ChatGPT

На первый взгляд, текст выглядит хорошо – он имеет логичную структуру и ценную информацию. Но этот текст определяется в Text.ru сгенерированным по совокупности других признаков:

К сожалению, Text.ru не умеет точно определять сгенерированный контент и иногда ошибается с оценкой. Например, на запрос статьи про рейку для дачи, нейросеть предлагает следующий текст:

Пример короткого текста, сгенерированного в нейросети ChatGPT
Пример короткого текста, сгенерированного в нейросети ChatGPT

Текст аналогично первому примеру выглядит структурированным и несет в себе полезную информацию. При этом Text.ru не справляется с его распознаванием, выдавая очень высокую оценку “человечности”:

Пример ошибочной оценки статьи, сгенерированной в нейросети ChatGPT, через сервис Text.ru
Пример ошибочной оценки статьи, сгенерированной в нейросети ChatGPT, через сервис Text.ru

Такие ошибки случаются и в других инструментах, например, для проверки текстов на русском и английском можно использовать детектор от Retext. Но и в этом случае вы можете столкнуться с ошибкой, когда ИИ-текст определяется естественным и наоборот.

Совет – мы в своей работе ориентируемся на отметку 50%. Если детектор оценивает шансы на ИИ менее 50%, то считаем, что материал создан человеком. Но даже при столь высокой планке, иногда пропускаем статьи с 60% и более, если уверены, что инструмент ошибся. Рекомендуем не смотреть слепо на оценку, так как на практике все детекторы ошибаются. Единственная точная проверка – вручную.

Например, материал, который вы сейчас читаете, был полностью написан вручную, но даже он получил оценку “14% текста сгенерировано нейросетью” в Retext:

Пример оценки статьи в Retext
Пример оценки статьи в Retext

Детекторы ИИ-контента стоит использовать в качестве вспомогательного инструмента, но не основного. Желательно, оценивать качество статьи вручную – это самый действенный способ проверки.

Ключевые критерии, которые помогут вам выявить ИИ-контент вручную:

  • Отсутствие конкретики – тексты получаются водянистыми.
  • Повторы и шаблонные обороты – самый яркий признак, что автор использовал искусственный интеллект. Большинство ИИ-детекторов оценивают именно его, вычисляя шаблонные обороты и повторяющуюся структуру. Опытный редактор, который видел сотни ИИ-статей сможет сделать такой анализ без инструментов, просто по штампам и оборотам, которые повторяются из предложения в предложение.
  • Низкая уникальность – не все ИИ-тексты страдают проблемой с уникальностью, но это частый симптом.
  • Нет ценности в материале – вся информация заимствована из других источников или “придумана”. Для оценки этого критерия необходимо разбираться в теме самостоятельно или сделать базовое исследование по вопросу, чтобы оценить уровень статьи.

Старые версии ИИ-генераторов, в том числе ChatGPT, грешили плохой структурой материалов. Но почти все современные инструменты теперь создают действительно качественную структуру. Поэтому на структуру не стоит ориентироваться – она может быть даже лучше, чем у человека, но низкая уникальность и отсутствие новой информации в тексте – чёткий сигнал.

Чек-лист редактуры AI-контента для SEO

Любой текст, созданный в нейросети, можно довести до ума. Иногда на это уходит больше сил и времени, чем при написании аналогичного материала с нуля, но с помощью чек-листа редактуры это можно сделать быстрее.

1. Читабельность

Первый критерий – читабельность текста. Оцените, насколько хорошо текст воспринимается. Помимо этого, оцените некоторые точечные параметры:

  • Соответствие текста вашему стилю
  • Подходит ли текст под вашу ЦА
  • И другие согласно вашей редакционной политике

При необходимости исправьте стиль и улучшите читабельность. Для этого может потребоваться разделить текст на новые смысловые блоки или изменить структуру повествования.

Совет – мы используем в работе сервис Главред. Это бесплатный инструмент, который позволяет быстро оценить структуру и читабельность. Желательно довести оценку по Главреду до 8,3 и более, но возможны исключения в зависимости от тематики. Также вы можете использовать другие инструменты для быстрой оценки читаемости, например, Адвего.

2. Факт-чекинг

Нейросети ошибаются в информации, которую они используют при подготовке материала. Например, ChatGPT предупреждает об этом при каждом запросе:

Пример предупреждения ChatGPT, что информация может быть некорректной
Пример предупреждения ChatGPT, что информация может быть некорректной

Даже минимальный фактчекинг позволит улучшить качество статьи. Но лучше проверить всё детально, хоть это и серьезно удлинит процесс работы. Оцените все цифры и данные, которые приводятся в материале.

Некоторые нейросети указывают источник информации, но не стоит на это полагаться. Как показывает наша практика, даже если указан источник, всё равно могут быть ошибки. Нейронка может неверно интерпретировать информацию, полностью исказив смысл. На нашей практике случались случаи, когда ИИ пропускал отрицание в источнике, и вместо негативного смысла у факта получился позитивный. Оцените сами:

  • Подать заявление на ВНЖ могут все, кого депортировали из страны по статье 121.1
  • Подать заявление на ВНЖ могут все, кого не депортировали из страны по статье 121.1

Одна маленькая деталь меняет смысл всего, что в конечном итоге делает материал непригодным для использования читателем.

На этапе факт-чекинга вы можете также оценить, насколько текст экспертный и точный, это поможет наметить места для улучшений на следующем этапе чек-листа.

3. E-E-A-T

Оценка E-E-A-T факторов связана не только с текстом, но и страницей, где материал будет публиковаться. В тексте вам нужно предварительно оценить следующие параметры:

  • Есть ли признаки опыта и экспертности?
  • Упомянуты ли источники и авторитетные организации?
  • Проверены ли данные и формулировки?
  • Есть ли честность в тексте без кликбейта и манипуляций?

Идеально, если все параметры сразу сделаны хорошо, но чаще всего это приходится править. Например, добавлять комментарий эксперта или ссылку на исследование.

Именно на этапе E-E-A-T вносятся самые объемные правки. Даже если блок с мнением эксперта занимает 1% от статьи, но на его составление может уйти много времени. Но именно экспертность материала превращает ИИ-контент в качественный материал.

4. SEO

При использовании нейросетей для SEO-текстов важно оценить, насколько полученный материал соответствует вашим SEO-требованиям. Для этого оцените ключи и SEO-структуру.

Оценить ключи можно с помощью специальных инструментов. Например, Advego позволяет даже в бесплатной версии проверить количество вхождений. Также бесплатно можно проверить с помощью Text.ru:

Пример проверки текста ChatGPT на SEO параметры через сервис Text.ru
Пример проверки текста ChatGPT на SEO параметры через сервис Text.ru

Важно – не стоит использовать ChatGPT и его аналоги для сбора ключей. При использовании ИИ для генерации текстов нужно предоставлять ключи из других источников. Но даже при предоставлении полноценного семантического ядра вы не получите 100% корректный текст, всё равно потребуется проверка и правки.

Проблемы с ключами могут быть не только в их количестве или отсутствии, но и в употреблении. Например, вам может потребоваться разбавить ключи вручную, добавить некоторые фразы или сократить их количество из-за переспама.

5. Уникальность

После всех предыдущих проверок и правок необходимо проверить уникальность. Проверять уникальность необходимо только на этом этапе, так как при проверке на начальной стадии вы получите другой результат.

Некоторые тексты от ИИ изначально уникальные – высокая уникальность не является фактором качественного текста в отрыве от остальных параметров.

Проверка уникальности требуется для соблюдения базового правила, что тексты не должны быть заимствованными. Например, ранее использованный в статье пример текста про тормозные колодки, сгенерированный в ChatGPT:

Пример проверки через Text.ru для уникальности текста, который сделан в ChatGPT
Пример проверки через Text.ru для уникальности текста, который сделан в ChatGPT

Пример сгенерированного текста до и после правок

Чтобы довести сгенерированный в нейросети текст до ума, может потребоваться много времени. Даже правки одного абзаца могут занять больше, чем написание материала с нуля. Разберем на примере статьи для туристического сайта на тему авиаперелетов из Москвы в США.

Например, ChatGPT предлагает следующий текст по времени и стоимости перелета:

Пример текста, сгенерированного в ChatGPT, по туристической тематике
Пример текста, сгенерированного в ChatGPT, по туристической тематике

На первый взгляд текст имеет смысл, но при редактуре потребуется внести целый ряд правок:

  • Время перелета – на самом деле оно не ограничено 22-24 часами, при проверке фактов около 20% рейсов занимают больше времени при длительной пересадке.
  • Стоимость перелетов не начинается от 80 тысяч, существуют варианты перелета за 57 000 рублей.

Это лишь примеры проблем в тексте, но на практике текст от ChatGPT не является полезным для читателя. Чтобы статья была полезной и экспертной вам потребуется существенно ее расширить и доработать.

Совет – ChatGPT зачастую опирается в ответе на иностранные источники. Например, для статьи про рейсы между Россией и США использован источник Kayak.com, который слабо представлен в России и не имеет актуальных данных. При необходимости подготовить материал, напрямую связанный с российским контекстном, можно протестировать отечественные инструменты от Яндекса и Сбера.

Помимо исправления фактов, данному материалу также требуется исправить структуру и SEO. Например, в заголовок “стоимость рейсов” можно дописать ключ “из Москвы в США”.

Другой пример текста, сгенерированного ИИ:

CRM-системы позволяют эффективно управлять клиентскими данными. Они помогают автоматизировать процессы и улучшить коммуникации. Кроме того, использование CRM-систем повышает продажи и оптимизирует бизнес-процессы.

На лицо все базовые проблемы нейросетей – шаблонность, общие фразы, отсутствие фактов и структуры. Данный текст можно исправить различными способами, вот один из них:

CRM – это не просто база клиентов, а инструмент для эффективного ведения бизнеса. По данным Salesforce, компании, использующие CRM, повышают продажи на 29%, а продуктивность сотрудников – на 34%.

3 преимущества CRM, подтвержденные практикой клиентов [название вашей компании]:

  1. Автоматизация – больше времени на продажи, меньше на бумажную работу.
  2. Единый профиль клиента – каждый менеджер знает историю взаимодействий.
  3. Прогнозируемость – наглядная воронка продаж и аналитика в реальном времени.

“Подключили CRM в ноябре 2024 года. На оцифровку ушло 2,5 недели и теперь все сделки прозрачны. Даже процент возвратов товаров уменьшился, так как делаем меньше ошибок” – цитата клиента [компании].

При наличии SEO ключей, текст можно доработать дополнительно, но главное, что в результате текст получился полезным и несет ценность – факты для читателя и опыт другого клиента компании.

Как сделать качественный текст с помощью искусственного интеллекта

Качественный текст с помощью искусственного интеллекта возможен только с условием его проверки и доработки. Существует мнение, что правильный промпт позволяет добиться сразу хорошего текста, но на практике это не так.

Промпт – задание для нейросети. Даже если вы пропишите, чтобы искусственный интеллект перепроверил все факты и использовал ключи, нейросеть не сможет гарантировать результат. Но правильный промпт существенно повышает качество и снижает объем необходимых правок.

Чтобы использовать нейросети для создания контента, руководствуйтесь следующими правилами:

  • Используйте платные версии нейросетей – например, ChatGPT по подписке предоставляет доступ к более совершенным моделям, которые дают лучшее качество. Но даже тексты, сделанные в платных ИИ, требуют существенных правок.
  • Включайте в описание задачи все детали, которые вам важны – если вы знаете какой-то факт или информацию, добавьте ее в промпт, как и включайте в описание задачи список SEO-ключей, если он у вас есть и другие данные, которые помогут ИИ выдать качественный результат.
  • Используйте несколько промптов для уточнения информации и улучшения финального материала.
  • Проверяйте статью по чек-листу в заданном порядке, внося необходимые изменения.
  • Добавляйте “ручные” блоки – кейсы, примеры и т.д.
  • Публикуйте материал на сайте от имени эксперта.

По нашей практике, ни одна из современных нейросетей не способна выдать полностью подходящий текст, поэтому единственный способ, как сделать качественно – доработка + правильный промпт. Почти ни в одной задаче не стоит публиковать материалы от нейросетей без правок.

Единственное исключение, когда можно обойтись без правок – короткие маркетинговые тексты. Это тексты, которые не имеют SEO потенциала – например, новость о начале акции, которую вы используете в email-рассылке или SMM. Но даже в этом случае требуется проверка, так как ни один из современных ИИ-инструментов не гарантирует качество.

Как не попасть под фильтры Яндекса и Google за ИИ-контент

AI – это инструмент, не волшебная палочка, которая сэкономит вам время и деньги на статьях. Главная сила ИИ – скорость, но только человек может превратить результат работы нейросети в экспертный контент, который будет в дальнейшем хорошо ранжироваться в поисковых системах.

Чтобы не попасть под фильтры Яндекс и Google за ИИ-контент, необходимо проверять контент и дорабатывать его по разным аспектам:

  • Читабельность – с материалом должно быть удобно взаимодействовать посетителю. Даже если вы выйдете в ТОП поисковых систем, но материал неудобен для чтения, то в скором времени вы лишитесь позиций из-за плохих поведенческих факторов.
  • Факты – если в очень хорошем по оформлению материале есть неточности и фактические ошибки, он не сможет принести пользу для читателя. И несмотря на сложность определения таких проблем, Яндекс и Google со времени понижают в выдаче неточные результаты. Один из критериев, как это определяется – пользователи будут возвращаться с вашего сайта обратно в поисковую выдачу со старым запросом.
  • SEO – ни один ИИ для написания статей не заменит Ahrefs, SEMRush, Keys.so, Serpstat и их аналоги для сбора ключей. Как минимум, искусственному интеллекту в промпте необходимо сообщить ключи, а в дальнейшем проверить их употребление. Без вашего задания и редактуры ни один ИИ, включая ChatGPT не сможет сделать SEO-оптимизированную статью. Это так, даже если вы увидите, что нейронка “умеет” собирать ключи – это делается некачественно.
  • Экспертность – Яндекс и Google любят экспертные материалы, которые не умеют делать нейронки. Чтобы повысить качество, а вместе с ним и ваши шансы на ТОП в поисковых системах, необходимо расширить материалы на дополнительные факты, которые подчеркнут вашу экспертность. Прокачивать экспертность можно не только на стороне текста, но и на самой странице, например, добавив к статье именитого автора.
  • Уникальность – несмотря на множество нововведений в алгоритмах, никто не отменял прошлые правила. Контент должен быть преимущественно уникальным с минимальным количеством заимствований.
  • И некоторым другим – ваш текст должен быть полезным для читателя, но также он должен быть не хуже, чем у конкурентов. Поэтому проверяйте, что в выдаче по вашему запросу и дорабатывайте до аналогичного состояния. Например, если конкуренты используют разные типы контента на странице, то желательно сделать то же самое или лучше.

Генерация страниц с помощью нейросетей – допустимое решение некоторых задач в SEO. Но это сработает только при ручной доработке материалов, которые вы получили от нейросети. Помните про принцип Human-in-the-loop (HITL), что в создании материала должен принимать участие человек.

В некоторых случаях проще и быстрее написать материал вручную с нуля, чем править и доводить до ума сгенерированный контент.

Помимо проработки статьи от ИИ, важно не забывать о самой странице – материал должен публиковаться от лица эксперта. Один и тот же материал на двух разных сайтах может показать разный результат в выдаче, если на одном сайте есть “прокаченный” профиль автора. Поэтому важно не только редактировать сам контент, но и улучшать место его публикации и заботиться о показателях самой страницы.