- Варианты организации материалов на сайте
- Какой выбрать
- Закрывать ли страницы пагинации от поисковиков
- Пример «Гардиан»
- Требования к страницам пагинации для разработчиков
- Используем понятную структуру сетевых адресов
- Исключаем дублирование первой страницы
- Формируем мета-данные по шаблону
- Формируем особые мета-данные для первой страницы
- Прописываем «каноникал»
- Добавляем перелинковку
- Прописываем 404-й ответ сервера для несуществующих страниц
- Выводим 20-50 карточек на странице
В этой статье развенчаем назойливый SEO-миф, а также сформируем понятные рекомендации для разработчиков. Если вы — программист и не хотите читать предысторию, сразу переходите в раздел «Требования».
Варианты организации материалов на сайте
Представим, что мы редизайним медиа-портал. Надо выбрать форму организации карточек статей для таксономических страниц (теги, рубрики, иные подборки) так, чтобы это было понятно для поисковых систем. Какие есть опции?
Пагинация — классический подход, когда результаты делятся на страницы с фиксированным числом элементов. Для роботов каждая страница пагинации имеет статичный адрес, который периодически можно посещать.
При желании мы достигнем новости любой давности, совершая переходы по ссылкам с главной страницы (главная —> тег —> стр. №2 —> стр. №3 и т.д.). Кликовая доступность здесь — не фактор ранжирования, а удобный критерий, позволяющий оценить перелинковку на сайте.
Бесконечная загрузка — пользователь крутит колёсико и карточки со статьями подгружаются налету. Часто используется на странице новости, чтобы задержать пользователя как можно дольше — вместо подвала он видит заголовок следующего материала.
Но с точки зрения SEO здесь есть проблема: поисковые роботы не скроллят. Значит, они увидят только те карточки, которые отдаст сервер при первой загрузке. У «Гугля» есть рекомендации, как сделать инфинитив индексируемым, но на практике мы с такой реализацией никогда не сталкивались.
Интересная деталь: роботы рендерят страничку целиком, то есть условным устройством с высотой экрана 10000px. Если инфинитив настроен на область видимости, боты будут видеть больше информации, чем предполагают разработчики.
Загрузка по кнопке «Показать еще» — по сути та же бесконечная загрузка, только пользователь явно оформляет желание увидеть дополнительные карточки кликом. С точки зрения SEO проблема та же: роботы не нажимают на кнопки.
Статичная страница со всеми результатами — загружаем всё и сразу. Подходит в случаях, когда элементы меняются не слишком часто, а иллюстрации или длинный текст выводить не нужно.
Какой выбрать
Для сайтов СМИ пагинацию используем на тегах и рубриках. Инфинитив — где нужно вовлечение, например, на главной или на страницах новостей. Статичный список — для перечисления авторов, тегов, рубрик, архива за день.
«Показать еще» используется реже всего, поскольку этот вариант и не затягивает пользователя, и не очень хорош для SEO (хотя тоже можно настроить).
Закрывать ли страницы пагинации от поисковиков
Среди оптимизаторов распространено мнение, что пагинация в глазах роботов — это мусорные и низкокачественные страницы, которые надо запрещать индексировать. Но в таком случае лучше сразу использовать инфинитив или «Показать еще». Эти варианты не генерируют дополнительные страницы и приятнее для пользователей.
Также предлагают два компромисса. Первый — закрыть страницы пагинации от индексации, но разрешить роботам по ним ходить для изучения структуры сайта. Для этого на страницах №2 и далее размещается мета-тег: <meta name="robots" content="noindex, follow">
.
Но роботы экономят ресурсы и со временем перестают посещать запрещенные к индексации страницы. Тогда озвучивают второй вариант. Пусть пагинация будет открыта, но каноничной версией мы определим только первую страницу. Если не знаете, что такое нормализация сетевых адресов, изучите документацию «Гугля».
Поэтому на условном /tag/spb/2
появляется тег:
<link rel="canonical" href="https://example.com/tag/spb>
Минус тот же самый — со временем роботы перестанут посещать неканоничные версии.
Всё это полумеры, которые противоречат ключевой цели страниц пагинации — добавлять «потоковым» сайтам больше структурированности и, тем самым, улучшать качество их восприятия роботами.
Пример «Гардиан»
Сайт газеты «Гардиан» — лучший по видимости в британском «Гугле» (по крайней мере был таким в начале 2020-х). Разберемся, как у них устроены таксономические страницы. Изучим тег Arts: https://www.theguardian.com/education/arts, там используется пагинация.
Переходим на вторую страницу: https://www.theguardian.com/education/arts?page=2. У нее:
- Уникальные мета-данные.
- Нет запрета на индексацию.
- «Каноникал» указывает на саму себя.
Требования к страницам пагинации для разработчиков
Используем понятную структуру сетевых адресов
- Основная страница —
/tag/spb
- Вторая страница —
/tag/spb/2
- Третья страница —
/tag/spb/3
- …
Исключаем дублирование первой страницы
Частая ошибка: основная страница тега доступна как по красивому адресу, так и как «первая страница»: /tag/spb
и /tag/spb/1
. Дублирование не нужно, убедитесь, что второй (альтернативный) адрес отдает 404 или 301 и не используется в перелинковке.
Формируем мета-данные по шаблону
Важно, чтобы каждая страница пагинации обладала уникальными «тайтлом» и «дескрипшеном». Для этого достаточно выводить номер страницы, например:
- title:
Последние новости Петербурга (страница 2) - Сайт.ру
- description:
Все новости на портале Сайт.ру по теме «Петербург» на сегодня — страница №2 из 923
Формируем особые мета-данные для первой страницы
С точки зрения SEO, для основной страницы указание ее номера — лишняя информация в сниппете, которая понизит кликабельность. Поэтому делаем исключение:
- title:
Последние новости Петербурга - Сайт.ру
- description:
Все новости на портале Сайт.ру по теме «Петербург» на сегодня
Прописываем «каноникал»
- Основная страница:
<link rel="canonical" href="https://example.com/tag/spb">
- Вторая:
<link rel="canonical" href="https://example.com/tag/spb/2">
- Третья:
<link rel="canonical" href="https://example.com/tag/spb/3">
- …
Добавляем перелинковку
Делаем так, чтобы с основной страницы пагинации до любой промежуточной (в том числе последней) можно было добраться с помощью кликов по ссылкам. Обычно это несколько циферок, а также элементы «Далее», «Назад», «В конец». Главное, чтобы всё это было завёрстано через тег <a>
— см. документацию «Гугля».
Прописываем 404-й ответ сервера для несуществующих страниц
Частая ошибка: если добавить большое число в урл пагинации, сервер отдает страницу без результатов, но с 200-м ответом. Представим, что в теге у нас только 47 страниц, тогда:
- 47-я страница —
/tag/spb/47
(200 ОК) - 48-я страница —
/tag/spb/48
(404 Not Found) - 234-я страница —
/tag/spb/234
(404 Not Found)
Выводим 20-50 карточек на странице
Нет смысла дробить контент на тысячи страничек по десять результатов. Посмотрите на конкурентов, которые стоят в топе со страницами тегов, сколько позиций они отдают с сервера? Обычно выводится 20-50 новостей до бесконечной загрузки или блока пагинации.