среда, 4 марта 2015 г.

Структура URL сайтов. Рекомендации Google


В этом обзоре я рассмотрю тему «Структура URL сайтов», используя рекомендации Google и практические примеры.  Для более полной картины рекомендую прочитать Руководство по поисковой оптимизации для начинающих в полном обьеме.
Структура URL по умолчанию должна отражать структуру сайта.  Она должна быть по-максимуму простой и понятной пользователю. Так пользователю проще определить в поиске нужную информацию и легче набрать URL в строке браузера.
Пример понятного URL
структура url
Пример непонятного URL
Неправильная структура url сайта
В поиске лучше для URL использовать расширенное описание веб-страниц.
Пример расширенного описания в навигации
Расширенное описание веб-страниц структуры  url

Не рекомендуется

  1. Использовать длинные URL с идентификаторами сессий, динамических параметров, параметрами сортировок.Длинные URL с индификаторами сессий, динамических параметров, параметрами сортировок.
  2. Использовать в URL ненужные слова, например «catalog»Использовать в URL ненужные слова
  3. Большое количество ключевых словБольшое количество ключевых слов в урле
  4. Большая вложенность категорийБольшая вложенность категорий в урле сайта
  5. Заглавные буквы в URLЗаглавные буквы в URL
  6. Нижнее подчеркивание в URL, лучше использовать дефисы для разделения слов.Нижнее подчеркивание в URL

Удаление части URL

Если пользователь зашел в товар и захотел вернутся в категорию товара не используя навигацию, а просто удалил часть URL — что будет показано пользователю, ошибка 404 или категория товара?
Вы должны предусмотреть и такие случаи.
Пример
http://www.mcsite.com.ua/prodvizenie-site/seo-pozicia.html убираем seo-pozicia.html
и получаем http://www.mcsite.com.ua/prodvizenie-site/
Пример
Набрали такой адрес
www.mcsite.com.ua/prodvizenie-site/seo-pozic и получили 404 страничку

Дубликаты URL

Ваш сайт должен предоставлять один URL для одного документа, это в идеале. Однако практически любая CMS генерирует дубликаты страниц. Кроме самой CMS, нужно правильно настроить файл .htaccess.
Обнаружить дубли сайта  вам поможет оператор Google site:site.com.ua. Для предовращения дубликатов страниц используйте 301 редирект или атрибут rel=“canonical”.
Подробнее о дубликатах страниц можете прочитать в статье как избавится от дубликатов страниц.

Канонические страницы

Это один из способов побороть дубликаты страниц с помощью атрибута rel=“canonical”.  Атрибут rel=“canonical”  указывает роботу основное содержание сайта для индексации, при этом игнорируя дубликаты страниц.
Пример
http://www.mcsite.com.ua/blog/
Каноническая страница
http://www.mcsite.com.ua/blog/?tag=веб-дизайн&key=tags
http://www.mcsite.com.ua/blog/?tag=создание сайта&key=tags
http://www.mcsite.com.ua/blog/?tag=интернет-магазин&key=tags
Ее дубли
В шаблоне каждого дубля должно быть указано <link rel=»canonical» href=»http://www.mcsite.com.ua/blog/» /> таким образом такий страницы не могут попасть в индекс поисковой машины.
Кроме дубликатов, которые генерирует сама CMS, очень часто возникают проблемы из-за неправильно заполнения сайта.
Пример: простой товар интернет-магазина опубликован в разных категориях — по сути, это уже дубликат для поисковой машины. Для того, чтобы такого не случилось, тоже необходим rel=“canonical”, в многих популярных CMS это решается специальными дополнениями.
Особенности использования rel=»canonical»
При указании канонической страницы сайта используйте абсолютный путь ссылки.
рел каноникал
Каноническая страница и ее варианты должны быть отмечены атрибутом rel=»canonical».

Пагинация или разбиение на страницы

Неправильная пагинация — это болезнь многих сайтов. Обычно это актуально для сайтов СМИ или интернет-магазинов.
Когда в индекс поисковой машины попадают такие странички, поисковик не всегда может правильно проиндексировать и понять, что страничка http://site.ua/kirpich/ главная, а другие — просто ее часть:
http://site.ua/kirpich/Page-3.html
http://site.ua/kirpich/Page-4.html
Руководство для вебмастеров дает несколько решений этой проблемы.
1. Чтобы указать связь между страничками пагинации, нужно использовать атрибуты rel=»next» и rel=»prev».  По опыту могу сказать, что это не всегда работало, и странички все равно попадали в индекс.
2. Более действенный способ — это атрибут rel=»canonical». Он помогает как бы склеить все странички разбивки в одну и указывает на одну главную каноническую страничку. Кстати, можна включить в шаблон еще и атрибуты rel=»next» и rel=»prev» — это не противоречит руководству.
Пример
При заходе на http://www.mcsite.com.ua/blog/?page=3 в шаблоне можете увидеть <link relcanonical»hrefhttp://www.mcsite.com.ua/blog/» />.
3. Этот способ не описан в руководстве, но он тоже работает. Если по каким-то причинам не можете использовать первые два способа, то используйте <meta name=»robots» content=»noindex,follow» /> в шаблоне страниц пагинации. Такая конструкция не позволяет индексировать такие странички как http://site.ua/kirpich/Page-3.html, но разрешает поисковику ходить по ссылкам и индексировать товар.

Как реализовывать?

Многие популярные CMS без проблем позволяют реализовать все рекомендации Google — это уже предусмотрено самыми CMS. Например, 404 ошибка и ЧПУ или rel=»canonical» . Также существует огромное количество дополнений. Кроме этого, еще нужно уметь обращатся с серверный файлом  htaccess.txt.
Однако необходимо понять, что это только рекомендации, и спустя какое-то время некоторые вещи могут быть уже не актуальны. Ведь многие авторитетные сайты находятся в топе даже не всегда придерживаясь данных рекомендаций.
Ключевую роль тут играют удобство для пользователя и качество контента или услуги. Ведь кто знает — пройдет немного времени, и поисковик научится понимать и URL с нижным подчеркиванием.
Как это было недавно с количеством внутренних ссылок на странице — сейчас Google индексирует их больше 100.

0 коммент.:

Отправить комментарий