В этом обзоре я рассмотрю тему «Структура URL сайтов», используя рекомендации Google и практические примеры. Для более полной картины рекомендую прочитать Руководство по поисковой оптимизации для начинающих в полном обьеме.
Структура URL по умолчанию должна отражать структуру сайта. Она должна быть по-максимуму простой и понятной пользователю. Так пользователю проще определить в поиске нужную информацию и легче набрать URL в строке браузера.
Пример понятного URL
Пример непонятного URL
В поиске лучше для URL использовать расширенное описание веб-страниц.
Пример непонятного URL
В поиске лучше для URL использовать расширенное описание веб-страниц.
Пример расширенного описания в навигации
Не рекомендуется
- Использовать длинные URL с идентификаторами сессий, динамических параметров, параметрами сортировок.
- Использовать в URL ненужные слова, например «catalog»
- Большое количество ключевых слов
- Большая вложенность категорий
- Заглавные буквы в URL
- Нижнее подчеркивание в URL, лучше использовать дефисы для разделения слов.
Удаление части URL
Если пользователь зашел в товар и захотел вернутся в категорию товара не используя навигацию, а просто удалил часть URL — что будет показано пользователю, ошибка 404 или категория товара?
Вы должны предусмотреть и такие случаи.
Пример
http://www.mcsite.com.ua/prodvizenie-site/seo-pozicia.html убираем seo-pozicia.html
и получаем http://www.mcsite.com.ua/prodvizenie-site/
http://www.mcsite.com.ua/prodvizenie-site/seo-pozicia.html убираем seo-pozicia.html
и получаем http://www.mcsite.com.ua/prodvizenie-site/
Пример
Набрали такой адрес
www.mcsite.com.ua/prodvizenie-site/seo-pozic и получили 404 страничку
Набрали такой адрес
www.mcsite.com.ua/prodvizenie-site/seo-pozic и получили 404 страничку
Дубликаты URL
Ваш сайт должен предоставлять один URL для одного документа, это в идеале. Однако практически любая CMS генерирует дубликаты страниц. Кроме самой CMS, нужно правильно настроить файл .htaccess.
Обнаружить дубли сайта вам поможет оператор Google site:site.com.ua. Для предовращения дубликатов страниц используйте 301 редирект или атрибут rel=“canonical”.
Подробнее о дубликатах страниц можете прочитать в статье как избавится от дубликатов страниц.
Канонические страницы
Это один из способов побороть дубликаты страниц с помощью атрибута rel=“canonical”. Атрибут rel=“canonical” указывает роботу основное содержание сайта для индексации, при этом игнорируя дубликаты страниц.
Пример
http://www.mcsite.com.ua/blog/
Каноническая страница
http://www.mcsite.com.ua/blog/
Каноническая страница
http://www.mcsite.com.ua/blog/?tag=веб-дизайн&key=tags
http://www.mcsite.com.ua/blog/?tag=создание сайта&key=tags
http://www.mcsite.com.ua/blog/?tag=интернет-магазин&key=tags
Ее дубли
http://www.mcsite.com.ua/blog/?tag=создание сайта&key=tags
http://www.mcsite.com.ua/blog/?tag=интернет-магазин&key=tags
Ее дубли
В шаблоне каждого дубля должно быть указано <link rel=»canonical» href=»http://www.mcsite.com.ua/blog/» /> таким образом такий страницы не могут попасть в индекс поисковой машины.
Кроме дубликатов, которые генерирует сама CMS, очень часто возникают проблемы из-за неправильно заполнения сайта.
Пример: простой товар интернет-магазина опубликован в разных категориях — по сути, это уже дубликат для поисковой машины. Для того, чтобы такого не случилось, тоже необходим rel=“canonical”, в многих популярных CMS это решается специальными дополнениями.
Особенности использования rel=»canonical»
При указании канонической страницы сайта используйте абсолютный путь ссылки.
При указании канонической страницы сайта используйте абсолютный путь ссылки.
Каноническая страница и ее варианты должны быть отмечены атрибутом rel=»canonical».
Пагинация или разбиение на страницы
Неправильная пагинация — это болезнь многих сайтов. Обычно это актуально для сайтов СМИ или интернет-магазинов.
Когда в индекс поисковой машины попадают такие странички, поисковик не всегда может правильно проиндексировать и понять, что страничка http://site.ua/kirpich/ главная, а другие — просто ее часть:
http://site.ua/kirpich/Page-3.html
http://site.ua/kirpich/Page-4.html
http://site.ua/kirpich/Page-4.html
Руководство для вебмастеров дает несколько решений этой проблемы.
1. Чтобы указать связь между страничками пагинации, нужно использовать атрибуты rel=»next» и rel=»prev». По опыту могу сказать, что это не всегда работало, и странички все равно попадали в индекс.
2. Более действенный способ — это атрибут rel=»canonical». Он помогает как бы склеить все странички разбивки в одну и указывает на одну главную каноническую страничку. Кстати, можна включить в шаблон еще и атрибуты rel=»next» и rel=»prev» — это не противоречит руководству.
Пример
При заходе на http://www.mcsite.com.ua/blog/?page=3 в шаблоне можете увидеть <link rel=»canonical»href=»http://www.mcsite.com.ua/blog/» />.
При заходе на http://www.mcsite.com.ua/blog/?page=3 в шаблоне можете увидеть <link rel=»canonical»href=»http://www.mcsite.com.ua/blog/» />.
3. Этот способ не описан в руководстве, но он тоже работает. Если по каким-то причинам не можете использовать первые два способа, то используйте <meta name=»robots» content=»noindex,follow» /> в шаблоне страниц пагинации. Такая конструкция не позволяет индексировать такие странички как http://site.ua/kirpich/Page-3.html, но разрешает поисковику ходить по ссылкам и индексировать товар.
Как реализовывать?
Многие популярные CMS без проблем позволяют реализовать все рекомендации Google — это уже предусмотрено самыми CMS. Например, 404 ошибка и ЧПУ или rel=»canonical» . Также существует огромное количество дополнений. Кроме этого, еще нужно уметь обращатся с серверный файлом htaccess.txt.
Однако необходимо понять, что это только рекомендации, и спустя какое-то время некоторые вещи могут быть уже не актуальны. Ведь многие авторитетные сайты находятся в топе даже не всегда придерживаясь данных рекомендаций.
Ключевую роль тут играют удобство для пользователя и качество контента или услуги. Ведь кто знает — пройдет немного времени, и поисковик научится понимать и URL с нижным подчеркиванием.
Как это было недавно с количеством внутренних ссылок на странице — сейчас Google индексирует их больше 100.
0 коммент.:
Отправить комментарий