Перейти к содержимому



Дубли страниц в Google Webmaster

#1 avkeys

avkeys
  • Пользователь
  • 7 сообщений
  • Репутация: 0
0

Отправлено 25 Март 2013 - 22:24

Здравствуйте! Есть проблема, которую давно не могу решить. Может кто опытный поможет.
Суть проблемы такова:
Google в панели вебмастера постоянно находит дубли страниц сайта с одинаковыми заголовками и описаниями, и постоянно кол-во дублей растет. Например, два адреса вида хттп://мойсайт/индекс.пхп/параметр=значение и хттп://мойсайт/?параметр=значение он считает двумя разными страницами сайта, но с одинаковым контентом (страница-то одна, просто почему-то гугл сам сократил и удалил из адреса index.php).
В sitemap.xml у меня все адреса с index.php (кроме главной страницы). Хотел найти решение через .htaccess, перелапатив кучу форумов и советов по устранению данной ситуации, но ничего не нашел.
Буду блогадарен всем, кто поможет с решением или советом

 

 

  • 0

#2 Jean

Jean
  • Пользователь PRO
  • 1 237 сообщений
  • Репутация: 218

Отправлено 26 Март 2013 - 07:28

1: <link rel=”canonical” href=”http://www.сайт.ru” /> Прописывать в <head> страницу которая будет считаться верной.
2: запрет индексации дублей в robots.txt
  • 1
Научу вас Seo оптимизировать и продвигать сайт, стоимость от 150р час, теория+практика
Консультирую по Интернет рекламе


#3 avkeys

avkeys
    Topic Starter
  • Пользователь
  • 7 сообщений
  • Репутация: 0

Отправлено 26 Март 2013 - 09:39

Спасибо за ответ, правда есть вопросы:
1: если создам php-script, который будет определять отсутствие index.php в адресе и автоматически добивать index.php с пропиской в <link rel=”canonical” href=”адрес страницы уже с index.php” /> - google должен будет склеить/объединить дубли? Будет ли это корректно для Яндекс?
2: Скорее всего возникнет проблема - будет достаточно сложно регулярно прописывать в robot.txt запрещенные страницы, так как в день я добавляю около 3-5 новых страниц, а гугл их дублирует страницами не только без index.php, но может добавить вообще исковерканный адрес типа хттп://мойсайт/?параметр=значение&shy;See - откуда вообще он берет такую ерунду в конце адреса!?)
  • 0

#4 Jean

Jean
  • Пользователь PRO
  • 1 237 сообщений
  • Репутация: 218

Отправлено 26 Март 2013 - 13:36

avkeys,
1: Если вы верно настроите, а ещё лучше поставите 301 редирект на верную страницу, то склеит и яндекс и гугл.
2: А в каждой странице у вас нет регулярного названия? У вас они генерируются постоянно уникальные?
ведь можно поставить и так
/?параметр=значение*
Чтоб не вдаваться в подробности http://help.yandex.r...ster/?id=996567
И не нужно будет прописывать каждую страницу, достаточно вывести верный Роботс.
  • 0
Научу вас Seo оптимизировать и продвигать сайт, стоимость от 150р час, теория+практика
Консультирую по Интернет рекламе


#5 avkeys

avkeys
    Topic Starter
  • Пользователь
  • 7 сообщений
  • Репутация: 0

Отправлено 26 Март 2013 - 18:45

Так как хостер значительно ограничил использование .htaccess (к примеру не могу использовать mod_rewrite) пришлось
1. Все дубли страниц свел через php-скрипт на правильные страницы, прописывая в head <link rel=”canonical” href=”единственный правильный URL” /> (скрипт определяет наличие или отсутствие в дублях index.php, определяет всякий хлам в параметрах, который гугл черт знает откуда берет).
2. Все несуществующие страницы (тоже не пойму откуда он их взял, правда их немного) свел на 404, через header:
<?пхп
header('HTTP/1.x 404 Not Found');
header("Status: 404 Not Found");
?>
Правда перекидывает на 404-страницу самого хостинга с ихней рекламой, но хотя бы ответ сервера с нее отдается 404 а не 200
Думаю, что сделал все правильно?

Может все-таки (по п.1) лучше применить 301 редирект через php:
<?пхп
header("HTTP/1.1 301 Moved Permanently");
header("Location: [b]единственный правильный URL[/b]");
exit();
?>

Спасибо за оказанную помощь
  • 0

#6 Jean

Jean
  • Пользователь PRO
  • 1 237 сообщений
  • Репутация: 218

Отправлено 27 Март 2013 - 07:32

avkeys, Можно и через php , да и 404 тоже верное решение.
Дайте теперь время и ПС верно проиндексирует сайт, если что пишите.
  • 0
Научу вас Seo оптимизировать и продвигать сайт, стоимость от 150р час, теория+практика
Консультирую по Интернет рекламе



Оформление форума – IPBSkins.ru