Перейти к содержимому

Реферальная программа Мегаплана

Партнерская программа Kredov

Осмысленные ссылки - быть или не быть?

#1 webby

webby
  • Пользователь
  • 9 сообщений
  • Репутация: 0
-1

Отправлено 25 Июнь 2013 - 05:44

Только сейчас... спустя долгое время... осознал я свою роковую ошибку. Коллеги, продумывайте все варианты заранее, дабы не повторять мой горький опыт, наступая на те же грабли.

Классика - мой горький опыт

Немного предыстории:
На заре моего опыта создания сайтов я, немного изучив теории построения динамических сайтов, принял решение идентифицировать страницы моего первого динамического сайта, используя идетификатор, или id, как все привыкли уже говорить. Поэтому URL почти всех страниц на моем сайте выглядели вот так:
http://mysitehostname.ru/page?id=14 (все значения URL в этом примере вымышленные, включая id=14 и не имеют никакого отношения к действительности за исключением самого принципа построения адреса страницы).

Дайожж креатифф!!! или креатифф рулит


Далее, немного почитав про ЧПУ (человеко-понятный УРЛ - для тех, кто пока невкурсе) я сделал настройку в файле .htaccess и мои страницы стали доступны по адресу:
http://mysitehostname.ru/page/14/ - согласитесь, немного посимпатичней. Очень лаконичный URL получился.

Кстати, кому интересно в .htaccess сделал следующую настройку, то есть указал следующие правила:
RewriteEngine on #включил модуль ModeRewrite
RewriteBase / #указал базовую директорию, т.е. корень сайта
RewriteRule ^page/*([0-9]*)/*$ page.php?id=$1 [NC] #собственно само правило, плюс флаг регистронезависимости url.

Но где-то здесь затаилась моя роковая ошибка, которая аукнулась мне несколько лет спустя. А именно, ссылки эти не имеют смысла, вернее имеют, но он (смысл) весьма ограничен.

Не всё так сталося, як гадалося


Всё... вроде бы всё красиво, лаконично и упорядочено... Но, как всегда в отлаженной системе возникает большое жирное НО, и самое обидное, что к этому я пришел не сразу, а спустя очень большое время.

Оказалось (и теперь всем станет ясно, почему я разместил данную тему в разделе SEO), что поисковые системы не любят подобных - непонятных, неосмысленных, безликих ссылок. При этом, самое парадоксальное, что я с этим оказался совершенно согласен.

Вот поставим себя на место обычного пользователя Интернета, как любят это делать поисковые системы, и что очень даже естественно и правильно, с моей точки зрения. Разве адрес страницы типа http://mysitehostname.ru/page/14/ сможет нам дать какую-либо информацию кроме того, что данный материал расположен на сайте mysitehostname.ru в разделе page и имеет то ли порядковый номер, то ли какой-то идентификатор со значением id? Все... дальше ничего не понятно... что это, о чем оно? Неудивительно, что поисковые системы отдают большее предпочтение более информативным ссылкам.

Впервые я задумался об этой проблеме побывав в шкуре пользователя Яндекс.Метрики. Все ссылки там отображаются не заголовками, а именно чистыми ссылками, как они есть. То есть статья с заголовком "Самая лучшая статья в Рунете" отображается там весьма заурядно и безлико... тупо http://mysitehostname.ru/page/14/ - согласитесь, ничего не понятно из УРЛ. Поэтому мне, пользователю Яндекс.Метрики приходится кликать по ссылкам своего же сайта, чтобы понять, что это за страница, о чем она и т.п. Или запомнить наизусть все id всех страниц... жуть и тупизм. То же самое подумает посетитель вашего (моего) сайта.

О ужас!!! Что же делать? - Изучать SEO. Осмысленные ссылки решат проблему.

Что значит - осмысленные ссылки?
- Ссылки (URL) включающие в себя ключевые слова контента, на которые они ссылаются.

Идея


Поэтому я решил перестроить свой сайт под новый формат. Теперь ссылки на все информативные страницы будут иметь формат:
http://mysitehostnam...resnoj-temy=14/ (если в тексте не видно полный адрес, наведите на ссылку и посмотрите его, а то теряется смысл моего повествования)

Согласитесь, теперь понятно, о чем повествует данная страница. Да - не так лаконично, как раньше, но теперь всем всё ясно.

И реализовать это было совсем не трудно - в добавок к указанным выше настройкам в .htaccess я добавил еще одну строчку:
RewriteRule ^page/*[a-z0-9-]+=([0-9]+)/*$ page.php?id=$1 [NC]
Это означает, что перед идентификатором страницы возникнут "ничего не означающий" (на самом деле очень важный) текст - он же заголовок страницы и разделительный знак - у меня равно, но это кому как нравится.

Почему добавил строчку в .htaccess, а не прописал вместо той что была? Для того чтобы старые ссылки вида http://mysitehostname.ru/page/14/ всё еще работали, т.е. отправляли пользователя на нужную страницу. Ведь вдруг у кого-то мои ссылки уже в закладках и т.д.

Реализация идеи

Сделал все весьма приметивно. При генерации ссылок (в меню и т.п.) вместо
<a href="http://mysitehostname.ru/page/<?=$id?>/"><!--?=$title?--></a>
выдаю
<a href="http://mysitehostname.ru/page/<?=trans($title).'='.$id?>/"><!--?=title?--></a> #, где trans() - функция типа:

function trans($text){
$trimtext = str_replace(" ", "-", trim(preg_replace("/[^a-z0-9а-яё]+/", " ", strtolower(strip_tags($text)))));
$transtext = array('-'=>'-',
'а'=>'a', 'б'=>'b', 'в'=>'v', 'г'=>'g', 'д'=>'d',
'е'=>'e', 'ё'=>'jo', 'ж'=>'zh', 'з'=>'z', 'и'=>'i',
'й'=>'j', 'к'=>'k', 'л'=>'l', 'м'=>'m', 'н'=>'n',
'о'=>'o', 'п'=>'p', 'р'=>'r', 'с'=>'s', 'т'=>'t',
'у'=>'u', 'ф'=>'f', 'х'=>'h', 'ц'=>'ts', 'ч'=>'ch',
'ш'=>'sh', 'щ'=>'sch', 'ъ'=>'', 'ы'=>'y', 'ь'=>'',
'э'=>'e', 'ю'=>'yu', 'я'=>'ya',
'1'=>'1', '2'=>'2', '3'=>'3', '4'=>'4', '5'=>'5',
'6'=>'6', '7'=>'7', '8'=>'8', '9'=>'9', '0'=>'0',
'a'=>'a', 'b'=>'b', 'c'=>'c', 'd'=>'d', 'e'=>'e',
'f'=>'f', 'g'=>'g', 'h'=>'h', 'i'=>'i', 'j'=>'j',
'k'=>'k', 'l'=>'l', 'm'=>'m', 'n'=>'n', 'o'=>'o',
'p'=>'p', 'q'=>'q', 'r'=>'r', 's'=>'s', 't'=>'t',
'u'=>'u', 'v'=>'v', 'w'=>'w', 'x'=>'x', 'y'=>'y',
'z'=>'z');
return strtr($trimtext,$transtext);
};

Естественно надо еще перезакинуть файл sitemap.xml туда куда нужно. То есть поисковым системам на съедение.

Что бы у пользователей работали старые ссылки решил оставить в .htaccess старые правила.
Но чтобы не возникла проблема дублей, решил воспользоваться замечательным, на мой взгляд, решением проблемы дублей изложенным на данном форуме по адресу http://www.masterweb...ochnaja-pobeda/ и запретить поисковым роботам индексировать страницы со старым URL.

Кроме того, чтобы пользователи заходившие по старым ссылками поняли, что что-то поменялось (в лучшую сторону), решил устроить переадресацию со старых URL на новые, используя тег &lt;meta http-equiv=&#39;Refresh&#39; content=&#39;...&#39;&gt; подставляя, тоже динамически, вместо &#39;...&#39; нужную страницу, с понятным уже для всех адресом.

В общем, реализация идеи не так уж и сложна, как казалось сперва. Сперва я думал переделывать базу данных, вводить дополнительное поле с транслитерацией заголовков. А потом каким-то загадочным образом идентифицировать страницу не только по id но и по трансзаголовку. Бррр... На самом деле заголовок этот (переделанный) нужен только для поисковых систем и пользователей, а для самого функционала сайта достаточно только id, поэтому он присутствует у меня в URL страниц вместе с адаптированным заголовком, а в качестве разделительного знака использую знак равно.

Нюансы


Оказалось, изучив тему подробней, что в URL в качестве разделителя слов, вместо пробела, приветствуется знак тире &quot;-&quot;, в то время, как знак нижнего подчеркивания &quot;_&quot; наоборот затрудняет интерпретацию адреса страницы. Подробностей тут не буду излагать. Кому интересно - погуглите на эту тему. Вкратце могу сказать, что знак нижнего подчеркивания часто используется в функциях языков программирования, поэтому поисковики типа Google не склонны распознавать его как разделительный знак, а поисковики типа Yandex во многом подражают поисковикам типа Google. Поэтому я принял окончательное решение на счет нового формата для ссылок своего сайта. Надеюсь поисковики это оценят.

Резюме - с небес на землю


Новый релиз сайта я конечно подготовил - уже даже сохранил его на флешку. Но реализовывать данное решение пока не спешу. Опасаюсь за уже существующие в индексе страницы. Что же будет теперь с ними? Понятное дело - со временем переиндексируются. Но когда это светлое будещее наступит? - вот в чем вопрос.

Кроме того, я боюсь, что потеряется вся статистика для старых адресов URL, и в Яндекс.Метрике и в Google.Analytics. Но с другой стороны, почему бы не начать все с чистого листа. Даже боюсь предположить какие могут возникнуть проблемы у тех, чей заработок тесно связан с проиндексированными страницами и т.п.

А самое страшное - это, не будут ли расценены те же самые страницы моего сайта, но уже с новыми URL, как совсем левые страницы с использованным ранее контентом, то есть как дубли тех страниц, что были до этой реконструкции. То есть, не потеряю ли я уникальность контента и его вес на своих же собственных страницах, всего лишь изменив указанным способом их URL адрес? Самое обидное, что всё делается исключительно во благо конечного пользователя сети Интернет.

P.S.


У кого есть интересные размышления на данную тему, прошу откликнуться? Интересно мнение каждого, кто в теме. А также интересно, что вы думаете о моих методах решения поставленной задачи. Быть или не быть, всё таки, &quot;осмысленным&quot; ссылкам у меня на сайте???

При поддержке: Fozzy - эксклюзивный спонсор конкурса на Masterwebs. На хостинге Fozzy ваш сайт будет работать до 3-х раз быстрее, а отзывчивая поддержка поможет в любой трудной ситуации. Попробуйте быстрый хостинг Fozzy бесплатно в течение 7 дней!
Изображение

 

 

  • -1

#2 fedornabilkin

fedornabilkin
  • Пользователь
  • 696 сообщений
  • Репутация: 91

Отправлено 25 Июнь 2013 - 09:21

Далее, немного почитав про ЧПУ (человеко-понятный УРЛ - для тех, кто пока невкурсе) я сделал настройку в файле .htaccess и мои страницы стали доступны по адресу: http://mysitehostname.ru/page/14/ - согласитесь, немного посимпатичней. Очень лаконичный URL получился.

Это не ЧПУ...
Статью не стал до конца читать, не очень понравилось.
Исключительно мое мнение по поводу ЧПУ, пользователей и отношения ПС к таким ссылкам такое:
1. Покажите мне хотя бы одного пользователя, который читает ЧПУ и после осознания либо переходит, либо не переходит по ссылке. Для этого существуют анкоры и околоссылочный текст.
2. Есть сомнения по отношению ПС к ЧПУ. Могу с 100% уверенностью сказать, что вид ссылки на индексацию не влияет. Для отображения сниппета и заголовка в выдаче, большую роль играет анкор, а не вид ссылки. По поводу ранжирования сказать ничего не могу.
  • 0
Как часто в горестной разлуке,В моей блуждающей судьбе, ФО, я думал о тебе.


#3 isvetlichniy

isvetlichniy
  • Пользователь
  • 619 сообщений
  • Репутация: 93

Отправлено 25 Июнь 2013 - 12:33

не знаю как поисковики, а пользователи уж точно в последнюю очередь обращают на ЧПУ
а касательно функции trans тоже спорный вопрос. я бы сделал дополнительное поле - имя страницы, которое было бы только на латинице и использовалось в качестве URL (по типу как в вордпрессе)
  • 0

#4 Sosnovskij

Sosnovskij
  • Администратор
  • 3 886 сообщений
  • Репутация: 566

Отправлено 25 Июнь 2013 - 14:37

Используйте для перенаправления со старых URL на новые 301-редирект. Он должен сохранить и передать вес, но бывает и по-другому.
  • 1

Не стесняйтесь ставить оценки темам :) Правила форума. Мой блог http://sosnovskij.ru/.



#5 webby

webby
    Topic Starter
  • Пользователь
  • 9 сообщений
  • Репутация: 0

Отправлено 25 Июнь 2013 - 18:04

Это не ЧПУ...
Статью не стал до конца читать, не очень понравилось.
Исключительно мое мнение по поводу ЧПУ, пользователей и отношения ПС к таким ссылкам такое:
1. Покажите мне хотя бы одного пользователя, который читает ЧПУ и после осознания либо переходит, либо не переходит по ссылке. Для этого существуют анкоры и околоссылочный текст.
2. Есть сомнения по отношению ПС к ЧПУ. Могу с 100% уверенностью сказать, что вид ссылки на индексацию не влияет. Для отображения сниппета и заголовка в выдаче, большую роль играет анкор, а не вид ссылки. По поводу ранжирования сказать ничего не могу.


Очень дружественно... не успел попасть в конкурс, уже пошла «жесткая» критика. Но никаких обид, объективная критика - это даже хорошо. Значит, есть над чем работать и проблема уже озвучена. Однако, не совсем понятно, что конкретно в моей статье не понравилось? Или, может быть, в данном конкретном случае раскрытая в статье тема не совсем интересна комментирующему её читателю.

«Не стал до конца читать...» а докуда дочитал? И зачем комментировал тогда, если даже не дочитал? Да еще и так критично. Как-то неуважительно.

«Это не ЧПУ...» А что же это? А что ЧПУ тогда?

http://site.com/magaz/98/tovar/666/ или http://site.com/maga.../tovar/valinki/ ???
- И то, и другое – ЧПУ !!! И мой пример http://mysitehostname.ru/page/14/ - тоже ЧПУ.

А вот http://site.com/kata...az=98&tovar=666 или http://site.com/kata...a&tovar=valinki или http://mysitehostnam.../page.php?id=14 - это всё не ЧПУ.

Почитайте матчасть на досуге - http://ru.wikipedia....i/ЧПУ_(Интернет)

И еще, я тот самый (может быть единственный, конечно) пользователь, который читает ЧПУ в адресе ссылки. Более понятные логические ссылки лучше воспринимаются и запоминаются (если они не слишком громоздкие, естественно). Тем более, что та же Яндекс.Метрика выдает статистику именно по URL и тут, при неудачном формировании ссылок, начинаются проблемы. Я же ведь об этом писал. Ах да, он же не дочитал. Бывает.

И беспокоит меня не то, проиндексируются мои новые ссылки или нет. А то, как поисковики отнесутся к такой реконструкции. Ведь по сути новые URL будут вести к материалам со старым контентом, то есть могут восприниматься, как дублирующие страницы и потерять в весе. Вот что меня более всего беспокоит. Ведь как-то же люди меняют URL для уже проиндексированных страниц своих сайтов. А иногда даже и с одного домена на другой переезжают - и все нормально. Может быть, поисковикам можно где-то сообщить о своем намерении поменять адреса уже существующих в поисковом индексе страниц?

Используйте для перенаправления со старых URL на новые 301-редирект. Он должен сохранить и передать вес, но бывает и по-другому.


А за это спасибо, думаю подойдет. Единственное неудобство - в моем случае придется для каждой ссылки отдельной строкой редирект прописывать, если редирект 301 организовывать через .htaccess. Надо еще почитать, как это делается непосредственно в заголовках конкретной страницы. Может этот метод будет более универсальным и гибким.

не знаю как поисковики, а пользователи уж точно в последнюю очередь обращают на ЧПУ
а касательно функции trans тоже спорный вопрос. я бы сделал дополнительное поле - имя страницы, которое было бы только на латинице и использовалось в качестве URL (по типу как в вордпрессе)


Изначально я так и хотел сделать. Но во-первых это более сложная реконструкция функционала (в моем случае), а во-вторых лишняя загрузка MySQL базы данных. А еще дополнительное поле подразумевает ручной ввод данных, а в моей функции trans() вся транслитерация подобрана таким образом, чтобы ссылка была максимально понятна и поисковикам и пользователям. А вручную там можно такого накуралесить.
  • 0

#6 isvetlichniy

isvetlichniy
  • Пользователь
  • 619 сообщений
  • Репутация: 93

Отправлено 25 Июнь 2013 - 18:27

загрузка MySQL базы данных

одним полем? а ты откуда вот это получаешь?
<?=$title?>
  • 0

#7 fedornabilkin

fedornabilkin
  • Пользователь
  • 696 сообщений
  • Репутация: 91

Отправлено 26 Июнь 2013 - 12:07

а докуда дочитал?

До нюансов дочитал, дальше не читал.
Я смотрю хорошо прокомментировал, тебя даже зацепило немного. Если често, то я именно такую реакцию и ожидал.

http://site.com/magaz/98/tovar/666/ или http://site.com/maga.../tovar/valinki/ ??? - И то, и другое – ЧПУ !!! И мой пример http://mysitehostname.ru/page/14/ - тоже ЧПУ.

Человекопанятный урл - это урл, который понятен человеку. Ни вебмастеру, ни сеошнику, а человеку. page/14 о чем говорит человеку? Ни о чем, следовательно он непонятен человеку. А magaz/tovar/valenki/ уже что-то проясняется.

И беспокоит меня не то, проиндексируются мои новые ссылки или нет. А то, как поисковики отнесутся к такой реконструкции.

А как поисковики могут относиться? Я думаю, что просматривая миллиарды ссылок нет особой необходимости вычленять вид(тип) ссылки. Куда более важно потратить ресурс на анкор и полученный контент.
Хотя... все может быть.
  • 0
Как часто в горестной разлуке,В моей блуждающей судьбе, ФО, я думал о тебе.


#8 webby

webby
    Topic Starter
  • Пользователь
  • 9 сообщений
  • Репутация: 0

Отправлено 26 Июнь 2013 - 20:29

одним полем? а ты откуда вот это получаешь?
<?=$title?>

да всё от туда же из базы конечно... но зачем мне в базе дублировать уже существующее поле? Ведь мы же не спроста создавая в базе в таблицах новые поля выбираем тип переменной и устанавливаем им размер. При этом для каждого поля как бы резервируется определенное место. То есть происходит определенного рода оптимизация структуры таблиц базы данных. Все это для того, чтобы сэкономить байты в размере базы. А наличие дублирующего поля - несколько нерационально. Пусть это мелочи, но если в таблице тысячи рядов (пока это не обо мне), то в итоге получим приличный лишний объем на ровном месте.

А как поисковики могут относиться? Я думаю, что просматривая миллиарды ссылок нет особой необходимости вычленять вид(тип) ссылки.


И снова мы говорим о разном. Дело не в новом виде ссылок, а в том, что новые ссылки будут вести пользователей и поисковых пауков на старые страницы. При этом старые страницы имеют какой-никакой вес, уникальный контент, а также, возможно, и обросли внешними ссылками на них. Всё это может пропасть в один миг и после такой оптимизации страницы могут упасть в рейтингах выдачи. Короче речь идет как раз о том что написано тут - http://sosnovskij.ru...s-dizaina-chpu/ Всё это очень стремно, вот я и создал тему - мож кто чиво толкового посоветует. Вот про редирект 301 узнал только тут, спасибо.
  • 0

robot

robot
  • Пользователь PRO
  • 2 652 сообщений
  • Репутация: 85


Оформление форума – IPBSkins.ru