Как узнать CMS (движок) сайта?Введение.
Бывало ли у вас так, что зайдешь на какой-нибудь сайт, и думаешь: «и на каком движке все это функционирует?». Если да, то эта статья для Вас.
И так, начнем. Для начала определимся, что собственно такое CMS?
CMS (Content Management System) – система обеспечивающая процесс создания, редактирования и управления контентом. Попросту говоря, это система управления содержимым сайта.
[img]http://s017.radikal.ru/i409/1211/52/b124e0215b2a.png[/img]А для чего нам собственно нужно узнавать на каком движке работает сайт?
Во-первых: Для того чтобы узнать на каком движке создан понравившийся сайт, тем самым понять, а возможно ли реализовать что-то похожее?
Во-вторых: Расширить свои познания в сфере создания сайтов.
Итак, как же узнать CMS нужного вам сайта?
Приведенные ниже методы будут ранжироваться в зависимости от сложности и затраченного на них времени:
Первый метод – самый легкий и быстрый
Последний метод – соответсвенно самый тяжелый и долгий
Переходим собственно к методам определения движка сайта.
1. Оценка внешнего вида сайта.Самый простой метод, достаточно почитать информацию, которая расположена внизу страницы. Чаще всего будет надписи типа: «Сайт разработан на Word Press», «Система для сообществ IP.Board» или «Работает на CMS DataLife Engine». Также можно распознать по типичному примению движка, т.е. WordPress – скорее блог. Bitrix – магазин, либо государственный сайт (Госдума например), IPB – форум. Не стоит также забывать, что на странице "О сайте" может быть, то, что нам нужно.
2. Просмотр исходного кода, другими слова html кода страницы.Данный способ я рекомендую всем, кто не хочет «заморачиваться». Метод работает практически в 100% случаев.
Суть, заходить на нужный вам сайт, нажимать на любом понравившемся месте правой кнопкой мыши и выбираете пункт «Исходный код», далее Ctrl+F, и ищем по следующим запросам:
Для
Word Press’ a:
<meta name=”generator” content=”
Word Press 3.4.2.” />
<link rel=”stylesheet” href=”http://www.адрес.ru/
wp-content>На самом деле не обязательно вводить весь код целиком, достаточно использовать ключевые слова: “wordpress, wp-content”.
Для
Data Life Engine:
<meta name=”generator” content=”DataLife Engine (
http://адрес.ru)” />
Либо по папке: /DLEoffsite/
Опять таки достаточно просто ввести “dle” в запрос и все найдется само.
Joomla:
Папка
http://адрес.ru/templates/Для всех остальных движков типа: Bitrix, Maxsite, и других принцип тот же, просто вводите название движка (полное DataLife Engine, либо сокращенное DLE, тоже самое с Word Press – WP) и теперь вы знаете на каком движке сайт.
3. Бесплатные онлайн сервисыИспользование онлайн сервисов, один из легких путей определения движка сайта, все, что нужно это просто вписать адрес нужно сайта и ждать пока вам откроется тайна, того, на каком движке стоит сайт.
- Заходите на сервис типа 2ip.ru, либо англоязычный BuiltWith.com. Кстати последний не только определяет CMS, но также предоставит вам множество различных данных по сайту.
- Вводи адрес
- Готово!
Большинство таких онлайн сервисов, содержат признаки использования 30-50, а то и более различных движков.
4. Анализируем файл robots.txtДанный файл хоть и предназначен для роботов поисковых систем, но мы можем им воспользоваться для определения того, на каком движке стоит сайт. Чтобы получить доступ к данному файлу, достаточно в строке URL написать:
http://адрес.ru/robots.txtНапример robots.txt для WordPress’a будет выглядеть так:
User-agent: *
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-content/
Disallow: /wp-admin/
Disallow: /wp-includes/
…
Или например Joomal’a:
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /editor/
Disallow: /images/
…
Или вот реальный пример определения движка, на сайте duma.gov.ru
User-agent: *
Disallow: /
# Disallow: /bitrix/
# Disallow: /search/
# Allow: /sitemap/
# Disallow: /auth/
# Disallow: /auth.php
Движок очевидно определяется по папке /bitrix/.
Конечно, не у всех сайтов один и тот же robots.txt, но это не мешает нам увидеть общую структуру файла, и по ней определить CMS.
5. Внешний вид URL сайтаМетод точный, но не всегда работает, т.к. большинство веб-мастеров настраивают ЧПУ, что мешает определить движок сайта, но, тем не менее, метод имеет место быть.
Например:
WordPress:
http://адрес.ru/?p=123IPB:
http://www.masterweb...showtopic=12594Joomla:
http://адрес.ru/content/view/11/33/Drupal:
http://адрес.ru/node/1 6. Поиск входа в консоль админа (другими словами, в админку).Данный метод заключается в том, чтобы методом перебора, найти нужный URL, который и даст нам подсказку о движке сайта.
WordPress:
http://адрес. ru/wp-admin
http://адрес. ru/wp-login.php
Joomla:
http://адрес.ru/administratorMaxSite:
http://адрес. ru/admin
Danneo:
http://адрес.ru/apanelBitrix:
http://адрес.ru/bitrix/admin/Другие движки в большинстве случаев используют /admin/
Возникает очевидный вопрос, ведь у нескольких движков может быть один и тот же вход в админку например: /admin/. Как же определить на каком именно движке работает сайт?
И вот ответ: дело в том, что в 99% случаев, войдя в на страницу ввода логина и пароля, вы увидите значок, определяющий принадлежность к той или иной CMS.
7. Плагины для браузеров.Плагин – самая удобная вещь в браузере. Установив его один раз, вам больше не понадобится тратить время на просмотр robots.txt, html-кода, на использование различных анализаторов, не говоря уже и о просмотре cookies.
На данный момент существует плагин Wappalyzer, который имеет поддержу в Mozilla FireFox, Google Chrome, и для других браузеров используется букмарклет (это небольшая JavaScript-программа, используемая как браузерная закладка) в бета версии, правда.
Разберем на примере Mozilla FireFox:
- Установить собственно сам браузер
- Зайти на сайт https://addons.mozil...don/wappalyzer/
- Нажать “+ Add to Firefox”, процесс установки занимает секунды 2, после этого идет перезапуск браузера, после которого плагин в полной мере будет функционировать.
[img]http://s019.radikal.ru/i601/1211/7e/f2577ffcfb58.jpg[/img]- Переходим на сайт, на котором нужно определить CMS, и, не совершая никаких дополнительных действий, в URL строке, справа будет значок, указывающих на определенную CMS.
[img]http://s019.radikal.ru/i635/1211/12/90d6d1f8868b.jpg[/img]Не забывайте обновлять плагин, ведь с каждым обновлением, процесс определения движка становится более точным.
8. Анализируем CookiesМетод уже более сложный. Будем разбирать все на том же браузере (Mozilla FireFox)
Для примера возьмем
http://www.1c-bitrix.ru/- Нам понадобится плагин на подобие HttpFox, хотя на самом деле подойдет любой плагин, читающий cookies.
- Заходим в Tools -> Web Developer -> HttpFox - > Toggle HttpFox
Используя данный плагин нас интересует данная строка:
[img]http://s017.radikal.ru/i421/1211/29/07c0a546e2c5.jpg[/img]X-Powered-CMS: Bitrix Site Manager (582fd04dac6869e159ea80524ec43d0d)
И эта:
Cookie …BITRIX_SM_GUEST_...
Вывод напрашивается сам собой, сайт функционирует на движке от битрикс.
Что делать, если узнать движок не получается?Сокрытие названия движка сайта встречается редко, но имеет место быть. И тому есть ряд причин:
Во-первых, это повышает безопасность от хакеров, и во-вторых, когда какая-либо коммерческая компания заказывает себе сайт своей фирмы, то зачастую, разработчики не создают новую CMS под критерии заказчика, а лишь загружают в бесплатной доступе такие движки как: WordPress, Joomla, Drupal и другие.
Также хочется сказать, что есть ряд сайтов, чаще всего государственных, которые пытаются скрыть движок сайта, тем самым усложняя процесс взлома сайта, но как говорится: “Всё тайное становится явным”.
И на примере государственного сайта РФ, я вам это покажу.
Пациент:
http://www.duma.gov.ru/1. Оценим внешний вид. Казалось бы ничего нету, и в правда на самом сайте ничего, но есть название компании которая сделала сайт: Интаро Софт, гуглим, заходим на их сайт, и видим, что «Наши решения: 1C-Битрикс» вывод образуется сам собой.
2. Смотрим исходный код страницы, по основным запросам типа: “wp-content, wordpress, templates, dle, bitrix, datalife” ничего нету, поехали дальше.
3. Онлайн анализ также ничего не нашел.
4. Смотрим файл robots.txt и тут начинается самое интересное:
# Disallow: /bitrix/ и /*bitrix_*=
5. Внешний вид URL ссылки нам ни о чем не говорит.
6. Ищем вход в админку: интересная картина наблюдается после ввода /bitrix/admin/ идет надпись: Идет процесс обновления данных, хотя никакие данные на самом деле не обновляются, что как бы намекает.
7. Плагин Wappalyzer ничего не показал.
8. Анализ cookies также ничего не показал.
Диагноз: CMS сайта пытались тщательно скрыть, но файл robots.txt нам рассказал всю тайну о движке сайта. Bitrix – движок данного сайта.
Хотя конечно, стоит отметь, что большинство сайтов так не защищены, и процесс определения CMS занимает обычно меньше минуты.
Подводя итог все выше сказанного, хотелось бы сказать, что вне зависимости от того, какой движок вы используете, самое главное это наполнять сайт интересным и нужным материалом.
А какой метод определения CMS сайта используете Вы?
Оставляйте свои комментарии. Всем удачи и до новых встреч!
При поддержке:
SeoPult - система автоматизированного продвижения сайтов и управления контекстной рекламой.
Обсудить на форуме.
[img]http://www.masterwebs.ru/sp/seopult.gif[/img]