Перейти к содержимому



Как узнать CMS (движок) сайта?

#1

Поделиться сообщением #1



andrey6357

andrey6357
  • Неактивные
  • 5 сообщений
  • Репутация: 1
0

Отправлено 24 Ноябрь 2012 - 17:55

Как узнать CMS (движок) сайта?

Введение.
Бывало ли у вас так, что зайдешь на какой-нибудь сайт, и думаешь: «и на каком движке все это функционирует?». Если да, то эта статья для Вас.
И так, начнем. Для начала определимся, что собственно такое CMS?
CMS (Content Management System) – система обеспечивающая процесс создания, редактирования и управления контентом. Попросту говоря, это система управления содержимым сайта.

Изображение

А для чего нам собственно нужно узнавать на каком движке работает сайт?
Во-первых: Для того чтобы узнать на каком движке создан понравившийся сайт, тем самым понять, а возможно ли реализовать что-то похожее?
Во-вторых: Расширить свои познания в сфере создания сайтов.

Итак, как же узнать CMS нужного вам сайта?
Приведенные ниже методы будут ранжироваться в зависимости от сложности и затраченного на них времени:
Первый метод – самый легкий и быстрый
Последний метод – соответсвенно самый тяжелый и долгий

Переходим собственно к методам определения движка сайта.

1. Оценка внешнего вида сайта.
Самый простой метод, достаточно почитать информацию, которая расположена внизу страницы. Чаще всего будет надписи типа: «Сайт разработан на Word Press», «Система для сообществ IP.Board» или «Работает на CMS DataLife Engine». Также можно распознать по типичному примению движка, т.е. WordPress – скорее блог. Bitrix – магазин, либо государственный сайт (Госдума например), IPB – форум. Не стоит также забывать, что на странице "О сайте" может быть, то, что нам нужно.

2. Просмотр исходного кода, другими слова html кода страницы.
Данный способ я рекомендую всем, кто не хочет «заморачиваться». Метод работает практически в 100% случаев.
Суть, заходить на нужный вам сайт, нажимать на любом понравившемся месте правой кнопкой мыши и выбираете пункт «Исходный код», далее Ctrl+F, и ищем по следующим запросам:
Для Word Press’ a:
<meta name=”generator” content=”Word Press 3.4.2.” />
<link rel=”stylesheet” href=”http://www.адрес.ru/wp-content>
На самом деле не обязательно вводить весь код целиком, достаточно использовать ключевые слова: “wordpress, wp-content”.

Для Data Life Engine:
<meta name=”generator” content=”DataLife Engine (http://адрес.ru)” />
Либо по папке: /DLEoffsite/
Опять таки достаточно просто ввести “dle” в запрос и все найдется само.

Joomla:
Папка http://адрес.ru/templates/

Для всех остальных движков типа: Bitrix, Maxsite, и других принцип тот же, просто вводите название движка (полное DataLife Engine, либо сокращенное DLE, тоже самое с Word Press – WP) и теперь вы знаете на каком движке сайт.


3. Бесплатные онлайн сервисы
Использование онлайн сервисов, один из легких путей определения движка сайта, все, что нужно это просто вписать адрес нужно сайта и ждать пока вам откроется тайна, того, на каком движке стоит сайт.
  • Заходите на сервис типа 2ip.ru, либо англоязычный BuiltWith.com. Кстати последний не только определяет CMS, но также предоставит вам множество различных данных по сайту.
  • Вводи адрес
  • Готово!
Большинство таких онлайн сервисов, содержат признаки использования 30-50, а то и более различных движков.

4. Анализируем файл robots.txt
Данный файл хоть и предназначен для роботов поисковых систем, но мы можем им воспользоваться для определения того, на каком движке стоит сайт. Чтобы получить доступ к данному файлу, достаточно в строке URL написать: http://адрес.ru/robots.txt
Например robots.txt для WordPress’a будет выглядеть так:
User-agent: *
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-content/
Disallow: /wp-admin/
Disallow: /wp-includes/


Или например Joomal’a:
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /editor/
Disallow: /images/

Или вот реальный пример определения движка, на сайте duma.gov.ru
User-agent: *
Disallow: /
# Disallow: /bitrix/
# Disallow: /search/
# Allow: /sitemap/
# Disallow: /auth/
# Disallow: /auth.php

Движок очевидно определяется по папке /bitrix/.

Конечно, не у всех сайтов один и тот же robots.txt, но это не мешает нам увидеть общую структуру файла, и по ней определить CMS.

5. Внешний вид URL сайта
Метод точный, но не всегда работает, т.к. большинство веб-мастеров настраивают ЧПУ, что мешает определить движок сайта, но, тем не менее, метод имеет место быть.
Например:
WordPress:
http://адрес.ru/?p=123
IPB:
http://www.masterweb...showtopic=12594
Joomla:
http://адрес.ru/content/view/11/33/
Drupal:
http://адрес.ru/node/1

6. Поиск входа в консоль админа (другими словами, в админку).
Данный метод заключается в том, чтобы методом перебора, найти нужный URL, который и даст нам подсказку о движке сайта.

WordPress:
http://адрес. ru/wp-admin
http://адрес. ru/wp-login.php

Joomla:
http://адрес.ru/administrator

MaxSite:
http://адрес. ru/admin

Danneo:
http://адрес.ru/apanel

Bitrix:
http://адрес.ru/bitrix/admin/

Другие движки в большинстве случаев используют /admin/
Возникает очевидный вопрос, ведь у нескольких движков может быть один и тот же вход в админку например: /admin/. Как же определить на каком именно движке работает сайт?
И вот ответ: дело в том, что в 99% случаев, войдя в на страницу ввода логина и пароля, вы увидите значок, определяющий принадлежность к той или иной CMS.

7. Плагины для браузеров.
Плагин – самая удобная вещь в браузере. Установив его один раз, вам больше не понадобится тратить время на просмотр robots.txt, html-кода, на использование различных анализаторов, не говоря уже и о просмотре cookies.

На данный момент существует плагин Wappalyzer, который имеет поддержу в Mozilla FireFox, Google Chrome, и для других браузеров используется букмарклет (это небольшая JavaScript-программа, используемая как браузерная закладка) в бета версии, правда.

Разберем на примере Mozilla FireFox:
  • Установить собственно сам браузер
  • Зайти на сайт https://addons.mozil...don/wappalyzer/
  • Нажать “+ Add to Firefox”, процесс установки занимает секунды 2, после этого идет перезапуск браузера, после которого плагин в полной мере будет функционировать.
Изображение
  • Переходим на сайт, на котором нужно определить CMS, и, не совершая никаких дополнительных действий, в URL строке, справа будет значок, указывающих на определенную CMS.
Изображение

Не забывайте обновлять плагин, ведь с каждым обновлением, процесс определения движка становится более точным.

8. Анализируем Cookies
Метод уже более сложный. Будем разбирать все на том же браузере (Mozilla FireFox)
Для примера возьмем http://www.1c-bitrix.ru/
  • Нам понадобится плагин на подобие HttpFox, хотя на самом деле подойдет любой плагин, читающий cookies.
  • Заходим в Tools -> Web Developer -> HttpFox - > Toggle HttpFox
Используя данный плагин нас интересует данная строка:

Изображение

X-Powered-CMS: Bitrix Site Manager (582fd04dac6869e159ea80524ec43d0d)

И эта:
Cookie …BITRIX_SM_GUEST_...
Вывод напрашивается сам собой, сайт функционирует на движке от битрикс.


Что делать, если узнать движок не получается?

Сокрытие названия движка сайта встречается редко, но имеет место быть. И тому есть ряд причин:
Во-первых, это повышает безопасность от хакеров, и во-вторых, когда какая-либо коммерческая компания заказывает себе сайт своей фирмы, то зачастую, разработчики не создают новую CMS под критерии заказчика, а лишь загружают в бесплатной доступе такие движки как: WordPress, Joomla, Drupal и другие.

Также хочется сказать, что есть ряд сайтов, чаще всего государственных, которые пытаются скрыть движок сайта, тем самым усложняя процесс взлома сайта, но как говорится: “Всё тайное становится явным”.

И на примере государственного сайта РФ, я вам это покажу.

Пациент: http://www.duma.gov.ru/

1. Оценим внешний вид. Казалось бы ничего нету, и в правда на самом сайте ничего, но есть название компании которая сделала сайт: Интаро Софт, гуглим, заходим на их сайт, и видим, что «Наши решения: 1C-Битрикс» вывод образуется сам собой.

2. Смотрим исходный код страницы, по основным запросам типа: “wp-content, wordpress, templates, dle, bitrix, datalife” ничего нету, поехали дальше.

3. Онлайн анализ также ничего не нашел.

4. Смотрим файл robots.txt и тут начинается самое интересное:
# Disallow: /bitrix/ и /*bitrix_*=

5. Внешний вид URL ссылки нам ни о чем не говорит.

6. Ищем вход в админку: интересная картина наблюдается после ввода /bitrix/admin/ идет надпись: Идет процесс обновления данных, хотя никакие данные на самом деле не обновляются, что как бы намекает.

7. Плагин Wappalyzer ничего не показал.

8. Анализ cookies также ничего не показал.

Диагноз: CMS сайта пытались тщательно скрыть, но файл robots.txt нам рассказал всю тайну о движке сайта. Bitrix – движок данного сайта.
Хотя конечно, стоит отметь, что большинство сайтов так не защищены, и процесс определения CMS занимает обычно меньше минуты.


Подводя итог все выше сказанного, хотелось бы сказать, что вне зависимости от того, какой движок вы используете, самое главное это наполнять сайт интересным и нужным материалом.

А какой метод определения CMS сайта используете Вы?

Оставляйте свои комментарии. Всем удачи и до новых встреч! ;)



При поддержке: SeoPult - система автоматизированного продвижения сайтов и управления контекстной рекламой. Обсудить на форуме.

Изображение

 

 

  • 0

robot

robot
  • Пользователь PRO
  • 2 652 сообщений
  • Репутация: 85
Советую обратить внимание на следующее:
  1. Какая система управления сайтов лучше?
  2. Какая это CMS (движок)?
  3. Что лучше: CMS или создание вручную?
  4. ТОП CMS по мнению обитателей www.masterwebs.ru
  5. Помогите узнать cms сайта.

#2

Поделиться сообщением #2



Mr.Developer

Mr.Developer
  • Неактивные
  • 73 сообщений
  • Репутация: 12

Отправлено 24 Ноябрь 2012 - 19:59

Хорошая тема, интересная статья.
Не против если оставлю пару дополнений?

Админка битрикса
http://site.ru/bitrix

Стандартные пути в Drupal
http://site.ru/node/1
  • 0

#3

Поделиться сообщением #3



andrey6357

andrey6357
    Topic Starter
  • Неактивные
  • 5 сообщений
  • Репутация: 1

Отправлено 25 Ноябрь 2012 - 11:11

Спасибо за дополнение.

По поводу Drupal'a добавил.
А вот у битрикса более правильный путь будет /bitrix/admin/, т.к. видел пару сайтов, у которых при запросе /bitrix/ идет либо 404 ошибка, либо информация о сайте/разработчике.
  • 0

#4

Поделиться сообщением #4



Mr.Developer

Mr.Developer
  • Неактивные
  • 73 сообщений
  • Репутация: 12

Отправлено 25 Ноябрь 2012 - 12:35

Да, вы правы по дефолту там редирект на /bitrix/admin идет )
  • 0

#5

Поделиться сообщением #5



r0mZet

r0mZet
  • Модератор
  • 1 114 сообщений
  • Репутация: 167

Отправлено 25 Октябрь 2013 - 14:53

Существуют онлайн сервисы по определению cms сайта, типо как 2ip.ru/cms/
  • 0

Копирую любой Landing Page. Сходство 100%, рабочие JS и РНР-формы. 




Оформление форума – IPBSkins.ru