X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Как узнать CMS (движок) сайта?
andrey6357
andrey6357
Topic Starter сообщение 24.11.2012, 18:55; Ответить: andrey6357
Сообщение #1


Как узнать CMS (движок) сайта?

Введение.
Бывало ли у вас так, что зайдешь на какой-нибудь сайт, и думаешь: «и на каком движке все это функционирует?». Если да, то эта статья для Вас.
И так, начнем. Для начала определимся, что собственно такое CMS?
CMS (Content Management System) – система обеспечивающая процесс создания, редактирования и управления контентом. Попросту говоря, это система управления содержимым сайта.

[img]http://s017.radikal.ru/i409/1211/52/b124e0215b2a.png[/img]

А для чего нам собственно нужно узнавать на каком движке работает сайт?
Во-первых: Для того чтобы узнать на каком движке создан понравившийся сайт, тем самым понять, а возможно ли реализовать что-то похожее?
Во-вторых: Расширить свои познания в сфере создания сайтов.

Итак, как же узнать CMS нужного вам сайта?
Приведенные ниже методы будут ранжироваться в зависимости от сложности и затраченного на них времени:
Первый метод – самый легкий и быстрый
Последний метод – соответсвенно самый тяжелый и долгий

Переходим собственно к методам определения движка сайта.

1. Оценка внешнего вида сайта.
Самый простой метод, достаточно почитать информацию, которая расположена внизу страницы. Чаще всего будет надписи типа: «Сайт разработан на Word Press», «Система для сообществ IP.Board» или «Работает на CMS DataLife Engine». Также можно распознать по типичному примению движка, т.е. WordPress – скорее блог. Bitrix – магазин, либо государственный сайт (Госдума например), IPB – форум. Не стоит также забывать, что на странице "О сайте" может быть, то, что нам нужно.

2. Просмотр исходного кода, другими слова html кода страницы.
Данный способ я рекомендую всем, кто не хочет «заморачиваться». Метод работает практически в 100% случаев.
Суть, заходить на нужный вам сайт, нажимать на любом понравившемся месте правой кнопкой мыши и выбираете пункт «Исходный код», далее Ctrl+F, и ищем по следующим запросам:
Для Word Press’ a:
<meta name=”generator” content=”Word Press 3.4.2.” />
<link rel=”stylesheet” href=”http://www.адрес.ru/wp-content>
На самом деле не обязательно вводить весь код целиком, достаточно использовать ключевые слова: “wordpress, wp-content”.

Для Data Life Engine:
<meta name=”generator” content=”DataLife Engine (http://адрес.ru)” />
Либо по папке: /DLEoffsite/
Опять таки достаточно просто ввести “dle” в запрос и все найдется само.

Joomla:
Папка http://адрес.ru/templates/

Для всех остальных движков типа: Bitrix, Maxsite, и других принцип тот же, просто вводите название движка (полное DataLife Engine, либо сокращенное DLE, тоже самое с Word Press – WP) и теперь вы знаете на каком движке сайт.


3. Бесплатные онлайн сервисы
Использование онлайн сервисов, один из легких путей определения движка сайта, все, что нужно это просто вписать адрес нужно сайта и ждать пока вам откроется тайна, того, на каком движке стоит сайт.
  • Заходите на сервис типа 2ip.ru, либо англоязычный BuiltWith.com. Кстати последний не только определяет CMS, но также предоставит вам множество различных данных по сайту.
  • Вводи адрес
  • Готово!

Большинство таких онлайн сервисов, содержат признаки использования 30-50, а то и более различных движков.

4. Анализируем файл robots.txt
Данный файл хоть и предназначен для роботов поисковых систем, но мы можем им воспользоваться для определения того, на каком движке стоит сайт. Чтобы получить доступ к данному файлу, достаточно в строке URL написать: http://адрес.ru/robots.txt
Например robots.txt для WordPress’a будет выглядеть так:
User-agent: *
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-content/
Disallow: /wp-admin/
Disallow: /wp-includes/


Или например Joomal’a:
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /editor/
Disallow: /images/

Или вот реальный пример определения движка, на сайте duma.gov.ru
User-agent: *
Disallow: /
# Disallow: /bitrix/
# Disallow: /search/
# Allow: /sitemap/
# Disallow: /auth/
# Disallow: /auth.php

Движок очевидно определяется по папке /bitrix/.

Конечно, не у всех сайтов один и тот же robots.txt, но это не мешает нам увидеть общую структуру файла, и по ней определить CMS.

5. Внешний вид URL сайта
Метод точный, но не всегда работает, т.к. большинство веб-мастеров настраивают ЧПУ, что мешает определить движок сайта, но, тем не менее, метод имеет место быть.
Например:
WordPress:
http://адрес.ru/?p=123
IPB:
http://www.masterweb...showtopic=12594
Joomla:
http://адрес.ru/content/view/11/33/
Drupal:
http://адрес.ru/node/1

6. Поиск входа в консоль админа (другими словами, в админку).
Данный метод заключается в том, чтобы методом перебора, найти нужный URL, который и даст нам подсказку о движке сайта.

WordPress:
http://адрес. ru/wp-admin
http://адрес. ru/wp-login.php

Joomla:
http://адрес.ru/administrator

MaxSite:
http://адрес. ru/admin

Danneo:
http://адрес.ru/apanel

Bitrix:
http://адрес.ru/bitrix/admin/

Другие движки в большинстве случаев используют /admin/
Возникает очевидный вопрос, ведь у нескольких движков может быть один и тот же вход в админку например: /admin/. Как же определить на каком именно движке работает сайт?
И вот ответ: дело в том, что в 99% случаев, войдя в на страницу ввода логина и пароля, вы увидите значок, определяющий принадлежность к той или иной CMS.

7. Плагины для браузеров.
Плагин – самая удобная вещь в браузере. Установив его один раз, вам больше не понадобится тратить время на просмотр robots.txt, html-кода, на использование различных анализаторов, не говоря уже и о просмотре cookies.

На данный момент существует плагин Wappalyzer, который имеет поддержу в Mozilla FireFox, Google Chrome, и для других браузеров используется букмарклет (это небольшая JavaScript-программа, используемая как браузерная закладка) в бета версии, правда.

Разберем на примере Mozilla FireFox:
  • Установить собственно сам браузер
  • Зайти на сайт https://addons.mozil...don/wappalyzer/
  • Нажать “+ Add to Firefox”, процесс установки занимает секунды 2, после этого идет перезапуск браузера, после которого плагин в полной мере будет функционировать.

[img]http://s019.radikal.ru/i601/1211/7e/f2577ffcfb58.jpg[/img]
  • Переходим на сайт, на котором нужно определить CMS, и, не совершая никаких дополнительных действий, в URL строке, справа будет значок, указывающих на определенную CMS.

[img]http://s019.radikal.ru/i635/1211/12/90d6d1f8868b.jpg[/img]

Не забывайте обновлять плагин, ведь с каждым обновлением, процесс определения движка становится более точным.

8. Анализируем Cookies
Метод уже более сложный. Будем разбирать все на том же браузере (Mozilla FireFox)
Для примера возьмем http://www.1c-bitrix.ru/
  • Нам понадобится плагин на подобие HttpFox, хотя на самом деле подойдет любой плагин, читающий cookies.
  • Заходим в Tools -> Web Developer -> HttpFox - > Toggle HttpFox

Используя данный плагин нас интересует данная строка:

[img]http://s017.radikal.ru/i421/1211/29/07c0a546e2c5.jpg[/img]

X-Powered-CMS: Bitrix Site Manager (582fd04dac6869e159ea80524ec43d0d)

И эта:
Cookie …BITRIX_SM_GUEST_...
Вывод напрашивается сам собой, сайт функционирует на движке от битрикс.


Что делать, если узнать движок не получается?

Сокрытие названия движка сайта встречается редко, но имеет место быть. И тому есть ряд причин:
Во-первых, это повышает безопасность от хакеров, и во-вторых, когда какая-либо коммерческая компания заказывает себе сайт своей фирмы, то зачастую, разработчики не создают новую CMS под критерии заказчика, а лишь загружают в бесплатной доступе такие движки как: WordPress, Joomla, Drupal и другие.

Также хочется сказать, что есть ряд сайтов, чаще всего государственных, которые пытаются скрыть движок сайта, тем самым усложняя процесс взлома сайта, но как говорится: “Всё тайное становится явным”.

И на примере государственного сайта РФ, я вам это покажу.

Пациент: http://www.duma.gov.ru/

1. Оценим внешний вид. Казалось бы ничего нету, и в правда на самом сайте ничего, но есть название компании которая сделала сайт: Интаро Софт, гуглим, заходим на их сайт, и видим, что «Наши решения: 1C-Битрикс» вывод образуется сам собой.

2. Смотрим исходный код страницы, по основным запросам типа: “wp-content, wordpress, templates, dle, bitrix, datalife” ничего нету, поехали дальше.

3. Онлайн анализ также ничего не нашел.

4. Смотрим файл robots.txt и тут начинается самое интересное:
# Disallow: /bitrix/ и /*bitrix_*=

5. Внешний вид URL ссылки нам ни о чем не говорит.

6. Ищем вход в админку: интересная картина наблюдается после ввода /bitrix/admin/ идет надпись: Идет процесс обновления данных, хотя никакие данные на самом деле не обновляются, что как бы намекает.

7. Плагин Wappalyzer ничего не показал.

8. Анализ cookies также ничего не показал.

Диагноз: CMS сайта пытались тщательно скрыть, но файл robots.txt нам рассказал всю тайну о движке сайта. Bitrix – движок данного сайта.
Хотя конечно, стоит отметь, что большинство сайтов так не защищены, и процесс определения CMS занимает обычно меньше минуты.


Подводя итог все выше сказанного, хотелось бы сказать, что вне зависимости от того, какой движок вы используете, самое главное это наполнять сайт интересным и нужным материалом.

А какой метод определения CMS сайта используете Вы?

Оставляйте свои комментарии. Всем удачи и до новых встреч! ;)



При поддержке: SeoPult - система автоматизированного продвижения сайтов и управления контекстной рекламой. Обсудить на форуме.

[img]http://www.masterwebs.ru/sp/seopult.gif[/img]
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Mr.Developer
Mr.Developer
сообщение 24.11.2012, 20:59; Ответить: Mr.Developer
Сообщение #2


Хорошая тема, интересная статья.
Не против если оставлю пару дополнений?

Админка битрикса
http://site.ru/bitrix

Стандартные пути в Drupal
http://site.ru/node/1
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
andrey6357
andrey6357
Topic Starter сообщение 25.11.2012, 12:11; Ответить: andrey6357
Сообщение #3


Спасибо за дополнение.

По поводу Drupal'a добавил.
А вот у битрикса более правильный путь будет /bitrix/admin/, т.к. видел пару сайтов, у которых при запросе /bitrix/ идет либо 404 ошибка, либо информация о сайте/разработчике.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Mr.Developer
Mr.Developer
сообщение 25.11.2012, 13:35; Ответить: Mr.Developer
Сообщение #4


Да, вы правы по дефолту там редирект на /bitrix/admin идет )
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
r0mZet
r0mZet
сообщение 25.10.2013, 15:53; Ответить: r0mZet
Сообщение #5


Существуют онлайн сервисы по определению cms сайта, типо как 2ip.ru/cms/

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыБыстрая индексация страниц сайта и обратных ссылок - 2Index
32 2Index 5481 Вчера, 16:33
автор: 2Index
Открытая тема (нет новых ответов) Как вы бросили работу и перешли на заработок с сайтов?
7 uahomka 1567 17.3.2024, 14:54
автор: uahomka
Открытая тема (нет новых ответов) Арбитражники, как ведете учет расходов и доходов?
10 Boymaster 1468 17.3.2024, 3:22
автор: malamut
Открытая тема (нет новых ответов) Как отозвать банковский платеж фрилансеру?
26 metvekot 3655 15.3.2024, 10:42
автор: Skyworker
Горячая тема (нет новых ответов) Как вы отдыхаете от работы за компом
140 adw-kupon.ru 18368 12.3.2024, 23:28
автор: Lumex


 



RSS Текстовая версия Сейчас: 19.3.2024, 6:48
Дизайн