Перейти к содержимому


Пользователь месяца
OlgaGetman OlgaGetman 1-й за Декабрь
Очков активности: 2100 10 тем, 170 сообщений, 7 баллов репутации
ТОП самых активных за этот месяц
  • Фотография Ixman
    #1

    Ixman (o5cat.ru)
    Очков активности: 195 Вне конкурса за определение пользователя месяца

  • Фотография Андрей WPMasterKZ
    #2

    Андрей WPMasterKZ (wpmaster.kz)
    Очков активности: 153 Вне конкурса за определение пользователя месяца

  • Фотография BLIK
    #3

    BLIK
    Очков активности: 126 0 тем, 21 сообщение, 4 балла репутации

  • Фотография OlgaGetman
    #4

    OlgaGetman
    Очков активности: 88.5 Вне конкурса за определение пользователя месяца

  • Фотография Cheaplinks
    #5

    Cheaplinks
    Очков активности: 54 0 тем, 18 сообщений, 2 балла репутации

  • Фотография Mandarin
    #6

    Mandarin
    Очков активности: 52.5 0 тем, 35 сообщений, 1 балл репутации

  • Фотография TimurR
    #7

    TimurR
    Очков активности: 49.5 Вне конкурса за определение пользователя месяца

  • Фотография Ilya74
    #8

    Ilya74
    Очков активности: 48 0 тем, 16 сообщений, 2 балла репутации

  • Фотография Constantine
    #9

    Constantine
    Очков активности: 48 5 тем, 17 сообщений, 1 балл репутации

  • Фотография magnet
    #10

    magnet (rbfxdirect.com)
    Очков активности: 30 0 тем, 10 сообщений, 2 балла репутации

  • Показать весь ТОП 10
Поддержите форум! =)
Апдейты
  • Яндекс ИКС: 25.12.2018
  • Яндекс выдача: 20.01.2019
Топ 5 участников по репутации


Как собрать базу блогов для комментирования

#1 rserg2017

rserg2017
  • Неактивные
  • 4 сообщений
  • Репутация: 0
0

Отправлено 17 July 2017 - 12:31

Добрый день!
Подскажите новичку, каким образом собирается база блогов для комментирования? 
Неоднократно видел блоги, в которых появляется масса комментариев, хотелось бы знать механизм сбора списка таких блогов 

 

 

Сообщение отредактировал Sosnovskij: 31 July 2017 - 13:19
убрал форматирование

  • 0

#2 BLIK

BLIK
  • Супермодератор
  • 4217 сообщений
  • Репутация: 963

Отправлено 17 July 2017 - 12:36

@rserg2017,Парсером собираются url по признакам и ключевым словам и потом комментируются. 


  • 0


#3 rserg2017

rserg2017
    Topic Starter
  • Неактивные
  • 4 сообщений
  • Репутация: 0

Отправлено 17 July 2017 - 12:39

@BLIK,Вот именно этот вопрос и интересует. какой запрос подсунуть парсеру, чтобы например получить базу блогов на wordpress. Или где поподробнее почитать об этом?


Сообщение отредактировал rserg2017: 17 July 2017 - 12:43

  • 0

#4 BLIK

BLIK
  • Супермодератор
  • 4217 сообщений
  • Репутация: 963

Отправлено 17 July 2017 - 12:48

@rserg2017,Тематически запросы(ключи), потом собрать все url что есть по запросам, потом делать выборку и оставлять только нужные движки. 

 

Как чистить базы в выдачи куча вариантов с информацией, в любом случае парсить придется все что есть, а потом чистить и удалять из базы ненужное. 


  • 0


#5 rserg2017

rserg2017
    Topic Starter
  • Неактивные
  • 4 сообщений
  • Репутация: 0

Отправлено 17 July 2017 - 12:54

@BLIK,Я видимо не совсем правильно выразился. Хотелось бы сначала напарсить большое кол-во блогов на wordpress, а потом уже оттуда делать выборку. 

Например блоги на blogspot можно поискать при помощи запроса inurl:».blogspot.com/2017/» «Post a Comment»

А вот для Wordpressa аналогичный бы запрос...


  • 0

#6 BLIK

BLIK
  • Супермодератор
  • 4217 сообщений
  • Репутация: 963

Отправлено 17 July 2017 - 12:59

@rserg2017,Значит ищите парсер с настройками фильтров cms при парсинге и собирайте базу.

 

Только смысла в этом не вижу, я бы спарсил все что есть и потом просто отфильтровал бы по признакам. 

Можете к этому присмотреться http://www.masterweb...-dmoz-whois-et/


Сообщение отредактировал BLIK: 17 July 2017 - 13:00

  • 0


#7 rserg2017

rserg2017
    Topic Starter
  • Неактивные
  • 4 сообщений
  • Репутация: 0

Отправлено 17 July 2017 - 13:07

@BLIK,Спасибо, гляну.


  • 0

#8 tuvaeff

tuvaeff
  • Заблокированные
  • 21 сообщений
  • Репутация: 1

Отправлено 02 August 2017 - 18:47

Вот именно этот вопрос и интересует. какой запрос подсунуть парсеру, чтобы например получить базу блогов на wordpress. Или где поподробнее почитать об этом?

 

wordpress часто ищут по форме добавления комментария.

 

 Для google

 

intext:'Сайт' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Сайт' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Сайт' intext:'Почта (обязательно)' site:.ru
intext:'Сайт' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Сайт' intext:'E-Mail (не публикуется)' site:.ru
intext:'Сайт' intext:'Почта (скрыта) *' site:.ru
intext:'Сайт' intext:'Email (required)' site:.ru
intext:'Сайт' intext:'E-mail' site:.ru
intext:'Сайт' intext:'E-mail/HTTP' site:.ru
intext:'Сайт' intext:'Mail (will not be published) (required)' site:.ru
intext:'Сайт' intext:'Mail (will not be published) ' site:.ru
intext:'Сайт' intext:'Email (required) - will not be published' site:.ru
intext:'Сайт' intext:'Email (will not be published) (required)' site:.ru
intext:'Сайт' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Сайт' intext:'Email Address(required)' site:.ru
intext:'Сайт' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Сайт' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Сайт' intext:'E-mail: (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'Почта (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-Mail (не публикуется)' site:.ru
intext:'Сайт (не обязательно)' intext:'Почта (скрыта) *' site:.ru
intext:'Сайт (не обязательно)' intext:'Email (required)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-mail' site:.ru
intext:'Сайт (не обязательно)' intext:'E-mail/HTTP' site:.ru
intext:'Сайт (не обязательно)' intext:'Mail (will not be published) (required)' site:.ru
intext:'Сайт (не обязательно)' intext:'Mail (will not be published) ' site:.ru
intext:'Сайт (не обязательно)' intext:'Email (required) - will not be published' site:.ru
intext:'Сайт (не обязательно)' intext:'Email (will not be published) (required)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Сайт (не обязательно)' intext:'Email Address(required)' site:.ru
intext:'Сайт (не обязательно)' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-mail: (обязательно)' site:.ru
intext:'Web-сайт' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Web-сайт' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Web-сайт' intext:'Почта (обязательно)' site:.ru
intext:'Web-сайт' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Web-сайт' intext:'E-Mail (не публикуется)' site:.ru
intext:'Web-сайт' intext:'Почта (скрыта) *' site:.ru
intext:'Web-сайт' intext:'Email (required)' site:.ru
intext:'Web-сайт' intext:'E-mail' site:.ru
intext:'Web-сайт' intext:'E-mail/HTTP' site:.ru
intext:'Web-сайт' intext:'Mail (will not be published) (required)' site:.ru
intext:'Web-сайт' intext:'Mail (will not be published) ' site:.ru
intext:'Web-сайт' intext:'Email (required) - will not be published' site:.ru
intext:'Web-сайт' intext:'Email (will not be published) (required)' site:.ru
intext:'Web-сайт' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Web-сайт' intext:'Email Address(required)' site:.ru
intext:'Web-сайт' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Web-сайт' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Web-сайт' intext:'E-mail: (обязательно)' site:.ru
intext:'Website' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Website' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Website' intext:'Почта (обязательно)' site:.ru
intext:'Website' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Website' intext:'E-Mail (не публикуется)' site:.ru
intext:'Website' intext:'Почта (скрыта) *' site:.ru
intext:'Website' intext:'Email (required)' site:.ru
intext:'Website' intext:'E-mail' site:.ru
intext:'Website' intext:'E-mail/HTTP' site:.ru
intext:'Website' intext:'Mail (will not be published) (required)' site:.ru
intext:'Website' intext:'Mail (will not be published) ' site:.ru
intext:'Website' intext:'Email (required) - will not be published' site:.ru
intext:'Website' intext:'Email (will not be published) (required)' site:.ru
intext:'Website' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Website' intext:'Email Address(required)' site:.ru
intext:'Website' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Website' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Website' intext:'E-mail: (обязательно)' site:.ru
intext:'Веб-сайт' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Веб-сайт' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Веб-сайт' intext:'Почта (обязательно)' site:.ru
intext:'Веб-сайт' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Веб-сайт' intext:'E-Mail (не публикуется)' site:.ru
intext:'Веб-сайт' intext:'Почта (скрыта) *' site:.ru
intext:'Веб-сайт' intext:'Email (required)' site:.ru
intext:'Веб-сайт' intext:'E-mail' site:.ru
intext:'Веб-сайт' intext:'E-mail/HTTP' site:.ru
intext:'Веб-сайт' intext:'Mail (will not be published) (required)' site:.ru
intext:'Веб-сайт' intext:'Mail (will not be published) ' site:.ru
intext:'Веб-сайт' intext:'Email (required) - will not be published' site:.ru
intext:'Веб-сайт' intext:'Email (will not be published) (required)' site:.ru
intext:'Веб-сайт' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Веб-сайт' intext:'Email Address(required)' site:.ru
intext:'Веб-сайт' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Веб-сайт' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Веб-сайт' intext:'E-mail: (обязательно)' site:.ru
intext:'Website (optional)' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Website (optional)' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Website (optional)' intext:'Почта (обязательно)' site:.ru
intext:'Website (optional)' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Website (optional)' intext:'E-Mail (не публикуется)' site:.ru
intext:'Website (optional)' intext:'Почта (скрыта) *' site:.ru
intext:'Website (optional)' intext:'Email (required)' site:.ru
intext:'Website (optional)' intext:'E-mail' site:.ru
intext:'Website (optional)' intext:'E-mail/HTTP' site:.ru
intext:'Website (optional)' intext:'Mail (will not be published) (required)' site:.ru
intext:'Website (optional)' intext:'Mail (will not be published) ' site:.ru
intext:'Website (optional)' intext:'Email (required) - will not be published' site:.ru
intext:'Website (optional)' intext:'Email (will not be published) (required)' site:.ru
intext:'Website (optional)' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Website (optional)' intext:'Email Address(required)' site:.ru
intext:'Website (optional)' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Website (optional)' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Website (optional)' intext:'E-mail: (обязательно)' site:.ru

  • 0

robot

robot
  • Пользователь PRO
  • 2652 сообщений
  • Репутация: 85


Похожие темы

  Название темы Автор Статистика Последнее сообщение

Оформление форума – IPBSkins.ru