Перейти к содержимому


Пользователь месяца
Ixman Ixman 1-й за Октябрь
Очков активности: 693 0 тем, 33 сообщения, 14 баллов репутации
Сайт: o5cat.ru
ТОП самых активных за этот месяц
  • Фотография ShowPrint
    #1

    ShowPrint (ShowPrint.ru)
    Очков активности: 96 Вне конкурса за определение пользователя месяца

  • Фотография Ixman
    #2

    Ixman (o5cat.ru)
    Очков активности: 85.5 Вне конкурса за определение пользователя месяца

  • Фотография yuran
    #3

    yuran (yurbol.ru)
    Очков активности: 82.5 0 тем, 55 сообщений, 1 балл репутации

  • Фотография BLIK
    #4

    BLIK
    Очков активности: 51 Вне конкурса за определение пользователя месяца

  • Фотография Mandarin
    #5

    Mandarin
    Очков активности: 51 0 тем, 34 сообщения, 1 балл репутации

  • Фотография WGN
    #6

    WGN (worldgamenews.com)
    Очков активности: 45 Вне конкурса за определение пользователя месяца

  • Фотография pozitron123
    #7

    pozitron123
    Очков активности: 31.5 2 темы, 15 сообщений, 1 балл репутации

  • Фотография алексс
    #8

    алексс
    Очков активности: 27 2 темы, 12 сообщений, 1 балл репутации

  • Фотография Андрей WPMasterKZ
    #9

    Андрей WPMasterKZ (wpmaster.kz)
    Очков активности: 19.5 0 тем, 13 сообщений, 1 балл репутации

  • Фотография Scool
    #10

    Scool (stostory.ru)
    Очков активности: 19.5 3 темы, 4 сообщения, 1 балл репутации

  • Показать весь ТОП 10
Поддержите форум! =)
Апдейты
  • Яндекс ИКС: 31.10.2018
  • Яндекс выдача: 15.11.2018
Топ 5 участников по репутации


Как собрать базу блогов для комментирования

#1 rserg2017

rserg2017
  • Неактивные
  • 4 сообщений
  • Репутация: 0
0

Отправлено 17 July 2017 - 12:31

Добрый день!
Подскажите новичку, каким образом собирается база блогов для комментирования? 
Неоднократно видел блоги, в которых появляется масса комментариев, хотелось бы знать механизм сбора списка таких блогов 

 

 

Сообщение отредактировал Sosnovskij: 31 July 2017 - 13:19
убрал форматирование

  • 0

#2 BLIK

BLIK
  • Супермодератор
  • 4142 сообщений
  • Репутация: 943

Отправлено 17 July 2017 - 12:36

@rserg2017,Парсером собираются url по признакам и ключевым словам и потом комментируются. 


  • 0

Качественный хостинг   Тут может быть ваша ссылка?



#3 rserg2017

rserg2017
    Topic Starter
  • Неактивные
  • 4 сообщений
  • Репутация: 0

Отправлено 17 July 2017 - 12:39

@BLIK,Вот именно этот вопрос и интересует. какой запрос подсунуть парсеру, чтобы например получить базу блогов на wordpress. Или где поподробнее почитать об этом?


Сообщение отредактировал rserg2017: 17 July 2017 - 12:43

  • 0

#4 BLIK

BLIK
  • Супермодератор
  • 4142 сообщений
  • Репутация: 943

Отправлено 17 July 2017 - 12:48

@rserg2017,Тематически запросы(ключи), потом собрать все url что есть по запросам, потом делать выборку и оставлять только нужные движки. 

 

Как чистить базы в выдачи куча вариантов с информацией, в любом случае парсить придется все что есть, а потом чистить и удалять из базы ненужное. 


  • 0

Качественный хостинг   Тут может быть ваша ссылка?



#5 rserg2017

rserg2017
    Topic Starter
  • Неактивные
  • 4 сообщений
  • Репутация: 0

Отправлено 17 July 2017 - 12:54

@BLIK,Я видимо не совсем правильно выразился. Хотелось бы сначала напарсить большое кол-во блогов на wordpress, а потом уже оттуда делать выборку. 

Например блоги на blogspot можно поискать при помощи запроса inurl:».blogspot.com/2017/» «Post a Comment»

А вот для Wordpressa аналогичный бы запрос...


  • 0

#6 BLIK

BLIK
  • Супермодератор
  • 4142 сообщений
  • Репутация: 943

Отправлено 17 July 2017 - 12:59

@rserg2017,Значит ищите парсер с настройками фильтров cms при парсинге и собирайте базу.

 

Только смысла в этом не вижу, я бы спарсил все что есть и потом просто отфильтровал бы по признакам. 

Можете к этому присмотреться http://www.masterweb...-dmoz-whois-et/


Сообщение отредактировал BLIK: 17 July 2017 - 13:00

  • 0

Качественный хостинг   Тут может быть ваша ссылка?



#7 rserg2017

rserg2017
    Topic Starter
  • Неактивные
  • 4 сообщений
  • Репутация: 0

Отправлено 17 July 2017 - 13:07

@BLIK,Спасибо, гляну.


  • 0

#8 tuvaeff

tuvaeff
  • Заблокированные
  • 21 сообщений
  • Репутация: 1

Отправлено 02 August 2017 - 18:47

Вот именно этот вопрос и интересует. какой запрос подсунуть парсеру, чтобы например получить базу блогов на wordpress. Или где поподробнее почитать об этом?

 

wordpress часто ищут по форме добавления комментария.

 

 Для google

 

intext:'Сайт' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Сайт' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Сайт' intext:'Почта (обязательно)' site:.ru
intext:'Сайт' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Сайт' intext:'E-Mail (не публикуется)' site:.ru
intext:'Сайт' intext:'Почта (скрыта) *' site:.ru
intext:'Сайт' intext:'Email (required)' site:.ru
intext:'Сайт' intext:'E-mail' site:.ru
intext:'Сайт' intext:'E-mail/HTTP' site:.ru
intext:'Сайт' intext:'Mail (will not be published) (required)' site:.ru
intext:'Сайт' intext:'Mail (will not be published) ' site:.ru
intext:'Сайт' intext:'Email (required) - will not be published' site:.ru
intext:'Сайт' intext:'Email (will not be published) (required)' site:.ru
intext:'Сайт' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Сайт' intext:'Email Address(required)' site:.ru
intext:'Сайт' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Сайт' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Сайт' intext:'E-mail: (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'Почта (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-Mail (не публикуется)' site:.ru
intext:'Сайт (не обязательно)' intext:'Почта (скрыта) *' site:.ru
intext:'Сайт (не обязательно)' intext:'Email (required)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-mail' site:.ru
intext:'Сайт (не обязательно)' intext:'E-mail/HTTP' site:.ru
intext:'Сайт (не обязательно)' intext:'Mail (will not be published) (required)' site:.ru
intext:'Сайт (не обязательно)' intext:'Mail (will not be published) ' site:.ru
intext:'Сайт (не обязательно)' intext:'Email (required) - will not be published' site:.ru
intext:'Сайт (не обязательно)' intext:'Email (will not be published) (required)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Сайт (не обязательно)' intext:'Email Address(required)' site:.ru
intext:'Сайт (не обязательно)' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Сайт (не обязательно)' intext:'E-mail: (обязательно)' site:.ru
intext:'Web-сайт' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Web-сайт' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Web-сайт' intext:'Почта (обязательно)' site:.ru
intext:'Web-сайт' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Web-сайт' intext:'E-Mail (не публикуется)' site:.ru
intext:'Web-сайт' intext:'Почта (скрыта) *' site:.ru
intext:'Web-сайт' intext:'Email (required)' site:.ru
intext:'Web-сайт' intext:'E-mail' site:.ru
intext:'Web-сайт' intext:'E-mail/HTTP' site:.ru
intext:'Web-сайт' intext:'Mail (will not be published) (required)' site:.ru
intext:'Web-сайт' intext:'Mail (will not be published) ' site:.ru
intext:'Web-сайт' intext:'Email (required) - will not be published' site:.ru
intext:'Web-сайт' intext:'Email (will not be published) (required)' site:.ru
intext:'Web-сайт' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Web-сайт' intext:'Email Address(required)' site:.ru
intext:'Web-сайт' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Web-сайт' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Web-сайт' intext:'E-mail: (обязательно)' site:.ru
intext:'Website' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Website' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Website' intext:'Почта (обязательно)' site:.ru
intext:'Website' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Website' intext:'E-Mail (не публикуется)' site:.ru
intext:'Website' intext:'Почта (скрыта) *' site:.ru
intext:'Website' intext:'Email (required)' site:.ru
intext:'Website' intext:'E-mail' site:.ru
intext:'Website' intext:'E-mail/HTTP' site:.ru
intext:'Website' intext:'Mail (will not be published) (required)' site:.ru
intext:'Website' intext:'Mail (will not be published) ' site:.ru
intext:'Website' intext:'Email (required) - will not be published' site:.ru
intext:'Website' intext:'Email (will not be published) (required)' site:.ru
intext:'Website' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Website' intext:'Email Address(required)' site:.ru
intext:'Website' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Website' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Website' intext:'E-mail: (обязательно)' site:.ru
intext:'Веб-сайт' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Веб-сайт' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Веб-сайт' intext:'Почта (обязательно)' site:.ru
intext:'Веб-сайт' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Веб-сайт' intext:'E-Mail (не публикуется)' site:.ru
intext:'Веб-сайт' intext:'Почта (скрыта) *' site:.ru
intext:'Веб-сайт' intext:'Email (required)' site:.ru
intext:'Веб-сайт' intext:'E-mail' site:.ru
intext:'Веб-сайт' intext:'E-mail/HTTP' site:.ru
intext:'Веб-сайт' intext:'Mail (will not be published) (required)' site:.ru
intext:'Веб-сайт' intext:'Mail (will not be published) ' site:.ru
intext:'Веб-сайт' intext:'Email (required) - will not be published' site:.ru
intext:'Веб-сайт' intext:'Email (will not be published) (required)' site:.ru
intext:'Веб-сайт' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Веб-сайт' intext:'Email Address(required)' site:.ru
intext:'Веб-сайт' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Веб-сайт' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Веб-сайт' intext:'E-mail: (обязательно)' site:.ru
intext:'Website (optional)' intext:'Почта (не будет видна) (обязательно)' site:.ru
intext:'Website (optional)' intext:'Почта (не публикуется) (обязательно)' site:.ru
intext:'Website (optional)' intext:'Почта (обязательно)' site:.ru
intext:'Website (optional)' intext:'E-mail (не публикуется) (обязательно)' site:.ru
intext:'Website (optional)' intext:'E-Mail (не публикуется)' site:.ru
intext:'Website (optional)' intext:'Почта (скрыта) *' site:.ru
intext:'Website (optional)' intext:'Email (required)' site:.ru
intext:'Website (optional)' intext:'E-mail' site:.ru
intext:'Website (optional)' intext:'E-mail/HTTP' site:.ru
intext:'Website (optional)' intext:'Mail (will not be published) (required)' site:.ru
intext:'Website (optional)' intext:'Mail (will not be published) ' site:.ru
intext:'Website (optional)' intext:'Email (required) - will not be published' site:.ru
intext:'Website (optional)' intext:'Email (will not be published) (required)' site:.ru
intext:'Website (optional)' intext:'E-Mail (will not be published , required)' site:.ru
intext:'Website (optional)' intext:'Email Address(required)' site:.ru
intext:'Website (optional)' intext:'Емайл (не публикуется) (обязательно)' site:.ru
intext:'Website (optional)' intext:'E-Mail:(не публикуется)(обязательно)' site:.ru
intext:'Website (optional)' intext:'E-mail: (обязательно)' site:.ru

  • 0

robot

robot
  • Пользователь PRO
  • 2652 сообщений
  • Репутация: 85


Похожие темы

  Название темы Автор Статистика Последнее сообщение

Оформление форума – IPBSkins.ru