X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Как создать граббер?
mega94
mega94
Topic Starter сообщение 9.1.2014, 16:08; Ответить: mega94
Сообщение #1


Здравствуйте. Помогите начинающему. Этот скрипт граббер, пожалуйста, опишите в комментарии, что делать для чего и почему:
<?php
/*   забыл, это в голову инклудь.. либо уберите... на твое ваше усмотрение...  */
$accept = "Accept: text/html, application/xml;q=0.9, application/xhtml+xml, image/png, image/jpeg, image/gif,image/x-bitmap, */*;q=0.1\r\n"; /* Опысать что делат для чего и почему  */
$accept_language = "Accept-Language: ru, en;q=0.9\r\n"; /*   */
$accept_charset = "Accept-Charset: utf-8;q=0.6 windows-1251;q=0.1 *;q=0.1\r\n";/*   */
$referer = "Referer: [url="http://хост/страница.php\r\n%22;"]http://хост/страница.php\r\n";[/url] //подумай что писать дабы не палить себя /*   */
$conection = "Connection: Close\r\n";/*   */
/* ********************************************************************************
****** */
$host= "хост"; //в виде site.ru /*   */
$path="/страница.php?".$_SERVER['QUERY_STRING']; /*   */
$fp=fsockopen($host,80,$errno, $errstr,10); /*   */
if(!$fp) {
echo "$errstr ($errno)<br/>\n"; /*   */
} else {
$data = "";$post=0;/*   */
foreach($_POST as $key=>$value){$post=1;
        $data.="&$key=$value";}
if($data)$data=substr($data,1);/*   */
if($post)
$headers = "POST $path HTTP/1.0\r\n";else /*   */
$headers = "GET $path HTTP/1.0\r\n"; /*   */
$headers .= "Host: $host\r\n"; /*   */
$headers .= "Accept: *\r\n"; /*   */
$headers .= "Accept-Charset: UTF-8\r\n"; /*   */
$headers .= "Accept-Charset: *\r\n"; /*   */
$headers .= "Accept-Encoding: deflate\r\n"; /*   */
$headers .= "Accept-Language: ru\r\n"; /*   */
$headers .= "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; ru) Opera 9.50\r\n"; /*   */
if($post){
$headers .= "Content-type: application/x-www-form-urlencoded\r\n"; /*   */
$headers .= "Content-Length: ".strlen ($data)."\r\n"; /*   */
$headers .= "\r\n"; /*   */
$headers .= $data;}else $headers.="\r\n"; /*   */
@fwrite($fp, $headers); /*   */
while($file != "\r\n") $file = @fgets($fp, 128); /*   */
$file = ''; /*   */
while(!feof($fp)) $file .= @fgets($fp, 4096); /*   */
@fclose($fp); }
$file=str_replace('что','на что',$file); //замена
echo $file; /*   */
?>
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
fedornabilkin
fedornabilkin
сообщение 10.1.2014, 11:01; Ответить: fedornabilkin
Сообщение #2


Этот скрипт вряд ли можно назвать граббером.
Написан в стиле
можешь указывать или не указывать заголовки, пост-запрос обрабатывается, но данные никуда не посылаются.
потом все равно указываются заголовки
и вся информация запроса пишется в файл
а еще что-то на что-то можно заменить
а еще у пхп есть более 1000 встроенных функций

Скажи, что хочешь грабить и какую информацию надо получать.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
angarsky
angarsky
сообщение 10.1.2014, 12:54; Ответить: angarsky
Сообщение #3


Для начала русский язык бы неплохо выучить, а потом уже за языки программирования браться


--------------------
SEO и Drupal по понятиям.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
mega94
mega94
Topic Starter сообщение 10.1.2014, 14:48; Ответить: mega94
Сообщение #4


например вот сайт http://ka4ka.ru/ хочу грабить раздел поиск mp3
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
fedornabilkin
fedornabilkin
сообщение 16.1.2014, 12:54; Ответить: fedornabilkin
Сообщение #5


Что конкретно надо получить с этой страницы?
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ixman
ixman
сообщение 16.1.2014, 14:30; Ответить: ixman
Сообщение #6


Лучше всего для парсинга использовать CURL, он проще и легче для восприятия. Очень много информации по нему. А так парсишь страницу, вырезаешь функцией str_replace всё что не нужно, либо вырезаешь и меняешь, и затем сохраняешь её в кеш, а оттуда отдаёшь пользователю. Ещё вариант, немного более сложный - это регулярками вытаскиваешь то, что нужно, а затем вставляешь в свой документ. Кстати CURL легко передаёт POST и GET данные.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
mega94
mega94
Topic Starter сообщение 16.1.2014, 15:05; Ответить: mega94
Сообщение #7


(fedornabilkin @ 16.1.2014, 15:54) *
Что конкретно надо получить с этой страницы?

Надо получить с этой страницы все что там есть, но под свой дизайн и ссылку, чтобы пользователь зашел на мой сайт и думал что это мои контенти

Ixman, А можно по подробнее с кодами на примере с этого сайта http://gegas.ru/ раздел "Поиск музыки расш." чтобы пользователь зашел на мой сайт и думал что это мои контенти
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ixman
ixman
сообщение 16.1.2014, 15:30; Ответить: ixman
Сообщение #8


[member=mega94], я бы тебе посоветовал обратиться к людям, которые специализируются на написания грабберов мобильных сайтов и искать их нужно на мобильных форумах. Думаю если в вапе обитаешь, то должен знать эти форумы. Стоят грабберы не так уж и дорого
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
fedornabilkin
fedornabilkin
сообщение 16.1.2014, 15:38; Ответить: fedornabilkin
Сообщение #9


чтобы пользователь зашел на мой сайт и думал что это мои контенти

Так не проще ли зазеркалить сайт?
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
mega94
mega94
Topic Starter сообщение 16.1.2014, 16:34; Ответить: mega94
Сообщение #10


как это?


Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Большие ставки для кликов в Я.Директ. Как удешевить?
2 rownong27 1122 26.3.2024, 14:13
автор: knezevolk
Открытая тема (нет новых ответов) Как вы бросили работу и перешли на заработок с сайтов?
12 uahomka 2292 25.3.2024, 6:52
автор: Skyworker
Открытая тема (нет новых ответов) Как отозвать банковский платеж фрилансеру?
28 metvekot 3920 25.3.2024, 6:34
автор: Skyworker
Открытая тема (нет новых ответов) Как вывести деньги в Украине с заблокированного Юмани ?
23 freeax 3644 24.3.2024, 20:55
автор: Liudmila
Открытая тема (нет новых ответов) Создать видеоканал лучше в ютуб или телеграм?
10 uahomka 1787 24.3.2024, 4:21
автор: Alexand3r


 



RSS Текстовая версия Сейчас: 29.3.2024, 8:52
Дизайн