Перейти к содержимому

Реферальная программа Мегаплана

Выбрать шаблон и создать сайт

Сборщик новостей с rss

#11 Xap

Xap
    Topic Starter
  • Пользователь
  • 1 520 сообщений
  • Репутация: 0
0

Отправлено 04 Октябрь 2008 - 19:02

http://www.kavkazweb...ws.cgi?nid=0108
Мне вообще-то нужно что-то вроде вышеуказанного.

А в rian.ru нашел что-то: http://rian.ru/docs/about/rss.html
  • 0

#12 ZiTosS

ZiTosS
  • Пользователь
  • 5 148 сообщений
  • Репутация: 8

Отправлено 05 Октябрь 2008 - 10:26

Хех с rian.ru тут проблемы в том что они не предоставляют импорт прямого RSS файла.

А вот для Lenta.ru я нашёл алгоритм
1) Идём по ссылке http://img.lenta.ru/r/EX/import.rss
2) Бирём к примеру ссылку на первую новость в списке http://lenta.ru/news...0/05/protester/
Добавляем к ней _Printed.htm и получаем версию для печати
http://lenta.ru/news...er/_Printed.htm Которую разобрать уже намного легче, да и ссылка на картинку там также присутствует...
3) В версии для печати воспользоваться граббером не так уж и сложна.

Вот и весь алгоритм :)
  • 0

#13 Xap

Xap
    Topic Starter
  • Пользователь
  • 1 520 сообщений
  • Репутация: 0

Отправлено 05 Октябрь 2008 - 10:50

Я вообщем-то нашел граббер для Joomla (лучший, да и в принципе единственный для Joomla) News Grabber JС Вот только это чудо стоит 2500 рублей. Может у кого уже стоит, поделитесь плиз там лицензия на 5 доменов.

ZiTosS а как сделать, чтобы граббер весь алгоритм проделывал сам?
  • 0

#14 ZiTosS

ZiTosS
  • Пользователь
  • 5 148 сообщений
  • Репутация: 8

Отправлено 05 Октябрь 2008 - 16:35

Есть такое чудо в PHP, как соккеты. С помощью них можно изменять или передавать свои заголовки странице... К примеру формировать тот же самый POST массив и отсылать помимо нажатия кнопки submit
Вот ту есть пара функций по соккетам http://ru.php.net/ma...p?pattern=socet
А вот функция, которая подсоединяется к URL
http://ru.php.net/ma...n.fsockopen.php

Хотя в нашем случае это можно сделать намного проще...
1) считываем _http://img.lenta.ru/r/EX/import.rss с помощью file_get_contents()
2) С помощью функции preg_match() разбираем получнное по <items>.
3) Затем с помощью того же preg_match, разбираем в цикле и вытаскиваем то, что находится между <link> и </link> + сразу же добавляем к этому _Printed.htm
4) Затем в цикле также обрабатываем ссылки с помощью file_get_contents()
5) Далее в цикле вытаскиваем заголовок(Находится между H3) и текст.


Там довольно всё непросто устроенно :)
  • 0

#15 Xap

Xap
    Topic Starter
  • Пользователь
  • 1 520 сообщений
  • Репутация: 0

Отправлено 05 Октябрь 2008 - 19:37

Вообщем мне теперь стало ясно, что самому все это не сделать. Буду искать людей которые будут покупать лицензию News Grabber JС для Joomla. Все равно огромное спасибо. Может если освою язык, буду пробывать предложенные Вами советы.
  • 0


Оформление форума – IPBSkins.ru