X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Написание парсера. Вопрос.
Banderas
Banderas
Topic Starter сообщение 21.9.2011, 13:51; Ответить: Banderas
Сообщение #1


Пожалуйста, напишите свой алгоритм создания парсера. Свой способ и т.д. Как правильно определять теги.
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Гость_0_* Гость_0_*
сообщение 21.9.2011, 15:44; Ответить: Гость_0_*
Сообщение #2


Banderas, откуда и что парсить?
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
matroskin8
matroskin8
сообщение 21.9.2011, 15:51; Ответить: matroskin8
Сообщение #3


ИМХО, универсального решения здесь нет. Под каждый случай необходимо будет править.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Banderas
Banderas
Topic Starter сообщение 21.9.2011, 18:46; Ответить: Banderas
Сообщение #4


Например я хочу спарсить все книги отсюда _http://www.books.ru/e-knigi-605406/?filter[view]=all&filter[sort]=8&type=
Вот кусок кода что я написал (парсю ссылки на картинки)
<!--shcode--><pre><code class="php">set_time_limit(180);
$tt = array();

for ($i=1; $i&lt;=3; $i++) {
    $data = file_get_contents('http://www.books.ru/e-knigi-605406/?filter[view]=all&amp;filter[sort]=8&amp;type='.$i.'');
    $title= $data;
    do {
        $imgs = preg_match("/src="(http://[a-z]+.[a-z]+.[a-z]+/[a-z]+/[0-9]+-[0-9]+/[0-9]+/[0-9]+.[a-z]{1,3})/i", $title, $res, PREG_OFFSET_CAPTURE);
        $title = substr($title, $res[0][1]+strlen($res[0][0]));
        array_push($tt, $res[1][0]);
    } while ($imgs);
}</code></pre><!--ehcode-->

знаю, я сделал по молдовански, забыл что существует функция preg_match_all(), но так работает тоже. Только собирает 3 ненужные ссылки. Как предложите удалить 3-4 последние ссылки из страницы?

А вообще я хотел узнать что есть обязательным при написание парсера. Какие циклы лучше использовать и т.д.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Draftpad
Draftpad
сообщение 10.10.2011, 15:22; Ответить: Draftpad
Сообщение #5


Попробуйте уже готовый фреймворк _http://simplehtmldom.sourceforge.net/
Очень удобный и простой в использовании.

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Написание софта, разработка сайтов, моб. приложений и игр
3 BurzhuyXXi 2427 10.11.2023, 19:51
автор: BurzhuyXXi
Открытая тема (нет новых ответов) Написание и размещение отзывов
Заказываем отзывы
6 Blacktext 2188 3.3.2023, 17:52
автор: kontenta
Открытая тема (нет новых ответов) Написание софта, разработка сайтов, моб. приложений и игр
4 BurzhuyXXi 2304 25.2.2023, 14:35
автор: BurzhuyXXi
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыНаписание скриптов на PHP, в т.ч. модулей для CMS, и другие услуги
Создание модулей и хаков для DLE и других движков, перенос контента
170 Coppermine 118336 24.2.2023, 12:30
автор: boltuk
Открытая тема (нет новых ответов) SERM - написание отзывов/комментариев о компании, услуге, товаре.
8 GET_ini 4660 15.12.2022, 19:13
автор: GET_ini


 



RSS Текстовая версия Сейчас: 25.4.2024, 20:33
Дизайн