Помощник
|
Написание парсера. Вопрос. |
Banderas
|
Сообщение
#1
|
||
|
|
||
|
|||
Гость_0_* Гость_0_* |
21.9.2011, 15:44;
Ответить: Гость_0_*
Сообщение
#2
|
|
Banderas, откуда и что парсить?
|
|
|
matroskin8 |
21.9.2011, 15:51;
Ответить: matroskin8
Сообщение
#3
|
|
ИМХО, универсального решения здесь нет. Под каждый случай необходимо будет править.
|
|
|
Banderas
|
Сообщение
#4
|
|
Например я хочу спарсить все книги отсюда _http://www.books.ru/e-knigi-605406/?filter[view]=all&filter[sort]=8&type=
Вот кусок кода что я написал (парсю ссылки на картинки) <!--shcode--><pre><code class="php">set_time_limit(180); $tt = array(); for ($i=1; $i<=3; $i++) { $data = file_get_contents('http://www.books.ru/e-knigi-605406/?filter[view]=all&filter[sort]=8&type='.$i.''); $title= $data; do { $imgs = preg_match("/src="(http://[a-z]+.[a-z]+.[a-z]+/[a-z]+/[0-9]+-[0-9]+/[0-9]+/[0-9]+.[a-z]{1,3})/i", $title, $res, PREG_OFFSET_CAPTURE); $title = substr($title, $res[0][1]+strlen($res[0][0])); array_push($tt, $res[1][0]); } while ($imgs); }</code></pre><!--ehcode--> знаю, я сделал по молдовански, забыл что существует функция preg_match_all(), но так работает тоже. Только собирает 3 ненужные ссылки. Как предложите удалить 3-4 последние ссылки из страницы? А вообще я хотел узнать что есть обязательным при написание парсера. Какие циклы лучше использовать и т.д. |
|
|
Draftpad |
10.10.2011, 15:22;
Ответить: Draftpad
Сообщение
#5
|
|
|
Попробуйте уже готовый фреймворк _http://simplehtmldom.sourceforge.net/
Очень удобный и простой в использовании.
|
|
|
||
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Написание софта, разработка сайтов, моб. приложений и игр | 3 | BurzhuyXXi | 2427 | 10.11.2023, 19:51 автор: BurzhuyXXi |
|
Написание и размещение отзывов Заказываем отзывы |
6 | Blacktext | 2188 | 3.3.2023, 17:52 автор: kontenta |
|
Написание софта, разработка сайтов, моб. приложений и игр | 4 | BurzhuyXXi | 2304 | 25.2.2023, 14:35 автор: BurzhuyXXi |
|
Написание скриптов на PHP, в т.ч. модулей для CMS, и другие услуги Создание модулей и хаков для DLE и других движков, перенос контента |
170 | Coppermine | 118336 | 24.2.2023, 12:30 автор: boltuk |
|
SERM - написание отзывов/комментариев о компании, услуге, товаре. | 8 | GET_ini | 4660 | 15.12.2022, 19:13 автор: GET_ini |
Текстовая версия | Сейчас: 25.4.2024, 20:33 |