X   Сообщение сайта
(Сообщение закроется через 3 секунды)



 

Здравствуйте, гость (

| Вход | Регистрация )

Открыть тему
Тема закрыта
> Скрипт по копированию контента
Bazalt
Bazalt
Topic Starter сообщение 30.3.2009, 22:15; Ответить: Bazalt
Сообщение #1


Есть ли в природе скрипт по копированию новостей или статей с указанных заранее сайтов (ссылок)?

То есть вначале задается урл сайта на котором нужно скопировать например главную страницу и сохранить текст в отдельный файл в виде текста уже без мусорных тэгов. Может есть хотя бы наброски такого скрипта - доработаю сам.
0
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ZiTosS
ZiTosS
сообщение 31.3.2009, 10:45; Ответить: ZiTosS
Сообщение #2


Вы поймите, что интелекта у языка нету, и анализировать что-то он может не по ощущениям, а только по строго заданным критериям и правилам. Поэтому под каждый парсер свой код понадобится (имею ввиду обработчик страницы).

А вообще чтобы скопировать код и убрать все мусорные теги, можно сделать так
1) Вытаскиваем со страницы контент в виде HTML с помощью file_get_contents()
2) Удаляем все ненужные теги с помощью функции strip_tags()
3) Сохраняем полученный текст в базу или файл... Всё :)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
m0tti
m0tti
сообщение 31.3.2009, 18:12; Ответить: m0tti
Сообщение #3


А потом еще первести на анлг и обратно и выложить с себе уникум.
Если такое существует мне оно надо.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
ilyazh
ilyazh
сообщение 31.3.2009, 18:27; Ответить: ilyazh
Сообщение #4


Такое существует, но без перевода. Текст получается уникальным, но на столько дерьмовым, что его невозможно читать. Стоят такие фиговины от $50 и выше. Сайты с таким не читабельным текстом банятся пс.
з.ы. Нужен уник контент - только руки и голова помогут вам. Придётся сами всё писать или покупать у других людей.
Иначе, все бы делали сайты для сапы тонными, на халявном и уникальном контенте, и не работали бы вообще. =)
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
m0tti
m0tti
сообщение 31.3.2009, 19:55; Ответить: m0tti
Сообщение #5


А как пс узнает что контент не читабельный, ведь самое главное слова.
Я бы на самом деле глянул результат такой фиговины и метод ее внедрения в автоматизацию.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Гость_0_* Гость_0_*
сообщение 31.3.2009, 20:02; Ответить: Гость_0_*
Сообщение #6


Саты с уникальным генерированным контентов сидят в индексе, но вылетают по стуку
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Bazalt
Bazalt
Topic Starter сообщение 31.3.2009, 20:23; Ответить: Bazalt
Сообщение #7


Я как раз и имел ввиду копирование html страницы и последующая его очистка от мусора.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
kimer
kimer
сообщение 31.3.2009, 21:04; Ответить: kimer
Сообщение #8


(admin @ 31.3.2009, 19:02) *
Саты с уникальным генерированным контентов сидят в индексе, но вылетают по стуку

А если они всё равно под сапу сделаны - какая разница? Или у них ещё и тИЦ слетает?
И кстати говоря, что - для сапы нельзя использовать неуникальный контент? :)

Замечание модератора:
Эта тема была закрыта автоматически ввиду отсутствия активности в ней на протяжении 100+ дней.
Если Вы считаете ее актуальной и хотите оставить сообщение, то воспользуйтесь кнопкой
или обратитесь к любому из модераторов.
Вернуться в начало страницы
 
Ответить с цитированием данного сообщения
Открыть тему
Тема закрыта
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0


Свернуть

> Похожие темы

  Тема Ответов Автор Просмотров Последний ответ
Открытая тема (нет новых ответов) Продам скрипт rtb exchange suite - система перепродажи трафика dsp/ssp в реальном времени.
5 buypushplatform 4302 Вчера, 21:02
автор: 100ftd
Горячая тема (нет новых ответов) Тема имеет прикрепленные файлыA-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров.
354 Forbidden 279454 22.4.2024, 16:05
автор: AParser_Support
Открытая тема (нет новых ответов) Дайте бесплатного контента! :)
2 Tia2 1001 22.12.2023, 18:53
автор: zyzy
Открытая тема (нет новых ответов) Скрипт поисковика видео StrongTube
3 3josoft 1575 14.8.2023, 14:45
автор: 3josoft
Горячая тема (нет новых ответов) Занимаюсь добычей качественного контента из Вебархива. Опыт уже более трех лет
Предоставляю только качественный, читабельный контент.
62 kuz999 38117 27.7.2023, 13:55
автор: kuz999


 



RSS Текстовая версия Сейчас: 24.4.2024, 23:49
Дизайн