Извлечение контента чужого сайта
Как можно извлечь контент какого нибудь другого сайта.
Например если скажем я захочу чтобы на моем сайте показывалось курсы валют взятая из сайта центрального банка.
PHP скрипт который просто считывает инфо у чужого сайта и показывает его на моем сайте...
Спасибо!!!!
А парсить чужие сайты без разрешения - воровство, т.е. преступление. Правила этого форума пресекают такие темы.
[HTML]
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />
<title>Untitled Document</title>
<style type='text/css'>
.gmtbl {background-color: #ffffff; border: 1px solid #241c11;}
td.gmtdttl, td.gmtdttl:hover {font-size: 14px; font-weight: bold; color: #000000; text-align:center; background-color: #f2e0c8;border-bottom: 1px solid #241c11;}
a.gmtdttl, a.gmtdttl:hover
{
color: #000000;
text-decoration: none;
}
.gmtdtext, .gmtdtext:hover {font-size: 12px; font-weight: normal; color: #000000;background-color: #fefefe; padding:1px;
}
table
{
padding:0; margin:0;
width:165px;
}
</style>
</head>
<body style="padding:0; margin:0; background:none;">
<script language='JavaScript' type='text/javascript' src='http://informer.gismeteo.ua/html/informer.php?index=33345%CA%E8%E5%E2&par=2&lang=&vieinf=sm&tblstl=gmtbl&tdttlstl=gmtdttl&tdtext=gmtdtext'></script>
</body>
</html>
[/HTML]
и парсить не надо))). Хотя, можешь данную страничку и запихнуть в обработку)
Например, gismeteo продаёт прогноз погоды. И им очень не хочется, чтобы парсили их сайт. Во-первых, они быстро заблокируют доступ парсеру. Во-вторых, их юристы очень быстро найдут, кто крадёт у них информацию, и тогда в лучшем случае морду набьют... А могут и... Воровство - уголовно-наказуемое деяние.
Хм, а я не знал)) :) А если пасить ихние фришные информеры?
А собственно, зачем их "пасить"? Не проще просто вставить в код страницы? По-моему, они для этого и предназначены.
Информеры отражают текущее состояние погоды. На том же сайте есть и XML бесплатно для погоды на сегодня-завтра.Кстати, а как ты собирался "парсить" картинки?
Никто так и не раскололся ;)
Никто так и не раскололся ;)
об чём? как парсить? как тырить информацию?
Очень хорошие результаты даёт анализ DOM-модели документа. )))) А то сейчас кто-нибудь предложит регулярные выражения. Хотя, и регулярные выражения - тоже имеющий место способ.
Очень хорошие результаты даёт анализ DOM-модели документа. )))) А то сейчас кто-нибудь предложит регулярные выражения. Хотя, и регулярные выражения - тоже имеющий место способ.
К вопросу DOM vs RegExp :D
http://forum.codenet.ru/showpost.php?p=209273&postcount=10
http://forum.codenet.ru/showpost.php?p=209273&postcount=10
Ну, я примерно о том же. Я думаю, особенно в данном случае скорость совсем не играет ни какой рояли. Зато - какая гибкость!
Кстати, посмотрел кишки на gismeteo. Сама погода, которую предполагалось автором парсить - суть javascript. Так что...
С помощью ее, как мне кажется, можно запарсить весь сайт гисметео и никто об этом не узнает...
А с прогнозом погоды, вообще просто, по любому, у вас будет работать скрипт тягающий из XML формата. Какая разница, тягать из одного источника или двух-трех? Если будете брать данные из нескольких источников и выводить среднее значение, то это будет уже Ваш личный прогноз. Во первых очень мала вероятность совпадения значений с одним из доноров, во вторых это уже анализ прогнозов, собственное издание.
И ещё, если использовать ссылки на источник, то просто не делайте их активными, написали URL (png :)) и достаточно
А вот торговцы погодой не в восторге, ибо это - их бизнес.
Всё очень просто, если купить этот XML...
Да, конечно. Если не хочешь, чтобы у тебя воровали - не воруй сам. А если у меня не чего украсть? :D