Спарсить кусок html-страницы
спомощью httpwebrequest/httpwebresponse взял страницу с одного сайта, теперь мне нужно взять кусок кода из этой страницы, а именно небольшую таблицу с данными.
[HTML]<tbody>
<tr>
<td>AE1111</td>
<td><img class="arrow" src="/ii/in-out.gif">AE 1111</td>
<td></td>
<td><a href="/prod/a58f1551-f854-4d87-b460-da40cd44b5d4.aspx">KNORR-BREMSE</a></td>
<td style="width:1%;"></td>
<td>Fren Market</td>
<td align="right">34,5</td>
<td><input type="text" style="width: 45px;" columns="4" id="a58f1551-f854-4d87-b460-da40cd44b5d4" name="a58f1551-f854-4d87-b460-da40cd44b5d4" value="1"></td>
<td><a onclick="java script:MkJsCb3('a58f1551-f854-4d87-b460-da40cd44b5d4')"><img src="/ii/add2cart-sm.gif" class="cart" alt="В корзину"></a></td>
</tr>
</tbody> [/HTML]
как лучше это сделать? спомощью регулярных выражений? парсить как xml-документ? подскажите пожалуйста.
Короче, кажите весь думент. Или если прописн доктайп -лучше его кажите :)
Цитата: alex-kniaz
Если документ оформлен в соответствии со стандартами XHTML - парсить как XML.
Короче, кажите весь думент. Или если прописн доктайп -лучше его кажите :)
Короче, кажите весь думент. Или если прописн доктайп -лучше его кажите :)
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
Значит можно парсить как XML