Список ссылок на картинки из html C#
Код:
Queue qe = new Queue();
Regex regexExtractURLs = new Regex(@"(?<=<img .*?src\s*=\s*"")[^""]+(?="".*?>)", RegexOptions.IgnoreCase | RegexOptions.Singleline);
MatchCollection mcURLs = regexExtractURLs.Matches(page);
foreach (Match mMatch in mcURLs)
qe.Enqueue(mMatch.ToString().Trim());
Regex regexExtractURLs = new Regex(@"(?<=<img .*?src\s*=\s*"")[^""]+(?="".*?>)", RegexOptions.IgnoreCase | RegexOptions.Singleline);
MatchCollection mcURLs = regexExtractURLs.Matches(page);
foreach (Match mMatch in mcURLs)
qe.Enqueue(mMatch.ToString().Trim());
например из таких конструкций:
Код:
.gbts{background:url(//ssl.gstatic.com/gb/images/b_8d5afc09.png);
Есть замечательный интерфейс IHTMLDocument2 и IHTMLDocument3 где можно выбрать все картинки при помощи getElementsByTagName('img')
А в IHTMLStyleSheet и других можно побегать по всем правилам в поисках background'ов