Problem med
Hej Eksperter,Jeg er ved at lave en mini crawler men jeg er støt ind i et problem, med HTMLDocument og getElementsByTagName. Min kode se ses her under. Mit problem er at når jeg prøver at finde alle udgaver af et tag på siden finder den intet og det gælder alle tags lige fra title til link tags?
Her er så min kode:
protected void Page_Load(object sender, EventArgs e)
{
HTMLDocument DocCrawlHTML = DocCrawlWebPage("http://www.eksperten.dk");
IHTMLElementCollection htmlCollection = DocCrawlHTML.getElementsByTagName("a");
showMe.Text = htmlCollection.length.ToString();
}
public static HTMLDocument DocCrawlWebPage(string url)
{
HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create(url);
request.UserAgent = "MyCrawler";
WebResponse response = request.GetResponse();
Stream stream = response.GetResponseStream();
StreamReader reader = new StreamReader(stream);
mshtml.HTMLDocument htmlText = new mshtml.HTMLDocument();
return htmlText;
}
håber at der er nogle der kan hjælpe!