09. september 2009 - 00:27Der er
5 kommentarer og 1 løsning
Få fat på feed fra ext. website med reg.exp
Hey
Jeg har behov for at kunne fange rss-feed'et fra et eksternt website. Det vil sige at jeg, ud fra hele HTML'en, skal fange noget der minder om:
link rel="alternate" type="application/rss+xml" href="/feed/" link href="/feed/" rel="alternate" type="application/rss+xml" link type="application/rss+xml" href="/feed/" rel="alternate"
Fælles for alle er vel kun, at de har attributterne rel="alternate" og type="application/rss+xml"
I øvrigt kan link-tagget sikkert inkludere flere valgfrie attributter end de 3 jeg skitserede (type, href og rel).
Nårh ja... Og det eneste jeg skal have fat i, er egentlig url'en der står i link taggets 'href'. Altså selve rss-feedet.
Fik det testet, og nu sidder jeg med en MatchCollection hvori der kan ligge både stylesheet, shortcuticon, bookmark, rss feed osv... Altså alle link-tags på siden.
Jeg kunne selvfølgelig splitte strengen selv med noget .net, men det kunne være optimalt at opnå med regular expression. :)
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.