09. september 2009 - 00:27Der er
5 kommentarer og 1 løsning
Få fat på feed fra ext. website med reg.exp
Hey
Jeg har behov for at kunne fange rss-feed'et fra et eksternt website. Det vil sige at jeg, ud fra hele HTML'en, skal fange noget der minder om:
link rel="alternate" type="application/rss+xml" href="/feed/" link href="/feed/" rel="alternate" type="application/rss+xml" link type="application/rss+xml" href="/feed/" rel="alternate"
Fælles for alle er vel kun, at de har attributterne rel="alternate" og type="application/rss+xml"
I øvrigt kan link-tagget sikkert inkludere flere valgfrie attributter end de 3 jeg skitserede (type, href og rel).
Nårh ja... Og det eneste jeg skal have fat i, er egentlig url'en der står i link taggets 'href'. Altså selve rss-feedet.
I dette særtema om aspekter af AI ser vi på skiftet fra sprogmodeller til AI-agenter, og hvordan virksomheder kan navigere i spændet mellem teknologisk hastighed og behovet for menneskelig kontrol.
Fik det testet, og nu sidder jeg med en MatchCollection hvori der kan ligge både stylesheet, shortcuticon, bookmark, rss feed osv... Altså alle link-tags på siden.
Jeg kunne selvfølgelig splitte strengen selv med noget .net, men det kunne være optimalt at opnå med regular expression. :)
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.