I praksis, gafle data fra en hjemmeside
Hej,Jeg kunne godt tænke mig lidt praktisk hjælp til regexps
Jeg forsøger at gafle nogle data fra en hjemmeside.
Et stykke nede på siden: http://www.euroinvestor.dk/stock/marketOverview_dk.aspx ses en tabel med aktiekurser.
Hvordan får jeg et array ud med f.eks.
MAERSK-A
52.900,00
18:00:01 28-03
i 1. sæt og
MAERSK-B
53.200,00
18:00:01 28-03
i 2. sæt og så videre helt ned til
WDH
374,00
18:00:11 28-03
I koden er det jeg leder efter f.eks. denne
<tr class="whiteRow">
<td align="center" width="15"><a href="/Alarm/NewAlert_Step2.aspx?InstrID=395357"><img src="/images/SNalert_on.gif" border="0" alt="Opret aktiealarm for A.P. Møller - Mærsk A"></a></td>
<td align="left"><span id="QUOTE:395357:DELAY:2"><a href="/Club/Realtidskurser.aspx?From=/stock/marketOverview_dk.aspx?" title="Forsinket data - Fortjener dine investeringer realtid - klik her"><img src="/images/streaming_delayed.gif" border="0" alt="Forsinket data - Fortjener dine investeringer realtid - klik her"></a></span>
<a href="http://www.euroinvestor.dk/Stock/ShowStockInfo.Aspx?StockId=395357" title="A.P. Møller - Mærsk A">
A.P. Møller - Mærsk A
</a>
</td>
<td align="right"><a href="http://www.euroinvestor.dk/stock/showstockinfo.aspx?stockid=395357" title="MAERSK-A">MAERSK-A</a></td>
<td align="right"><span id="QUOTE:395357:LAST:2">52.900,00</span></td>
<td align="right"><span class="green" id="QUOTE:395357:DIFF:2">1.200,00</span></td>
<td align="right"><span class="green" id="QUOTE:395357:DIFFPERCENT:2">2,32%</span></td>
<td align="right"><span id="QUOTE:395357:BID:2">52.700,00</span></td>
<td align="right"><span id="QUOTE:395357:ASK:2">52.900,00</span></td>
<td align="right"><span id="QUOTE:395357:VOLUME:2">927</span></td>
<td align="right"><span id="QUOTE:395357:TIMESTAMP:2">18:00:01
28-03
</span>
</td>
</tr>
Jeg tænker lidt at det måske er en ide at lave en 2. step proces.
Først finde de hits der matcher ovenstående (altså med forskellige data naturligvis). Det giver mig så 20 hits.
I de 20 hits kører jeg så en indre regexp som giver mig de 3 data jeg har brug for.
Nogen der kan få mig kørende, - evt. bare med første del?
