Avatar billede johan.o Nybegynder
10. november 2005 - 22:36 Der er 7 kommentarer og
1 løsning

Indhold af 'generic character types'

Er der nogen der kan hjælpe med et link til, eller information om, præcis hvilke karakterer disse 'generic character types' indeholder ?

Mere præcis om indholdet af \w, da \d og \s umiddelbart virker logiske nok. Åbenbart variere indholdet alt efter sprog så først er jeg selvfølgelig intresseret i DK, men vil da meget gerne se andre også.

Mvh. Johan
Avatar billede roenving Novice
11. november 2005 - 09:12 #1
Du kan f.eks. kigge her: http://www.regular-expressions.info/reference.html

-- men jeg har ikke nærlæst den, så der kan være andre fejl end den email-regexp, som står på deres index-side ...

-- og det hører da med, at de forskellige regexp-motorer har forskellig opfattelse af, hvad der er word characters (\w), og det er, som du nævner, ydermere afhængigt af locale !o]

-- og der såvidt jeg husker også en del syntaktiske forskelle i forskellige varianter, altså skal du ikke forvente, at alt virker fuldstændig ens i f.eks. et Perl-script og et javascript med hensyn til dette (eller i forskellige varianter af ECMA-script !-)
Avatar billede johan.o Nybegynder
11. november 2005 - 10:57 #2
Nu stopper I :), ikke nok med, at det nærmest er umuligt at få de forskellige browsere til at fatte det samme stykke kode ens, så viser det sig også at de ikke engang er enige om hvad der er bogstaver......:) Helt ærligt, for mange kokke :)

Da alle de stor kanoner inde for grundkodning af UA og regexp-motorer læser med her :) så lad mig opfordrer til at man tager hele banden, maser dem ned i en standard form, lukker låget, ryster kraftigt, koger, brænder og steger, og lader stå på køl en 14 dages tid, indtil deres opførselsmønster er ens, og først når det er 100% ens, lukker dem ud i det pulserende liv igen :) - Og nej jeg er ikke spor frustreret :)

Mvh. Johan
Avatar billede Slettet bruger
11. november 2005 - 11:59 #3
Forskellene er nu ikke så voldsomme igen, med mindre du begynder at bruge look-back eller navn-givne matchgrupper på det rimeligt basale plan fungerer de ens.

At der er forskelle i locals er jo fordi alfabeterne i forskellige sprog indeholder forskellige definitioner og tegn med forskellig betydning. Det er bare virkeligheden og den passer desværre sjældent til vores ønsker ;)
Avatar billede johan.o Nybegynder
11. november 2005 - 13:22 #4
>>kryptos: At der er forskelle i locals er jo fordi alfabeterne i forskellige sprog indeholder forskellige definitioner og tegn med forskellig betydning.

Ja, men sammenlign det med hvad roenving skriver :

-- og det hører da med, at de forskellige regexp-motorer har forskellig opfattelse af, hvad der er word characters (\w), og det er, som du nævner, ydermere afhængigt af locale !o]

ordet der skaber irritation er jo _ydermere_ for det betyder jo at der er forskel i det basale indhold af \w selv om sproget er det samme. Og en hurtig test i IE og FF bekræfter jo at IE ikke inkluderer f.eks. äëüï men det gør FF (gecko) :(

Mvh. Johan
Avatar billede Slettet bruger
11. november 2005 - 14:19 #5
Er det noget du praktisk skal bruge eller er det en teoretisk diskusion?
Avatar billede johan.o Nybegynder
11. november 2005 - 15:51 #6
Tja, det er naturligvis tæt knyttet til dette spørgsmål http://exp.dk/spm/663625 som du jo også er aktiv i - og tak for det.

Det reg_exp jeg arbejder med i det spørgsmål opfører sig jo forskelligt alt efter hvilken browser (IE / gecko) der eksekverer det og det skyldes 'problemet' med indholdet af \w

Men det er nok lukketid, jeg har jo erfaret at der er forskel på indholdet fra browser til browser og så er det jo svært at vise en oversigt som jeg efterspørger.

roenving, hvis du smider et svar så kvitterer jeg.

Mvh. Johan
Avatar billede roenving Novice
13. november 2005 - 01:41 #7
Velbekomme '-)
Avatar billede roenving Novice
13. november 2005 - 02:06 #8
-- og tak for point ;~}
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Kurser inden for grundlæggende programmering

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester