Dokumenttyper
De første HTML-standarder tilbød et meget simpelt sæt mærker (tags), som ikke gav de store muligheder for grafisk design. Det web med rige mediemuligheder, som vi kender i dag, blev grundlagt da Netscape indførte en lang række mærker, som kun fungerede i Netscapes egen browser. Den standard, der senere blev kendt som HTML 3.2, bygger i store træk på Netscapes mærker.
En del af skylden for webbets succes er givetvis, at Netscape blæste på de gældende standarder og indførte disse hjemmelavede tags. Men denne model viste sig snart at være en dårlig ide. Med version 4 af de to store browsere, Netscapes Navigator og Microsofts Internet Explorer, blev situationen uholdbar, da webdesignerne ofte måtte udvikle forskellige versioner af websiderne til de to browsere.
Situationen har dog udviklet sig den anden vej. Browserproducenterne er mere bevidste om standardernes betydning, blandt andet på grund af pres fra udviklere og brugere. Nytilkomne standarder som CSS, stylesheets, gør det også nemmere at udvikle websider, som ser ens ud på tværs af browsere og platforme.
Dokumenttyper
De formelle definitioner bag HTML-standarderne er hård kost at komme igennem. Men man behøver heldigvis ikke at gennemgå hele specifikationen for at kunne rette siderne ind. Der er dog visse enkelte punkter, som man skal være opmærksom på.
Flere dialekter
HTML findes i flere dialekter, og et dokuments aktuelle dialekt eller dokumenttype specificeres ved et mærke øverst i HTML-dokumentet. Dokumenttypen er meget vigtig, for ellers er det jo ikke muligt at teste, om dokumentet opfylder den givne specifikation.
Den almindelige version hedder HTML 4.01, og den nyeste version hedder XHTML, som er HTML i en udformning, der opfylder reglerne for XML-sprog. På længere sigt er det en god ide at udvikle siderne hen imod XHTML, men hvis man ikke føler sig helt parat til at forlade den gammeldags kodestil med <FONT>-mærker og så videre, skal man benytte HTML 4.01.
HTML 4.01 findes også i to versioner: En stringent version, hvor grafiske formateringsmærker er forbudt, og en overgangs-version, hvor de samme mærker er tilladt. Helt præcist er der faktisk tre versioner, hvor den sidste skal benyttes til frame-baserede sider.
Det mærke, som angiver dokumenttype, ser således ud for hver af de tre versioner:
HTML 4.01 Transitional, som altså tillader grafiske mærker:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
HTML 4.01 Strict, hvor grafisk opmærkning skal ske med stylesheets:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
Til frameset skal man benytte denne dokumenttype:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN"
"http://www.w3.org/TR/html4/frameset.dtd">
Men den skal altså kun anvendes i selve det dokument, der definerer framesettet.
Hvis man er parat til at hoppe ud i XHTML, skal man benytte tre tilsvarende dokumentdefinitioner, og dem kan man finde på World Wide Web-konsortiets hjemmeside.
Kodeeftersyn
Validering
Når først dokumentet er udstyret med en dokumentdefinition, kan man teste, hvor galt det står til med HTML-koden. Der er flere værktøjer hertil. Hvis man har en hurtig internetforbindelse kan man benytte et script på World Wide Web-konsortiets hjemmeside. Scriptet fungerer ved, at webadressen indtastes (i feltet Address), og derefter klikker man på knappen Validate. Hvis man ikke har sat sin dokumenttype i HTML-dokumentet, kan scriptet ikke validere koden, men i en snæver vending kan man sætte dropdown-listen Document Type til den type, som man har ambitionerne om at opfylde. Man kan også oploade en fil ved at klikke på linket Upload.
Scriptet giver gode og klare fejlmeddelelser med præcise angivelser af, hvor fejlen opstår, og hvad der er galt.
Et lidt nemmere mulighed, specielt hvis man arbejder offline, er at benytte det lille freeware-program TidyGUI, som kan downloades fra W3C's website.
Programmet er ganske simpelt at bruge, og ud over at validere dokumenterne renser det også koden op. Man åbner det dokument, man ønsker at validere, med knappen Browse. Derefter meddeler programmet, hvad det fandt af fejl, og ved at klikke på knappen Show output kan man gemme det rettede dokument. Programmet kan også klare ASP og PHP-dokumenter.
Hvis der er egentlige fejl i HTML-koden, for eksempel mærker som ikke er rigtigt indlejret blandt andre mærker, giver programmet dog op. Så må man selv gå ind og rette i koden, før at TidyGUI kan gøre rent for en.
Der er en hel del konfigurationsmuligheder i programmet, som for eksempel muligheden for at overskrive input-dokumenterne, og det hele er lige ud af landevejen.
Når man så har fået koden rengjort, kan man besmykke sin webside med et passende emblem fra World Wide Web-konsortiet, som kan vise hele verden, at man også er renfærdig indeni.