Generer PDF-filer fra HTML-sider

HTMLDOC er et avanceret open source program ,der kan generere avancerede PDF-filer fra HTML-dokumenter. Programmet kan benyttes som en almindelig applikation eller benyttes som cgi-script på webserveren eller i mange andre sammenhænge for eksempel i forbindelse med PHP.

Praktisk PDF

HTMLDOC er et open source program fra firmaet Easy Software Products, der kan konvertere HTML-filer til Adobe Acrobat-filer, som bedre er kendt under dokumenttypenavnet PDF, Portable Document Format. HTMLDOC findes i en version med grafisk brugergrænseflade, så man kan teste mulighederne før at man investerer søvnløse nætter i implementeringen af HTMLDOC.

Lad det være sagt med det samme: HTMLDOC er ikke gearet til smarte produktbeskrivelser, salgsmateriale eller andet, der skal imponere eller sælge. Men derfor kan programmet have mange gode anvendelsesmuligheder alligevel. I de sammenhænge, hvor virksomheden eller organisationen har større informationsmængder af teknisk eller dokumenterende art, betyder det præsentationsmæssige som regel ikke det store. Derudover ser de PDF-filer, som HTMLDOC genererer, faktisk ganske præsentable ud. HTMLDOC bibeholder links i konverteringen og kan automatisk generere indholdsfortegnelser i større dokumenter. Det sidste kræver dog, at det HTML-forlæg, der benyttes, overholder nogle basale standarder.

Umiddelbart er det måske ikke lige til at se, hvorfor man skulle ønske at konvertere HTML-filer til PDF-dokumenter, da de fleste browsere jo udmærket kan printe. Men PDF giver afsenderen typografisk sikkerhed for, at dokumentet ser helt ens ud hos modtageren som hos afsenderen. Samtidig er det lidt bøvlet at skulle distribuere HTML-filer med eksterne grafikfiler og så videre. Selv om at PDF-filer er en del mere fyldige end HTML, så er det alt andet lige en meget nemmere oplevelse for modtageren af dokumentet, der slipper for at rode med udpakningsværktøjer.

Denne fil er genereret udfra en HTML-side hos World Wide Web-konsortiet. Det er et nemt forlæg, da W3 overholder dets egne standarder særdeles strengt, og resultatet er da også ganske nydeligt - med klikbar indholdsfortegnelse.

Kildekode og compilere

En oplagt anvendelse er at benytte HTMLDOC i forbindelse med såkaldte Content Management Systems - applikationer, som styrer og formidler publicering på web for brugere, der ikke nødvendigvis har tekniske forkundskaber.

Et eksempel genereret fra en artikel på PC World Online. Skrifttyper og billeder bibeholdes.

Windows GUI-versionen
Den eneste binære fil, man kan downloade til Windows, er en version af HTMLDOC med en rudimentær grænseflade. Den kan faktisk udmærket benyttes til at generere PDF-filer, men hvis man har behov for at skabe mange PDF-filer "i hånden" er man bedre tjent med et kommercielt alternativ. Hvis man kun skal lave få stykker, kan den dog udmærket bruges. Men ellers kan den benyttes til at eksperimentere med de muligheder, som programmet har.

Man kan i øvrigt ikke downloade binære versioner af kommando-linie udgaven af HTMLDOC. Enten må man købe en version eller selv downloade og kompilere kildekoden. Det sidste kan både lade sig gøre med Visual C++ og GCC, og der følger fyldig dokumentation med, så det skulle ikke være det store problem, hvis man kender lidt til kompilering.

GUI-versionen

GUI-versionen er nem nok at anvende: Under fanebladet Input vælges input-HTML-filerne, og dernæst skal man angive en sti med filnavn under fanebladet Output.

Derefter klikkes knappen Generate, og programmet meddeler, om konverteringen var en succes eller angiver eventuelle fejl, der er opstået undervejs.

Der følger som sagt en særdeles fyldig manual med programmet, og her kan man blandt andet se, hvorledes kommando-linie-versionen kompileres og bruges fra et terminalvindue eller via Perl, PHP, C eller Java. Eksemplerne er gennemarbejdede, og i tilfældet med integrering med PHP får man et helt køreklart script med, så man kan komme i gang med det samme.

De mange parametre, som man kan benytte i forbindelse med kommando-linieversionen er også gennemgående dokumenteret.

Programmet, kildekoden og dokumentationen kan downloades fra Easy Software Products' hjemmeside.




Brancheguiden
Brancheguide logo
Opdateres dagligt:
Den største og
mest komplette
oversigt
over danske
it-virksomheder
Hvad kan de? Hvor store er de? Hvor bor de?
Konica Minolta Business Solutions Denmark A/S
Salg af kopimaskiner, digitale produktionssystemer og it-services.

Nøgletal og mere info om virksomheden
Skal din virksomhed med i Guiden? Klik her

Kommende events
Computerworld Summit 2025, København – AI transforming business

Årets uomgængelige konference for dig, der er med til at træffe beslutninger om din organisations teknologiske fremtid, og vil have det samlede overblik over aktuelle tendenser i IT-branchen.

27. maj 2025 | Læs mere


Årets CIO 2025

Vi skal finde Årets CIO 2025 og den kvinde eller mand, som i et helt år kan bryste sig af at være landets bedste CIO.

03. juni 2025 | Læs mere


Computerworld Summit 2025, Aarhus – AI transforming business

Årets uomgængelige konference for dig, der er med til at træffe beslutninger om din organisations teknologiske fremtid, og vil have det samlede overblik over aktuelle tendenser i IT-branchen.

03. juni 2025 | Læs mere