Notifikationer

Markér alle som læst Log ud

andreasepg Nybegynder

22. februar 2011 - 15:13 Der er 1 løsning

pdftohtml arabiske tegn

Hej,

Der er følgende installeret på den Ubuntu server jeg kører på: http://linux.die.net/man/1/pdftohtml
Jeg bruger det til at konvetere PDF filer til XML som jeg derefter kan parse.

Programmet bliver kaldt igennem PHP:
exec("/usr/bin/pdftohtml 2>&1 -xml <some-path>");

Mit problem opstår når jeg vil konvetere en PDF fil med arabiske bogstaver, de bliver simpelthen bare ignoreret - og jeg får et tomt XML feed. (Tal og latinske bogstaver bliver korrekt oversat).

Jeg prøver at parse følgende PDF:
http://www.dmi.gov.ae/press/uploads%5C2011%5CMar%5Cdocs%5CLarge_260.pdf

Synes godt om

andreasepg Nybegynder

11. april 2011 - 11:38 #1

lukker.
ingen løsning

Synes godt om

Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Følg dette spørgsmål

Opret Preview

Se alle it-kurser fra Computerworld Kurser

IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Se alle it-kurser

Flere spørgsmål fra Andet software kategorien

Titel	Indlæg	Oprettet	Seneste aktivitet
Problem med "Explorer Patcher" (File Explorer i Win 11) Af ErikHg i Andet software	3	26/06/202621:22	27/06/202615:16
Windows 10 - Stadigvæk Af Lemming@privat.dk i Andet software	3	16/06/202622:37	22/06/202610:53
Ai gemme en Ai chat? Af nu_igen i Andet software	3	16/06/202609:28	16/06/202618:51
Mere svindel fra YOUSEE ? Som afsender? Af nu_igen i Andet software	3	07/06/202608:17	08/06/202612:36
Nyåbnede sider flimrer på Android tablet, hvorfor Af annam i Andet software	2	21/05/202611:48	21/05/202612:13

Se alle spørgsmål i kategorien Opret spørgsmål

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester

Alle kategorier på Eksperten

Seneste artiklerRSS

14:00

Ugen i tech: Toyota går langt for at efterligne benzinbilen: Vil udvikle en elbil, der kan gå i stå / Meta presser prisen i bund på AI-briller

26/06

Disse tre gadgets har fulgt mig igennem mit vægttab: Sådan har de fungeret og hjulpet mig

26/06

Først lukkede USA for Anthropic-model: Nu presses OpenAI af Det Hvide Hus

26/06

Nørgaard: Apple er centrum i farlig måde at regulere på, der kun kan føre til dårlige ting - og jeg har endda prøvet det selv

26/06

Nye spor peger i denne retning: Stod de bag et af verdenshistoriens mest skadelige hacker-angreb?

26/06

Itm8 har tabt knap to milliarder kroner på fire år: Nu skyder ejeren penge ind

26/06

Fortsætter som ene-leverandør: Netcompany kommer til at sidde tungt på central opgave for den danske stat i mange år

26/06

Amerikansk datagigant klar med plan for digital suverænitet: ”Vi giver kunderne fuld kontrol”

26/06

Norlys sælger Mjølner Informatics til konsulentgigant efter blot fire års ejerskab

26/06

Novo-ejer og statens superfond investerer milliarder i europæisk techfond

26/06

Derfor er datagrundlaget alfa og omega for AI – sådan får du styr på det

Vis flere artikler

IT-JOB

NOVAX A/S

Developer

Netcompany A/S

Data Management Consultant

Everllence

Java Cloud Engineer — Build and evolve the platform behind the world’s largest engines

Mibau Stema Danmark A/S

ERP Analyst at Mibau Stema Group

Banedanmark

Teknisk Arkitekt – Netværk og Firewall

Vis flere jobs

Seneste spørgsmål Seneste aktivitet

I går 20:51	Creative Soundblaster Audigy FX v2 Af ErikHg i Andet hardware
27/0616:10	Tilbage til Outlook Klassisk design Af susalapi i E-mail programmer
27/0613:59	CRASH og så gik windows ud af vinduet og ret til helvede .... Af snestrup2000 i Windows
26/0621:22	Problem med "Explorer Patcher" (File Explorer i Win 11) Af ErikHg i Andet software
26/0611:14	Windows 10 forlænger 1 år til 12. Okt. 2027 Af Uvanga i Windows

White papers

De spørgsmål 200+ danske virksomheder stiller om print – samlet i én guide
Konica Minolta
Find den SOC-model, der virker i praksis
SecureDevice
Undgå at printeren bliver svageste led i sikkerheden
Konica Minolta
Samarbejde mellem AI og mennesker styrker sikkerheden
Konica Minolta

Flere white papers »