Avatar billede younk-dk Nybegynder
26. januar 2006 - 18:00 Der er 18 kommentarer og
1 løsning

Mærkelige tegn.

Jeg har længe haft et phpbb forum, og det blev så tid til et server skifte, så jeg eksporterede databasen. Første problem var at den har lavet æøå til mærkelige tegn.

Det var let nok at rette via notesblok, søg efter tegnet og erstat det med æ ø eller å, så det passede ind i sætningerne.

Problemet er bare at den heller ikke har kunne finde ud af éáý osv. Det laver den også til en masse mærkelige fejl. Det kan da ikke passe at jeg er den eneste der har oplevet denne fejl.

Nogle der ved hvad jeg kan gøre for at få ændret det hele tilbage til dansk, så æø og å passer og éáýúó osv ikke bliver til underlige tegn.

Det skal lige siges at databasen fylder cirka 250 mb og er på mere end 2 mio linjer.

Her er en lille del af de mærkelige tegn der er i databasen:
Ã…
– =&
ö=ø
Ã…=Å
Ã¥=å
é=é
´=mellemrum
”=mellemrum
Ø=ø
Æ=æ
…=ingenting
“=ingenting
’=ingenting
‘
ü=ö
ë=e
€650
Örebro
accomplish
all…
maybe…
…
’s
osv.

Håber virkelig at der er nogle der kan hjælpe mig. Skriv hvis der er noget i ikke kan forstå.
Avatar billede webstuff Nybegynder
26. januar 2006 - 18:06 #1
Hvorfor laver du ikke et script som gør det for dig i stedet for at lave det i notesblok?
Det må da tage en krig :O
Avatar billede younk-dk Nybegynder
26. januar 2006 - 19:45 #2
Problemet er at jeg ikke ved hvad de forskellige ting betyder.
Avatar billede arne_v Ekspert
26. januar 2006 - 20:27 #3
prøv og konverter fra UTF+8 til ISO-8859-1 med et passende tool
Avatar billede younk-dk Nybegynder
26. januar 2006 - 20:49 #4
Kender du et passende tool?
Avatar billede arne_v Ekspert
26. januar 2006 - 20:58 #5
enhver god tekst editor kan goere det

linux utility iconv kan goere det

hvis du har hang til programmering er det nemt i baade Java og C#
Avatar billede younk-dk Nybegynder
26. januar 2006 - 21:44 #6
Jeg kan ikke java eller C#. Jeg køre windows, så ja, jeg er ikke ligeså nørdet som dig desværre.

Jeg sidder bare med en 250 mb txt fil, som indeholder trælse tegn, som jeg gerne vil have fjernet hurtigst mulig, så hvis du kunne være en lille smule mere specifik. Et program eller en metode til det ville være perfekt. Jeg vil gerne ofre den tid det tager så længe det kommer til at virke.

Databasen skal virke lige meget hvad. Så Hvis du ville være så rat at vise mig første step så skal jeg nok selv klare resten.


Jeg ved godt at jeg kan replace(ctrl+h) Men efter som jeg ikke ved hvad de forskellige tegn betyder er det meget svært.

Efter som det er en mysql database som bliver importeret via phpmyadmin. Kan det så være phpmyadminén der er forkert sat op?

Jeg har prøvet at ændre charset, men efter som det er den dump jeg har i forvejen der er noget galt med, kan det jo være lige meget hvad phpmyadmin står indstillet til (lige nu er den ufc8).

Jeg håber på at du har tid til at hjælpe mig, så jeg kan lære noget, for det er nok et problem jeg støder på mere end 1 gang i mit liv.


På forhånd tak.
Avatar billede arne_v Ekspert
26. januar 2006 - 21:52 #7
sandsyneligvis er det et opsaetnings problem et eller andet sted

hvad editor bruger du til at kigge paa filen med ?

har du Java installeret ?
Avatar billede younk-dk Nybegynder
26. januar 2006 - 22:59 #8
Jeg har java installeret. Men jeg bruger notesblok til at åbne filen med. Jeg har også brugt wordpad.

Du kan lige få en linje derfra:
INSERT INTO forum_forums (forum_id, cat_id, forum_name, forum_desc, forum_status, forum_order, forum_posts, forum_topics, forum_last_post_id, prune_next, prune_enable, auth_view, auth_read, auth_post, auth_reply, auth_edit, auth_delete, auth_sticky, auth_announce, auth_vote, auth_pollcreate, auth_attachments) VALUES (34, 11, 'Idéer', 'Her kan idéer til avisen skrives.', 0, 10, 100, 6, 91801, NULL, 0, 0, 0, 0, 0, 1, 1, 3, 3, 1, 1, 0);
Avatar billede arne_v Ekspert
28. januar 2006 - 03:05 #9
package january;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;

public class CharSetConvert {
    private final static String INFILE = "C:\\z1.txt";
    private final static String OUTFILE = "C:\\z2.txt";
    private final static String INCS = "UTF-8";
    private final static String OUTCS = "ISO-8859-1";
    public static void main(String[] args) throws Exception {
        BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(INFILE), INCS));
        BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(OUTFILE), OUTCS));
        String line;
        while((line = br.readLine()) != null) {
            bw.write(line);
            bw.newLine();
        }
        br.close();
        bw.close();
    }
}
Avatar billede arne_v Ekspert
28. januar 2006 - 03:06 #10
ret filnavne

compile med:
  javac CharSetConvert.java

kør med:
  java CharSetConvert
Avatar billede younk-dk Nybegynder
28. januar 2006 - 13:25 #11
Jeg har læst en masse inde på www.webcafe.dk og jeg har hentet jdk1.5.0_06 men jeg kan ikke få compile det. Du kunne vel ikke komme med en lille kort guide.
Avatar billede arne_v Ekspert
02. februar 2006 - 03:22 #12
du har installeret ?

enten ligger du java's bin dir ind i PATH

eller saa angiver du fuld sti til java og javac
Avatar billede younk-dk Nybegynder
02. februar 2006 - 22:49 #13
Har prøvet men det er meget svært. Har også oprettet 3 spørgsmål på forskellige forummer, men ingen har kunne give mig et brugbart svar på hvordan jeg får compilet det.

Jeg ved ikke om du har icq eller andet, for jeg tror at det er 200 gange hurtigere, end at du siger at jeg skal gøre noget, og det gør jeg så, og så laver dne fejl, og så skal jeg prøve noget nyt osv osv osv i en stor ring.

Jeg ved godt at det er imod ekspertens regler at få hjælp via andre stedet end på exp.dk

Men efter som scriptet ligger her, burde det vel ikke være et brud at få hjælp til at sætte det op. (min msn messenger er dellevela(at)hotmail(dot)com
Avatar billede younk-dk Nybegynder
06. februar 2006 - 22:35 #14
Arne jeg vil meget gerne i kontakt med dig. Jeg er villig til at sende hele databasen til dig, så du kan kigge på den... Er villig til at give alt, bare min database kommer til at se normal ud.

Så please svar, på en eller anden måde, (du kan godt få mit telefon nummer, hvis dette er nødvendigt)

På forhånd tak.
Avatar billede arne_v Ekspert
06. februar 2006 - 23:27 #15
kan du goere filerne tilgaengelig for download ?

(250 MB er lig ei overkanten til en email !)
Avatar billede younk-dk Nybegynder
07. februar 2006 - 07:27 #16
Kan pakke den så den fylder 12 mb som rar fil og 20 mb som zip fil. Hvad vil du have, og hvad for en mail skal jeg sende linket til... (den er uploadet på en server, men jeg vil ikke have min database med passwords og brugeroplysninger ud til alle på nettet)
Avatar billede arne_v Ekspert
07. februar 2006 - 21:07 #17
lad os prove med en 12 MB rar email

arne_v@mail.danbbs.dk
Avatar billede younk-dk Nybegynder
26. februar 2006 - 18:58 #18
Smid svar.. fik det til at virke.. tak
Avatar billede arne_v Ekspert
26. februar 2006 - 22:16 #19
ok
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
Computerworld tilbyder specialiserede kurser i database-management

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester