Avatar billede KurtG Professor
06. april 2026 - 13:13 Der er 9 kommentarer og
1 løsning

Batch OCR

Jeg har nok ikke helt ramt rette gruppe, men synes ikke at jeg finde finde en der rammer bedre.

Jeg bruger FineReader 14 (FR14) til OCR, og den virker fint til det meste.
Men jeg har nu brug for at lave OCR på flere tusinde grafikfiler, og gemme hver med samme filnavn i pdf-format.
Det ser ikke ud til, at  FR14 kan det!

Findes der et program der kan gøre det (med nogenlunde samme kvalitet i OCR som FR14), og som er til at betale inden for et hobbybudget?
Avatar billede ejvindh Ekspert
07. april 2026 - 17:06 #1
Tesseract kan bruges til kommandolinje OCR:
https://tesseract-ocr.github.io/tessdoc/Command-Line-Usage.html
https://github.com/tesseract-ocr/tessdoc

Hvordan kvalitetsforholdet er mellem FineReader og Tesseract ved jeg ikke. Jeg plejer selv at være ok tilfreds med Tesseract, men det er rigtigt mange år siden jeg har prøvet FR.
Avatar billede KurtG Professor
07. april 2026 - 17:59 #2
Tak for tipset, jeg prøver det hvis jeg kan finde ud af det med kommandilinje.
Avatar billede KurtG Professor
08. april 2026 - 00:13 #3
Jeg har lige kikket på linket, og det ser indviklet ud. Det er vist noget Linux, og det har jeg ikke forstand på og heller ikke mod på at sætte mig ind i.

Men jeg har begået en dødssynd ved ikke at give tilstrækkelige oplysninger i starten:
Jeg manglede at fortælle, at output skal være en søgbar pdf-fil og det tror jeg ikke er muligt med det foreslåede.
Jeg undskylder for ulejligheden.
Avatar billede kulawig Guru
08. april 2026 - 08:24 #4
https://help.abbyy.com/en-us/finereader/16/user_guide/commandline_save/

det burde være en løsning med en bat fil der kigger i specifik mappe og læser xxx.gif og gemmer som xxx.pdf
Avatar billede supportsiden Professor
08. april 2026 - 11:59 #5
PDF24 kan rigtig mange ting, måske du kan bruge det ?
https://www.pdf24.org/en/
rug download versionen, så du ikke sender dine data ud
Avatar billede supportsiden Professor
08. april 2026 - 12:09 #6
Free OCR software
Windows  app :
https://www.microsoft.com/da-dk/p/a9t9-free-ocr-software/9nblgggz5nsn?activetab=pivot:overviewtab

Windows program - også til GPO :
https://www.naps2.com/

Du kan også OCR genkende med OneNote
Avatar billede ejvindh Ekspert
08. april 2026 - 18:49 #7
#3: jeg synes nu også det ser ud til, at der findes en Windows udgave på den GitHub side, som jeg linker til. Men ja, jeg kører selv med Linux, så jeg har ikke testet udgaven til Windows.

Og programmet laver en søgbar udgave i samme format som input filen.
Avatar billede ole_madsen Ekspert
08. april 2026 - 21:37 #8
En betalingsudgave kunne være https://www.tungstenautomation.com/products/paperport - Paperport har været på markedet som dokument-håndteringssystem næsten så længe som FineReader, og min lidt ældre version 14.0 kan i hvert fald markere en mappe fuld af JPG filer og konvertere til PDF - og herefter gør dem søgbare med OCR.

Paperport har skifte ejer så mange gange at jeg tvivler på nogen kan huske dem alle i hovedet - og ejes åbenbart i dag af "Tungsten". Det eneste jeg er lidt træt af er, at den grafiske visning af dokumenter bliver en anelse træg, når man når op over 100 dokumenter i en mappe - men måske har de fået bugt med det i nyeste version...
Avatar billede KurtG Professor
19. april 2026 - 19:02 #9
Jeg har nu købt PDF24 og prøvet den.
Den virker udmærket men er lidt langsommere end FR14. Desuden ser det ud til, at den skal køres med alle filerne for at gemme som PDF og igen med alle filer for at gemme til Txt-filer.

I mellemtiden har jeg gransket FR14 nøjere og fundet ud af, at den faktisk kan gemme som enkeltfiler selv om den skal lave OCR på flere hundrede sider på een gang. Det indstilles blot først når der er kørt OCR og der skal gemmes.
Og den behøver ikke at genkende alle filer igen for at gemme som txt.

Så jeg har altså ulejliget jer uden grund! Men så har jeg jo fået indsigt i andre programmer til formålet.
Tak til jer alle.
Avatar billede KurtG Professor
20. april 2026 - 09:24 #10
Jeg har prøvet at lave OCR på 200 sider, der blev gemt som enkeltsider i *pdf og *.txt.
PC: Lenovo med AMD Ryzen 7000 og 2TB RAM.
Det gav følgende resultat:
OCR med FR14: 7 min. Gemme som PDF:  3 min. Gem som Txt: < 1 min. 
OCR med FR14 gemt som PDF og Txt: Ialt 11 min

OCR med PDF24: 22 min.  Gemme som PDF:  1 min.  Ialt 23 min.
OCR med PDF24: 22 min.  Gemme som Txt:  1 min.  Ialt 23 min.
OCR med PDF24 gemt som PDF og Txt: Ialt 46 min
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview
Kategori
IT-kurser om Microsoft 365, sikkerhed, personlig vækst, udvikling, digital markedsføring, grafisk design, SAP og forretningsanalyse.

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester