Tekstgenkendelse på nettet

På hjemmesiden Free online OCR får man lige præcis det som navnet antyder – nemlig gratis tekstgenkendelse. Man uploader blot et billede (eller en pdf) og så omsætter hjemmesiden hele herligheden til skøn og helt uformateret tekst

For at teste tjenesten har jeg brugt min mobiltelefon, hvilket jo ikke giver de skarpeste billeder. Det tager hjemmesiden dog ikke så tungt og genkender teksterne rigtig godt. Sværere er det dog at forstå dansk. Systemet er kun lavet til de store vestlige sprog, og kan derfor ikke genkende særlige danske bogstaver, ligesom systemets selvkorrektion ikke klarer opgaven helt så flot som med engelske dokumenter. Sprogfamilieskaber fornægter sig dog ikke og resultatet bliver lidt bedre når man fortæller systemet at det danske dokument er skrevet på tysk!

Man undgår altså ikke en gennemgang af den genkendte tekst og det begrænser naturligvis mulighederne for at digitalisere store mængder tekst – en begrænsning der yderligere skærpes ved en begrænsning i systemet på 10 uploads i timen.  Men systemet er let at bruge i en snæver vending, selvom det (endnu) ikke kan konkurrere med en god scanner med et godt OCR-program og så er det ganske gratis.

freeocr

Her ses den originale tekst (et mobilfoto af en tekst i et blad) og den scannede tekst. Man slipper ikke for en manuel gennemgang, men i hovedtræk er det gået nogenlunde for programmet.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *