Scannattujen sivujen läpikäynti ja OCR-hitaus

Liittynyt
10.03.2017
Viestejä
221
Morjesta!

Tosiaan kaverille apua vailla.

Gradua varten tarvitsee käydä läpi n. 10 000 sivua scannattuja pdf-sivuja. (sanomalehdistä)

Mikä olisi paras tapa käydä nuo läpi?

Tavoitteena saada haettua esim. nimellä Alvar Aalto. ja ohjelma näyttäisi mistä noita löytyisi.

Adoben OCR- löytää kyllä, mutta aika hitaalta vaikuttaa.
 
Todennäköisesti yliopiston kirjastolla on pääsy digitoituihin sanomalehtiin, kannattaa kysyä pääseekö sitä kautta tekemään aineistohakuja.
 

Statistiikka

Viestiketjuista
277 108
Viestejä
4 767 383
Jäsenet
77 582
Uusin jäsen
Matias1

Hinta.fi

Back
Ylös Bottom