Scannattujen sivujen läpikäynti ja OCR-hitaus

Liittynyt
10.03.2017
Viestejä
221
Morjesta!

Tosiaan kaverille apua vailla.

Gradua varten tarvitsee käydä läpi n. 10 000 sivua scannattuja pdf-sivuja. (sanomalehdistä)

Mikä olisi paras tapa käydä nuo läpi?

Tavoitteena saada haettua esim. nimellä Alvar Aalto. ja ohjelma näyttäisi mistä noita löytyisi.

Adoben OCR- löytää kyllä, mutta aika hitaalta vaikuttaa.
 
Todennäköisesti yliopiston kirjastolla on pääsy digitoituihin sanomalehtiin, kannattaa kysyä pääseekö sitä kautta tekemään aineistohakuja.
 

Uusimmat viestit

Statistiikka

Viestiketjuista
277 064
Viestejä
4 768 285
Jäsenet
77 568
Uusin jäsen
kride95

Hinta.fi

Back
Ylös Bottom