Scannattujen sivujen läpikäynti ja OCR-hitaus

Liittynyt
10.03.2017
Viestejä
225
Morjesta!

Tosiaan kaverille apua vailla.

Gradua varten tarvitsee käydä läpi n. 10 000 sivua scannattuja pdf-sivuja. (sanomalehdistä)

Mikä olisi paras tapa käydä nuo läpi?

Tavoitteena saada haettua esim. nimellä Alvar Aalto. ja ohjelma näyttäisi mistä noita löytyisi.

Adoben OCR- löytää kyllä, mutta aika hitaalta vaikuttaa.
 
Todennäköisesti yliopiston kirjastolla on pääsy digitoituihin sanomalehtiin, kannattaa kysyä pääseekö sitä kautta tekemään aineistohakuja.
 

Statistiikka

Viestiketjuista
281 691
Viestejä
4 838 075
Jäsenet
78 293
Uusin jäsen
loukovis

Hinta.fi

Back
Ylös Bottom