Scannattujen sivujen läpikäynti ja OCR-hitaus

Liittynyt
10.03.2017
Viestejä
168
Morjesta!

Tosiaan kaverille apua vailla.

Gradua varten tarvitsee käydä läpi n. 10 000 sivua scannattuja pdf-sivuja. (sanomalehdistä)

Mikä olisi paras tapa käydä nuo läpi?

Tavoitteena saada haettua esim. nimellä Alvar Aalto. ja ohjelma näyttäisi mistä noita löytyisi.

Adoben OCR- löytää kyllä, mutta aika hitaalta vaikuttaa.
 
Liittynyt
06.09.2017
Viestejä
56
Todennäköisesti yliopiston kirjastolla on pääsy digitoituihin sanomalehtiin, kannattaa kysyä pääseekö sitä kautta tekemään aineistohakuja.
 
Toggle Sidebar

Uusimmat viestit

Statistiikka

Viestiketjut
241 142
Viestejä
4 213 387
Jäsenet
71 009
Uusin jäsen
S0mpa

Hinta.fi

Ylös Bottom