Scannattujen sivujen läpikäynti ja OCR-hitaus

Liittynyt
10.03.2017
Viestejä
181
Morjesta!

Tosiaan kaverille apua vailla.

Gradua varten tarvitsee käydä läpi n. 10 000 sivua scannattuja pdf-sivuja. (sanomalehdistä)

Mikä olisi paras tapa käydä nuo läpi?

Tavoitteena saada haettua esim. nimellä Alvar Aalto. ja ohjelma näyttäisi mistä noita löytyisi.

Adoben OCR- löytää kyllä, mutta aika hitaalta vaikuttaa.
 
Liittynyt
06.09.2017
Viestejä
56
Todennäköisesti yliopiston kirjastolla on pääsy digitoituihin sanomalehtiin, kannattaa kysyä pääseekö sitä kautta tekemään aineistohakuja.
 
Toggle Sidebar

Statistiikka

Viestiketjut
248 320
Viestejä
4 334 829
Jäsenet
72 165
Uusin jäsen
toni.kangasluoma

Hinta.fi

Ylös Bottom