Datan hakeminen PDF-tiedostosta.

Liittynyt
26.10.2016
Viestejä
4 933
Olis pieni tarve hakee pdf tiedostoista tietoa. Ei siis muuttaa koko tiedostoa tekstiksi, vaan ottaa sivuilta tiettyjä kohtia, viedä siitä tietoa exceliin. Ongelma vain on, kun pdf saattaa olla sen 100+s, joka sivulla ei välttämättä ole tarvittavaa riviä, joillakin sivuilla kymmeniä rivejä ja näitä sitten pitäisi kerätä taulukkoon. Käsin, no jokainen arvaa paljon tuossa menee aikaa, mutta oliskos täällä jotain joka osaisi antaa vinkkejä tuon ratkaisuun?
 
Liittynyt
19.10.2016
Viestejä
1 563
Kokemusta minulla ei ole, mutta odotetusti työkaluja datan poimimiseen PDF-tiedostosta löytyy runsaasti. Neämmä esimerkiksi Scott Murray on listannut joitain työkaluja. Kuvasit poimittavan datan jokseenkin olemattomasti, joten tarkempaa apua en osaa ilman kokemusta antaa.
 
Liittynyt
26.10.2016
Viestejä
4 933
Kokemusta minulla ei ole, mutta odotetusti työkaluja datan poimimiseen PDF-tiedostosta löytyy runsaasti. Neämmä esimerkiksi Scott Murray on listannut joitain työkaluja. Kuvasit poimittavan datan jokseenkin olemattomasti, joten tarkempaa apua en osaa ilman kokemusta antaa.

Poimittava data on asiakkaan toimittama luettelo tuotteista, siihen liittyvistä erinäisistä numeerisista arvoista. Periaatteessa luetteloa voisi ajatella todella pitkänä puhelinlaskuna. Vaakariveillä on aina tiettyä tuotetta koskevaa dataa, joka pitäisi saada joiltain osin kerättyä exceliin, eikä edes kaikista tuotteista.

Käytännössä helpoin varmaan olisi kerätä aina tietty vaakarivi kerralla, mutta kun koitan acrobat dc:llä viedä sen exceliin, tulee koko roska kerralla ja solut alkaa heittelemään, enkä pysty Excelillä kovin järkevästi sorttaamaan dataa. Osa kun on ns. tuoteryhmän kokonaissaldoa ja sen kohta on pystyriveillä eri kuin yksittäisten tuotteiden. Yhtiö ei luovuta tietoa muussa kuin pdf-muodossa, jäykät paskiaiset :)

Selvensiköhän yhtään. Kiitos muuten Xiyng vastauksesta, katselen tuolta myös.
 
Liittynyt
17.10.2016
Viestejä
311
Agent Ransack - Free File Searching Utility

Tuolla voisi onnistua, tukee PDF:ää ja regexiä (jos tuttu). Tulokset pystyy exportaamaan csv tiedostona. Ei ihan auennut vielä toi datan sisältö, joten en ole varma soveltuuko sun tarkoitukseen, itsellä ei kokemusta tuosta.
 
Liittynyt
19.10.2016
Viestejä
1 563
Jos data on taulukkomuotoista, kuten kuulostaa luultavasti olevan, ainakin aiemmin linkkaamastani listastakin löytyvä Tabula kuulostaa sille, että se saattaisi osata hoitaa homman kotiin. Ylipäänsä taulukkomuotoisen datan keräämiseen luulisi löytyvän jonkin muun työkalun, jos Tabula ei toimikaan.
 

neko

ᓚᘏᗢ
Liittynyt
18.10.2016
Viestejä
3 752
Agent Ransack - Free File Searching Utility

Tuolla voisi onnistua, tukee PDF:ää ja regexiä (jos tuttu). Tulokset pystyy exportaamaan csv tiedostona. Ei ihan auennut vielä toi datan sisältö, joten en ole varma soveltuuko sun tarkoitukseen, itsellä ei kokemusta tuosta.
Itsellä ollut pitkään tuon ilmaisen jälkeen tuo Pro versio, ja ohjelma taipuu monenlaiseen etsintään. Ääni siis tuolle ilmaisellekin, oli tosi hyvä sekin.
 
Toggle Sidebar

Uusimmat viestit

Statistiikka

Viestiketjut
240 965
Viestejä
4 215 712
Jäsenet
70 983
Uusin jäsen
Kananugetti

Hinta.fi

Ylös Bottom