Automaattiset snapshotit web sivuista tiettynä ajankohtana

Liittynyt
05.01.2021
Viestejä
5 047
Olisi tarve jollekin ohjelmalle, totta kai ilmaiselle, joka pystyisi ottamaan snapshotteja tietyistä web sivuista haluamanani ajankohtana ja tallentamaan ne kuvana tietyyn paikkaan. Googlaiin asiaa , mutta en oikein päässyt mihinkään lopputulokseen. Näyttäisi siltä että tälläisiä on, mutta en sellaista kuitenkaan onnistunut löytämään. Osaisiko joku vinkata ?
 
Liittynyt
17.10.2016
Viestejä
384
Linuxille löytyy useampikin komentorivityökalu tuohon snapshottien ottoon. Semmosen ajastaa sitte cron:lla tekee sen automaagisesti..

Googleen vaikkapa "linux webpage snapshot" hakusanaksi.
 
Liittynyt
05.01.2021
Viestejä
5 047
Linux pohjaiset ratkaisut ei tässä tapauksessa tule kysymykseen.
Ja hei, kysyjä on aika kädetön näissä asioissa.
 
Liittynyt
17.10.2016
Viestejä
5 736
Onnistuu ainakin Chromella ja Firefoxilla suoraan komentoriviltä. Esim. Chromella:
Koodi:
chrome.exe --headless --screenshot="C:\polku_kuvalle.png" "https://www.google.com"
Ajastuksen ja polkujen käsittelyn ym. voi sitten tehdä haluamallaan työkalulla.
 
Liittynyt
17.10.2016
Viestejä
5 515
Onnistuu ainakin Chromella ja Firefoxilla suoraan komentoriviltä. Esim. Chromella:
Koodi:
chrome.exe --headless --screenshot="C:\polku_kuvalle.png" "https://www.google.com"
Ajastuksen ja polkujen käsittelyn ym. voi sitten tehdä haluamallaan työkalulla.
Hittolainen, tuo onkin noin yksinkertaista. Tuo saattoi ratkaista yhden pitkään duunissa hiertäneen ongelman jos tuohon saa vielä pari asetusta jotenkin ympättyä mukaan. "Virallinen" raporttigeneraattori kun työstää raporttia ikuisuuden ja jollakin vastaavalla tyylillä generoi jokaisen kuvatiedoston erikseen ja on varsin herkkä erilaisille virhetilanteille. Jos itse saisi määrättyä että generoisi kuvatiedoston tai pdf:n sopivilla asetuksilla nettisivusta niin virallinen raporttigeneraattori vaihtuisi välittömästi omaan versioon. Pitääkin vähän tutustua tuohon headless -tilan screenshot-toimintoon kun kuitenkin saan selaimessa näkymään halutun raportin halutulla tavalla, jos sen saisi vaan käännettyä pdf:ksi jollain helpolla automaattisella tavalla.
 
Liittynyt
20.10.2016
Viestejä
6 267
Sattu tulemaan tuollainen vastaan, jos kiinnostaa testata, näytti toimivan ihan OK pikaisella testillä...
Löytyy precompiled binaarit Windowsillekin, ihan portable mallia, ei siis tarvii edes asennella mitään.

wkhtmltopdf and wkhtmltoimage are open source (LGPLv3) command line tools to render HTML into PDF and various image formats using the Qt WebKit rendering engine. These run entirely "headless" and do not require a display or display service.

Ja onnistuu myös Firefoxilla komentoriviltä:
Koodi:
firefox.exe --headless --screenshot [KuvanNimi].png [URL]
 
Viimeksi muokattu:
Liittynyt
05.01.2021
Viestejä
5 047
Kiitos vinkistä, tuo komentorivi toimii....

Mutta.....Yksi pieni ongelma minun tapauksessa. Sivu jolta haluan snapshotin, vaatii kirjautumisen, ja nyt tuo ottaa snaphotin kirjatumissivusta. Ei näytä olevan vaikutusta vaikka selaimessa on jo auki sivu johon on kirjauduttu. Ilmeisesti tuo avaa uuden chromen tehdäkseen hommansa.

Saisiko tuon toimivaan jotenkin siten että ei avaisi uutta chromesta, vaan käyttäisi jo auki olevaa chromea, jolla on kirjauduttu jo ko. sivulle ?

mitä htuo headless tekee ?

chrome.exe [URL ] avaa kilisti sivun uuteen välilehteen....ilman että jää jumiin kirjautumissivuun
 
Viimeksi muokattu:
Liittynyt
20.10.2016
Viestejä
6 267
Hittolainen, tuo onkin noin yksinkertaista. Tuo saattoi ratkaista yhden pitkään duunissa hiertäneen ongelman jos tuohon saa vielä pari asetusta jotenkin ympättyä mukaan. "Virallinen" raporttigeneraattori kun työstää raporttia ikuisuuden ja jollakin vastaavalla tyylillä generoi jokaisen kuvatiedoston erikseen ja on varsin herkkä erilaisille virhetilanteille. Jos itse saisi määrättyä että generoisi kuvatiedoston tai pdf:n sopivilla asetuksilla nettisivusta niin virallinen raporttigeneraattori vaihtuisi välittömästi omaan versioon. Pitääkin vähän tutustua tuohon headless -tilan screenshot-toimintoon kun kuitenkin saan selaimessa näkymään halutun raportin halutulla tavalla, jos sen saisi vaan käännettyä pdf:ksi jollain helpolla automaattisella tavalla.
Tuollainen tuli vastaan tuohon PDF asiaan:

The --print-to-pdf flag creates a PDF of the page

Kiitos vinkistä, tuo komentorivi toimii....

Mutta.....Yksi pieni ongelma minun tapauksessa. Sivu jolta haluan snapshotin, vaatii kirjautumisen, ja nyt tuo ottaa snaphotin kirjatumissivusta. Ei näytä olevan vaikutusta vaikka selaimessa on jo auki sivu johon on kirjauduttu. Ilmeisesti tuo avaa uuden chromen tehdäkseen hommansa.

Saisiko tuon toimivaan jotenkin siten että ei avaisi uutta chromesta, vaan käyttäisi jo auki olevaa chromea, jolla on kirjauduttu jo ko. sivulle ?

mitä htuo headless tekee ?

chrome.exe [URL ] avaa kilisti sivun uuteen välilehteen....ilman että jää jumiin kirjautumissivuun
Tuo kirjautumisen vaatimus tuokin sitten ihan omat ongelmansa ja vaatisi että softa tukisi esim. cookies tiedoston hyväksikäyttämistä, siinäpä sitten haastetta löytää simppeli softa. Jos haluaa alkaa kikkailee, niin sitten löytyy:

Paljon on myöskin keskustelua tuosta selaimien Headless tilan käytöstä ja Cookies hyödyntämisen ongelmista jo tovin ajan, eli tiete ei onnistu enään helposti tuollainen senkään kautta.

Ja tuossa selostusta, mikä tuo Headless mode on:
 
Liittynyt
17.01.2018
Viestejä
2 119
Wget/curl voisi osata kirjautumisen, saattaisi onnistua jos pystyisi hakemaan sivun ja en jälkeen wkhtmltopdf.
Tosin jos on joku raportointiväline (cognos/tableau/jne) niin yleensä menee hankalaksi.
 
Liittynyt
05.01.2021
Viestejä
5 047
Saako komentoriviltä ajetua graafisen käyttöliittymän omaavaa chromea vastaavasti kuin tuo ylläoleva. Tuo ylläoleva käynnistää chromen ilman graafista käyttöliittymään ja kirjautumisongelma johtuu siitä?
 
Liittynyt
16.10.2016
Viestejä
2 434
Ja onnistuu myös Firefoxilla komentoriviltä:
Koodi:
firefox.exe --headless --screenshot [KuvanNimi].png [URL]
Tota ei muistaakseni kannata ajaa ilman että tekee uuden profiilin koska headless mode saattaa kirjoittaa jotain yli profiiliin ja sen jälkeen normaali graafista käynnistäessä voi joutua käymään sen troubleshoot/refresh Firefox jutun läpi ja menettää profiilidataa.
 
Liittynyt
16.10.2016
Viestejä
2 434
Saako komentoriviltä ajetua graafisen käyttöliittymän omaavaa chromea vastaavasti kuin tuo ylläoleva. Tuo ylläoleva käynnistää chromen ilman graafista käyttöliittymään ja kirjautumisongelma johtuu siitä?
Kirjautuminen ei ole sinänsä kiinni graafisuudesta, mutta ainakaan oletuksena (jos osaa ollenkaan) ei käytä jo olemassa olevaa profiilia jossa käyttäjädata ja keksit olisi tallessa.

Tuo jo linkattu Puppeteer osaa kirjautumisen ja käyttäjädatan tallentamisen mutta sen kanssa ei voi paljon saada aikaan ilman Javascriptin osaamista. Ehkä googlettanalla löytyy jonkun valmiiksi tekemä kun lienee aika yleinen tarve.
 
Toggle Sidebar

Statistiikka

Viestiketjut
242 396
Viestejä
4 235 968
Jäsenet
71 197
Uusin jäsen
Fomppa

Hinta.fi

Ylös Bottom