Projekti MBnet Apaja

Liittynyt
11.08.2017
Viestejä
142
MBnet, tuo vuosina 1994-2002 toiminut purkki, sekä sen sisältämä tiedostoalue Apaja, on varmasti monelle täällä tuttu. Purkissa oli tallennettuna suuri määrä kotimaisia pikkupelejä, tracker-musiikkia yms. tiedostoja, joita ei välttämättä ole enää mistään saatavilla.
Purkki on tallennettu kuitenkin kansalliskirjastoon, jonka vapaakappaletyöasemilta voi selata aineistoja tilauksesta, mutta ei kopioida.

Archive.orgista löytyy joitakin osioita, kuten trackeribiisejä ja oudot/pilapelit. Myös CD-levyinä myytyjen vuosikertalehtien mukana tuli otos Apajan tiedostoista kyseiseltä vuodelta. Archivesta kuitenkin puuttuu 1998 ja 1999 vuosikertalevyjen tiedostot, joten jos joltakin ne löytyy, laittakaa ihmeessä jakoon? Kyseessä on kuitenkin freeware- ja shareware -tiedostoja, joten tuskin tarvitsee asian lakiteknistä puolta kuumotella. 94-95, 96 ja 97 vuosikertalevyt löytyvät. Viimeinen vuoden 2000 vuosikertakokoelma sisältää 1994-2000 PDF-näköislehdet, mutta ei sisällä MBnet-tiedostoja.
Edit: vuosikertalevyt toimitettu! Kiitokset AveragePizzaBuffetFan.

Lisäksi oli vielä 1997 alkaen julkaistut Huvi- ja hyöty CD:t, joista löytyy myös pieni otos tiedostoista. Ne lienee kaikki archivessa, ainakin 1990-luvulla julkaistut. 1995 julkaistiin korppu, mutta mahdollisesti 1996 julkaistua korppua ei löydy. Se saattoi tosin olla vain 1995 korpun päivitetty uusintapainos. Kiitokset J. Sirénille muisteluista.

---

Itse asiaan: Aloin pohtia paljonko noita Apajan tiedostoja olisi yhä saatavilla. Vertailin MBnetin 01/1997 ulottuvaa tiedostolistausta edellämainittuihin kokoelmiin. Laadin ChatGPT:n avustuksella Python-räpellyksen löytämään yhtäläisyyksiä kahden tekstitiedoston välillä. Esimerkiksi vertaillessa 94-95 MBCD:n 1029 (oikeasti 1034?) tiedostoon. löytyi 835 osumaa. Osa tiedostoista oli vaihtanut nimeään, osa ehkä poistunut? Tarkka vertailu vaatisi parempaa skriptiä ja mahdollisesti manuaalista työtä.

Olisiko tällaiselle projektille muilla kiinnostusta? Voisi ehkä pyrkiä luomaan verkkoon hakutyökalun, jolla voisi vertailla kiintolevyjen uumenista löytyviä tiedostoja Apajan tiedostolistaan ja mahdollisesti ladata sinne sieltä puuttuvia tiedostoja? Ehkä pyrkiä rekonstruktoimaan koko Apajan? Tehdä replika koko purkista? Tai jos ei muuta, niin kattavampi paketti Archive.orgiin.
Pitäisi tosin määritellä, minkä vuoden version Apajasta pyrkisi palauttamaan, vai pitäisikö versioita olla useampia? Vuoteen 2002, jolloin purkki lakkautettiin, vai pitäisikö 2002–2010 www-ajan tiedostot olla mukana?

---

Edittiä projektin etenemisestä:
-Luotu sivusto jossa voi selata Apajan tiedostoja: Apajalista
-Repo taustadatalle ja ajantasaisille skripteille: apajadata
- @amblik tekemä skripti 1996 listauksen .csv-konversiolle: mbfiles
- @jad tekemä MBCD-indeksoija: ApajaIndex

---

Kuvissa MBCD2:lta löytynyt tiedostolistauksen selausohjelma (mbread.zip) ja Wayback Machinella löytynyt kuva Apajan www-versiosta, jonka linkit eivät valitettavasti toimi.

MBRead.png MikrobittiApaja_02-12-1998.png
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
2 197
Mulla pitäisi jossain kätkössä noita "Huvi- ja hyöty cd". Mielestäni en roskiin niitä, vieläkään, edellisen siivouksen aikana nakannut.
Koitan kaivella ja voin langoille pistää jos tarvetta on.

Mielenkiintoinen proggis, MBnetin kanssa aloiteltiin omat BBS viritelmät joskus vm95 aikoihin :)
 
Liittynyt
17.10.2016
Viestejä
227
Tämä projekti ehdottomasti jatkoo!

Itselläni ei välttämättä ole mitään listävää tähän mutta lupaan vaihtaa mikroKIVIkautisen luolamies asun päälleni ja muistella kaihollan niitä aikoja ilman internettiä jolloin kaivettii hämäriä pelejä MBn HH levyiltä koulun jälkeen tylsyyden tappamiseksi
 
Liittynyt
11.08.2017
Viestejä
142
Parantelin hieman skriptiä. Nyt se listaa osumat ja hutit erillisiin tiedostoihin. Apajan listoja minulla on kaksi, toinen on tuo aloituspostauksessa mainittu 01/1997 listaus ja toinen on 01/2005 web-ajan listaus, jossa tiedot ovat eri formaatissa. Jotkut osiot näkyvät siinä myös kahteen kertaan. Paremman puutteessa keskityn nyt tuohon 01/1997 tiedostolistaukseen.

Mikäli 01/1997 listalla on todella ~27 000 25 222 tiedostoa, työsarka on melkoinen. Osumia 94-95-96 MBCD-sisällöistä on 1846 / 2091 ja nämä ovat niitä helppoja tiedostoja. Kokeilin myös Suomipelit-pakettia ja siinä oli suoria osumia vain 3. Se ei tosin noudata 8+3 formaattia.
>>> %Run vertaa.py
Työstää..

Tiedostoja mbfiles_1996_utf-8_2.txt:ssa: 28372
Tiedostoja suomipelit.txt:ssä: 269
Löydetyt yhteensä: 3, tallennettu tiedostoon osumat.txt
Hutit yhteensä: 266, tallennettu tiedostoon hutit.txt
>>>

90-luvulla julkaistiin maailmalla roppakaupalla cd-levyjä eri purkkien shareware-tiedostoista, joilta voisi löytyä Apajassa ollutta ulkomaista tarjontaa. Discmaster toimii kätevänä hakutyökaluna Archive.orgin CD-sisällöistä. Ehkä seuraavaksi tutkin hieman niitä.

Mahtoikohan kaikki tiedostot olla Apajan servereillä samassa kansiossa? Listaus on kyllä jaettu tiukasti eri kategorioihin, mutta tiedostojen nimet lienee kuitenkin uniikkeja. Ehkä tähänkin voisi jonkin skriptin kirjoittaa tarkistamaan, löytyykö listalta samoja tiedostonimiä. Pitäisikö listasta tehdä tietokanta?
Näkemyksiä ja kehitysehdotuksia saa antaa vapaasti. Joku tietokantavelho voisi ehkä kertoa, miten kannattaisi edetä?

Edittiä:
2005 listauksesta löytyy 2975 tuplaa, joista 83 on peräkkäisillä riveillä. Valtaosa lienee sama tiedosto kahteen kertaan, mutta muutamia erillisiäkin on.
2005 listauksesta tehty sqlite-tietokanta. Yhteensä 53 153 tiedostoa.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
2 966
Hyvä projekti ja tieto siitä että Kansalliskirjastolla on edes tästä osuudesta kopio ilahdutti kun aikanaan luin Redditistä muistaakseni Jouni Heikniemen ketjusta jossa kertoili sen historiasta, että purkin myöhemmästä kohtalosta ei ollut mitään tietoa. Kansalliskirjastonkin varmaan voisi olla periaatteessa mahdollista näitä laittaa jakoon jos tekijänoikeudellinen puoli siihen vaan joustaa ja siellä löytyisi kiinnostusta asiaa järjestää.

Vanhanmalliselle listaukselle varmaan kannattaisi alkuun tehdä ainakin konversioskripti johonkin helpommin ohjelmallisesti käsiteltävään muotoon. Voisi sisällyttää myös linkkinä tai muuten tiedon siitä onko tiedostolle jo olemassaoleva lähde. Tuon Discmasterin ja muiden potentiaalisten paikkojen kautta osumien hakemisen automatisointia voisi myös tutkia.
 
Liittynyt
17.10.2016
Viestejä
246
Mulla on ainakin Huvi ja hyöty cd:tä useampia tallessa ja vanhempien nurkkia kun kaivelin viime kesänä niin löytyi myös yksi disketti-ajalta.

edit: korppu oli -95
 
Viimeksi muokattu:
Liittynyt
11.08.2017
Viestejä
142
Hyvä projekti ja tieto siitä että Kansalliskirjastolla on edes tästä osuudesta kopio ilahdutti kun aikanaan luin Redditistä muistaakseni Jouni Heikniemen ketjusta jossa kertoili sen historiasta, että purkin myöhemmästä kohtalosta ei ollut mitään tietoa. Kansalliskirjastonkin varmaan voisi olla periaatteessa mahdollista näitä laittaa jakoon jos tekijänoikeudellinen puoli siihen vaan joustaa ja siellä löytyisi kiinnostusta asiaa järjestää.
On sitä kai moni yrittänyt kysellä, mutta ei tule tapahtumaan ylivarovaisen laintulkinnan takia. Pitäisi pyytää lupa jokaisen tiedoston julkaisuun niiden tekijänoikeuden haltijoilta. Tai jotain sellaista.

Vanhanmalliselle listaukselle varmaan kannattaisi alkuun tehdä ainakin konversioskripti johonkin helpommin ohjelmallisesti käsiteltävään muotoon. Voisi sisällyttää myös linkkinä tai muuten tiedon siitä onko tiedostolle jo olemassaoleva lähde. Tuon Discmasterin ja muiden potentiaalisten paikkojen kautta osumien hakemisen automatisointia voisi myös tutkia.
Samaa mietin. Skripti on nyt tuollaista spagettia, kun se yrittää seuloa nimiä mahdollisimman monen tyyppisistä listoista. Olisi tosiaan parasta saada kaikki aineisto esim. csv-formaattiin. Tuo 2005 lista on jo aika lähellä sitä, joten se konvertoituu Pythonin csv-modulilla helposti. Kokeilin jo yhden rivin verran ja se aukesi nätisti taulukkolaskennassa sen jälkeen. Tuo vanhempi lista lienee vähän haasteellisempi, kun siinä on kappalejaotusta.

Visioin että nuo voisi listautua webbisivulla ja mikäli tiedosto on ladattavissa, näkyisi nimi linkkinä. Ja jonkin sortin hakutyökalu voisi olla. Itsellä ei ole web-sovellusten luomisesta kokemusta, joten aikaa tämä ottaa. Rupesin jo katselemaan Django-tutoriaalia. Vai olisiko tähänkin joku valmis sovellutus, ettei tarvisi keksiä pyörää uusiksi?

Löysin hyllystä Software Vaultin CD:n vuodelta 1994. Siinä on paljon samoja tiedostoja kuin Apajassa, mutta tiedostojen nimet ei välttämättä ole samat. Tai sitten samalla tiedostonimellä voi olla täysin eri sovellukset. Eli pitäisi vertailla myös kuvauksia ja versionumeroita. Ja sitten pohtia, pitäisikö löydetyn tiedoston nimi muuttaa samaksi kuin Apajassa, vai lisätä tieto, että nimi on eri.
 
Liittynyt
10.05.2023
Viestejä
490
Archivesta kuitenkin puuttuu 1998 ja 1999 vuosikertalevyjen tiedostot, joten jos joltakin ne löytyy, laittakaa ihmeessä jakoon?
Mielestäni omistan kys. levyt, mutta muistaakseni yksi kahdeksasta ei enää toimi. Valtaosa tiedostoista pitäisi kuitenkin löytyä.

Pengon illalla levylootaani.
 
Liittynyt
10.05.2023
Viestejä
490
EDIT Ei sittenkään Driveen näitä – kokeilen Internet Archivea.

---

1998 ja 1999 -vuosikertalevyjen tiedostot, ja vain tiedostot (ei siis lehtiä PDF:nä), uppautuvat juuri Driveeni. Tässä linkki: REDACTED -- tässä pitäisi myös olla kaikki tiedostot, sillä se taisikin olla vuoden 1997 vuosikertalevysetti, josta yksi levy on rikki.

Syistä, jotka vain rclone ja Drive ymmärtävät, ensimmäisenä alkoi täyttymään hakemisto MBCD4d. ETAkin heittelee 2 ja 7 tunnin väliltä, mutta kaippa nuo joskus keskiyöhön mennessä ovat tuonne tiensä löytäneet. :)

Ja vielä epämääräinen varoituksen tapainen, olen aikeissa luopua Google Drivestä, eli ikuisuuksia tiedostot eivät tuon linkin takaa tule löytymään. Pistäkääs kiinnostuneet imuroiden, vai ainakin vinkatkaa, mihin nuo kannattaisi laittaa. :)
 
Viimeksi muokattu:
Liittynyt
11.08.2017
Viestejä
142
1998 ja 1999 -vuosikertalevyjen tiedostot, ja vain tiedostot (ei siis lehtiä PDF:nä), uppautuvat juuri Driveeni. Tässä linkki: Apaja – Google Drive -- tässä pitäisi myös olla kaikki tiedostot, sillä se taisikin olla vuoden 1997 vuosikertalevysetti, josta yksi levy on rikki.

Syistä, jotka vain rclone ja Drive ymmärtävät, ensimmäisenä alkoi täyttymään hakemisto MBCD4d. ETAkin heittelee 2 ja 7 tunnin väliltä, mutta kaippa nuo joskus keskiyöhön mennessä ovat tuonne tiensä löytäneet. :)

Ja vielä epämääräinen varoituksen tapainen, olen aikeissa luopua Google Drivestä, eli ikuisuuksia tiedostot eivät tuon linkin takaa tule löytymään. Pistäkääs kiinnostuneet imuroiden, vai ainakin vinkatkaa, mihin nuo kannattaisi laittaa. :)
Hieno homma! Archive.orgista nuo muutkin löytyvät, eli lataa ihmeessä sinne.
 
Liittynyt
18.03.2024
Viestejä
6
Tuo ns. 2005 listaus taitaa olla kaikista wayback machineen osoitteen http://www.mbnet.fi/apaja/alueet/ alle tallentuneista apajan listauksista skriptillä joskus koostamani listaus, josta puuttuu osa listaussivuista, joita sinne ei ollut minään ajankohtana tallentunut. Ei siis mikään virallinen tai täydellinen listaus. Osa tiedostoista oli eri snapshottien välillä saattanut siirtyä esim. alueiden arkisto-osastoille tai poistettu uudemman version tieltä.
 
Liittynyt
10.05.2023
Viestejä
490
Google oli huomaavinaan viruksia MBCD:n ohjelmissa ja uhkaili tilin sulkemisella, joten keskeytin synkkaamisen ja heitin kaiken roskiin. Kokeilen tuota Internet Archivea seuraavaksi.

e. Latautuu parhaillaan Internet Archiveen.
 
Viimeksi muokattu:
Liittynyt
11.08.2017
Viestejä
142
Tuo ns. 2005 listaus taitaa olla kaikista wayback machineen osoitteen http://www.mbnet.fi/apaja/alueet/ alle tallentuneista apajan listauksista skriptillä joskus koostamani listaus, josta puuttuu osa listaussivuista, joita sinne ei ollut minään ajankohtana tallentunut. Ei siis mikään virallinen tai täydellinen listaus. Osa tiedostoista oli eri snapshottien välillä saattanut siirtyä esim. alueiden arkisto-osastoille tai poistettu uudemman version tieltä.
Tuo voisi kyllä selittää asioita. Mutta on tuo saatavilla olevista listoista nyt kuitenkin kattavin.
Muokkailin aiempaan postauksesn aiemmin: "2005 listauksesta löytyy 2975 tuplaa, joista 83 on peräkkäisillä riveillä. Valtaosa lienee sama tiedosto kahteen kertaan, mutta muutamia erillisiäkin on.", "Yhteensä 53 153 tiedostoa."
 
Viimeksi muokattu:
Liittynyt
18.03.2024
Viestejä
6
No niin, uusintayritys, nyt Internet Archivessa: MBCD 4 & 5 ohjelmat : Helsinki Media Oy : Free Download, Borrow, and Streaming : Internet Archive

Laiskuuttani jaoin vain kahdeksi isoksi zipiksi. Toivottavasti toimii ja kelpaa. :)
Kiitos. Pitkään ollut nämäkin etsinnän alla. Löytyykö muita shareware ym. romppuja, joita ei archivessa vielä ole?

Ja jos täällä on jotain entisiä BBS sysopeja tai muita, joilla olisi vielä backuppeja tallessa tiedostoalueilta tai vähemmän sensitiivisistä keskusteluista, niitäkin varmaan olisi hyvä jonnekin pysyvämpään paikkaan arkistoida talteen. Erityisesti tekstitiedostoja ja muuta harvinaisempaa materiaalia.
 
Liittynyt
17.10.2016
Viestejä
2 197
Ja jos täällä on jotain entisiä BBS sysopeja tai muita, joilla olisi vielä backuppeja tallessa tiedostoalueilta tai vähemmän sensitiivisistä keskusteluista, niitäkin varmaan olisi hyvä jonnekin pysyvämpään paikkaan arkistoida talteen. Erityisesti tekstitiedostoja ja muuta harvinaisempaa materiaalia.
Mulla pitäs löytyä oman purkin (Premium BBS) backuppi cd/dvd jostain. Kauan meinannut kaivella ja katsella mitä siitä löytyy.
Ehkä nyt olisi aika tehdä eikä meinata :D
 
Liittynyt
10.05.2023
Viestejä
490
Tuo Macmaailma-levy on aika haastava, se kun on ilmeisesti jonkinlainen hybridi-HFS-ISO 9660 -levy. Minun pitää Linuxissa erikseen mountata se HFS-tyyppisenä edes nähdäkseni nuo "Halvat" ohjelmat, mutta ohjelmatiedostojen koko on nähtävästi 0 tavua, ja monen kansion ja tiedoston nimen perässä lukee "(invalid encoding)"; tuollaisia tiedostoja / tuollaisessa hakemistossa olevia tiedostoja en saa lainkaan auki.

En siis oikein ota tästä tolkkua, enkä varmaan osaisi ripatakaan tätä oikein, ja sitten lisähaasteena tällä levyllä on täydet vuosikerrat sekä Macmaailma- että Tietokone-lehdistä vuosilta 1994 - 1997, eli tämmöisenään tätä ei edes voisi mihinkään törkätä rikkomatta törkeästi jonkun oikeuksia.

Vinkkejä otetaan vastaan. Macia en ole omistanut sitten 90-luvun, joten se ei ole vaihtoehto. :(
 
Liittynyt
10.05.2023
Viestejä
490
Liittynyt
11.08.2017
Viestejä
142
Täällä se sivusto hiljalleen rakentuu Pythonilla ja Flaskilla. Yritän pitää sivuston käyttökelpoisena myös hieman vanhemmilla selaimilla. Kuvan IE sai tosin serverin tietokantahaun jotenkin jumiin samalla kun kaatui, kun yritin listata kaikkia tiedostoja.
Mitä tahansa osastoa klikkaamalla sivusto listaa myös mahdollisten alaosastojen tiedostot kaikki samalle sivulle, mikä voi olla hieman liian raskasta vanhoille selaimille, mutta toisaalta ctrl+f käy kätevästi. Listaus pysyy kohtuullisena tietysti alimmissa kategorioissa.

Noita päällekkäisyyksiä osastoissa ja tiedostoissa pitäisi seuloa ja päättää miten niitä yhdistelee. Kun nyt tuolla on esimerkiksi "/ Pelit / DOS" ja "/ Pelit / DOS-pelit". Löytyykö innokkaita datanörttejä käymään tuota läpi?

etusivu.png win98-ie.jpg
 
Viimeksi muokattu:
Liittynyt
11.08.2017
Viestejä
142
Tässä sitä voi nyt testailla. SSL-serttiä en onnistunut kovasta yrityksestä huolimatta tuohon saamaan, joten selain voi varoitella turvattomasta yhteydestä. Ei tuo sivusto toisaalta salausta edes tarvitse, kun ei ole käyttäjätunnuksia tai mitään. Ilmoitelkaa jos sivu ei toimi.
 
Liittynyt
17.10.2016
Viestejä
5 445
Tulipahan testattua ja jotenkin aika nostalginen fiilis tuli. Vielä kun noihin tiedostoihin saisi oikeasti linkit että saisi noita latailtuakin niin olisihan se hienoa. Tuolla kuitenkin on kaikenlaista retrokoneharrastajille ehkä kiinnostavaa materiaalia. Tuo vaan saattaa olla jo haastavaa kun pitäisi nuo kaikki tiedostot löytää jostakin ja saada ne johonkin talteen ja linkitettyä.
 
Liittynyt
11.08.2017
Viestejä
142
Tulipahan testattua ja jotenkin aika nostalginen fiilis tuli. Vielä kun noihin tiedostoihin saisi oikeasti linkit että saisi noita latailtuakin niin olisihan se hienoa. Tuolla kuitenkin on kaikenlaista retrokoneharrastajille ehkä kiinnostavaa materiaalia. Tuo vaan saattaa olla jo haastavaa kun pitäisi nuo kaikki tiedostot löytää jostakin ja saada ne johonkin talteen ja linkitettyä.
Latausmahdollisuus on jo työn alla! Yritän saada seuraavaan päivitykseen tiedostojen nimet linkeiksi, mikäli ovat ladattavissa. Ekana tulevat ne tiedostot, jotka löytyvät vuosikertalevyiltä, eli joitakin tuhansia. Loput ovatkin sitten työläämpiä.
Ajatuksena on, että mikäli käyttäjiltä löytyy harvinaisempia tiedostoja, mitä ei esim. archive.orgista löydä, niin niitä voisi sitten tuonne jossain vaiheessa lähettää.
 
Liittynyt
10.05.2023
Viestejä
490
Ekana tulevat ne tiedostot, jotka löytyvät vuosikertalevyiltä, eli joitakin tuhansia
Apajan luonteesta johtuen saattaa olla, että vuosikertalevyiltä kyllä löytyy kaivattu ohjelma tai peli, mutta vanhempana versiona. Keksittynä esimerkkinä tuolla Apajassa voisi olla vaikka "LIERO133.ZIP", mutta viimeisin vuoslkertalevyiltä löytyvä olisikin "LIERO125.ZIP". Ratkaisua tähän voi joutua miettimään, tosin ehkä se kannattaa tehdä vasta, kun joku tapaus tulee oikeasti vastaan; saatanhan huolehtia ihan turhastakin. :)
 
Liittynyt
11.08.2017
Viestejä
142
Apajan luonteesta johtuen saattaa olla, että vuosikertalevyiltä kyllä löytyy kaivattu ohjelma tai peli, mutta vanhempana versiona. Keksittynä esimerkkinä tuolla Apajassa voisi olla vaikka "LIERO133.ZIP", mutta viimeisin vuoslkertalevyiltä löytyvä olisikin "LIERO125.ZIP". Ratkaisua tähän voi joutua miettimään, tosin ehkä se kannattaa tehdä vasta, kun joku tapaus tulee oikeasti vastaan; saatanhan huolehtia ihan turhastakin. :)
Kävin vuosikertalevyjen tiedostoja läpi kopioimalla kaikki tiedostot samaan kansioon. Niissäkin oli ~182 tuplatiedostoa, jotka vaikuttivat olevan sama versio kahteen kertaan. Osan kävin manuaalisesti läpi, loppupäästä käytin Linuxin diff-komentoa. Eroja oli lähinnä pakkausohjelmissa, kuten winzip95.exe. Niitä en toistaiseksi vaivautunut sen tarkemmin tutkimaan. Kansioon jäi 6413 (todennäköisesti) uniikkia tiedostoa. Seuraavaksi vertasin tiedostolistausta sivustolla olevaan listaukseen, josta raakkasin ensin tuplat pois.
Tiedostoja 2005_v2_tiedostot_tuplat_poistettu.txt:ssa: 50178
Tiedostoja 94-95-96-97-98-99.txt:ssä: 6413
Löydetyt yhteensä: 5091, tallennettu tiedostoon osumat.txt
Hutit yhteensä: 1315, tallennettu tiedostoon hutit.txt
>>>
Eli 1315 tiedostoa ei löytynyt 2005 listalta, ainakaan samalla nimellä. Eroina saattaa olla esim. vuosikertalevyn "#1agent.zip" ja listan "1agent.zip". Pitäisikö tässä kylmän viileästi poistaa tuo risuaita, vai muokata, tai lisätä, risuaidallinen versio listaan?

Tietysti jos lisäisi rivejä listaan ja niiden välille relaatioita ja muodostaisi jokaiselle tiedostolle oman lataussivun, jossa nämä relaatiot sitten ilmenevät.
Tulee tämä ongelma siinäkin, kun aletaan lisäämään internetistä löydettyjä shareware-tiedostoja, jotka ovat todennäköisesti eri nimellä. Eli pitäisikö niistä tehdä alkuperäistä nimeä vastaava zippi, vai lisätä tieto, ettei tiedosto ole alkuperäinen? Yksi vaihtoehto olisi pakata tällaiset tiedostot kahteen kertaan, ensin MBnet-nimellä ja siihen sitten se internetistä löydetty zippi ja vaikka tekstitiedosto jossa mainitaan lähde. Ei tarvisi listaa sörkkiä.

Edit: Ja itse kysymykseen, listalle voisi kyllä lisätä rivin vanhemmalle versiolle, mikäli se on jossain aiemmassa listauksessa ollut.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
2 966
Eli 1315 tiedostoa ei löytynyt 2005 listalta, ainakaan samalla nimellä. Eroina saattaa olla esim. vuosikertalevyn "#1agent.zip" ja listan "1agent.zip". Pitäisikö tässä kylmän viileästi poistaa tuo risuaita, vai muokata, tai lisätä, risuaidallinen versio listaan?

Tietysti jos lisäisi rivejä listaan ja niiden välille relaatioita ja muodostaisi jokaiselle tiedostolle oman lataussivun, jossa nämä relaatiot sitten ilmenevät.
Tulee tämä ongelma siinäkin, kun aletaan lisäämään internetistä löydettyjä shareware-tiedostoja, jotka ovat todennäköisesti eri nimellä. Eli pitäisikö niistä tehdä alkuperäistä nimeä vastaava zippi, vai lisätä tieto, ettei tiedosto ole alkuperäinen? Yksi vaihtoehto olisi pakata tällaiset tiedostot kahteen kertaan, ensin MBnet-nimellä ja siihen sitten se internetistä löydetty zippi ja vaikka tekstitiedosto jossa mainitaan lähde. Ei tarvisi listaa sörkkiä.
Noiden tiedostojen nimestä riippumatta samaksi tunnistamiseen voisi olla hyötyä siitä että pakettien file_id.diz (ainakin, tiedä sitten onko ainoastaan tuota käytetty) on ilmeisesti lähteenä tuolle listauksissa oleville kuvausteksteille eli jos se mätsää niin on aika hyvä indikaattori että samasta paketista kyse. Samoin tiedostojen koot ja päiväykset voi olla hyödyllisiä tapoja koittaa vahvistaa onko kyse samasta tiedostosta ja rajata vaihtoehtoja pois. Ihannetapauksessahan kaikista olisi jonkinlainen tarkistussumma tallessa jota voisi varsinaisiin tiedostoihin verrata mutta sellaista ei nyt ainakaan toistaiseksi tietysti ole saatavilla vaikka se kansalliskirjaston kappale periaatteessa olisi lähde sellaisellekin... sinänsä sellaisenkin sisällyttäminen nyt tallennettuihin tietoihin ei ehkä huono idea olisi.

Jossain määrinhän tuo varmaan tulee olemaan sellaista että koneellisesti voi tehdä eri lähteiden listoista erilaisilla perusteilla enemmän tai vähemmän varmoja yhdistämisiä mutta oikeastaan varsinkin vähemmän selvien tapausten osalta pitää käsityöllä yrittää todella tarkistaa kyseessä todella olevan oikea tiedosto. Nuo eri versiotkin samoista ohjelmista silloin kun täsmällistä osumaa ei ole tosiaan yksi asia ja niitäkin voisi haravoida tuolla periaatteella että vertailee epätäsmällisiä osumia tiedostonimiin ja kuvauksiin.

Uploadmahdollisuus kuulostaa hyvältä, mutta olisi hyvä jos itse tietokannankin voisi sitten jossain muotoa ladata jotta dataa voi jatkokäsitellä vaikka juuri tuossa vielä puuttuvien etsimistarkoituksessa.
 
Liittynyt
11.08.2017
Viestejä
142
Noiden tiedostojen nimestä riippumatta samaksi tunnistamiseen voisi olla hyötyä siitä että pakettien file_id.diz (ainakin, tiedä sitten onko ainoastaan tuota käytetty) on ilmeisesti lähteenä tuolle listauksissa oleville kuvausteksteille eli jos se mätsää niin on aika hyvä indikaattori että samasta paketista kyse. Samoin tiedostojen koot ja päiväykset voi olla hyödyllisiä tapoja koittaa vahvistaa onko kyse samasta tiedostosta ja rajata vaihtoehtoja pois. Ihannetapauksessahan kaikista olisi jonkinlainen tarkistussumma tallessa jota voisi varsinaisiin tiedostoihin verrata mutta sellaista ei nyt ainakaan toistaiseksi tietysti ole saatavilla vaikka se kansalliskirjaston kappale periaatteessa olisi lähde sellaisellekin... sinänsä sellaisenkin sisällyttäminen nyt tallennettuihin tietoihin ei ehkä huono idea olisi.

Jossain määrinhän tuo varmaan tulee olemaan sellaista että koneellisesti voi tehdä eri lähteiden listoista erilaisilla perusteilla enemmän tai vähemmän varmoja yhdistämisiä mutta oikeastaan varsinkin vähemmän selvien tapausten osalta pitää käsityöllä yrittää todella tarkistaa kyseessä todella olevan oikea tiedosto. Nuo eri versiotkin samoista ohjelmista silloin kun täsmällistä osumaa ei ole tosiaan yksi asia ja niitäkin voisi haravoida tuolla periaatteella että vertailee epätäsmällisiä osumia tiedostonimiin ja kuvauksiin.
Niin no tässä on sekin vielä, että pitäisikö tiedostojen olla juuri MBnetistä kotoisin ja mätsätä johonkin viralliseen Apajan listaukseen, vai kelpuuttaako mukaan esimerkiksi tunnetun pelin shareware-version jostain ihan muusta lähteestä, jos vain versionumero täsmää. Itse kallistuisin kelpuuttamaan, mutta tähän kysymykseen saa ottaa kantaa. Tästä pitäisi tosin olla jokin merkintä, että tiedoston voisi korvata ns. alkuperäisellä, jos sellainen myöhemmin löytyy. Apajassa ei käsittääkseni ollut kahta samaa tiedostonnimeä, joten Apaja-versiossa tiedoston nimeä on voitu joutua muuttamaan.
Yleisesti ottaen, tietokanta perustuu mahdollisesti käyttäjän @arkistoilija koostamaan listaan (kiitos ja kunnia koostajalle) ja ei välttämättä sisällä kaikkia tiedostoja, joita virallisessa listassa pitäisi olla.
Alunperin mietin, että Apajasta voisi yrittää palauttaa tietyn vuoden version, mutta ehkä sivusto voisi olla alkuperäisen Apajan listauksiin perustuva yleinen arkisto.

Vertailin noita vuosikertalevyjen hutitiedostoja listalla oleviin käyttämällä Pyhonin difflibiä. Sivustolle voisi lisätä sarakkeen, mistä saisi klikkaamalla esiin skriptin mielestä saman tyyppiset tiedostonnimet. Ei ole kovin tarkka, mutta tyhjää parempi.
Tiedostonimelle '#1agent.zip' löytyi seuraavat samankaltaiset tiedostonimet:
- 1agent.zip
- 1_tagent.zip

Tiedostonimelle '#1arctic.zip' löytyi seuraavat samankaltaiset tiedostonimet:
- 1arctic.zip

Tiedostonimelle 'align_it.zip' löytyi seuraavat samankaltaiset tiedostonimet:
- align-it.zip
- liegnitz.zip
- aligne12.zip

Tiedostonimelle 'alle2_12.zip' löytyi seuraavat samankaltaiset tiedostonimet:
- alleg22.zip
- alleg21.zip
- ale_p12.zip

Tiedostonimelle 'alm32.zip' löytyi seuraavat samankaltaiset tiedostonimet:
- dahl.mp3

Uploadmahdollisuus kuulostaa hyvältä, mutta olisi hyvä jos itse tietokannankin voisi sitten jossain muotoa ladata jotta dataa voi jatkokäsitellä vaikka juuri tuossa vielä puuttuvien etsimistarkoituksessa.
Sivustolle voisi laittaa latausmahdollisuuden ajantasaiseen tietokantaan. Voisin kyllä muutenkin julkaista kaiken datan ja skriptit mitä tässä käytän. Täytyypä miettiä, tekisinkö aiheelle osion tuonne sivustolle, vai johonkin githubiin tms.
Tässä on nyt kuitenkin tietokannan data mikä on tämän hetkisessä ns. tuotantoversiossa: https://archive.org/download/mbnet_files_09-01-2005/mbnet_files_09-01-2005_v2.csv
 
Liittynyt
11.08.2017
Viestejä
142
Eli 1315 tiedostoa ei löytynyt 2005 listalta, ainakaan samalla nimellä. Eroina saattaa olla esim. vuosikertalevyn "#1agent.zip" ja listan "1agent.zip". Pitäisikö tässä kylmän viileästi poistaa tuo risuaita, vai muokata, tai lisätä, risuaidallinen versio listaan?
Tarkemmin asiaa tutkiessa, tuo tiedosto on ollut kahdella nimellä ja kuvauksella virallisella vuoden 1996 listalla. 2005 listalta "1agent.zip" löytyy vain osastolta "Apaja / Pelit / PC-Arkisto / DOS-pelit". Eli nimiä ei nyt ainakaan kannata alkaa muuttelemaan, ennen kuin löytyy lisää listoja joita voisi yhdistää tuohon sivustolla olevaan.

1agent.png

Haluaisiko joku ottaa haasteen tästä 1996 listasta ja muuttaa sen vastaavaan csv-formaattiin kuin 2005 lista? Voisi yrittää sen jälkeen yhdistellä nuo kaksi listaa. Siinä on paljon ylimääräisiä rivinvaihtoja ja välilyöntejä. Jälkimmäiset saa tosin helposti pois tekstieditoreiden "etsi ja korvaa" -toiminnoilla. Toinen vaikeus on saada osastot oikein joka riville ja ylimääräiset merkit pois.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
2 966
Haluaisiko joku ottaa haasteen tästä 1996 listasta ja muuttaa sen vastaavaan csv-formaattiin kuin 2005 lista? Voisi yrittää sen jälkeen yhdistellä nuo kaksi listaa. Siinä on paljon ylimääräisiä rivinvaihtoja ja välilyöntejä. Jälkimmäiset saa tosin helposti pois tekstieditoreiden "etsi ja korvaa" -toiminnoilla. Toinen vaikeus on saada osastot oikein joka riville ja ylimääräiset merkit pois.
Joo, tein tuohon CSV-konversioon Python-skriptin. Tämä ottaa alkuperäisellä enkoodauksella olevan tiedoston sellaisenaan, ehkä tuon joskus pääsee ajamaan jollekin muullekin listatiedostolle jos sattuisi löytymään. Tuolla skripti ja konversiotulos ladattavissa: mbfiles

Tuon -96 alkuperäisen tiedoston alku muuten sisältää outouksia, siinä on kaikkien kategorioiden listauksen seassa jotain pätkiä yksittäisten tiedostojen kuvauksista muutamalla rivillä. Tuon mbread-ohjelman lisäksi näkyi olevan myös MB-Kamu -niminen ohjelma noiden lukemiseen mutta en saanut sitä jostain syystä listatiedostoa tunnistamaan kun yritin testata, ilmeisesti ollut jossain MB:n ohjelmointikilpailussa aiheena tuollaisen luku- ja latauslistaohjelman teko.
 
Liittynyt
11.08.2017
Viestejä
142
Joo, tein tuohon CSV-konversioon Python-skriptin. Tämä ottaa alkuperäisellä enkoodauksella olevan tiedoston sellaisenaan, ehkä tuon joskus pääsee ajamaan jollekin muullekin listatiedostolle jos sattuisi löytymään. Tuolla skripti ja konversiotulos ladattavissa: mbfiles

Tuon -96 alkuperäisen tiedoston alku muuten sisältää outouksia, siinä on kaikkien kategorioiden listauksen seassa jotain pätkiä yksittäisten tiedostojen kuvauksista muutamalla rivillä. Tuon mbread-ohjelman lisäksi näkyi olevan myös MB-Kamu -niminen ohjelma noiden lukemiseen mutta en saanut sitä jostain syystä listatiedostoa tunnistamaan kun yritin testata, ilmeisesti ollut jossain MB:n ohjelmointikilpailussa aiheena tuollaisen luku- ja latauslistaohjelman teko.
Hienoa työtä! Vähän nuo rivinvaihdot kiusaavat kuvauksissa. Ja osastot tarvisi saada samaan muotoon kuin 2005 tiedostossa, tuo sivustoni on tarkka siitä, että jokaisella rivillä on osasto samassa muodossa, koska kategorialistaukset tulee niistä. Tähän tapaan se käsittelee niitä:
Koodi:
# osasto esim. muotoa "Apaja / Pelit / Windows 95/98/NT/2000 -pelit / Tasohyppely"
    jaotellut_osastot = {}
    for osasto in osastot:
        osasto = osasto['osasto']
        osat = osasto.split(' / ')

        paaosasto = osat[1]  # Toinen osa osastosta on pääosasto
        alakategoria = osat[2]

        # Jos pääosasto ei ole vielä sanakirjassa, lisää se
        if paaosasto not in jaotellut_osastot:
            jaotellut_osastot[paaosasto] = {}
...
Mutta tuosta sitä on hyvä jatkokäsitellä eteenpäin.
 
Viimeksi muokattu:

KLF

Liittynyt
17.10.2016
Viestejä
1 820
Edit: luotu sivusto jossa voi selata Apajan tiedostoja: Apajalista
Löytyyköhän noi ropeltaja-zipit vielä jostain.
ROPEL1.ZIP44,8 kt11.6.1996Ropeltaja #1 (kesäspesiaali ;) 1996
ROPEL2L.ZIP135,8 kt5.12.1996Ropeltaja - sähköinen roolipelilehti Jouluspesiaali 1996 ;)
ROPEL3.ZIP48,9 kt3.3.1998Ropeltaja 3 Peliluolan sähköinen rope-lehti nro. 3
ROPEL4.ZIP85,4 kt21.9.1998Ropeltaja-lehden neljäs numero.

Jotain Cyberpunk aiheista juttua on tullut kirjoiteltua ainakin yhteen noista.
 
Liittynyt
17.10.2016
Viestejä
2 966
Hienoa työtä! Vähän nuo rivinvaihdot kiusaavat kuvauksissa. Ja osastot tarvisi saada samaan muotoon kuin 2005 tiedostossa, tuo sivustoni on tarkka siitä, että jokaisella rivillä on osasto samassa muodossa, koska kategorialistaukset tulee niistä. Tähän tapaan se käsittelee niitä:
Koodi:
# osasto esim. muotoa "Apaja / Pelit / Windows 95/98/NT/2000 -pelit / Tasohyppely"
    jaotellut_osastot = {}
    for osasto in osastot:
        osasto = osasto['osasto']
        osat = osasto.split(' / ')

        paaosasto = osat[1]  # Toinen osa osastosta on pääosasto
        alakategoria = osat[2]

        # Jos pääosasto ei ole vielä sanakirjassa, lisää se
        if paaosasto not in jaotellut_osastot:
            jaotellut_osastot[paaosasto] = {}
...
Mutta tuosta sitä on hyvä jatkokäsitellä eteenpäin.
Noita rivinvaihtoja myös vähän mietin, nythän nuo on alkuperäisen rivityksen mukaan. Tossa hankaluutena on se, että jotkut ovat tehneet kuvauksiin grafiikkaa ja niiden toiminta vaatii että rivitys on muuttumaton, esimerkiksi Zorlimin kirjoitusnopeustesti:
Screenshot_20240412_104212.png


Tai ajopeli Lapamato:
Screenshot_20240412_104911.png


Noiden näkyminen oikeinhan vaatii kyllä sitäkin että esitetään monospace-fonteilla. Voisi tietysti periaatteessa koittaa seuloa joukosta ja toimia eri tavalla jos kyse on grafiikasta tms.

Kategoriathan sinänsä aika helposti voi muokata erottelemaan pää- ja alataso tohon uudemman listan malliin, liekö suht erilainen rakenne tosin ollut tuolloin purkissa kuin myöhemmin web-apajassa.
 
Liittynyt
17.10.2016
Viestejä
5 445
Noita rivinvaihtoja myös vähän mietin, nythän nuo on alkuperäisen rivityksen mukaan. Tossa hankaluutena on se, että jotkut ovat tehneet kuvauksiin grafiikkaa ja niiden toiminta vaatii että rivitys on muuttumaton, esimerkiksi Zorlimin kirjoitusnopeustesti:


Tai ajopeli Lapamato:


Noiden näkyminen oikeinhan vaatii kyllä sitäkin että esitetään monospace-fonteilla. Voisi tietysti periaatteessa koittaa seuloa joukosta ja toimia eri tavalla jos kyse on grafiikasta tms.

Kategoriathan sinänsä aika helposti voi muokata erottelemaan pää- ja alataso tohon uudemman listan malliin, liekö suht erilainen rakenne tosin ollut tuolloin purkissa kuin myöhemmin web-apajassa.
Itse olisin sitä mieltä että nuo kaikki selitteet näytettäisiin niinkuin aikanaankin, eli monospace-fontilla, alkuperäisellä rivityksellä ja vieläpä jollain wanhan DOS-fontin tyylisellä niin tulee samalla mukava retro-fiilis. Noissahan oli joku standardikin, ainakin siinä file_id.diz -tiedostossa, olikohan että max 42 merkkiä pitkät rivit ja x kpl rivejä käsiteltiin tiukemmin ja loppuosa saatettiin hylätä tai käsitellä eri tavalla tms.
 
Liittynyt
17.10.2016
Viestejä
718
Löytyyköhän noi ropeltaja-zipit vielä jostain.
ROPEL1.ZIP44,8 kt11.6.1996Ropeltaja #1 (kesäspesiaali ;) 1996
ROPEL2L.ZIP135,8 kt5.12.1996Ropeltaja - sähköinen roolipelilehti Jouluspesiaali 1996 ;)
ROPEL3.ZIP48,9 kt3.3.1998Ropeltaja 3 Peliluolan sähköinen rope-lehti nro. 3
ROPEL4.ZIP85,4 kt21.9.1998Ropeltaja-lehden neljäs numero.

Jotain Cyberpunk aiheista juttua on tullut kirjoiteltua ainakin yhteen noista.
Tosa näyttäs olevan 1
 
  • Tykkää
Reactions: KLF
Liittynyt
11.08.2017
Viestejä
142
Noita rivinvaihtoja myös vähän mietin, nythän nuo on alkuperäisen rivityksen mukaan. Tossa hankaluutena on se, että jotkut ovat tehneet kuvauksiin grafiikkaa ja niiden toiminta vaatii että rivitys on muuttumaton, esimerkiksi Zorlimin kirjoitusnopeustesti:
Screenshot_20240412_104212.png



Tai ajopeli Lapamato:

Screenshot_20240412_104911.png
Itse olisin sitä mieltä että nuo kaikki selitteet näytettäisiin niinkuin aikanaankin, eli monospace-fontilla, alkuperäisellä rivityksellä ja vieläpä jollain wanhan DOS-fontin tyylisellä niin tulee samalla mukava retro-fiilis. Noissahan oli joku standardikin, ainakin siinä file_id.diz -tiedostossa, olikohan että max 42 merkkiä pitkät rivit ja x kpl rivejä käsiteltiin tiukemmin ja loppuosa saatettiin hylätä tai käsitellä eri tavalla tms.
Totta kyllä. Ongelma tulee siinä, ettei noita rivinvaihtoja ole 2005 listalla, kyse ei siis ole pelkästä fontista. Eli sitten pitäisi muokata 2005 lista noudattamaan tuota 1996 formaattia. Harmi kun ei ole muita virallisia listoja käsillä. Edit: korvataan 2005 rivit virallisilla sitä mukaa kun löytyy rivinvaihtojen kera.

Osasto "Apaja / Pelit / PC-Arkisto /Pelien lisäkentät" archivesta:
1712925880698.png

Sama 1996 listalta:
1712925925861.png


Olen tähän asti pyöritellyt tuota 2005 listaa Libreoffice Calcissa, yhdistellyt osastoja ja etsinyt tuplia, jonka jälkeen olen muuntanut takaisin csv-tiedostoksi ja tehnyt siitä suoraan sqlite-tietokannan. Pitäisi siis myös keksiä kuinka tiedosto aukeasi ylimääräisten rivinvaihtojen kanssa taulukkolaskennassa ilman sekasotkua, tai sitten keksiä joku vaihtoehtoinen tapa käsitellä dataa.
edit: aukesi nätimmin kun laittoi string delimiter ". Ehkä tämä voisikin onnistua. Edit2: mihin lie katosi nuo tähdet rivien lopusta..

mbfiles.csv:
1712926896344.png
1712927969395.png
 
Viimeksi muokattu:
Liittynyt
11.08.2017
Viestejä
142
Sain viimein tehtyä repon datasta ja skripteistä, josko joku tarvii: apajadata
Sivuston lähdekoodia en ainakaan vielä kehtaa julkaista, mutta ehkä teen vielä sillekin joskus erillisen repon.
 
Liittynyt
17.10.2016
Viestejä
2 966
Olen tähän asti pyöritellyt tuota 2005 listaa Libreoffice Calcissa, yhdistellyt osastoja ja etsinyt tuplia, jonka jälkeen olen muuntanut takaisin csv-tiedostoksi ja tehnyt siitä suoraan sqlite-tietokannan. Pitäisi siis myös keksiä kuinka tiedosto aukeasi ylimääräisten rivinvaihtojen kanssa taulukkolaskennassa ilman sekasotkua, tai sitten keksiä joku vaihtoehtoinen tapa käsitellä dataa.
edit: aukesi nätimmin kun laittoi string delimiter ". Ehkä tämä voisikin onnistua. Edit2: mihin lie katosi nuo tähdet rivien lopusta..
Bugihan tuossa oli joka näemmä söi ne, laitoin uudet versiot tiedostosta ja skriptistä ja nyt pitäisi näyttää paremmalta.
 
Toggle Sidebar

Statistiikka

Viestiketjut
241 158
Viestejä
4 210 079
Jäsenet
71 022
Uusin jäsen
Slerbbaliini

Hinta.fi

Ylös Bottom