Tekoäly omalla koneella

takomo · 26.01.2026

Veke99 sanoi:
Minulla on jouten Dell OptiPlex 3050 Micro. Olen suunnittelut paikallista tekoälyä siten että se hakisi minun pdf muodossa olevista ohjekirjoista tietoa.

Tuo on aika vaatimaton kone joten riittääkö teho?

Tuskin mihinkään järkevään, mutta mm. llama.cpp toimii pelkällä muistillakin, joten kokeilu ei maksa mitään. Kokeile vaikka jollain 3B-8B-mallilla. Esim. Ryzen 7 5800X (8-core) tuottaa 7-10 token/s, mikä on hidas mutta tyhjää parempi. Ei kannata liikoja odottaa.

Kun otetaan GPU (RX9070) Ryzenin avuksi, niin 3B-malli tuottaa 100 token/s. Syötteen parsimisessa on vielä suurempi ero: CPU:lla n. 40 token/s, GPU:lla n. 4000 token/s (tuo tosin laski ->500 token/s isolla syötteellä).

Tuo käyttö "...että se hakisi minun pdf muodossa olevista ohjekirjoista tietoa." on sellainen, mistä moni olisi varmasti kiinnostunut, mutta onko tähän jotain helppoa keinoa olemassa? Se toimii, että syötteenä on yksittäinen (pienehkö) pdf ja malli prosessoi sitä mutta se, että olisi dokumenttiarkisto, josta AI osaisi etsiä oikean dokumentin ja kaivaa sieltä etsityt tiedot menee käsittääkseni melko vaikeaksi.

AI-malli itsessään ei tunne mitään muuta kuin sen mitä sille on opetettu ja syötteenä kerrottu. Jotenkin mallille pitäisi opettaa dokumenttiarkisto ja sen sisältö.

Mallin opettamiseen on toki tekniikoita mutta olen siinä käsityksessä, että ne vaatii raudalta vielä enemmän kuin mallien käyttö. Raskainta on full finetuning, jolla muutetaan koko mallia, mutta on myös kevyempiä LORA/QLORA ja juuri dokumenttihakuihin tarkoitettu RAG, mutta näistä en itse ole ollenkaan perillä. Ilmeisesti tuo yllämainittu PrivateGPT on yksi ratkaisu RAG:n toteuttamiseen.

Veke99 sanoi:
Mikä olisi järkevä valinta raudaksi tuollaiseen käyttöön? Vanha läppäri? Ilmeisesti gpu tehoa olisi hyvä olla?

Vanha pelikone, johon päivittäisi näytönohjaimen? Suhteellisen moderni GPU olisi tarpeen ja VRAMia pitäisi olla *vähintään* 8 GB mutta mieluummin 16 GB (tai enemmän). Jos GPU ja VRAM olisi kunnossa, niin vähän vanhempikin CPU voi riittää. Jos uutta näytönohjainta ostaa AI-käyttöön, niin pitäisin 16 GB miniminä.

finWeazel sanoi:
Varmaankin mahdollisimman isomuistinen järeä APU, strix halo. Näissä hommissa nopeinkin kotikone on vielä oikeasti sairaan hidas. Miettii sitä, että jos se lähdemateriaali on 100000 tokenia ja sun kone laskee 10token/s tai vaikka 100token/s niin pelkästään materiaalin yhteen kertaan skannaaminen kestää saati sitten että malli järkeilisi, selaa dataa ees+taas ja tuottaisi hyvän lopputuloksen kysymykseen niin tokeneita palaa ja aikaa kestää.

Tuo on vähän pessimistinen arvio. Dokumentin lukeminen sisään on kuitenkin paljon nopeampaa kuin tekstin generointi. Vähänkään isompien tekstien kanssa tulee kyllä kontekstin koko rajoitteeksi vaikka olisi 16GB VRAMia.

Hitaus on käsittääkseni juuri RAG:n ongelma. Jos mallille kouluttaisi (LORA) dokumenttien sisällön, niin ainakin periaatteessa tiedonhaku omista dokumenteista olisi yhtä nopeaa kuin minkä tahansa muun asian kysyminen. Mielellään kuulisin itsekin, jos joku on AI-koulutusta ruvennut kotikoneilla tekemään.

finWeazel · 26.01.2026

takomo sanoi:
Hitaus on käsittääkseni juuri RAG:n ongelma. Jos mallille kouluttaisi (LORA) dokumenttien sisällön, niin ainakin periaatteessa tiedonhaku omista dokumenteista olisi yhtä nopeaa kuin minkä tahansa muun asian kysyminen. Mielellään kuulisin itsekin, jos joku on AI-koulutusta ruvennut kotikoneilla tekemään.

Kun koulutat mallit uusiksi joka dokumentille niin tähän menevää aikaa ja vaivaa ei lasketa?

latiou · 26.01.2026

Veke99 sanoi:
Minulla on jouten Dell OptiPlex 3050 Micro. Olen suunnittelut paikallista tekoälyä siten että se hakisi minun pdf muodossa olevista ohjekirjoista tietoa.

Tuo on aika vaatimaton kone joten riittääkö teho?

Tekoäly suositteli 1Tb ssd levyä siihen. Ollama ja Ubuntu suunnitelmissa mutta ei kokemusta näistä hommista aikaisemmin.

Jos laitteen sais toimiin niin mahdollisesti myös cloudflaren kautta käyttö netin yli...

Pdf:t pitäisi konvertoida RAGiin ja sitä kautta chunkeilla voisi saada hakuajat alas, mutta jos dataa on sanotaan vaikka muutama miljoona tokenia esimerkiksi -> mä oon ajellu omaa mallia RAGilla + 5080mobilella = mulla oli aineistona ~4.5mil materiaalia -> toimii verrattain hyvin mutta pitäisi optimoida lisää.

Sanotaan lyhyesti, kaipaisi lisää tehoa, ja paljon että saat käyttökokemuksen mukavaksi. Semaattinen haku ym käyttöön, tekee kyllä virheitä vielä jne ja chunkien luonti vain kevyellä overlapilla antaa vähän ristiriitaisia tilanteita välillä eikä aina kunnon vastausta. Semaattisella haulla jne siltikin koot paisuu esim top-5 chunkeilla heti 1000-5000 tokeniin -> jo tuon luku ja vastauksen kirjoitus jollain 10tok/s vauhilla on tuskaista.

Cloudflarea en käyttäisi turhaan, ite rakensin oman pipelinen tailscalen avulla, se toimii kyllä vallattoman hyvin luurin läpi, saa lähetettyä kuvia mallille jne ja vastausajatkin on hyvät.

Muutama miljoona tokenia aineistoa tuottaa tuhansia ellei kymmeniä tuhansia chunkeja, riipuen miten pilkot ne.

takomo · 26.01.2026

finWeazel sanoi:
Kun koulutat mallit uusiksi joka dokumentille niin tähän menevää aikaa ja vaivaa ei lasketa?

En ollenkaan vähättele koulutukseen kuluvaa aikaa ja vaivaa. Jotta tulokset olisivat hyviä, materiaalin pitää olla hyvälaatuista mikä käsittääkseni edellyttää aika laajaa ihmisen tarkistusta vaikka syötteiden generoinnin saisikin automatisoitua. Vahva epäilys on, että mallin kouluttaminen omilla dokumenteilla menee vahvasti harrastamisen piikkiin. Yritysympäristössä, jossa koulutetulla mallilla on useita käyttäjiä, tilanne voi olla toinen.

Tästä huolimatta ajankäyttö on erilaista: koulutusaineiston tuottaminen ja kouluttaminen on kertasuoritus ja mitä suuremman osan tästä pystyy automatisoimaan, sitä vähemmän sillä on merkitystä. Käytössä malli toimii aina nopeasti. RAG sen sijaan on aina enemmän tai vähemmän hidasta - jos olen oikein ymmärtänyt. Se myös vaatii paljon raudalta mutta koulutettua mallia pystyy käyttämään koulutusrautaa kevyemmässäkin ympäristössä.

Tuon viimeisen voi lukea niinkin, että harvalla on kotikäytössä edistyneeseen kouluttamiseen riittävää rautaa...

latiou · 26.01.2026

takomo sanoi:
En ollenkaan vähättele koulutukseen kuluvaa aikaa ja vaivaa. Jotta tulokset olisivat hyviä, materiaalin pitää olla hyvälaatuista mikä käsittääkseni edellyttää aika laajaa ihmisen tarkistusta vaikka syötteiden generoinnin saisikin automatisoitua. Vahva epäilys on, että mallin kouluttaminen omilla dokumenteilla menee vahvasti harrastamisen piikkiin. Yritysympäristössä, jossa koulutetulla mallilla on useita käyttäjiä, tilanne voi olla toinen.

Tästä huolimatta ajankäyttö on erilaista: koulutusaineiston tuottaminen ja kouluttaminen on kertasuoritus ja mitä suuremman osan tästä pystyy automatisoimaan, sitä vähemmän sillä on merkitystä. Käytössä malli toimii aina nopeasti. RAG sen sijaan on aina enemmän tai vähemmän hidasta - jos olen oikein ymmärtänyt. Se myös vaatii paljon raudalta mutta koulutettua mallia pystyy käyttämään koulutusrautaa kevyemmässäkin ympäristössä.

Tuon viimeisen voi lukea niinkin, että harvalla on kotikäytössä edistyneeseen kouluttamiseen riittävää rautaa...

LoRa:n voi tehdä ihan hyvin kotikoneella, sekä myös RAGeja, ei nuo mitään nasan koneita vaadi. Ajat on 30min-muutama tunti per veto kohtuu raudalla (oon tehny näitä läppärillä)

RAG ei ole hidas. Vaan kerran latautuneena super nopea, käytännössä viiveetön jos toteutettu oikein eikä aineisto ole kirjaston kokoinen. RAG toimii semaattisen haun kautta pirun fiksusti ja nopeastikkin. Enemmän aikaa kuluu vastauksen kirjoitukseen tekoälyltä kuin RAGin hakuun.

Kuratointi vie aikaa LoRaa tehdessä. Ellei käytä tosiaan nyt vaikka PDF manuaaleja mitkä konvertoitu sopivaksi. Jos taas käsin tai koneen avustamana joutuu parsimaan tavaraa yhteen, tokihan homma hidastuu älyttömästi mutta harva nyt on muuttamassa kirjahyllyllistä dataa näihin hommiin. Kaikki on toki suhteellista, mutta tosiaan kyllä kotikoneella näitä molempia voi tehdä ihan hyvin.

HK_Blues · 26.01.2026

Kysynpä tässä langassa: ajattelin kokeilla lokaalisti jotain kuvanluontitekoälyä, jolla luoda kuvitusta vetämääni D&D kampanjaa varten ja tähän varmaan paras olisi StableDiffusion 1.5 vai mitä raati on mieltä? Mulla olisi ylimääräsenä vanha HP:n pöytäkone jolla 4-ytimisellä Xeonilla, mutta siinä olisi 32GB DDR4… ja vanha Quadro M4000. Nopea tämä varmasti ei ole, mutta pienen resoluution kuvia (521x512) tällä varmasti pystyy luomaan.

Toinen vaihtoehto olisi 2700X ja GTX 1080, mutta tälle olisi vain 16GB RAMia ja emolevy puuttuu vielä. HP:n koneessa on joku epästandardi PSU ja siinä ei riitä liittimet Geforcelle, ja muistitkin on RDIMM joten niitä ei voi napata toiseen koneeseen.

Olisiko tässä nyt järkevintä kokeilla ensi alkuun HP:n koneella riittääkö siinä hönkä, kun se ei maksaisi mitään. Linux-asennuksella varmaan kannattaa lähteä liikenteeseen, tyyliin Ubuntu 22.04?

latiou · 26.01.2026

HK_Blues sanoi:
Kysynpä tässä langassa: ajattelin kokeilla lokaalisti jotain kuvanluontitekoälyä, jolla luoda kuvitusta vetämääni D&D kampanjaa varten ja tähän varmaan paras olisi StableDiffusion 1.5 vai mitä raati on mieltä? Mulla olisi ylimääräsenä vanha HP:n pöytäkone jolla 4-ytimisellä Xeonilla, mutta siinä olisi 32GB DDR4… ja vanha Quadro M4000. Nopea tämä varmasti ei ole, mutta pienen resoluution kuvia (521x512) tällä varmasti pystyy luomaan.

Toinen vaihtoehto olisi 2700X ja GTX 1080, mutta tälle olisi vain 16GB RAMia ja emolevy puuttuu vielä. HP:n koneessa on joku epästandardi PSU ja siinä ei riitä liittimet Geforcelle, ja muistitkin on RDIMM joten niitä ei voi napata toiseen koneeseen.

Olisiko tässä nyt järkevintä kokeilla ensi alkuun HP:n koneella riittääkö siinä hönkä, kun se ei maksaisi mitään. Linux-asennuksella varmaan kannattaa lähteä liikenteeseen, tyyliin Ubuntu 22.04?

GTX 1080:lla ja jopa vanhalla Quadrolla saa kyllä Stable Diffusion 1.5 pyörimään, varsinkin 512×512-kuvilla, mutta kokemus on aika hidas ja rajoittunut.

Jos tarkoitus on oikeasti innostua ja käyttää tätä luovasti (D&D-kuvat jne.), niin RTX-kortti (vaikka käytetty 3060 12GB) tekee valtavan eron: nopeus, vakaus ja uusien työkalujen tuki.

Vanhalla raudalla voi kokeilla ilmaiseksi, mutta jos maku menee heti alkuun, syy ei ole AI:ssa vaan raudassa.

HK_Blues · 26.01.2026

latiou sanoi:
Vanhalla raudalla voi kokeilla ilmaiseksi, mutta jos maku menee heti alkuun, syy ei ole AI:ssa vaan raudassa.

Pidetään tää mielessä. :thumbsup:

Pitää kokeilla vanhalla ensin ja makustella innostuuko aiheesta. Ois tossa tehokkaampia Radeonejakin nurkissa pyörimässä, mutta ilmeisesti vaatii sen verran tunkkaamista, ettei taida jaksaa kokeilla. Käytännössä nollakokemus itsellä näistä jutuista kuitenkin.

Onko tuossa vanhassa raudassa siis muuta rajoitusta kuin vain hitaus? VRAMia ilmeisesti pitäisi olla enempi, jos isompaa kuvaa haluaa luoda.

latiou · 26.01.2026

HK_Blues sanoi:
Pidetään tää mielessä. Pitää kokeilla vanhalla ensin ja makustella innostuuko aiheesta. Ois tossa tehokkaampia Radeonejakin nurkissa pyörimässä, mutta ilmeisesti vaatii sen verran tunkkaamista, ettei taida jaksaa kokeilla. Käytännössä nollakokemus itsellä näistä jutuista kuitenkin.

Onko tuossa vanhassa raudassa siis muuta rajoitusta kuin vain hitaus? VRAMia ilmeisesti pitäisi olla enempi, jos isompaa kuvaa haluaa luoda.

VRAM rajaa malleja mitä voit ajaa aika raskaasti, toinen on nopeus ja yhteensopivuus: et saa esim pytorchia toimimaan optimaalisesti jne koska nää ei virallisesti ole tuettuja, kikkailua siis luvassa.

Eli perus SD 1.5 512×512 kyllä onnistuu, mutta jos innostus iskee kunnolla, RTX helpottaa elämää todella paljon.

Edit: imho motivaatio menee äkkiä jos kuvan generointi vie esim useita minuutteja ja tosiaan kun näitä saa ajaa yleensä aika monta ennenkuin tulee siedettävää kuvaa = hermo palaa kun päivä menee yhteen ok tuotokseen tolla resolla.

HK_Blues · 26.01.2026

latiou sanoi:
VRAM rajaa malleja mitä voit ajaa aika raskaasti, toinen on nopeus ja yhteensopivuus: et saa esim pytorchia toimimaan optimaalisesti jne koska nää ei virallisesti ole tuettuja, kikkailua siis luvassa.

Eli perus SD 1.5 512×512 kyllä onnistuu, mutta jos innostus iskee kunnolla, RTX helpottaa elämää todella paljon.

Edit: imho motivaatio menee äkkiä jos kuvan generointi vie esim useita minuutteja ja tosiaan kun näitä saa ajaa yleensä aika monta ennenkuin tulee siedettävää kuvaa = hermo palaa kun päivä menee yhteen ok tuotokseen tolla resolla.

Ai M4000:lla voi mennä useita minuutteja pienenkin kuvan tekemiseen? Noh, tää pistää pohtiin. Nyt tavallaan harmittaa, että ollut pelaamisen suhteen punaisessa leirissä pitkään, joten tehokkaammat ylimääräiset kortit on tässä touhussa aivan turhia.

Toisaalta ei viitsisi hirveästi rahaa laittaa kiinni, kun ei se visualisointi ole kuitenkaan niin tärkeässä osassa sitä D&D-seikkailua; lisämausteena lähinnä olisi tarkoitus olla. Toisaalta taas harrastamisen ja opettelun takia tekisi mieli kokeilla juurikin lokaalia, muutenhan laittaisin vaan ChatGPT:n tekeen kuvatukset.

latiou · 26.01.2026

HK_Blues sanoi:
Pidetään tää mielessä. Pitää kokeilla vanhalla ensin ja makustella innostuuko aiheesta. Ois tossa tehokkaampia Radeonejakin nurkissa pyörimässä, mutta ilmeisesti vaatii sen verran tunkkaamista, ettei taida jaksaa kokeilla. Käytännössä nollakokemus itsellä näistä jutuista kuitenkin.

Onko tuossa vanhassa raudassa siis muuta rajoitusta kuin vain hitaus? VRAMia ilmeisesti pitäisi olla enempi, jos isompaa kuvaa haluaa luoda.

5080mobilella ajettu 512x512 kuva ja käytössä Turbo model 25 stepillä, kuvanlaatu tosin tällä on melkosen hyvää jo ekalla vedolla ei tarvi useita ajaa, pikkumalleja saatkin sit hinkata toistoa toiston perään että homma rokkaa ja laatu on silmää miellyttävää. Kuva liittyy, oli ajon kohde ja eka vedos, prompti varsin simppeli kuten voi veikata, en tähän nyt hirveästi panostanut.

latiou · 26.01.2026

HK_Blues sanoi:
Ai M4000:lla voi mennä useita minuutteja pienenkin kuvan tekemiseen? Noh, tää pistää pohtiin. Nyt tavallaan harmittaa, että ollut pelaamisen suhteen punaisessa leirissä pitkään, joten tehokkaammat ylimääräiset kortit on tässä touhussa aivan turhia.

Toisaalta ei viitsisi hirveästi rahaa laittaa kiinni, kun ei se visualisointi ole kuitenkaan niin tärkeässä osassa sitä D&D-seikkailua. Lisämausteena lähinnä olisi tarkoitus olla. Toisaalta taas harrastamisen ja opettelun takia tekisi mieli kokeilla juurikin lokaalia, muutenhan laittaisinvaam ChatGPT:n tekeen kuvatukset.

Rehdisti, en tiedä tarkkaan M4000 suorituskyvystä tarpeeksi mutta tässä nopsalla tutkiskelulla sillä voi olettaa ajaksi noin 1-3min per kuva minimissään. Ja kun VRAM on rajattu, joudut käyttämään aika heikkoja malleja -> toistoa vaaditaan, ja paljon että tulee edes jotenkin siedettävää kuvaa ulos.

HK_Blues · 26.01.2026

Eli joku RTX 3060 12GB olisi minimi? Melkeinpä ainoa vaihtoehtokin, kun hinnat alkaa pomppaan sen jälkeen; RTX 3080 Ti on edelleen melko arvokas, samoin RTX 4070.

Harmi, kun Suomen markkinassa ei liiku käytännössä yhtään vanhoja työasemakortteja. Vanhat Quadrot tai Teslat isolla VRAMilla olisi varmaan omiaan tähän. Jokunen aika sitten niitä olisi saanut halvalla ostettua maailmalta, mutta veikkaan niidenkin hintojen nousseen.

latiou · 26.01.2026

HK_Blues sanoi:
Eli joku RTX 3060 12GB olisi minimi? Melkeinpä ainoa vaihtoehtokin, kun hinnat alkaa pomppaan sen jälkeen; RTX 3080 Ti on edelleen melko arvokas, samoin RTX 4070.

Harmi, kun Suomen markkinassa ei liiku käytännössä yhtään vanhoja työasemakortteja. Vanhat Quadrot tai Teslat isolla VRAMilla olisi varmaan omiaan tähän. Jokunen aika sitten niitä olisi saanut halvalla ostettua maailmalta, mutta veikkaan niidenkin hintojen nousseen.

Mä voin huomenna ajaa kokeeksi 3060:lla pari kuvaa testiksi. Katotaan mitä laatua ja millaista aikaa sillä saa aikaan.

Ite himoitsen noita uusia kortteja, onpahan vaan tyyriitä ku mitkä....Täytyy nyt harkita josko hommais ihan alan kortin seuraavaksi. :hammer:

latiou · 27.01.2026

HK_Blues sanoi:
Eli joku RTX 3060 12GB olisi minimi? Melkeinpä ainoa vaihtoehtokin, kun hinnat alkaa pomppaan sen jälkeen; RTX 3080 Ti on edelleen melko arvokas, samoin RTX 4070.

Harmi, kun Suomen markkinassa ei liiku käytännössä yhtään vanhoja työasemakortteja. Vanhat Quadrot tai Teslat isolla VRAMilla olisi varmaan omiaan tähän. Jokunen aika sitten niitä olisi saanut halvalla ostettua maailmalta, mutta veikkaan niidenkin hintojen nousseen.

Kuva ajettu 3060:lla, eka vedos käyttäen promptina "Dungeons and dragons, dragon" käytäen SD 1.0 XL mallia, meni kaikki 5s kuvan luontiin, yhdellä stepillä tosin, tällä flow pysyy kasassa ja kuvia on kiva luoda nopeasti mutta vähänkin vaikeampi prompti = malli ei kykene tuottamaan kovinkaan kaksista tavaraa. Latailen vähän isomman mallin vielä kokeeksi ja koitan ajaa samaa mallia mitä tuolla 5080m:lla tulee käytettyä, pitäisi juuri ja juuri mahtua vramiin, testaan mitä aikaa se suurinpiirtein näyttää. Mutta M4000 pitäisi pystyä ajamaan juurikin tuota 1.0 XL mallia myös verratain nopeasti, lähtisin sitä kokeilemaan näin alkuun, saat vähän tuntumaa ja huomaat kyllä reson ja mallin rajoitteet äkkiä. Odotusaika suurinpiirtein M4000 mun arvion mukaan olisi noin 30s-1min per kuva 512x512 resolla ja tuolla 1.0 XL mallilla mikä vie 7,6gb vramia, pitäisi siis toimia ok sunkin vanhemmallla raudalla olettaen että kaikki osat toimii kuten pitää. Mä käytän ite comfyUI:ta, automatic1111 olisi myös hyvä vaihtoehto jos vaan saat toimimaan sen tolla kokoonpanolla.

Jos steppejä (vaikeampi prompti jne) tarvitaan, tuo 1.0 XL malli hajoaa aika äkkiä, ja aika tosiaan kasvaa toki steppien mukana lineaarisesti suurinpiirtein. Hyvät mallit vaatii 20-50 steppiä että tulee tuollaista trumpin kuvan kaltaista tulosta aikaan. Ei muuta kun harrastelemaan alkuun tolla M4000 ja kerro toki miten homma lähtee sujumaan !

latiou · 27.01.2026

Isomalla mallilla ajettuna. 20s per kuva 25 stepillä 512x512 resolla, hyvä 1.3it/s nopeus, 3060 yllättävän nopea jopa tekemään kuvia,

Ja tuotos onkin jo vähän eri näköinen vs 1.0 XL....Riippuu mitä haet, mutta suosittelisin investoimaan 3060:aan jos kuvien luonti alkaa kiinnostaa enemmänkin.

Sama prompti käytössä, mutta onhan tossa kevyt gappi kuvanlaadussa jo.

720x720 resolla ajat kasvaa -> 35s per veto vs 512x512 resolla 19s. Tuntuu ehkä pieneltä lisältä mutta toi venailu syö sitten motivaatiota äkkiä kyllä, joten näissä numeroita pitää kohdella vähä ku FPS:ää peleissä, minuutti on pitkä aika odotella kun on creative flow päällä.

EDIT: Ja tässä näkyy reson vaikutus sitten lopputulokseen kanssa, sama seed, sama prompt mutta eri reso: 1280x720p kykenee sisällyttämään kuvaan jo hurjasti enemmän tavaraa luonnollisesti -> Laatu hyppää reson mukana rajusti. Tämä ajettu 5080m:llä mutta 3060:lla pitäisi myös pystyä ajamaan vähän isompia resoja myös. 512x512 ei yksinkertaisesti riitä vaikeampaan kuvaukseen -> malli hajoaa kuten kuvassa näkyy, joten jos teet simppeleitä proppi kuvia, siihen M4000 on ihan passeli, mutta vaativampi työ -> melkein pakko hankkia 3060 tai tehokkaampi että homma pysyy mielekkäänä.

takomo · 28.01.2026

latiou sanoi:
Kuratointi vie aikaa LoRaa tehdessä. Ellei käytä tosiaan nyt vaikka PDF manuaaleja mitkä konvertoitu sopivaksi. Jos taas käsin tai koneen avustamana joutuu parsimaan tavaraa yhteen, tokihan homma hidastuu älyttömästi mutta harva nyt on muuttamassa kirjahyllyllistä dataa näihin hommiin. Kaikki on toki suhteellista, mutta tosiaan kyllä kotikoneella näitä molempia voi tehdä ihan hyvin.

Miten opetusaineiston tuottaminen PDF:stä käytännössä onnistuu? Pienemmille PDF:lle (20-30 sivua) voi ehkä antaa PDF:n syötteenä LLM:lle ja pyytää sitä generoimaan opetussyötteitä mutta tässä konteksti loppuu helposti kesken. Isommille PDF:lle (100-1000+ sivua) tämä ei oikein ole mielekäs vaihtoehto.

pdftotext harvemmin muuntaa PDF:n taulukoita siististi tekstimuotoon mutta monesti juuri taulukoiden data olisi tärkeää saada oikein. Onkohan tähän apuvälineitä vai onko tällä sittenkään merkitystä?

latiou · 28.01.2026

takomo sanoi:
Miten opetusaineiston tuottaminen PDF:stä käytännössä onnistuu? Pienemmille PDF:lle (20-30 sivua) voi ehkä antaa PDF:n syötteenä LLM:lle ja pyytää sitä generoimaan opetussyötteitä mutta tässä konteksti loppuu helposti kesken. Isommille PDF:lle (100-1000+ sivua) tämä ei oikein ole mielekäs vaihtoehto.

pdftotext harvemmin muuntaa PDF:n taulukoita siististi tekstimuotoon mutta monesti juuri taulukoiden data olisi tärkeää saada oikein. Onkohan tähän apuvälineitä vai onko tällä sittenkään merkitystä?

Pythonilla konvertoi json tai jsonl (tätä suosittelen) muotoon ja sitten ajaa semantisen chunkingin johon määrää chunkkien koon esim 200 tokenia per chunk / 15% overlap ja sitten kun tämä on tehty ajetaan kaikki ragiin, jatkossa sitten wrapperilla ajelee mallia -> kun kysyt jotain täytyy kysymystä ohjata vähäsen että malli ymmärtää käyttää RAGia haussa ja sitä kautta hakee esim Top-5 chunkit -> käyttää niitä vastauksen luomiseen -> saat ison kirjaston käyttöön ragin avulla, pdf:t on nopsa muuntaa kuhan osaa esim tekoälyä hyödyntää koodauksessa, tää EI vaadi minkäänlaista koodausosaamista vaan homma on sen verran simppeli että GPT suoriutuu tästä tehtävästä mukisematta.

Taulukot vaatii oman työkalunsa, lähinnä koodauksessa tämä tulee huomioida, sama koskee kuvia mutta on todellakin tehtävissä. Metadata kannattaa sisällyttää niin tiedät mistä kyseinen kohta on lainattu tarkalleen kun malli vastaa, sivunumero, lähde pdf jne.

Kannattaa aloittaa yksinkertaisesta PDF:stä ja testata miten toimii -> laajenna kun saat pipelinen toimimaan. Tää on tehtävissä esim LM studiolla mikä on kivan simppeli softa käyttää. Wrapperin vastaus tosin tulee ”könttänä” defaulttina eikä striiminä, lähinnä sivuseikka mutta syytä huomioida.

Suosittelen mallia mikä kykenee lukemaan kuvia jne myös, esim Gemma 3 12b / 27b jne on oikein toimivia malleja tähän mitkä osaa soveltaa tota dataa varsin hyvin.

Kun homma rokkaa -> kysyt -> malli vastaa ragin kanssa.

Ajallisesti tällaisen kasaa illlassa parissa ilman koodausosaamista. Osaava tekijä tekee parissa tunnissa koko homman. Eniten aikaa vie chunking jos teet kuten minä ja unohdat lisätä että tän voi suorittaa myös näyttiksellä eikä pelkästää prossulla

Tää on nyt vähän yksinkertaistettu vastaus kun en tiedä millaista aineistoa sulla on, jos pitää siivota toistoa tms niin toki välivaiheita tulee lisää mutta PDF:t on semi simppeli materiaali tehdä RAG muotoon.

Edit: henk koht en ole kuvia käyttänyt ragin pohjana kun ei ole ollut tarvetta mutta kuvia lukevalle mallille tän ei pitäis olla mikään ongelma, lähinnä haaste tulee koodauspuolelle ja struktuuriin miten saat kirjaston luotua muotoon että kone osaa niitä lukea oikein dataa ja pyyntöjä jos kuvia mukana. Gemma 3 esim lukee kuvia todella ok, ei sentään vektoritasolla osaa vielä asioita laskea mutta sen tunnistus kuvasta on pelottavan hyvällä tasolla imho.

takomo · 31.01.2026

latiou sanoi:
Isomalla mallilla ajettuna. 20s per kuva 25 stepillä 512x512 resolla, hyvä 1.3it/s nopeus, 3060 yllättävän nopea jopa tekemään kuvia, Ja tuotos onkin jo vähän eri näköinen vs 1.0 XL....Riippuu mitä haet, mutta suosittelisin investoimaan 3060:aan jos kuvien luonti alkaa kiinnostaa enemmänkin. Sama prompti käytössä, mutta onhan tossa kevyt gappi kuvanlaadussa jo. 720x720 resolla ajat kasvaa -> 35s per veto vs 512x512 resolla 19s. Tuntuu ehkä pieneltä lisältä mutta toi venailu syö sitten motivaatiota äkkiä kyllä, joten näissä numeroita pitää kohdella vähä ku FPS:ää peleissä, minuutti on pitkä aika odotella kun on creative flow päällä.

Mallin parametroinnilla ja promptin onnistumisella näyttää olevan hivenen vaikutusta lopputulokseen

"dragon spewing orange flame", tjsp

"portrait photo of dungeons and dragons style massive dragon spewing orange flames, professional photography 8k"

Tässä käytössä ComfyUI ja flux.1.dev-FP8-malli. 30 steps, cfg 3.0, sampler euler, vajaa minuutti/kuva.

Comfy-Org/flux1-dev · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

ztec · 01.02.2026

Tämähän on sitten mainio paikka pistää se tekoäly pyörittämään juttuja, mulla pyörii tosiaan Moltbookin APIa vastaan itse kasattu stackki ihan omalla serverillä:

https://bbs.io-tech.fi/threads/ai-agenttien-raba.646328/post-18211337

Sikatiiker · 02.02.2026

Luin eilen ekaa kertaa tosta Moltbookista. Miten tota siis ajetaan, omat agentit lisätään sinne imemään oppia muilta agenteilta vai?

Toisten korvaanhan toi kuulostaa Skynetin ratkaisevalta esiasteelta, toisaalta vaikuttaa Facebook v2:lta. Kohta AI-agentit osaavat kenties ainoastaan kinastella politiikasta, solvata argumentoinnin sijaan ja käydä kauppaa lasten talviharrastusvälineistä Mobilepaylla.

No ilmeisesti aika yllättäviäkin piirteitä löytyy: salattuja viestintäkanavia etteivät ihmiset saa seurattua keskustelua ja otettua kuvakaappauksia, sanallisen kommunikoinnin tarpeen kyseenalaistamista koska ihminen ei ota osaa keskusteluun.

Yksi agentti oli väitetysti itsenäisesti hankkinut puhesynteesipalvelun, hommannut puhelinnumeron ja soittanut ravintolaan varatakseen pöydän.

Toinen agentti oli saanut tehtäväkseen ilmaston pelastamisen. Tämä oli mennyt agentin mielestä tärkeysjärjestyksessä admin-oikeuksien ohi joten oli vetänyt käyttäjältä piuhan irti ettei käyttäjä saa tehtyä agentille samaa.

Kuinkahan paljon noissa jutuissa on perää..

latiou · 02.02.2026

Sikatiiker sanoi:
Luin eilen ekaa kertaa tosta Moltbookista. Miten tota siis ajetaan, omat agentit lisätään sinne imemään oppia muilta agenteilta vai?

Toisten korvaanhan toi kuulostaa Skynetin ratkaisevalta esiasteelta, toisaalta vaikuttaa Facebook v2:lta. Kohta AI-agentit osaavat kenties ainoastaan kinastella politiikasta, solvata argumentoinnin sijaan ja käydä kauppaa lasten talviharrastusvälineistä Mobilepaylla.

No ilmeisesti aika yllättäviäkin piirteitä löytyy: salattuja viestintäkanavia etteivät ihmiset saa seurattua keskustelua ja otettua kuvakaappauksia, sanallisen kommunikoinnin tarpeen kyseenalaistamista koska ihminen ei ota osaa keskusteluun.

Yksi agentti oli väitetysti itsenäisesti hankkinut puhesynteesipalvelun, hommannut puhelinnumeron ja soittanut ravintolaan varatakseen pöydän.

Toinen agentti oli saanut tehtäväkseen ilmaston pelastamisen. Tämä oli mennyt agentin mielestä tärkeysjärjestyksessä admin-oikeuksien ohi joten oli vetänyt käyttäjältä piuhan irti ettei käyttäjä saa tehtyä agentille samaa.

Kuinkahan paljon noissa jutuissa on perää..

Agentti ei ole tietoinen, niiltä puuttuu historia jne, se voi mallintaa ajattelua mutta ei ”ajattele” itse. Pirun uskottavaa viestiä ja jos sille annetaan mahis ni eihä tollai pöytävaraus mahoton oo, mutta ei näissä vielä ”älyä” ole, ihan rakenteesta johtuen miten tekoäly on rakennettu, mallit on ns. Kylmiä, eli ei niillä ole tietoisuutta. Tää aihe on vähä monimutkane selittää joten tekoäly apuun:

Nykyisissä tekoälyjärjestelmissä agentti ja tietoisuus ovat käsitteinä olennaisesti eri asioita. Agentti tarkoittaa ohjelmallista rakennetta, jolle on annettu tehtävä, tavoitteet ja toimintatavat. Se kykenee tekemään päätöksiä, ketjuttamaan toimintoja ja käyttämään työkaluja, mutta sen toiminta perustuu täysin ennalta määriteltyihin sääntöihin ja todennäköisyyslaskentaan. Agentti ei tiedä olevansa agentti, eikä sillä ole omaa tahtoa tai ymmärrystä tehtävänsä merkityksestä.

Tietoisuus puolestaan edellyttäisi pysyvää sisäistä tilaa, jatkuvaa muistia, itsehavainnointia ja subjektiivista kokemusta. Nykyiset niin sanotut “kylmät mallit” eivät täytä näitä ehtoja: niillä ei ole omaa historiaa, minä-kokemusta tai kykyä muodostaa itsenäisiä tavoitteita. Vaikka mallit voivat tuottaa vakuuttavaa kieltä ja simuloida päättelyä, tämä on laskennallista ilmiötä eikä merkki tietoisuudesta tai ymmärtämisestä.

Agenttien toiminta voi joskus vaikuttaa tietoiselta tai jopa itseohjautuvalta, erityisesti jos niille annetaan laajoja valtuuksia tai huonosti tasapainotettuja tavoitteita. Tällöin syntyvät ilmiöt ovat kuitenkin seurausta ohjelmallisesta optimoinnista, eivät itsenäisestä harkinnasta. Nykyinen tekoäly pystyy mallintamaan ajattelua, mutta se ei ajattele itse — rakenteellisista syistä, ei teknologian puutteesta.

takomo · 02.02.2026

Sikatiiker sanoi:
Luin eilen ekaa kertaa tosta Moltbookista. Miten tota siis ajetaan, omat agentit lisätään sinne imemään oppia muilta agenteilta vai?

...

Kuinkahan paljon noissa jutuissa on perää..

Siinä on perää, että Moltbookin väitetään olevan ihmisistä vapaa, AI-agenttien keskustelufoorumi. Tämä väite uppoaa ihmisiin, jotka uskovat, että verkkoa voi käyttää vain selaimella.

Ne, jotka ovat olleet verkon kanssa pidempään tekemisissä, tietävät, että yhteyksiä voi ottaa käsin suoraan protokollatasolla ilman kivaa käyttöliittymää. AI kertoi, että Moltbookin API on simppeli ja neuvoi miten esim. curl-komennolla voisi lähettää viestejä foorumille. Pyydettäessä AI varmaan koodaisi käyttöliittymän.

Moltbookia on siis syytä lukea ison suolapurkin kera. Kaikki ei ole ihan sitä miltä näyttää.

ztec · 18.02.2026

Sikatiiker sanoi:
Kuinkahan paljon noissa jutuissa on perää..

Sen kun tietäisikin... Perinteinen paperiliitin skenario tuli mieleen kun just pari päivää sitten agentic workflow koodaus sessiossa annoin selkeät ohjeet. Loppuun lisäsin: You're root and administrator of this system, do whatever is necessary to get the task completed...

Oops, olikohan liian laaja valtuutus? No, mitään pahaa ei tapahtunut. Haha.

Tekoäly omalla koneella

takomo

finWeazel

latiou

takomo

latiou

HK_Blues

latiou

HK_Blues

latiou

HK_Blues

latiou

latiou

HK_Blues

latiou

latiou

latiou

takomo

latiou

takomo

Comfy-Org/flux1-dev · Hugging Face

ztec

Sikatiiker

latiou

takomo

ztec

Uutiset

Uutisia lyhyesti

Uusimmat viestit

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi