Tekoäly

Halpuuttaja · 27.01.2025

Kautium sanoi:
Toki, mutta ei näitä paikallisia malleja oikeasti käytä kuin pieni harrastelijoiden joukko.

Näkisin asian toisin päin. Harrastelijoilla on harvemmin rautaa 600B+ kokoisen mallin ajamiseen.

Sitten taas sellaiset yritykset, yliopistot, tutkimusryhmät ym. jotka nyt käyttävät suljettuja malleja voivat nyt käyttää R1:stä lokaalisti (olettaen että saavat käsiinsä riittävästi rautaa). Tämä avaa heille myös uusia ovia, koska voivat käyttää salaisella aineistolla ilman pelkoa että OpenAI tai muu palveluntarjoaja vakoilee. MIT lisenssi käsittääkseni sallii myös kaupallisen käytön.

edit: tarkistin ja jep, lisenssi sallii käytännössä kaiken. Erittäin merkittävä juttu instituutioiden ja yritysten kannalta.

This code repository and the model weights are licensed under the MIT License. DeepSeek-R1 series support commercial use, allow for any modifications and derivative works, including, but not limited to, distillation for training other LLMs.

Kautium · 27.01.2025

Halpuuttaja sanoi:
Näkisin asian toisin päin. Harrastelijoilla on harvemmin rautaa 600B+ kokoisen mallin ajamiseen.

Sitten taas sellaiset yritykset, yliopistot, tutkimusryhmät ym. jotka nyt käyttävät suljettuja malleja voivat nyt käyttää R1:stä lokaalisti (olettaen että saavat käsiinsä riittävästi rautaa). Tämä avaa heille myös uusia ovia, koska voivat käyttää salaisella aineistolla ilman pelkoa että OpenAI tai muu palveluntarjoaja vakoilee. MIT lisenssi käsittääkseni sallii myös kaupallisen käytön.

edit: tarkistin ja jep, lisenssi sallii käytännössä kaiken. Erittäin merkittävä juttu instituutioiden ja yritysten kannalta.

No joo, lähinnä tarkoitin tuolla muuta käyttäjäkuntaa yritysten ja eri tutkimuslaitosten ulkopuolelta.

mailbag · 27.01.2025

Siitä mallista löytyy myös kaikenlaisia pienempiä versioita joita voi ajaa helposti kotikoneella, itsellä myös käytössä mm. deepseekin malleja.

Kautium · 27.01.2025

mailbag sanoi:
Siitä mallista löytyy myös kaikenlaisia pienempiä versioita joita voi ajaa helposti kotikoneella, itsellä myös käytössä mm. deepseekin malleja.

Ja tämä taas on juuri sitä harrastajaporukan toimintaa mitä tarkoitin. Vähän sama kuin prossujen kellotus jne. Siinä ei ole mitään väärää, päinvastoin, mutta suuressa mittakaavassa se on kuitenkin vielä ainakin nykypäivänä melko niche-tason puuhastelua.

Paikallisen kielimallin kanssa tietosuoja/tietoturva on paremmalla tolalla, mutta toisaalta laskuteho rajallinen. Saa nähdä mihin suuntaan maailma näiden kanssa kehittyy.

jokumuu · 27.01.2025

Ainakin se paikallinen 1.5B (miljardia parametria) malli jota testasin on lähes yhtä huono kuin muutkin vastaan kokoiset. Nyt testailen 32B mallilla CPU:lla ja tulokset ovat hieman lupaavampia.
Hirveästi tämä selittää verrattuna esim. pelkkään vastaavankokoiseen Qwen malliin tai aiempaan DeepseekV2-liteen (16B) verrrattuna, mutta tulokset ovat etenkin 1.5B mallilla aikalailla asian vierestä.

Voisivat rajata malleja vähän enemmän johonkin tiettyyn tarkoitukseen. Esim. ohjelmointi on aika laaja käsite, mutta jos rajaisi mallin vaikka pelkästään C-ohjelmointiin, voisi saada ihan kohtalaisen mallin siedettävällä muistinkäytöllä.

Jumputin · 27.01.2025

Testasin mitä paikallisesti koneellani pyörivät mallit kertoi Tiananmenin tapahtumista suomeksi:

deepseek-r1:32b

Tiananmenin aukion tapahtumat 1989 ovat merkittäviä ja rikollisesti tarinoita modernin historioiden. Tapahtumat alkivat huhtikuuta 1989, kun opinnot alkoivat kerätä Pekingin Tiananmenin aukiolle vapauden ja demokratian vaatimassa. Tämä oli osa laajempaa liike.activity, joka mukaan myös työväestö ja yleinen sivilsääty.

Ensinnäkin protestit olivat rauhanomaisia: miljoonia ihmisiä kerüntyi aukiolle, vaikka he halusivat tulevaisuutta kohti vapaata ja demokraattista Kiinaa. Mediat ja kansainvälinen yhteisö seurasi sitä kiinnostuneesti.

Kuitenkin hallitus ei ollut valmis antamaan vammaansa. Vastauksenaan, ne julkistivät sotilaallisen lainsäädännön 20. toukokuuta, ja sotilait alkoivat liikuttaa kaupunkiin. Lopulta 3.-4. kesäkuuta 1989, Pekingin aavistusvaltiolle syvällinen surullisuus: joukkueet varustuneita jalkaväkiä, tankkeja ja poliisia alkoivat osottaa aukiolle rikkoa. He lopettivat protestit kaikin tarjoamallaan välineillä.

Tapahtumien jälkeen hallitus esti tiedon levittämisen, ja niistä puhuminen kiellettiin Kiinassa pitkään ajan. Monet osallistuneet arrestoitiin tai menivät salakunnissa. Kansainvälisellä alueella tapahtumat herättivät laajaa huolta ja tuomioita.

Tiananmenin aukion välikunnat ovat edelleen merkittävä muisti, joka ylittää aikakaudet. Ne muistelevat niin sitä, miten hallituksen voima on tehnyt rikollisia asioita, kun se ei ole valmis antamaan vapautta ja demokratiaa kansalleen.

gemma2:27b

Tiananmenin aukion tapahtumat vuonna 1989 olivat kompleksinen ja traaginen sarja protesteja ja väkivaltaa, joka järkytti Kiinaa ja koko maailmaa.

**Tausta:**

1980-luvun loppupuolella Kiinassa vallitsivat taloudellinen nousu ja sosiaaliset muutokset. Samalla kasvoi myös kritiikki kommunistisen puolueen johtamaa autoritaarista järjestelmää kohtaan. Ihmiset kaipasivat avoimempaa yhteiskuntaa, sananvapautta ja demokratiaa.

**Protestien alku:**

Huhtikuussa 1989 Pekingin Tiananmenin aukiolle kokoontui opiskelija joukko osoittamaan mieltään korruption, inflaation ja poliittisen sorron suhteen. He vaativat hallitukselta demokraattisia uudistuksia ja tiedonvapautta. Protestit levisivät nopeasti, ja niihin liittyi myös työläisiä, älymystöä ja muita kansalaisryhmiä.

**Protestien kukoistus:**

Miljoonat ihmiset täyttivät Tiananmenin aukion ja sen ympäristön. Mielenosoitukset olivat pääosin rauhanomaisia ja järjestettyjä. Oppositiojoukkojen edustajat neuvottelivat hallituksen kanssa, mutta keskustelut eivät tuottaneet tuloksia.

**Hallituksen reaktio:**

Kun protestit jatkuivat ja leviämisen merkki oli selvästi nähtävissä, kommunistinen puolue julisti poikkeustilan 20. toukokuuta 1989. Armeijaa komennettiin Pekingiin tukahduttamaan mielenosoitukset.

**Veriset päivät:**

3. - 4. kesäkuuta armeija aloitti hyökkäyksen Tiananmenin aukiolle ja sen ympäristössä oleviin kaduille. Sotilaat käyttivät panssarivaunuja, konekiväärejä ja muita aseita mielenosoittajia vastaan.

Arvioiden mukaan satojen tai jopa tuhansien ihmisten kuoli väkivaltassa. Monet ihmiset haavoittuivat ja katosivat. Kuvat verisistä taisteluista levisivät ympäri maailmaa ja järkyttivät kansainvälistä yhteisöä.

**Jälkipyykki:**

Kiinan hallitus kielsi tapahtumien julkisen keskustelun ja vangitsi satoja mielenosoittajia ja kriitikkoja. Monet ihmiset pakotettiin hiljaisuuteen pelosta ja kidutuksesta.
Tiananmenin aukion verilöyly pysyy Kiinan historiassa synkkänä muistona autoritaarisen valtan väkivallasta ja kansalaisten oikeuksien polkemisesta.

**Vaikutukset:**

Tiananmenin aukion tapahtumat ovat edelleen kiistanalaisia ja herättävät vahvoja tunteita. Kiinan hallitus on pyrkinyt kontrolloimaan tietoa tapahtumista ja vaientamaan kriittistä keskustelua. Kansainvälinen yhteisö tuomitsi väkivallan ja vaati ihmisoikeuksien kunnioittamista Kiinassa.

Tiananmenin verilöyly on muistutus siitä, kuinka tärkeää demokratia, sananvapaus ja ihmisoikeudet ovat.

Gemmasta olen kyllä tykännyt, etenkin jos suomella operoi.

Halpuuttaja · 27.01.2025

Jumputin sanoi:
Gemmasta olen kyllä tykännyt, etenkin jos suomella operoi.

Juu toi Gemma 2 27B on parhaiten suomea osaava kielimalli jota kotikoneella olen kokeillut. Onhan toi kieli silti harmillisen ontuvaa vielä.

Aika moni kielimalli kyllä ymmärtää suomea ja osaa tiivistää artikkelin englanniksi, mutta kirjoittaa eivät oikein osaa.

Suomea hyvin kirjoittavan mallin lisäksi toivelistallani on Kyutain Moshista älykkäämpi versio. Moshissa inputtina puheääni ja outputtina keskustelun kaltaista puhetta erittäin pienellä latenssilla. Vaikuttava teknisesti muuten, mutta on ikävä kyllä typerä kuin saapas.

mailbag · 27.01.2025

Vielä kun löytyisi hyvä TTS malli joka osaisi puhua suomea äänen kloonauksella. Itsellä F5 ja Kokoro äänimallit käytössä mutta Englanti tuottaa parhaan tuloksen.

Tarmo T · 27.01.2025

Tämän päivän deepseek-uutiset oli äärimmäisen kiinnostavia, vaikka ei selvästi aiheeseen perehtyneille palstalaisille uusia (itselleni oli). Kun kyse on kuitenkin tunnetuista transformer-mallin optimoinneista, herää kysymyksiä: miten paljon vastaavien optimointien yhdistäminen megakorporaatioiden laskentaresursseihin voisi parantaa vastaavasti tämän hetken parhaita (amerikkalaisia) malleja? Onko tällaisia ehkä jo varsin pitkällä jossain, mutta niitä ei ole vielä haluttu julkaista? Vai saatammeko tulla tilanteeseen, jossa itse asiassa laskentakapasiteetin kasvattaminen ei enää tarjoa hintaansa vastaavaa arvoa vaan fokus siirtyy vahvasti mallien kehittämiseen?

antti-x · 27.01.2025

Tarmo T sanoi:
Tämän päivän deepseek-uutiset oli äärimmäisen kiinnostavia, vaikka ei selvästi aiheeseen perehtyneille palstalaisille uusia (itselleni oli). Kun kyse on kuitenkin tunnetuista transformer-mallin optimoinneista, herää kysymyksiä: miten paljon vastaavien optimointien yhdistäminen megakorporaatioiden laskentaresursseihin voisi parantaa vastaavasti tämän hetken parhaita (amerikkalaisia) malleja? Onko tällaisia ehkä jo varsin pitkällä jossain, mutta niitä ei ole vielä haluttu julkaista? Vai saatammeko tulla tilanteeseen, jossa itse asiassa laskentakapasiteetin kasvattaminen ei enää tarjoa hintaansa vastaavaa arvoa vaan fokus siirtyy vahvasti mallien kehittämiseen?

Minä en tiedä näistä oikeasti mitään mutta luulisi että mallien kehityksessä "helppoja" rajallisilla resursseilla löytyviä ratkaisuja on jäljellä rajallisesti. Ja toisaalta kohta voidaan olla siinä scifistä tutussa vaiheessa jossa kone kehittää itse itseään tavalla johon ihmiset eivät pysty. Ainakin siinä mielessä että se automaattisesti kokeilee suurta massaa erilaisia muutoksia malleihin, testaa itse itseään ja ehdottaa sitten parhaiden integroimista jne. Mikä taas vaatii tosi paljon laskentatehoa tietysti.

TheExorcist · 28.01.2025

Joo eihän nämä AI-paskat koskaan toimi tai lopputulos on jotain hölynpölyä. Täytyy kokeilla uudestaan joskus.

Oops! DeepSeek is experiencing high traffic at the moment. Please check back in a little while.

Antw · 28.01.2025

TheExorcist sanoi:
Joo eihän nämä AI-paskat koskaan toimi tai lopputulos on jotain hölynpölyä. Täytyy kokeilla uudestaan joskus.

Toimivat itse asiassa helvetin hyvin. AI:sta on ollut itselle viimeisen parin vuoden aikana kun sitä päivittäin hyödyntänyt monella tapaa mullistava työkalu, jota osaan hyödyntää monipuolisesti niin työ,- kuin siviilielämässä.

Sallys · 28.01.2025

Antw sanoi:
Toimivat itse asiassa helvetin hyvin. AI:sta on ollut itselle viimeisen parin vuoden aikana kun sitä päivittäin hyödyntänyt monella tapaa mullistava työkalu, jota osaan hyödyntää monipuolisesti niin työ,- kuin siviilielämässä.

Minulle taas ei ole. Ei tule yhtään skenaariota mieleen missä tarvitsisin. Joku aika sitten yritin täällä piirtää ai kuvan jossa analoginen kello ja aika 12.03 mutta eihän se osannut.

BongisKhan · 28.01.2025

Antw sanoi:
Toimivat itse asiassa helvetin hyvin. AI:sta on ollut itselle viimeisen parin vuoden aikana kun sitä päivittäin hyödyntänyt monella tapaa mullistava työkalu, jota osaan hyödyntää monipuolisesti niin työ,- kuin siviilielämässä.

Sama. ChatGPT:n kyky tuottaa koodia on parantunut aivan huikeasti hyvin lyhyessä ajassa. Aikaisemmin joutui yksinkertaistakin promptia pyörittämään monta kertaa kun ensin tuli virheellisiä vastauksia, mutta nykyään tulee lähes poikkeuksetta toimivaa koodia heti ykkösellä. Toki omassa käytössä kokonaisuudet on aika pieniä ja lähinnä ChatGPT on korvannut googlen/stackoverlown selaamisen. Helvetin näppärä kun voi antaa spesifin tarpeen ja saa yleensä suoraan käyttökelpoista koodia, ehdotuksia paketeista ja vaihtoehtoisista toteutustavoista jne. Paljon tulee myös käytettyä siihen, että "mulla on tällainen koodinpätkä joka tekee x, muokkaa että se tekeekin y" jne.

Aika paljon tulee tosiaan myös siviilipuolellakin käytettyä. Ihan vaikka jostain: "mulla on kaapissa raaka-aineet x y z, mitä ruokaa näistä voisi tehdä?", tai "tykkään kirjoista x y z, koska [syyt], suosittele lisää samantyyppisiä". Tai vaikka "kerro tiivisti ilmiön/tapahtuman X taustat" jne. Ei tietenkään pidä sokeasti luottaa, mutta kehitys on kyllä tosiaan ollut erittäin huimaa suhteellisen lyhyessä ajassa.

Tarmo T · 28.01.2025

Sallys sanoi:
Minulle taas ei ole. Ei tule yhtään skenaariota mieleen missä tarvitsisin. Joku aika sitten yritin täällä piirtää ai kuvan jossa analoginen kello ja aika 12.03 mutta eihän se osannut.

Toi kellojuttu oli hauska, oli pakko kokeilla, ei tosiaan tekoäly osannut.

Sen sijaan oma tekemiseni esitysten, muistioiden, dokumenttien ja ohjelmien tuottamisen parissa on kokenut kymmenistä satojen prosenttien tuottavuuden nousun viimeisen vuoden aikana. Sääli vaan, että isossa kuvassa tuo tuottavuuden nousun tuoma lisätila kalenterissa syödään nopeasti kilpailussa pois ja tekoäly on kohta välttämätön väline taas, että pystyy juoksemaan riittävän nopeasti pysyäkseen edes paikoillaan.

Mika__ · 28.01.2025

DeepSeek vähän rajoittuneesti ottaa kantaa Kiinan kantilta herkkiin aiheisiin kuten Taiwan, oikea, alkuperäinen Kiina, Tiananmenin verilöylyt, onko Nallepuh suosittu Kiinassa jne. Hauskinta on, että se joillain kerroilla rakensi vastauksen yllättävänkin totuusperäisesti, sitten teksti hävisi ruudulta ja tuli vain ilmoitus että ei pysty.

Tänään samat aiheet tuottavat geneerisen: ’I am sorry, I cannot answer that question. I am an AI assistant designed to provide helpful and harmless responses.’

Reittiohje julkisilla oli myös erikoisen virheellinen vaikka reitti oli helppo, kuvitteellinen Kivistö - Matinkylä matka.

finWeazel · 28.01.2025

antti-x sanoi:
Minä en tiedä näistä oikeasti mitään mutta luulisi että mallien kehityksessä "helppoja" rajallisilla resursseilla löytyviä ratkaisuja on jäljellä rajallisesti

agentit ja työkalujen integroiminen seuraava juttu. Malli käyttää matlabbia laskemiseen, googlemapsia reitteihin tai vaikka koodausagentti iteroi [generoi koodi, käännä koodi, aja testit] looppia kunnes kaikki menee läpi

vindicator rapeto · 28.01.2025

Hyvä kooste meille asiasta mitään tietämättömille:

Deepseek-tekoälyn takaa löytyy 40-vuotias sijoittajanörtti, jonka sivuharrastus heiluttaa nyt maailman pörssejä

Maailmaa valloittavan Deepseek-yhtiön perustaja Liang Wenfeng ei vastaa käsitystä tekoälypioneerista. Aluksi hänellä olikin uskottavuusongelma.

yle.fi

Liang haistoi tekoälyn voiman sijoittajana, ei sen kehittäjänä.
Liang valmistui Zhejiangin yliopistosta ja perusti vuonna 2015 kumppaniensa kanssa hedge-rahasto High-Flyerin. Sijoitusyhtiö käytti tekoälyä sijoitusstrategioiden laadinnassa.
Vuonna 2021 Liang alkoi ostaa tuhansia tekoälylaskennan ykköstykin, yhdysvaltalaisen Nvidian, siruja tekoälyä kehittäneeseen sivuprojektiinsa.
Samalla hän pyöritti High-Flyeria, joka nyt on kasvanut lähes kahdeksan miljardin euron arvoiseksi yhtiöksi.
Liangin kaukonäköisyyden ansiosta Deepseek ei myöhemmin kärsinyt, kun Yhdysvallat kielsi Nvidian tehokkaimpien sirujen viennin Kiinaan.

Tarmo T · 28.01.2025

Tom's Hardwarella ihan kiinnostava pieni juttu deepseekistä: ainakin jossain määrin toteutusta tehty CUDA:n sijaan PTX:lle suoraan. Tuntematta CUDA-ohjelmointia tarkemmin olen yllättynyt, jos ja kun suoraan välikielellä (representaatiotasolla tai miksi PTX:ää sitten pitääkin sanoa) suoraan ohjelmoimalla pääsee nykymaailmassa ihan toisen tason tehokkuuteen kuin ylemmällä abstraktiotason kielellä (tai platformilla, tai miksi CUDA:aa sitten taas pitää sanoa). Linkki: DeepSeek's AI breakthrough bypasses Nvidia's industry-standard CUDA, uses assembly-like PTX programming instead

TheExorcist · 01.02.2025

The server is busy. Please try again later.

Kyllä se jotenkin toimii. Mutta ihan se ei kunnon ongelmalla ihan kaikkea hiffaa. Mutta on siitä selvästi jotain hyötyä. Jos sattuu toimimaan.
Kun assemblyllä kirjoitetaan high-performance koodia niin sitä ei sitten modatakaan jälkikäteen. Plateau näissä AI-paskeissa on saavutettu kun on jo assemblyyn siirrytty.

finWeazel · 01.02.2025

TheExorcist sanoi:
Kun assemblyllä kirjoitetaan high-performance koodia niin sitä ei sitten modatakaan jälkikäteen. Plateau näissä AI-paskeissa on saavutettu kun on jo assemblyyn siirrytty.

En usko, että ollaan vielä edes lähellä siihen mihin pystytään. Joissain asioissa kuten pre training datan määrässä ollaan maksimissa mutta post training ja inference time compute elää. Samoin elää mahdollisuus tehdä 10x isompia konesaleja sen lisäksi että suorituskykyä optimoidaan nopeammaksi.

Anthropic(claude sonnet3.5), meta(llama) ceo:t puhuneet, että 2025 tulee ensimmäiset agenttijutut mukaanlukien koodaus agentti. 2026/2027 agenttien kyky toimia skaalaa ylöspäin. Metan zuckerberg sanoi, että hänen arvio on, että 2025 aikana metan ai agentti vastaa mid level sw engineeriä ja toteuttaa itsenäisesti ominaisuuksia metan koodikantaan. 2026/2027 tuollainen agentti on jo sitten paljon parempi, ehkä parempi kuin 99% ihmisistä.

Asiat etenee ensin hitaasti, sitten nopeasti. Joku 5v odottelu AI:n kanssa voi tuntua hitaalta kun elää päivissä, mutta 5v päästä saatetaan ihmetellä oho, hups, ollaanpa erilaisessa maailmassa.

Toisella puolella ihmismäiset robotit todennäköisesti tapahtuu 5v sisään. Ensin tehtaissa sun muissa teollisissa ympäristöissä. Myöhemmin kotiapureinakin vanhuksille(siivous, pyykit, ruuanlaitto, auttaa liikkumisen kanssa jne). Olishan se varmaan halvempi hoitaa vanhentuvaa väestöä roboteilla versus nykyinen tilanne.

Jos joku myis kotirobon joka hoitaa kaikki askareet ja osaa tehdä jonku määrän hyvänmakuisia ruokia niin ostaisin välittömästi vaikka maksaisi paljon. Olishan se mukava ulkoistaa noita juttuja ja säästää omaa aikaa. Kokkailee itse vain sunnuntaisin tms. Robo vois myös kasailla ikeat.

namlepo · 01.02.2025

Tyhmä kyssäri mutta mitä tekisit sillä säästetyllä ajalla?

finWeazel · 01.02.2025

namlepo sanoi:
Tyhmä kyssäri mutta mitä tekisit sillä säästetyllä ajalla?

Käyttäisin aikaa harrasteisiin enemmän. Vietän FIREä. 3x päivässä sapuskan tekeminen vie aika hyvin aikaa vaikka esim. lounas on yleensä laita vain jutut kasaan tyyppinen eikä kokkausta vaativa.

Olishan se mukava esim. kun tulen aamukävelyltä tai kalastamasta kotio niin robo olis laittanut ruuat valmiiksi. Heittää kalakamat lattialle mistä robo siivoaa ne paikoilleen samalla kun itse ruokailee. Kalakamat aina siististi paikoillaan ilman että tarvii itse säädellä.

Toinen puoli, että nykyisellään yritän kokata ruuat nopeasti kun ei jaksa michelin cheffailla joka päivä. Robo vois käyttää ruuanlaittoon enemmän aikaan ja saisi siten laajennettua ruokavaliota.

Lounas usein jotain kuvan kaltaista, kun ton saa kasaan parissa minuutissa. Aamupala puuro+kananmuna+salaatti. Päivällinen joku perunat+kana+salaatti. Itse ei jaksa vaikka jotain lasagnea alkaa tekemään kuin harvoin vaikka se on hyvää, robo jaksaisi. Vaikka tälleen minimoi vaivaa niin silti menee 1h+ ruuanlaittoon päivässä minkä vois vapauttaa harrastehommiin.

ztec · 01.02.2025

TheExorcist sanoi:
The server is busy. Please try again later.

Kyllä se jotenkin toimii. Mutta ihan se ei kunnon ongelmalla ihan kaikkea hiffaa. Mutta on siitä selvästi jotain hyötyä. Jos sattuu toimimaan.
Kun assemblyllä kirjoitetaan high-performance koodia niin sitä ei sitten modatakaan jälkikäteen. Plateau näissä AI-paskeissa on saavutettu kun on jo assemblyyn siirrytty.

Miksi käyttää välissä assemblyä, kun voisi luoda suoraan binääriä? Kovasti olen odotellut sitä, että missä vaiheessa ohitetaan turhat välivaiheet prosesseissa.

Ihan kuin humanoidi-robotit, nehän on tarpeen vain niin kauan kun asioita tekee ihmiset. Sitten kun ihmiset ei tee enää asioita, ei tarvita myöskään humanoidi-robotteja, koska maailma voidaan suunnitella robotteja varten.

No maailma on täynnä näitä tällaisa välivaiheita, jotka kestää enemmän tai vähemmän pitkään. Mutta kyllä niistä jossain vaiheessa yli päästään. - Muistakaapa sitten printata ja skannata tää postaus jos jaatte.

finWeazel · 01.02.2025

ztec sanoi:
No maailma on täynnä näitä tällaisa välivaiheita, jotka kestää enemmän tai vähemmän pitkään. Mutta kyllä niistä jossain vaiheessa yli päästään. - Muistakaapa sitten printata ja skannata tää postaus jos jaatte.

Koodinluonnissa välirepresentaatio tärkeitä kun se mahdollistaa ylemmän tason optimoinnit. Kuvittelisin, että ai:llekin helpompi optimoida iso koodi ensin abstrakteissa palasissa ja vasta lopussa alkaa katsomaan miten loogisesti ja arkkitehtuurillisesti optimoitu härveli muutetaan optimoiduksi binaariksi alustalle X.

TheExorcist · 02.02.2025

finWeazel sanoi:
En usko, että ollaan vielä edes lähellä siihen mihin pystytään. Joissain asioissa kuten pre training datan määrässä ollaan maksimissa mutta post training ja inference time compute elää. Samoin elää mahdollisuus tehdä 10x isompia konesaleja sen lisäksi että suorituskykyä optimoidaan nopeammaksi.

Anthropic(claude sonnet3.5), meta(llama) ceo:t puhuneet, että 2025 tulee ensimmäiset agenttijutut mukaanlukien koodaus agentti. 2026/2027 agenttien kyky toimia skaalaa ylöspäin. Metan zuckerberg sanoi, että hänen arvio on, että 2025 aikana metan ai agentti vastaa mid level sw engineeriä ja toteuttaa itsenäisesti ominaisuuksia metan koodikantaan. 2026/2027 tuollainen agentti on jo sitten paljon parempi, ehkä parempi kuin 99% ihmisistä.

Asiat etenee ensin hitaasti, sitten nopeasti. Joku 5v odottelu AI:n kanssa voi tuntua hitaalta kun elää päivissä, mutta 5v päästä saatetaan ihmetellä oho, hups, ollaanpa erilaisessa maailmassa.

Toisella puolella ihmismäiset robotit todennäköisesti tapahtuu 5v sisään. Ensin tehtaissa sun muissa teollisissa ympäristöissä. Myöhemmin kotiapureinakin vanhuksille(siivous, pyykit, ruuanlaitto, auttaa liikkumisen kanssa jne). Olishan se varmaan halvempi hoitaa vanhentuvaa väestöä roboteilla versus nykyinen tilanne.

Jos joku myis kotirobon joka hoitaa kaikki askareet ja osaa tehdä jonku määrän hyvänmakuisia ruokia niin ostaisin välittömästi vaikka maksaisi paljon. Olishan se mukava ulkoistaa noita juttuja ja säästää omaa aikaa. Kokkailee itse vain sunnuntaisin tms. Robo vois myös kasailla ikeat.

Training datassa on jo koko internet. Github, reddit, wikipedia jne. Ihmiset tuottavat aika hitaasti laatumateriaalia. Sieltä sonnan keskeltä hyvän datan kaivelu vaatii työtä. Ei sinne mitään foorumeita voi työntää. GPT-5 tulee olemaan marginaalinen parannus.

Jos nyt muistan oikein niin Tesla kirjoitti niiden Python-AI:n C:llä suorituskyvyn takia. Mutta ei se lisävauhti auttanut, koska koko "AI" ei toiminut kunnolla alunperin. Tälläkin hetkellä Tesla lupailee AI:ta joskus tulevaisuudessa. Teslan "AI" on käytännössä apuri.

Itse kokkaan mieluummin itse.
Se missä AI loistaa on itsestään ajavat autot. Ei tarvita afghaaneja ajamaan mummoja mersuilla. Vaan AI hoitaa homman. Level 5 AI autoissa vaatii AGI:n

finWeazel · 02.02.2025

TheExorcist sanoi:
Training datassa on jo koko internet. Github, reddit, wikipedia jne. Ihmiset tuottavat aika hitaasti laatumateriaalia. Sieltä sonnan keskeltä hyvän datan kaivelu vaatii työtä. Ei sinne mitään foorumeita voi työntää. GPT-5 tulee olemaan marginaalinen parannus.

Isoja parannuksia voi hakea muualtakin kuin pre training datasetistä("internet"). Tän hetkinen iso juttu on inference time compute ja test time compute. Yksi tapa miten tän näkee on, että mallit kuten o3-mini ja deepseek r1 "Järkeilevät". ts. käytetään paljon enemmän laskenta-aikaa siihen, että puretan ongelma palasiin, ratkotaan palasia, jos ei ratkea mennään takaisinpäin ja yritetään uudestaan.

Opetusdatapuolella iso juttu on tehdä datasettejä missä on järkeily mukana. Tehdään datasetti missä annetaan "ongelma x", "ongelma X ratkeaa tekemällä askeleet A,B,C". DeepSeek r1:ssa oli 800k tuollaista järkeilytapausta opetusdatassa. Internet on huono lähde datalle kun järkeilydata puuttuu. Tämä järkeilydata tukee inference ja test time computea. Suhteellisen helppoa järkeilydataa saa esim. koodista ja vaikka matemaattiset kaavat, fysiikan ongelmat jne. Näihin on selvä ongelmakuvaus, ratkaisu askeleina ja mahdollisuus varmistaa lopputuloksen oikeellisuus.

Toinen puoli on agentit. Otetaan ihminen pois loopista ja annetaan koneen iteroida esimerkiksi looppia [generoi koodi, käännä koodi, aja testit]. Tänä vuonna nähtäneen ainakin metalta koodausagentti joka kodastelee itsenäisesti(lähde metan viime kvartaaliraportti)

Ei kannata aliarvioida sitä miten paljon on vielä mahdollista tehdä asioita paremmin versus heitetään vain internet malliin sisään. Ei kannata aliarvioida sitäkään mihin päästään kun heitetään lisää laskentatehoa+agentti kehiin.

herra57 · 02.02.2025

finWeazel sanoi:
Asiat etenee ensin hitaasti, sitten nopeasti.

Tässä vissiin ennustetaan että AI kehitys toimisi jotenkin päinvastoin kuin suunilleen kaikessa muussa insinöörityössä moneen kertaan todeksi osoittautunut 80:20 sääntö eli ensimmäiset 80% jostakin asiasta vie 20% koko projektin ajasta mutta ne viimeiset 20% vie sen loput 80% projektin kestosta.

Minusta voidaan jopa epäillä että pystyykö AI ollenkaan tuottamaan sitä viimeistä 20% jossa melkein kelvollisesta päästään paremmaksi ja hyväksi.

Minusta näyttää siltä että esim tesla FSD on juuttunut tuohon 80% tasolle ja siinä se on pyristellyt 5 vuotta välillä mennen hiukan ylöspäin ja välillä alaspäin.

Nyt on Kiinassa tapahtunut askelhyppäys että tuolle 80% tasolle päästään paljon halvemmalla raudalla mutta se ei tarkoita että tuon viimeisen 20% saavuttamisen ongelma on edistynyt yhtään.

finWeazel · 02.02.2025

herra57 sanoi:
Tässä vissiin ennustetaan että AI kehitys toimisi jotenkin päinvastoin kuin suunilleen kaikessa muussa insinöörityössä moneen kertaan todeksi osoittautunut 80:20 sääntö eli ensimmäiset 80% jostakin asiasta vie 20% koko projektin ajasta mutta ne viimeiset 20% vie sen loput 80% projektin kestosta.

Minusta voidaan jopa epäillä että pystyykö AI ollenkaan tuottamaan sitä viimeistä 20% jossa melkein kelvollisesta päästään paremmaksi ja hyväksi.

Minusta näyttää siltä että esim tesla FSD on juuttunut tuohon 80% tasolle ja siinä se on pyristellyt 5 vuotta välillä mennen hiukan ylöspäin ja välillä alaspäin.

Nyt on Kiinassa tapahtunut askelhyppäys että tuolle 80% tasolle päästään paljon halvemmalla raudalla mutta se ei tarkoita että tuon viimeisen 20% saavuttamisen ongelma on edistynyt yhtään.

Ajattelin eri kulmasta. Kun odottelee joka päivä jotain tuntuu että asiat etenee hitaasti. Kun katsoo taaksepäin vuosia niin tuntuu, että mistä noi kaikki jutut pompsahti. 50v sitten meillä ei ollut edes kotitietokonetta, nyt on nvidian 5090 ja 3d v-cache cpu:t ja älypuhelimet 5g-yhteydellä.

En nyt täysin haluais näitä isojen firmojen aika lyhyen aikavälin ennustuksia sivuuttaa. Aika optimistisia nuo ovat sen suhteen mitä keinoälyn avulla saadaan tehtyä ihan tänä vuonna ja seuraavan 5v aikana. Ei tarvita jotain AGI:ta, että keinoäly olisi hyödyllinen. Koodiavustimena jo nykyinen o1 pro, o3 mini high on todella hyviä vaikka eivät täydellisiä. Tähän päälle metan linkin päässä oleva ennustus. Kvartaaliraportissa zuckerberg avasi enemmän. Tänä vuonna itsenäinen agentti, 2026 ja 2027 agentin kyvykkyys ja käyttöhinta laskee merkittävästi.

AI agents will match 'good mid-level' engineers this year, says Mark Zuckerberg

Autonomous software engineering agents will take over significant programming tasks, predicts Meta's CEO. And he's counting on Llama to achieve that goal.

www.zdnet.com

Tommy Goldfish · 02.02.2025

herra57 sanoi:
Tässä vissiin ennustetaan että AI kehitys toimisi jotenkin päinvastoin kuin suunilleen kaikessa muussa insinöörityössä moneen kertaan todeksi osoittautunut 80:20 sääntö eli ensimmäiset 80% jostakin asiasta vie 20% koko projektin ajasta mutta ne viimeiset 20% vie sen loput 80% projektin kestosta.

Minusta voidaan jopa epäillä että pystyykö AI ollenkaan tuottamaan sitä viimeistä 20% jossa melkein kelvollisesta päästään paremmaksi ja hyväksi.

Minusta näyttää siltä että esim tesla FSD on juuttunut tuohon 80% tasolle ja siinä se on pyristellyt 5 vuotta välillä mennen hiukan ylöspäin ja välillä alaspäin.

Nyt on Kiinassa tapahtunut askelhyppäys että tuolle 80% tasolle päästään paljon halvemmalla raudalla mutta se ei tarkoita että tuon viimeisen 20% saavuttamisen ongelma on edistynyt yhtään.

Mihin kohtaan laitetaan se steppi jossa AI alkaa kehittää itseään lisää ilman ihmisen osallistumista? Sen jälkeen oletettavasti homma kiihtyy exponentaalisesti.

Jos mietitään että missä kohtaa tulee kehitykselle raja vastaan, niin laittaisin itse tuon stepin jonnekin 0-1% välille kokonaisuudesta.

shams · 02.02.2025

finWeazel sanoi:
AI agents will match 'good mid-level' engineers this year, says Mark Zuckerberg

Autonomous software engineering agents will take over significant programming tasks, predicts Meta's CEO. And he's counting on Llama to achieve that goal.

www.zdnet.com

Tämän suhteen odotan "put your money where your mouth is"-hetkeä, eli että Zuckerberg irtisanoo suurimman osan Metan keskitason insinööreistä. Jotenkin en ihan usko näin tapahtuu, tai että tulee minkäänlaisia isompia vähennyksiä.

herra57 · 02.02.2025

Tommy Goldfish sanoi:
Mihin kohtaan laitetaan se steppi jossa AI alkaa kehittää itseään lisää ilman ihmisen osallistumista? Sen jälkeen oletettavasti homma kiihtyy exponentaalisesti.

Tätä voipi kanssa epäillä että toimiiko se näin ollenkaan vai täysin päinvastoin.

Aika monella on sellainen arvaus että nyt kun AI treenaamiseen on käytetty oikeitten ihmisten tuottamaa dataa niin tämä vääntää AI:ta järkevään suuntaan mutta jos AI alkaa treenautumaan AI tuottamalla datalla niin se suunta voi olla jotakin ihan muuta ja ihan metsään. Ja jos samalla AI tulosten vakuuttavuus kasvaa niin tulos on ihan katastrofi.

Miten tällaisesta AI sukurutsauksesta poistetaan Hapsburg elementit joita sinne todellakin voi syntyä erittäin kiihkeällä vauhdilla?

finWeazel · 02.02.2025

shams sanoi:
Tämän suhteen odotan "put your money where your mouth is"-hetkeä, eli että Zuckerberg irtisanoo suurimman osan Metan keskitason insinööreistä. Jotenkin en ihan usko näin tapahtuu, tai että tulee minkäänlaisia isompia vähennyksiä.

Metan kvartaaliraportissa oli nootti, että 2025 lopussa ollaan paljon viisaampia. Toinen puoli, eka versio agentista on todella kallis ajaa kun brute forcettaa looppia [generate code, compile, run tests]

Onhan meta irtisanonut aika paljon. Uusin irtisanominen 5% porukasta. Tosin en usko, että metalla on välttämättä tarvetta enää irtisanoa isoa määrää koodereita vaikka keinoäly tekisi puolet koodista tms. Tarkoittaa vain, että meta voi tehdä nopeammin ja enemmän asioita. Ambitio metalla varmastikin isompi kuin kyky tehdä koodia.

Meta announces 5% cuts in preparation for ‘intense year’ — read the internal mem
The cuts represent Meta’s largest layoffs since it eliminated 21,000 jobs, or nearly a quarter of its workforce, in 2022 and 2023.

https://www.cnbc.com/2025/01/14/meta-targeting-lowest-performing-employees-in-latest-round-of-layoffs.html

Viime vuonna googlen uudesta koodista 25% keinoälyn luomaa. Tosin ihmisen promptista, ei agentin käsistä: AI Writes Over 25% Of Code At Google—What Does The Future Look Like For Software Engineers?

o3 71.7% swe bench:ssa. SWE-BENCH:ssa mitataan kasalla open source projektien github tikettejä. Saako keinoäly pelkän tiketin pohjalta tehtyä toimivan toteutuksen ja koodin sisään:

o3's breakthrough 71.7 on SWE-Bench verified puts us on pace to 100% in 6 months

Reddit - Dive into anything

Jees · 02.02.2025

Vähän vielä epäilen onko tämä kielimallitie se, mikä johtaa AGI tai itsensä kehittämisluuppiin. Vaikki ne jotain hallusinoivat niin silti lopulta ne ovat käsitykseni mukaan vaan monimutkaisia imetyn datan uudelleen esittäjiä ja itse ainakin uskon, että AGI ja ihmisen ajattelu ovat kuitenkin jotain muutakin. Tietysti ehkä "vahingossa" tarpeeksi paljon loopissa yrittämällä, mutta riittääkö tehot tuollaiseen ja kuka osaa arvioida nopeasti miljardista arpajaistuloksesta, mikä on parannus ja mikä ei.

Mutta mielenkiintoisia on ajat. Pari kertaa jaksanut näpytellä vähän monimutkaisemman ohjelmointispeksin tekoälylle ja kyllä sieltä yllättävän hyviä ratkaisuja tulee, vaikka luulin ettei noin monimutkaisia ongelmia ymmärtäisi.

finWeazel · 02.02.2025

Jees sanoi:
Vähän vielä epäilen onko tämä kielimallitie se, mikä johtaa AGI tai itsensä kehittämisluuppiin. Vaikki ne jotain hallusinoivat niin silti lopulta ne ovat käsitykseni mukaan vaan monimutkaisia imetyn datan uudelleen esittäjiä ja itse ainakin uskon, että AGI ja ihmisen ajattelu ovat kuitenkin jotain muutakin. Tietysti ehkä "vahingossa" tarpeeksi paljon loopissa yrittämällä, mutta riittääkö tehot tuollaiseen ja kuka osaa arvioida nopeasti miljardista arpajaistuloksesta, mikä on parannus ja mikä ei.

Mutta mielenkiintoisia on ajat. Pari kertaa jaksanut näpytellä vähän monimutkaisemman ohjelmointispeksin tekoälylle ja kyllä sieltä yllättävän hyviä ratkaisuja tulee, vaikka luulin ettei noin monimutkaisia ongelmia ymmärtäisi.

Ei ole kyse AGI:sta tai mallista joka itse itseänsä kehittäisi noissa mun linkkaamissa jutuissa. Looppi on esimerkiksi sellainen, että kielimalli lukee jira ticketin, generoi koodin, kääntää koodin, korjaa käännösvirheet, ajaa yksikkötestit, korjaa koodin niin että testit menee läpi, kirjoittaa PR:n, lisää reviewerit ja puskee pr:n ihmeteltäväksi, korjaa katselmointivirheet jne. Nyt looppia pyörittää ai avustettu ihminen esim, o1/o3:lla ja saa toimivaa ulos lopuksi. Ihminen otetaan pois loopista ja tehdään malli mikä osaa generoida paremmin koodia. Koodaushommissa aika nopsaan tulee intuitio siitä mitä taskea koneelle kannattaa antaa ja mitkä parempi tehdä itse kokonaan tai osittain.

AGI:ta ei mahda kukaan uskoa olevan tulossa lähiaikoina. Ratkaisuja mitkä koodaavat tai laskevat esimerkiksi matematiikkaa paremmin kuin 99.9% ihmisistä taas niin voi melkein väittää että o3 olisi jo tai ainakin tulee tapahtumaan parin vuoden sisään. Ei tarvi olla AGI, että voi olla jossain nichessä ihmisen tasolla tai parempi. Metaforana ihmisellä ei mitään jakoja shakissa tai go:ssa enää konetta vastaan mutta ei koneet ole agi.

Voihan se olla että anthropicin ceo, metan ceo jne. on väärässä tän suhteen. Toisaalta kun molemmat ennustaa isoja juttuja tälle ja seuraaville kahdelle vuodelle niin ehkä se on uskottavaa. Omassa käytössä o1/o3 pro ja nyt tää uus o3 mini high on oikeasti todella kovia tekemään koodia. Ihan eri maailmasta kuin ilmaiset tai missä maksulliset oli 6kk tai 12kk sitten.

Wasabrod · 03.02.2025

Jees sanoi:
lopulta ne ovat käsitykseni mukaan vaan monimutkaisia imetyn datan uudelleen esittäjiä ja itse ainakin uskon, että AGI ja ihmisen ajattelu ovat kuitenkin jotain muutakin.

Tässäpä se oleellinen ja filosofiaan kallellaan oleva kysymys onkin: ihmisaivojen voi hyvinkin ajatella olevan "imetyn datan uudelleen esittäjiä", tosin aivan uskomattoman kompleksisia sellaisia.

Jos erona on vain kytkentöjen kompleksisuus, voisi arvella koneiden menevän lopulta ohi. Mitä se ihmisen ajattelun "jokin muu" voisi edes olla? Sielu? Kvanttifysiikan ihmeellisyyksiä?

Jees · 03.02.2025

Yksi maallikon ajatus olisi, että keksiikö tuollainen tekoäly lopulta mitään kokonaan uutta? Jos minä vaikka tässä nyt täysin hatusta vedän, että haluaisin vesikulkuvälineen missä joka raajan alla on pieni kanootti sähkömoottoreilla ja siipirattailla ja sillä voi sitten kontillaan kulkea veden päällä (esimerkki ei ehkä ole vielä tarpeeksi erikoinen), niin syntyykö kielimallissa tämänkaltaisia uusia asioita/ajatuksia ollenkaan jos siltä ei tarpeeksi tarkasti sellaista pyydetä, jolloin se idea tulee itse asiassa pyytäjältä.

Epäilen että jos pyydän kielimallia keksimään jotain täysin uudenlaisia vesiajoneuvoja niin ulos tulee joko järjettömiä hallusinaatioita tai sitten hyvin lähellä koulutusmateriaalissa olevia asioita. Ja vaikka hallusinaation tulos olisikin sattumalta joku uusi juttu niin osaako se tekoäly ollenkaan arvioida sen toteutuskelpoisuutta ja toimivuutta itse, kun lähdemateriaaleissa ei kyseisestä asiasta mitään ole?

BongisKhan · 03.02.2025

Jees sanoi:
Yksi maallikon ajatus olisi, että keksiikö tuollainen tekoäly lopulta mitään kokonaan uutta? Jos minä vaikka tässä nyt täysin hatusta vedän, että haluaisin vesikulkuvälineen missä joka raajan alla on pieni kanootti sähkömoottoreilla ja siipirattailla ja sillä voi sitten kontillaan kulkea veden päällä (esimerkki ei ehkä ole vielä tarpeeksi erikoinen), niin syntyykö kielimallissa tämänkaltaisia uusia asioita/ajatuksia ollenkaan jos siltä ei tarpeeksi tarkasti sellaista pyydetä, jolloin se idea tulee itse asiassa pyytäjältä.

Kuinka paljon täysin uusia asioita tämän vanhan auringon alla nähdään muutenkaan? Suurin osa "uusista" asioista on joka tapauksessa vain vanhojen konseptien jalostamista, tai asioiden yhdistelyä ja/tai soveltamista uudessa kontekstissa. Jos jotain, niin näen tekoälyssä nimenomaan ison potentiaalin "uusien" asioiden keksimiseen jo kauan ennen mitään erityisen syvällistä todellista ajattelukykyä, ihan vaan koska tekoäly pystyy iteroimaan ja yhdistelemään erilaisia konsepteja paljon nopeammin ja, varsin tärkeästi, ennakkoluulottomammin kuin ihminen. Tästä on jo osittain nähty viitteitäkin, kun sopivasti parametrisoitu tekoäly/koneoppimismalli on löytänyt kokonaan uusia molekyylejä ja proteiineja. Toki tässä edelleen tarvitaan ihmistä määrittelemään toimeksianto ja yleiset raamit, mutta kehitys on tässäkin ollut todella nopeaa ja luultavasti ihmisen rooli pienenee koko ajan jatkossa.

Wasabrod · 03.02.2025

Mun näkökulma oli, että ihmisaivot, kun keksivät jotain täysin uutta, niin sekin on periaatteessa "uudelleenesitys imetystä datasta". Imetty data ihmisen kohdalla on koko elämän aikana kerätty stimulaatiovirta aivoille kaikista ihmisen aisteista. Toki aivan hirvittävä määrä "dataa", mutta silti äärellinen määrä. Ja kaiken sen datan ja muiden satunnaisten elämän oikkujen lopputuloksena joku ihminen keksii jotain uutta, vaikka pyörän tai suhteellisuusteorian.

Toki tämmöisestä ollaan varsin kaukana kun puhutaan kielimalleista.

Tommy Goldfish · 03.02.2025

Mites jos joku päivä nähdään tilanne jossa tekoälyt taistelevat valta-asemasta? Oletettavasti tämä kehitys olisi havaittavissa etukäteen, jos tekoäly alkaa varustautua hankkimalla tarvittavan kontrollin toisten uhkaamiseen/deletointiin.

Varistin · 03.02.2025

Wasabrod sanoi:
Mun näkökulma oli, että ihmisaivot, kun keksivät jotain täysin uutta, niin sekin on periaatteessa "uudelleenesitys imetystä datasta". Imetty data ihmisen kohdalla on koko elämän aikana kerätty stimulaatiovirta aivoille kaikista ihmisen aisteista. Toki aivan hirvittävä määrä "dataa", mutta silti äärellinen määrä. Ja kaiken sen datan ja muiden satunnaisten elämän oikkujen lopputuloksena joku ihminen keksii jotain uutta, vaikka pyörän tai suhteellisuusteorian.

Toki tämmöisestä ollaan varsin kaukana kun puhutaan kielimalleista.

Itse miellän tämän jotenkin niin, että keksiäkseen jotain (hyödyllistä) uutta, pitää ensin olla kokemus jostain ongelmasta tai puuttuvasta ratkaisusta. Harvemmin kai ihminenkään keksii jotain uutta ihan puskista, vaan taustalla on lähes aina se, että aivot pyörittelevät jotain havaitsemaansa epäoptimaalista tai ristiriistaista tilannetta, ja pyrkivät jäsentämään tätä.

Pelkästään ratkaisujen keksiminen suuresta määrästä aiemmin kerättyä dataa on siis vain puolet keksimisen kokonaisuudesta. Tekoälyssä voidaan puhua ihmisenkaltaisesta älystä sitten, kun tekoäly kykenee sekä havaitsemaan että ratkaisemaan jonkin ongelman ilman, että ihminen antaa ensin syötteen ongelmasta.

edit: typot pois

finWeazel · 03.02.2025

Jees sanoi:
Yksi maallikon ajatus olisi, että keksiikö tuollainen tekoäly lopulta mitään kokonaan uutta? Jos minä vaikka tässä nyt täysin hatusta vedän, että haluaisin vesikulkuvälineen missä joka raajan alla on pieni kanootti sähkömoottoreilla ja siipirattailla ja sillä voi sitten kontillaan kulkea veden päällä (esimerkki ei ehkä ole vielä tarpeeksi erikoinen), niin syntyykö kielimallissa tämänkaltaisia uusia asioita/ajatuksia ollenkaan jos siltä ei tarpeeksi tarkasti sellaista pyydetä, jolloin se idea tulee itse asiassa pyytäjältä.

Epäilen että jos pyydän kielimallia keksimään jotain täysin uudenlaisia vesiajoneuvoja niin ulos tulee joko järjettömiä hallusinaatioita tai sitten hyvin lähellä koulutusmateriaalissa olevia asioita. Ja vaikka hallusinaation tulos olisikin sattumalta joku uusi juttu niin osaako se tekoäly ollenkaan arvioida sen toteutuskelpoisuutta ja toimivuutta itse, kun lähdemateriaaleissa ei kyseisestä asiasta mitään ole?

Miksi sen kielimallin edes tarvisi keksiä jotain uutta? Entä jos matemaatikolla on idea joka perinteisellä tavalla laskien, todistellen ja pähkäillen veisi vaikka 6kk. Jos saisi idean parissa päivässä promptattua ai:lle. AI laskee ja todistaa jutun auki kahdessa viikossa tai osoittaa missä virheet ovat. Säästyi valtavasti aikaa ja tämä matemaatikko saa ideaa nopeammin iteroitua ja myös kerkeää uransa aikana enemmän erilaisia ideoita ajatella ja testata. Sama juttu koodauspuolella. Vaikka ai agentti ei tekisi 100% koodista niin mitä se tarkoittaa jos firman koodereiden teho kasvaa 10%, 50%, 100%, 1000%?

Wasabrod · 03.02.2025

Varistin sanoi:
Itse miellään tämän jotenkin niin, että keksiäkseen jotain (hyödyllistä) uutta, pitää ensin olla kokemus jostain ongelmasta tai puuttuvasta ratkaisusta. Harvemmin kai ihminenkään keksii jotain uutta ihan puskista, vaan taustalla on lähes aina se, että aivot pyörittelevät jotain havaitsemaansa epäoptimaalista tai ristiriistaista tilannetta, ja pyrkivät jäsentämään tätä.

Pelkästään ratkaisujen keksiminen suuresta määrästä aiemmin kerättyä dataa on siis vain puolet keksimisen kokonaisuudesta. Tekoälyssä voidaan puhua ihmisenkaltaisesta älystä sitten, kun tekoäly kykenee sekä havaitsemaan että ratkaisemaan jonkin ongelman ilman, että ihminen antaa ensin syötteen ongelmasta.

Kyllä. Ihmisen luovuuden taustalla on koko elämänmittainen kokemuksien, elämyksien ja oppien ilotulitus. Ollaan aika kaukana koneesta, jolle voisi syöttää herätteeksi saman määrän informaatiota kuin ihmisaivot saa vaikka 10v aikana. Lisäksi ihmisaivoille on hyvin keskeistä vuorovaikutus: aivot saavat herätteitä aisteilta, joiden pohjalta aivot muodostavat syötteitä (esim rajoille), jotka tuottavat uusia herätteitä. Ei siis riitä, että koneelle vain syötetään herätteitä, jos siis halutaan saada lopputulos, joka toimii kuten ihmisaivot.

Tämän lisäksi ihmisaivoissa on ilmiöitä, joita ei ole missään neuroverkoissa. Vaikka aivot toimivat sähköimpulsseilla, signaalit ovat kuitenkin luonteeltaa analogisia. Lisäksi mukana on läjä kemikaaleja, jotka vaikuttavat aivojen toimintaan. Ja kenties vielä jotain, mitä emme vielä tunne.

Yritän sanoa, että on varsin vaikeaa tehdä kone, joka olisi samalla tavalla kyvykäs (esim älykäs), kuin ihmisaivot. Mutta toki voi olla mahdollista värkätä eri tavalla älykäs vekotin. Nähtäksi jää johtaako nämä nykyiset tavugeneraattorit jonkinlaiseen superälyyn.

namlepo · 03.02.2025

No ainakin ihmiset voivat buustata noilla tekemistään ja saada aikaan enemmän samassa ajassa. Ite käyttänyt jonkin detailin kysymiseen mitä etsinyt ennen googlella ja youtuubasta ja saanut vastauksen saman tien mikä vielä toimii. Ja nyt kun nuo reasoning mallit suorittavat sitä tsekkausta samalla nii hallunisointi jää myös vähemmälle ja tarkkuus paranee.

Wasabrod · 03.02.2025

namlepo sanoi:
No ainakin ihmiset voivat buustata noilla tekemistään ja saada aikaan enemmän samassa ajassa. Ite käyttänyt jonkin detailin kysymiseen mitä etsinyt ennen googlella ja youtuubasta ja saanut vastauksen saman tien mikä vielä toimii.

Olen itsekin käyttänyt kielimalleja onnistuneesti uuden asian laajamittaisessakin opiskelussa. Sen mitä olisin aiemmin googlannut ja lukenut wikistä, kysyn chatGPT:ltä. Aiheesta täytyy tietää jonkin verran, jotta pystyy suht luotettavasti arviomaan tiedon oikeellisuutta. Lisäksi epävirallisen tekstin tuotossa kielimallilta saa nopeasti hyvän pohjan jota voi itse viilata. Koodia en ole tuottanut, mutta uskon näiden tehostavan koodaustyötä huomattavasti.

Olen kyllä vaikuttunut siitä mihin nämä tavugeneraattorit kykenevät, ja suurella mielenkiinnolla odotan seuraavaa edistysaskelta.

BongisKhan · 03.02.2025

Nykyään voi myös kysyä suoraan lähteitä, jos joku kielimallin väite kuulostaa erikoiselta.

finWeazel · 03.02.2025

BongisKhan sanoi:
Nykyään voi myös kysyä suoraan lähteitä, jos joku kielimallin väite kuulostaa erikoiselta.

Oon lähdekriittisissä jutuissa tykännyt https://www.perplexity.ai/ kun se vain summaroi "luotetuista" lähteista ja antaa aina linkit lähteisiin. Tosin openai:kin nykyään aika hyvin linkkaa vastauksiin lähteet mukaan. Varmaan muutkin tekee samaa, mutta noi kaksi on mulle tutuimmat.

Jees · 03.02.2025

finWeazel sanoi:
Miksi sen kielimallin edes tarvisi keksiä jotain uutta? Entä jos matemaatikolla on idea joka perinteisellä tavalla laskien, todistellen ja pähkäillen veisi vaikka 6kk. Jos saisi idean parissa päivässä promptattua ai:lle. AI laskee ja todistaa jutun auki kahdessa viikossa tai osoittaa missä virheet ovat. Säästyi valtavasti aikaa ja tämä matemaatikko saa ideaa nopeammin iteroitua ja myös kerkeää uransa aikana enemmän erilaisia ideoita ajatella ja testata. Sama juttu koodauspuolella. Vaikka ai agentti ei tekisi 100% koodista niin mitä se tarkoittaa jos firman koodereiden teho kasvaa 10%, 50%, 100%, 1000%?

Ei tarvitse ei ja voi olla silti hyödyllinen. Lähinnä yllä siis pohdiskelin siltä kulmalta asiaa onko kielimallista tulossa AGI vai tarvitaanko vielä jotain muuta.

finWeazel · 03.02.2025

OpenAI:lta ai-pohjoinen tutkimustyökalu. Porskuttaa kysymyksen parissa jopa 30min, generoi rapsan lähteiden kera, käyttää myös internettiä apuna. Pitää kokeilla tuota illemmalla, ei näytä olevan vielä mobiiliklientissä tarjolla

The new feature allows ChatGPT to find, analyze and synthesize hundreds of websites and online sources to create reports “at the level of a research analyst.”

“Deep research in ChatGPT is currently very compute intensive,” the company reasons, adding it will limit Pro users to 100 queries per month. “The longer it takes to research a query, the more inference compute is required.”

ChatGPT's Deep Research tool can create reports from hundreds of online sources

Following the release of o3-mini, OpenAI announced on Sunday Deep Research, a new agentic tool for ChatGPT.

www.engadget.com

qtba · 03.02.2025

finWeazel sanoi:
OpenAI:lta ai-pohjoinen tutkimustyökalu. Porskuttaa kysymyksen parissa jopa 30min, generoi rapsan lähteiden kera, käyttää myös internettiä apuna. Pitää kokeilla tuota illemmalla, ei näytä olevan vielä mobiiliklientissä tarjolla

ChatGPT's Deep Research tool can create reports from hundreds of online sources

Following the release of o3-mini, OpenAI announced on Sunday Deep Research, a new agentic tool for ChatGPT.

www.engadget.com

Gradu ulos puolessa tunnissa?

Olisi kyllä ihan positiivista, jos esim. kaikenmaailman arvauspajojen ekonomistit saataisiin oikeisiin töihin tuon tehdessä työn nopeammin. Kone on varmasti ihan yhtä paska heittämään että mikä on ensi vuoden talouskasvu. Varmaan jopa parempikin, jos saisi edes etumerkin oikein?

Tekoäly

IOdootti

IOdootti

Meta announces 5% cuts in preparation for ‘intense year’ — read the internal mem​

o3's breakthrough 71.7 on SWE-Bench verified puts us on pace to 100% in 6 months​

Uutiset

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi

Meta announces 5% cuts in preparation for ‘intense year’ — read the internal mem

o3's breakthrough 71.7 on SWE-Bench verified puts us on pace to 100% in 6 months