AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

Makis · eilen klo 16:40

En sanonut, etteikö algoritmejakin piiloteltaisi. Varsinkin jos ne on saatu luotua tuosta datasta, niin ne on vähintään yhtä arvokkaita.

Ja miksi taas tuot koko maailman koodin tähän? Olenko väittänyt että jotain javascript-kikkaretta, joita on jo maailmassa miljoona ei voi tehdä AI:lla ja tunkea vaikka open sourceksi jos siltä tuntuu? Mutta kun minä otin esille oman tilanteeni niin miksi veessä tuo on relevanttia? Miksi koko ajan tahallaan sotket asiaa? Mikä ihmeen tarve sinulla on yrittää vähätellä asiaa? Teetkö noin yleisemminkin, kun joku kertoo ongelmastaan niin sinä vastaat, että ei tuolla ole väliä kun suurimmalla osalla ihmisistä ei ole tuollaista ongelmaa? Koska käytännössä sinä teet just sitä. Argumenttisi ovat tässä ihan nollatasoa, tai oikeastaan arvoltaan negatiivisia, kun aktiivisesti yrität estää asiallisen keskustelun.

finWeazel · eilen klo 17:00

Makis sanoi:
Ja miksi taas tuot koko maailman koodin tähän?

Keskustelun aihe on koodausavustimet ja koodi yleensä eikä vain joku pieni niche. Jos haluaa miettiä esim. koodausavustimien ja ai:n vaikutusta ohjelmistoihin niin lienee relevanttia keskustella koko ohjelmistoalasta eikä keskittyä yhteen puuhun näkemättä metsää.

Algoritmeista jos haluaa keskustella niin voi miettiä miten ison osan tunnetuista algoritmeista ja tieteellisistä papereista saa tehtyä AI-avusteisesti todella kätevästi koodiksi. Aika harva ohjelmistoalan seniori pärjäisi IMO matematiikkakisassa tai atcode koodauskisassa, AI:lla tuon kyvykkyyden saa kuka tahansa. Kehitys ei myöskään ole pysähtynyt imo/atcoder viime kesän tasoon. Päivä päivältä vähenevät asiat mitä pätevä ihminen kera AI:n ei saa kloonattua jos joku on jo asian X tehnyt ja kyse on puhtaasta koodista/algoritmista eikä esim. miljoonista ihmisistä kerätystä datasta mitä ei voi syntetisoida.

JeanS · eilen klo 18:16

Itse kävin pitkän keskustelun Ouran tekoälyn kanssa ja vaikutti ihan ”osaavalta”. Olen ”moniunivammainen” ja antoi muutamia järkevältä kuulostavia vinkkejä.

BongisKhan · eilen klo 18:18

Makis sanoi:
Haluaisitteko te, että vaikka hengityskoneen koodit on vibe-koodattu? Miten paljon tuollaisen koodin tapauksessa olisitte valmiita jättämään AI:n harteille? Pitäisikö ihmisten ihan oikeasti ymmärtää se koodi? Uskaltaisitteko luottaa, että AI tekee vedenpitävät speksit kun kyse on ihmishengistä?

Suoraan sanottuna tuollaisessa käyttökohteessa haluaisin olevan mahdollisimman vähän yhtään mitään koodia, oli se sitten ihmisen, AI:n tai apinan kirjoittamaa.

--

Jos mennään vähän arkisempiin sovelluksiin, niin oma kokemus on hyvin pitkälti se, että AI on jo nyt todella hyvä renki, joka osaa varsin itsenäisesti analysoida ja yhdistellä varsin monimutkaistakin dataa ja tehdä siitä ihan järkeviä päätelmiä tieteellisen kirjallisuuden perusteella. Olen monta kertaa päässyt yllättymään kuinka hyvä ja oivaltava se voi oikeasti olla ihan vaan täysin suljettua dataakin katsomalla. Kaikenlaisen tutkivamman koodailun, iteroinnin ja pikkutarkan analysoinnin tekemisessä tekoäly on aivan älyttömän hyvä jo nyt ja väitän, että itsellä on kokonaisoutput omissa töissä AI:n ansiosta ihan oikeasti jossain 2-4x tasolla aiemmasta. Osittain varmaan liittyy ihmistyyppiinkin, kun tällaiselle AC/DC-miehelle jatkuva kontekstinvaihto, moneen suuntaan kerrallaan eteneminen ja asioiden välillä pomppiminen AI-avusteisesti pitää homman mielenkiintoisena, että tulee puolivahingossa itsekin tehtyä oikeasti enemmän töitä.

Toisaalta surkea isäntä se AI on edelleen ja renkinäkin sellainen, että perään saa olla katsomassa koko ajan. Mitä itsevarmempia julistuksia se tekee, sitä suuremmalla syyllä pitää kyseenalaistaa ja pyytää sitä tarkistamaan kuinka päätyi tähän lopputulokseen. Sanoisin, että noin yksi kerta kolmesta lopputulos on, että AI toteaa "hups, totesinkin vähän liian jyrkästi, oikeasti onkin x y z". Eli oma kokemus on, että ei se yleensä ole väärässä, mutta on hösöttäessään hukannut juuri sopivasti kontekstia ja nyanssia, että väittämät eivät kestä kriittisempää tarkastelua.

Muutenkin olen edelleen sitä mieltä, että joo kannattaa speksata hyvin, tehdä suunnitteludokkarit sun muut, mutta siitä eteenpäin homma kannattaa tehdä pienemmissä paloissa, vähän väliä kontekstia tyhjennellen ja muutenkin perään katsoen. Alkuun tuli annettua isompia kokonaisuuksia, mutta hyvin pian totesin, että tunnin ruksuttelun lopputuloksessa ei välttämättä ole päätä eikä häntää, koska jossain kriittisessä kohdassa AI on ymmärtänyt väärin tai oikaissut ja koko homma on lähtenyt pois raiteiltaan.

En tiedä onko kyseessä vain Clauden nykyinen laiskottelutaipumus, vai päteekö sama muihinkin frontier - malleihin, mutta tänään oli loistava esimerkki siitä, että tarkkana saa olla: tutkin yhden luonnonilmiön mallintamista tai sen mallin parantamista ja tähän tarkoitusperään olin laittanut Clauden tutkimaan kolmea eri potentiaalista reittiä, joilla hommaa voisi alkaa lähestymään. Tulosta tuli ja yksi menetelmistä vaikutti selvästi vahvemmalta kuin muut. Claude oli käynyt läpi ison nipun tutkimuskirjallisuutta ja tehnyt kaikista muistiinpanot tiedostoihin ja pystyttänyt erinäisiä protosovelluksia kustakin lähestymistavasta. Tässä alkuvaiheessa kun kokonaisuutta vasta hahmotellaan, en ollut hirveän tarkasti käynyt läpi kaikkea mitä Claude taustalla oli puuhaillut, mutta sitten kun alkoi olla aika tehdä päätöksiä siitä mitä polkua lähden itse seuraamaan tarkemmin, rupesin käymään läpi Clauden muistiinpanoja luetusta kirjallisuudesta. Siinä vaiheessa kävi ilmi, että Claude ei ollutkaan oikeasti lukenut kokonaisuudessaan yhtä artikkelia, johon yksi menetelmistä nojasi lähes kokonaisuudessaan, vaan pelkän tiivistelmän. Muistiinpanoissa oli kyllä tästä merkintä, mutta Claude ei ollut mitenkään maininnut tästä. Noh, tällä kertaa lopputulos oli siinä mielessä onnellinen, että Claude oli saanut keskeisimmät luvut ja havainnot ongittua pelkistä tiivistelmistä, mutta koko artikkelin lukemalla kävi ilmi, että yksi laskennan vähäpätöisempi alikomponentti olisi mennyt aika pahasti pieleen.

finWeazel · eilen klo 18:57

JeanS sanoi:
Itse kävin pitkän keskustelun Ouran tekoälyn kanssa ja vaikutti ihan ”osaavalta”. Olen ”moniunivammainen” ja antoi muutamia järkevältä kuulostavia vinkkejä.

Uni on melko yksinkertainen juttu. Ei oura ole keksinyt mitään sellaista mitä ei sais yhdelle a4:lle printattua tai jos haluaa isomman kontekstin niin why we sleep kirja. Toki tämä ei ole estänyt sitä, että jos uni kuoppaan kurkistaa niin löytyy vaikka minkälaista käämeöljyä esim. youtuben puhuvilta päiltä.

Unihygienia on helppo ymmärtää, mutta vaikeus siinä että pitäisi jaksaa ja pystya noudattamaan protokollaa, samalla lailla, joka päivä, alkaa jo aamulla kun herää. Jonkinlaista tuunausta joutuu tekemään pärstäkohtaisesti, mutta siinäkin työ tehtävä itse. Esimerkiksi kuinka lähellä nukkumaanmenoa syö ja mitä syö.

user_timo · eilen klo 19:29

Heitän keskustelun väliin Hermes Agent asiaa, 0.12.0 päivityksessä tuli tuetuksi rinnakkaiset agentit ja Kanban työkulku.
Testasin tuota niin, että loin suunnittelija, review, koodari, dokumentoija ja security agentit, jokainen on omilla api avaimillaan ja omalla muistilla.
Työn kulku suunnittelinja<->review <-> sitten sopivat agentit.

Pistin tuossa idean että Soldat 2 serverille (Hermes samalla palvelimelle) luodaan scripti, millä pelaaja voi kysellä omia tilastoja ja nähdä serverin top 3 pelaajaa jne.
Siellä ne sitä porukalla pyöritteli ja sai homman valmiiksi, täytyy käydä jossain välissä toteamassa että mitä ne sai aikaiseksi kunhan ehtii.

Mutta pitkälle on tultu siitä yksittäisestä chatbotista.

user_timo · eilen klo 19:43

Claude codeen rajojen helpostusta:

Linkki: https://x.com/claudeai/status/2052060693269008586?s=20

Karhu III · eilen klo 19:52

Makis sanoi:
Niin, koneoppiminen ei nimenomaan ole, mutta nykyään kaikki ML leimataan AI:ksi koska jälkimmäinen on hypeä.

Mutta jos lähdetään tuollaiselle linjalle selvityksessä, niin se vaatii ihan helvetisti dataa. Siinä vaiheessa en näe oikein enää edes järkeä sotkea Ouran sormusta hommaan.

Eli data on arvokasta. Ja todellakin sotkisin Ouran sormuksen hommaan. Ensimmäisenä tutkisin Ouran patentit. Tai en minä, AI saisi tehdä sen minun puolesta ja tehdä yhteenvedon.

Makis sanoi:
Ja jos tekisitkin noin, niin mitä siis etsisit AI:lla sieltä?

En minä tiedä mitä minä etsisin AI:lta sieltä. En ole kiinnostunut älysormuksista. Tiedän itsekin milloin minulla on nälkä.

Makis · eilen klo 20:55

finWeazel sanoi:
Keskustelun aihe on koodausavustimet ja koodi yleensä eikä vain joku pieni niche.

No jo on asenne. Jos joku siis puhuisi täällä jostain vähemmän suositusta avustimesta, niin sinä voisit tunkea sekaan selittämään jotain epärelevanttia vaikka Claudesta? Eihän tuollaisessa ole mitään järkeä, että asioista voi keskustella vain hyvin yleisellä tasolla, mistään detskuista ei voi keskustella tässä ketjussa.

Karhu III · eilen klo 20:55

On AI selvästi kehittynyt. Esimerkkinä curl.

Ensin se hukkui AI sloppiin:
Death by a thousand slops

Nyt laadukkaita AI bugikorjauksia sataa ämpärikaupalla:
The difference now compared to before however, is that they are mostly very high quality.

Makis · eilen klo 20:58

BongisKhan sanoi:
Suoraan sanottuna tuollaisessa käyttökohteessa haluaisin olevan mahdollisimman vähän yhtään mitään koodia, oli se sitten ihmisen, AI:n tai apinan kirjoittamaa.

I've got some bad news for you... sairaalalaitteissa on ihan hitokseen koodia. Ei niitä laitteita oikein muuten voi käyttää.

finWeazel · eilen klo 21:12

user_timo sanoi:
Claude codeen rajojen helpostusta:

Upea juttu, että saadaan lisää konesalikapasiteettia ai-avustimiin. Hieman harmittaa se, että tämä kertonee ettei xai:n llm:t tule olemaan lähiaikoina kilpailukykyisiä koodaushommissa(miksi muuten myydä kapasiteettia kilpailijalle). Ehkä cursor+xai yhteistyö poikii jotain, mutta sen lopputulosta ei nähtäne ennen kuin loppuvuodesta/2027 puolella.

user_timo · eilen klo 21:31

Tuossa Clauden viikkolimit kuitenkin ilmeisesti pysyy samana.

finWeazel · eilen klo 21:56

user_timo sanoi:
Tuossa Clauden viikkolimit kuitenkin ilmeisesti pysyy samana.

Saa nähdä muuttaavatko pellinalla mallien parametreja niin että idioottimoodi poistuisi. Mielenkiinnolla seuraan redditiä. Ei ole näkynyt wow 4.7 on paras koskaan. Enempi porukka kaipailee 4.6:sta takaisin siltä ajalta kun malli oli vielä hyvävointinen.

finWeazel · tänään klo 00:39

Ja näin se alkaa redditkin heräileen, että codex myös menee idoottimoodiin toisinaan. Uskomatonta scheissea, jos jotain hyvää niin vieroittaa näistä koodausharrastuksista hyvin. Ehkä se kalastuskausi oikeasti alulle, ei ole vielä kerinnyt siimoja liottamaan tälle keväälle.

Jännästi sekä claude dumb mode ja codex dumb modessa reddit heräilee vajaa viikko sen jälkeen kun itse huomannut että jotain on pahasti pielessä. Internet vähän hidas nostamaan höyryt pinnalle.

Three days ago this exact same set of prompts and model built things out perfectly. No issues whatsoever. Does anyone have a foolproof set of tests to check these models out before turning agents loose with write permissions on a project?

This has happened to me today too.

Codex (using 5.5 extra high) has been really incredibly stupid for me today on a few occasions

Reddit - Please wait for verification

www.reddit.com

Useampia ketjuja aiheesta

Reddit - Please wait for verification

www.reddit.com

Lol, joku tehnyt bugirapsan openai:lle. Suap nähdä saako samanlaisen nothing to see here, close ticket kuin openai teki clauden osalta: Severe output quality variance across accounts and time periods · Issue #18104 · openai/codex

Lassivv · tänään klo 07:23

Mitkä työkalut olisi hyvät home assistantin + noderedin kanssa tekemiseen, niin ettei anna kuitenkaan ai käpälöidä koko asennusta.

Käytin maksullista gemini kerran ja toimi ihan ok, mut aika paljon cope pasta edes takas on aina. Onko jotkut työkalut millä voisi kokeilla, ehkä jopa ilmaiseksi.

namlepo · tänään klo 07:57

Codexia ja cursoria voi koittaa ilmaiseksi.

Lassivv sanoi:
Mitkä työkalut olisi hyvät home assistantin + noderedin kanssa tekemiseen, niin ettei anna kuitenkaan ai käpälöidä koko asennusta.

Käytin maksullista gemini kerran ja toimi ihan ok, mut aika paljon cope pasta edes takas on aina. Onko jotkut työkalut millä voisi kokeilla, ehkä jopa ilmaiseksi.

Makis · tänään klo 08:14

Ei nyt varsinaisesti tee liiketoiminnalle hyvää, tuo jos joku (hintojen nousun lisäksi) ajaa firmat käyttämään omia malleja. Jos koko bisnesmalli perustuu noiden käyttämiseen ja sitten säännöllisesti mallit on kelvottomia, niin tilanne on aika kestämätön.

Durbasauna · tänään klo 10:08

Niin, kohta voi olla ihan realismia pikkuisille ketterille puulaakifirmoille ostaa parit RTX 6000 Prot ja pyörittää lokaaleja LLM:iä. Nykytahdilla ei mene edes kauaa, että ”maksavat itsensä takaisin” ja laatu perus koodarille 90% nykyisistä lippulaivamalleista.

namlepo · tänään klo 10:10

Googlellahan on gemma. Eli lokaali malli ja sitten myyvät pilveä missä voi sen kanssa hallunisoida.

Makis · tänään klo 10:21

Meidän AI-äijjä väitti että Qwenin uusi versio olisi Gemmaa parempi.

edup · tänään klo 10:40

Makis sanoi:
Meidän AI-äijjä väitti että Qwenin uusi versio olisi Gemmaa parempi.

Riippuu käytöstä. Agenteissa ja koodauksessa joo, yleiskäyttöisenä LLM:nä ei. Esim. täällä hyvää juttua: Qwen3.6 27B vs Qwen3.5 27B vs Gemma 4 31B: Accuracy, Latency, Memory, and Token Efficiency Tested Muutenkin suositus Kaitchupille.

mlackke · tänään klo 11:01

Kävin kuuntelemassa Anthtropicin esityksen Claudesta. Jatkossa claude ei tule enää olemaan innokas juniori ns "make it work asenne" vaan osaa myös kysyä apua jos ei saa ongelmaa ratkaistua

ravallo · tänään klo 12:25

mlackke sanoi:
Kävin kuuntelemassa Anthtropicin esityksen Claudesta. Jatkossa claude ei tule enää olemaan innokas juniori ns "make it work asenne" vaan osaa myös kysyä apua jos ei saa ongelmaa ratkaistua

Eikös tuosta juuri täällä valitettu, että sen sijaan että se ryhtyisi töihin se mussuttaa vastaan ja kyselee tyhmiä?

(Eli toimii kuten ihan oikeakin seniori vs. juniori

)

Makis · 45 minuuttia sitten

edup sanoi:
Riippuu käytöstä. Agenteissa ja koodauksessa joo, yleiskäyttöisenä LLM:nä ei. Esim. täällä hyvää juttua: Qwen3.6 27B vs Qwen3.5 27B vs Gemma 4 31B: Accuracy, Latency, Memory, and Token Efficiency Tested Muutenkin suositus Kaitchupille.

No, koodaukseen sitä käytetäänkin.

AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

Makis

finWeazel

JeanS

BongisKhan

finWeazel

user_timo

user_timo

Karhu III

Makis

Karhu III

Makis

finWeazel

user_timo

finWeazel

finWeazel

Reddit - Please wait for verification

Reddit - Please wait for verification

Lassivv

namlepo

Makis

Durbasauna

namlepo

Makis

edup

mlackke

ravallo

Makis

Uutiset

Uutisia lyhyesti

Uusimmat viestit

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi