AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

On niissä paljon eroja jopa samankin mallin sisällä. Esim. clauden uusin opus niin sitä voi ajaa erilaisilla määrillä "työtä". Suosittelevat, että isoihin taskeihin/suunnitteluun high ja kun on palasteltu niin medium:lla toteutusta. Kuvassa opus 4.5 mallin suorituskyky swe-bench:ssa eri "työ" parametrilla.

Eri työkaluista kun käyttää malleja niin asetuksia on voitu optimoida eri tavalla(kontekstin koko, effortti, jne). Työkalun sisässä on prompti kielimallille ja logiikka mitä/miten työkalu laittaa kontekstiin. Sama malli samoilla asetuksilla voi toimia eri tavalla työkalusta riippuen. Jopa sillä, että importtaa sairaan määrän mcp-servereitä ja työkaluja kontekstiin voi myrkyttää mallin osaamisen ja käytettävien tokeneiden määrä kuuhun==kallista.

Ei olla vielä semmoisessa "it just works" ajassa. Jos/kun joku ei onnistu niin voi katsella, että toimisko eri mallilla/eri tavalla homman alustamalla vai onko vielä tekemätön paikka AI:lle.
1764881934832.png
Nyt alkaa silmät painaa liikaa ja liikaa infoa näihin tunteihin mun pienille avoille, ni mä harrastan viikonloppuna lisää 😊 varsinkin ko si nähny kuinka yö automatio nyt toiminut fiksausten jälkeen
Edit toki siinä tehdesaäkin huomasin et ohitti välillä koko koodin ja keskittyi vain juuri ongelmaan, ja piti ohjeistaa palauttamaan koko kokonaisuus. Mut se oli helpoa. Niin ja sillon ollu viellä got repoa, ihan filua luki ja chatissa annoin jsonia node rediltä. Ni paikkas siis vaan yhen ongelman yksin ja muut toiminnot siis jäi pois, mut kun huomautti tuntui tulevan toimiva kokonaisuus
 
Viimeksi muokattu:
OpenAI julisti jonkin "code red" tilan, huhuttu että ihan asap. tulossa ulos jotain paremmaksi tuunattua mallia.
Luin että joku paniikki OpenAI:lla kun muut mallit menivät sivusta ohi. En usko että ihan heti pystyvät paremman tekemään ellei tule joku purkkaratkaisu.
 
Luin että joku paniikki OpenAI:lla kun muut mallit menivät sivusta ohi. En usko että ihan heti pystyvät paremman tekemään ellei tule joku purkkaratkaisu.
Altman sanoi joskus syksyllä, että heillä olisi parempia malleja mutta ei riitä konesalissa kapasiteetti niiden tarjoamiseen isolle massalle. Voi olla, että kaivavat jonkin tuollaisen naftaliinista ja ottavat lyhytaikaisesti turpaan kalliin mallin kanssa jota ei voi tarjota kaikille.

Eilen kuuntelin anthropicin CEO:n jutustelua. Se siunaili, että hyvä juttu että tuli valittua enterprise asiakkaat niin ei tarvi openai/google nokitteluun osallistua vaan voi tehdä vähän pitkäjänteisemmin. Ilmeisesti anthropicin isompi asiakasmassa ei ryntää joka rasahduksen perässä palvelusta toiseen.
 
Claude codessa on Opus 4.5 oletuksena päällä, mutta se automaattisesti tekee simppelit asiat Haiku-agentilla. Nopeuttaa paljon eikä kuluta pääagentin kontekstia.
 
Tuohon tulee kyllä hyvin intuitio, nykyään aina takaraivossa jyskyttää "tähän tarvii Codex Max Extra highillä, tuohon Gemini, tätä pitää selvittää Grokilta..".
Samoilla linjoilla, itse lajittelen hommat näin:

Pieni taski: pieni konteksti, "lähdemateriaali" selkeä ja lopputulos helppo/nopea määritellä (ei oikeastaan tarvitse plan-modea) > Haiku.

Keskikokoinen taski: Vaatii suunnitelman, jota pitää iteroinnissa hieman hioa. Lopputuloksen määrittely voi jäädä osittain avoimeksi, koska se voi olla monivaiheinen tai kompleksinen > Opus/Sonnet.

Iso taski: Tarvitsee useamman iteraation, lopputulosta on vaikea tarkasti määritellä, mutta lähtökohtaisesti odotetaan, että se menee kuitenkin sinnepäin, joten palastellaan pienempiin osiin myöhemmin > GPT 5.1.
 

Statistiikka

Viestiketjuista
294 220
Viestejä
5 030 379
Jäsenet
80 663
Uusin jäsen
kolaolli

Hinta.fi

Back
Ylös Bottom