AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

Saapa nähdä tuleeko oikeasti sonnet4.8. 4.7:en vois väittää olevan huonompi kuin 4.6 ja 4.6 nyt huonompi kuin 4.6 julkaisussa. Numerot kertoo yhtä tarinaa, todellinen käyttö toista. Paras minkä anthropic vois tehdä olis saada 4.6 "peak" tasoinen malli ulos mitä voidaan ajaa niin halvalla ettei tarvi käynnistellä idioottimoodia. Sitten kun konesalikapasiteetti riittää laittaa isompia malleja tarjolle. Toki niitä isompia olisi tässä skenaariossa pakko kehittää koko ajan vaikka ei niitä toisi kuluttajille tarjolle. vrt. mythos nyt vain rikkaiden hupia.

Toki voi tulla 4.8 tai vaikka 5.0 mutta hinta pompsahtaa niin paljon että hinta&kysyntä kohtaa ja taviksille jää tarjolle retard moodissa oleva 4.7.
 
Tässä videossa hyvää perustelua miksi hinnat tulevat nousemaan rajusti jatkossa:
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

En osaa oikein TL;DR:ää tuosta tehdä, mutta jos joku ei ole vielä merkkejä nähnyt ilmassa niin tuosta löytyy. Ihan lopussa vielä Clauden asiakkaille tärkein pointti, eli kunhan IPO tapahtuu, niin mallien hinnoittelu tulee perustumaan neljännesvuosittaisiin tuottoihin.
 
Uskon että parempi malli sieltä tulee, mutta kuinka pitkään se on hyvä ja mihin hintaan täysin eri juttu.

mythos nyt vain rikkaiden hupia.
Tällä menolla pian on myös Opus ja kaikki tulevat frontier mallit. Köyhillä (200€/kk) tilaajat saavat tyytyä 1h käyttöaikaan tai Previous Gen non-reasoning malleihin.

Toivottavasti ei tule käymään näin, mutta kysyntä/tarjonnan laki.
 
Uskon että parempi malli sieltä tulee, mutta kuinka pitkään se on hyvä ja mihin hintaan täysin eri juttu.
Tässä on iso kysymys se, että oikeasti parempi malli vaiko vain paperilla parempi malli. Edelleen taitaa olla niin, että käytännössä tän hetken 4.7 ja 4.6 huonommat kuin mitä 4.6 oli julkaisussa. Malleja tyhmennetty kun ei ole konesalikapasiteettia. Ei ole hyötyä näyttää bigger bar better graafeja+julkaisua jos mallia ajetaan idioottimoodissa. Ei sekään ole hyvä jos x% ajasta saa priiman missä x ei ole 100%. Järki lähti siinä kohtaa kun claude meni vamma-moodiin viikoiksi. OpenAI 5.5 onneksi toimii paremmin mennen kilpikonnamoodiin paljon harvemmin kuin claude.

Eiköhän seuraava anthropic ole edelleen mythos:sta distilloitu ja paremmin viilattu pienempi malli. Toivottavasti tällä kertaa semmoinen mitä voivat ajaa priima asetuksilla retard moodin sijaan.
 
Nyt taas mennään?
Tämä Opencode kehittäjältä.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://x.com/thdxr/status/2055071042536632622?s=20

Ainakin mulle osui noita vammasessioita myös openai:n codex+5.5 xhigh:lla. Harvemmin tosin kuin clauden kanssa. Näkee jo suunnitelmaa tehdessä millainen vointi mallilla on ja tietää kannattaako jatkaa vai ei.
 
OpenAI näyttää ainakin kommentoivan palvelun huonontumista. Saapa nähdä mitä seuraa
1778866068022.png


Redditissä porukka vielä lämpimänä anthropicin suuntaan
1778866123754.png
 
Onhan tää nyt vaan tragikoomista miten tää jatkuvasti tulee "yllätyksenä" että suljetut mallit on suljettuja ja niiden toiminta on just tasan mallin kehittäjän tahtotilan ja konesalikapasiteetin armoilla. Vaihdatte niihin isoihin avoimiin pilvimalleihin, niin voitte suoraan vaihtaa palveluntarjoajaa jos näkyy mitään merkkejä lobotomiasta (ei muuten näy, koska ne kaikki tietää sen ettei sellainen pelleily vetele).
 
Onhan tää nyt vaan tragikoomista miten tää jatkuvasti tulee "yllätyksenä" että suljetut mallit on suljettuja ja niiden toiminta on just tasan mallin kehittäjän tahtotilan ja konesalikapasiteetin armoilla. Vaihdatte niihin isoihin avoimiin pilvimalleihin, niin voitte suoraan vaihtaa palveluntarjoajaa jos näkyy mitään merkkejä lobotomiasta (ei muuten näy, koska ne kaikki tietää sen ettei sellainen pelleily vetele).
Ei se nyt oikein ole vaihtoehto kun lokaalit ei toimi senkään vertaa kuin claude/codex dumb-moodissa. Ei mene lokaalit mitä saa esim. 5090:een tai m4 max pro 128GB:een ajoon rajan yli mikä mun projekteissa olisi käyttökelpoinen. Qwen3.6:27b 5090:lla opencoden kautta käytettynä tyhmempi kuin saapas ja niin hidas että ennemmin olen edistämättä kotiprojekteja kuin tuota käyttäisin.
 
Ei se nyt oikein ole vaihtoehto kun lokaalit ei toimi senkään vertaa kuin claude/codex dumb-moodissa. Ei mene lokaalit mitä saa esim. 5090:een tai m4 max pro 128GB:een ajoon rajan yli mikä mun projekteissa olisi käyttökelpoinen. Qwen3.6:27b 5090:lla tyhmempi kuin saapas ja niin hidas että ennemmin olen edistämättä kotiprojekteja kuin tuota käyttäisin.
Mä en puhunut lokaaleista malleista, vaan avoimista isoista pilvimalleista.
 
Mä en puhunut lokaaleista malleista, vaan avoimista isoista pilvimalleista.
Ennemmin tuossa tapauksessa tällä erää maksaisin kuitenkin openai:sta. Se on pääasiassa toiminut ja pykäliä edellä vaikka deep seek v4:sta. Sen tosin ymmärtää, että pykii hetkittäin kun käyttäjämäärät on räjähtäneet hetkessä. Jos porukka siirtyy johonkin avoimeen malliin samalla rytinällä niin konesaleista loppuu kapasiteetti vielä nopeammin kun ei ole openai:n paksua lompakkoa ja sopimuksia konesaleista+uusien rakentamisrsta. Tollanen kuvan kevee 30x nousu codexin latausmäärissä kun 5.5 julkaistiin. Anthropic:lla 80x kasvu eka kvartaalilla: Anthropic CEO says 80-fold growth in first quarter explains 'difficulties with compute'


1778883624230.png
 
Aivan kuin rajat olisi laskeneet, ajattelin vähän puuhastella ennen unia, pistin jopa heikomman mallin päälle ja noin vartissa meni koko 5 tuntia. Tulee ikävä niitä aikoja, kun halvimmalla tilauksella sai tykittää lähes aamusta iltaan.

Loppuun vielä heitin perinteisen ison työn, kun käyttörajaa oli muutama prosentti jäljellä, pääsin ilmeisesti tutustumaan peloteltuun idioottimoodiin, kun 5.5 xhigh toteutti tavoitteesta muutaman asian heikosti ja silti merkkasi kaiken toteutetuksi.
 
Tässä videossa hyvää perustelua miksi hinnat tulevat nousemaan rajusti jatkossa:
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

En osaa oikein TL;DR:ää tuosta tehdä, mutta jos joku ei ole vielä merkkejä nähnyt ilmassa niin tuosta löytyy. Ihan lopussa vielä Clauden asiakkaille tärkein pointti, eli kunhan IPO tapahtuu, niin mallien hinnoittelu tulee perustumaan neljännesvuosittaisiin tuottoihin.

Ei kyllä jaksa katsoa 10 minuutin lätinöitä. Ei sulla olisi mitään AI:n tekemää yhteenvetoa?

Mutta joo, mulla on nyt Codex Pro joka on 100 €/kk. Vaikka se maksaisi 1000 €/kk, niin minusta se olisi kannattava sijoitus. 10000 €/kk, niin pitää ehkä miettiä kenelle tiimissä annetaan lopputili.

Tähän on valitettavasti tultu.
 
Sam meinaa, että ihmiset vaan tottunu liian hyvään
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://x.com/sama/status/2055356452286640630?s=20

Luenkohan mä jotenkin tyhmästi kun eka ajatus mikä mieleen tuli tuosta altmanin postauksesta

"jengi tottunut hyvään" - [Malli halvennettu] - lol naurattaa aina kun porukka haluaa sen hyvän takaisin mihin on totuttu. Nyt kun "korjattu" niin liekö siellä yritetty halventaa, todettu että meni överiksi ja peruttu jotain muutoksia.

Ettei menis pelkäksi narinaksi niin codex app:in peukku alas/ylös systeemi on ollut tovin aikaa tosi hyvä. Helppo antaa palaute ja luulis syntyvän nopea signaali jos jossain on mätää ja palaute osuu oikeisiin sektoreihin.
 
Viimeksi muokattu:
macOS:ssa saa tuon Codexin paritettua puhelimen ChatGPT:hen. Testasin tuota eilen ja hyvin näytti toimivan, kotona oli Mac Mini hereillä ja se siellä hommia sit painoi.
 
Tokenien hinta on vähän sama kuin pohtisi pätevien työntekijöiden hintaa. Kyllä kooderien pitäisi saada vain 2500e/kk, hulluutta maksaa enemmän, pöh. Noh, joku noinkin ajattelee ja siellä firmassa ei varmasti ole parhaat menot, tekijät tai menestykset. Voittoon on hankala säästää itseänsä.

Kannattaisi miettiä, että jos/kun saadaan enemmän aikaiseksi niin voisiko yritykselle generoida voitollista kasvua nopeammalla tuotesyklillä, uusilla tuotteilla/palveluilla jne. Nopeet syö hitaat.
 
Mulla käytännössä koko päivän pyöriny Codexissa ja Hermeseissä Codex(100€)tilauksen agentit Kanban joukkioina puuhastelemassa.
On,
1. rakennettu Codex:ssa Java Gradle projekti
2. Päivittänyt oman golang projektin
3. Ajanut Hermesissä Kanban hommalla kahta erillistä egenttijoukkoa, jotka parannelleen palvelimella olevien pelien scriptejä.

Kaikki olleet high/xhigh ajoja 5.5:lla.
Codexin viikko- tai tuntirajat eivät missään vaiheessa ollut mitään muuta kuin 100%.
En pian kahteen viikkoon ole nähnyt kuin 100% lukemia.

Alan olemaan sitä mieltä, että mulla on joku todella posiviinen bugi mun tilillä.

Edit: otan nyt oikein asiakseni availla isoja projekteja ja pyydän niistä xhigh:lla reviewejä, että muuttuuko nuo mihkään
Edit2: tuo 5h aikaikkuna on minulla koko ajan liukuva, eli missään vaiheessa se ei ilmeisesti ala.
Edit3: täytin reilu 2vk sitten OpenAi:lle OpenSource tukihakemuksen, mutta siitä ei mitään ole kuulunut ja minun ymmärtääkseni se olisi hyvitystä API tilille, missä sitten voisi sitä tuhlata, joten ei pitäisi tähän tilaukseen vaikuttaa.
 
Viimeksi muokattu:
Niin kauan hauskaa, että bugi olikin laskutuspuolella ja tulee joku biljoona tokenia lasku perästä. Siinä sitten tappelemaan, että en ole API hinnalla mitään suostunut ostamaan enkä maksa laskua.
Totta. Mutta API-tokeneita en ole tässä käyttänyt lainkaan, kaikki tuon 100€ tilauksen juttuja. Ei ole edes generoituna OpenAi API avainta.
Edit: minulla ollut myös useita päiviä ettei käyttöä ole ollut lainkaan tai se on ollut todella vähäistä, voiko olla että tuollaisista nykyään lasketaan jotain puskuria että saa sitten vastineeksi vähän enemmän?

Edit2: eipä nuo tuosta liiku. Empä kiusaa enemmäpää tuota..
 
Viimeksi muokattu:
Tokenien hinta on vähän sama kuin pohtisi pätevien työntekijöiden hintaa. Kyllä kooderien pitäisi saada vain 2500e/kk, hulluutta maksaa enemmän, pöh. Noh, joku noinkin ajattelee ja siellä firmassa ei varmasti ole parhaat menot, tekijät tai menestykset. Voittoon on hankala säästää itseänsä.
Vähän yksipuolinen näkemys. Mitenkäs harrastelijat? Harvalla on vara laittaa tekoälyavustimeen tonneja kuussa.
 
Ite koitin 5.4 ja keskitasoa ja hitaampaa. Riittää omiin hommiin ja ei mene käyttörajat heti nollille. Miettikääpä jos ois rajattomasti tokeneita. Varmaan netti palas. Ja kaikki muutkin paikat.
 
Vähän yksipuolinen näkemys. Mitenkäs harrastelijat? Harvalla on vara laittaa tekoälyavustimeen tonneja kuussa.

Mun näkemys on että harrastelijoilla on tosi hyvä tilanne tällä hetkellä, kun yritysasiakkaat maksaa lystin API-hinnoilla. Itsellä menee helposti 100-200 dollaria työpäivän aikana, enkä ole meidän firmassa edes kovimpia käyttäjiä. Eli sanoisin että nyt kannattaa halvalla kuukausimaksulla harrastella niin paljon kuin mahdollista, en usko että näin halvat hinnat voi jatkua loputtomiin.
 
Mun näkemys on että harrastelijoilla on tosi hyvä tilanne tällä hetkellä, kun yritysasiakkaat maksaa lystin API-hinnoilla. Itsellä menee helposti 100-200 dollaria työpäivän aikana, enkä ole meidän firmassa edes kovimpia käyttäjiä. Eli sanoisin että nyt kannattaa halvalla kuukausimaksulla harrastella niin paljon kuin mahdollista, en usko että näin halvat hinnat voi jatkua loputtomiin.
Jos pidetään laatu samana tokenien hinta putoaa 1/10 osaan vuosittain. Jos ei tarvi parempaa niin hyvin voi jatkua nykymeno, ennenpitkää myös kuluttajakoneissa eikä tarvi pilveä. Se missä toki hinta kasvaa on isot projektit missä parhaankin nykyisentasoisen ai-avustimen rajat tulevat vastaan, parempaa kaipaisi. Tokenien hinnan putoaminen laadun pysyessä samana tarkoittaa mun mielestä myös sitä, että lokaalit avustimet mitä voi ajaa kuluttajaraudassa jatkavat parantumista vuosi vuodelta.
Ite koitin 5.4 ja keskitasoa ja hitaampaa. Riittää omiin hommiin ja ei mene käyttörajat heti nollille. Miettikääpä jos ois rajattomasti tokeneita. Varmaan netti palas. Ja kaikki muutkin paikat.
Heitän tähän villin veikkauksen, että open source hyötyy valtavasti koodiavustimista. Kaikenlaiset kokonaiset softat ja palikat löytyvät yhä isommissa määrin open sourcesta. Raha otettava muusta kuin "salainen lähdekoodi" kun koodia voi generoida vuosi vuodelta helpommin. Open source puoleltahan tähän löytyy esimerkkiä miten voidaan tehdä bisnestä vaikka koodi on avointa.
 

Uusimmat viestit

Statistiikka

Viestiketjuista
307 344
Viestejä
5 208 022
Jäsenet
83 050
Uusin jäsen
RMi

Hinta.fi

Back
Ylös Bottom