AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

finWeazel · torstaina klo 19:59

Saapa nähdä tuleeko oikeasti sonnet4.8. 4.7:en vois väittää olevan huonompi kuin 4.6 ja 4.6 nyt huonompi kuin 4.6 julkaisussa. Numerot kertoo yhtä tarinaa, todellinen käyttö toista. Paras minkä anthropic vois tehdä olis saada 4.6 "peak" tasoinen malli ulos mitä voidaan ajaa niin halvalla ettei tarvi käynnistellä idioottimoodia. Sitten kun konesalikapasiteetti riittää laittaa isompia malleja tarjolle. Toki niitä isompia olisi tässä skenaariossa pakko kehittää koko ajan vaikka ei niitä toisi kuluttajille tarjolle. vrt. mythos nyt vain rikkaiden hupia.

Toki voi tulla 4.8 tai vaikka 5.0 mutta hinta pompsahtaa niin paljon että hinta&kysyntä kohtaa ja taviksille jää tarjolle retard moodissa oleva 4.7.

Makis · eilen klo 08:48

Tässä videossa hyvää perustelua miksi hinnat tulevat nousemaan rajusti jatkossa:

En osaa oikein TL;DR:ää tuosta tehdä, mutta jos joku ei ole vielä merkkejä nähnyt ilmassa niin tuosta löytyy. Ihan lopussa vielä Clauden asiakkaille tärkein pointti, eli kunhan IPO tapahtuu, niin mallien hinnoittelu tulee perustumaan neljännesvuosittaisiin tuottoihin.

mlackke · eilen klo 09:36

Uskon että parempi malli sieltä tulee, mutta kuinka pitkään se on hyvä ja mihin hintaan täysin eri juttu.

mythos nyt vain rikkaiden hupia.

Tällä menolla pian on myös Opus ja kaikki tulevat frontier mallit. Köyhillä (200€/kk) tilaajat saavat tyytyä 1h käyttöaikaan tai Previous Gen non-reasoning malleihin.

Toivottavasti ei tule käymään näin, mutta kysyntä/tarjonnan laki.

finWeazel · eilen klo 13:09

mlackke sanoi:
Uskon että parempi malli sieltä tulee, mutta kuinka pitkään se on hyvä ja mihin hintaan täysin eri juttu.

Tässä on iso kysymys se, että oikeasti parempi malli vaiko vain paperilla parempi malli. Edelleen taitaa olla niin, että käytännössä tän hetken 4.7 ja 4.6 huonommat kuin mitä 4.6 oli julkaisussa. Malleja tyhmennetty kun ei ole konesalikapasiteettia. Ei ole hyötyä näyttää bigger bar better graafeja+julkaisua jos mallia ajetaan idioottimoodissa. Ei sekään ole hyvä jos x% ajasta saa priiman missä x ei ole 100%. Järki lähti siinä kohtaa kun claude meni vamma-moodiin viikoiksi. OpenAI 5.5 onneksi toimii paremmin mennen kilpikonnamoodiin paljon harvemmin kuin claude.

Eiköhän seuraava anthropic ole edelleen mythos:sta distilloitu ja paremmin viilattu pienempi malli. Toivottavasti tällä kertaa semmoinen mitä voivat ajaa priima asetuksilla retard moodin sijaan.

user_timo · eilen klo 14:17

Nyt taas mennään?
Tämä Opencode kehittäjältä.

Linkki: https://x.com/thdxr/status/2055071042536632622?s=20

finWeazel · eilen klo 14:21

user_timo sanoi:
Nyt taas mennään?
Tämä Opencode kehittäjältä.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://x.com/thdxr/status/2055071042536632622?s=20

Ainakin mulle osui noita vammasessioita myös openai:n codex+5.5 xhigh:lla. Harvemmin tosin kuin clauden kanssa. Näkee jo suunnitelmaa tehdessä millainen vointi mallilla on ja tietää kannattaako jatkaa vai ei.

finWeazel · eilen klo 20:27

OpenAI näyttää ainakin kommentoivan palvelun huonontumista. Saapa nähdä mitä seuraa

Redditissä porukka vielä lämpimänä anthropicin suuntaan

edup · tänään klo 01:09

Onhan tää nyt vaan tragikoomista miten tää jatkuvasti tulee "yllätyksenä" että suljetut mallit on suljettuja ja niiden toiminta on just tasan mallin kehittäjän tahtotilan ja konesalikapasiteetin armoilla. Vaihdatte niihin isoihin avoimiin pilvimalleihin, niin voitte suoraan vaihtaa palveluntarjoajaa jos näkyy mitään merkkejä lobotomiasta (ei muuten näy, koska ne kaikki tietää sen ettei sellainen pelleily vetele).

finWeazel · tänään klo 01:14

edup sanoi:
Onhan tää nyt vaan tragikoomista miten tää jatkuvasti tulee "yllätyksenä" että suljetut mallit on suljettuja ja niiden toiminta on just tasan mallin kehittäjän tahtotilan ja konesalikapasiteetin armoilla. Vaihdatte niihin isoihin avoimiin pilvimalleihin, niin voitte suoraan vaihtaa palveluntarjoajaa jos näkyy mitään merkkejä lobotomiasta (ei muuten näy, koska ne kaikki tietää sen ettei sellainen pelleily vetele).

Ei se nyt oikein ole vaihtoehto kun lokaalit ei toimi senkään vertaa kuin claude/codex dumb-moodissa. Ei mene lokaalit mitä saa esim. 5090:een tai m4 max pro 128GB:een ajoon rajan yli mikä mun projekteissa olisi käyttökelpoinen. Qwen3.6:27b 5090:lla opencoden kautta käytettynä tyhmempi kuin saapas ja niin hidas että ennemmin olen edistämättä kotiprojekteja kuin tuota käyttäisin.

edup · tänään klo 01:16

finWeazel sanoi:
Ei se nyt oikein ole vaihtoehto kun lokaalit ei toimi senkään vertaa kuin claude/codex dumb-moodissa. Ei mene lokaalit mitä saa esim. 5090:een tai m4 max pro 128GB:een ajoon rajan yli mikä mun projekteissa olisi käyttökelpoinen. Qwen3.6:27b 5090:lla tyhmempi kuin saapas ja niin hidas että ennemmin olen edistämättä kotiprojekteja kuin tuota käyttäisin.

Mä en puhunut lokaaleista malleista, vaan avoimista isoista pilvimalleista.

finWeazel · tänään klo 01:22

edup sanoi:
Mä en puhunut lokaaleista malleista, vaan avoimista isoista pilvimalleista.

Ennemmin tuossa tapauksessa tällä erää maksaisin kuitenkin openai:sta. Se on pääasiassa toiminut ja pykäliä edellä vaikka deep seek v4:sta. Sen tosin ymmärtää, että pykii hetkittäin kun käyttäjämäärät on räjähtäneet hetkessä. Jos porukka siirtyy johonkin avoimeen malliin samalla rytinällä niin konesaleista loppuu kapasiteetti vielä nopeammin kun ei ole openai:n paksua lompakkoa ja sopimuksia konesaleista+uusien rakentamisrsta. Tollanen kuvan kevee 30x nousu codexin latausmäärissä kun 5.5 julkaistiin. Anthropic:lla 80x kasvu eka kvartaalilla: Anthropic CEO says 80-fold growth in first quarter explains 'difficulties with compute'

El Toro · tänään klo 02:33

Aivan kuin rajat olisi laskeneet, ajattelin vähän puuhastella ennen unia, pistin jopa heikomman mallin päälle ja noin vartissa meni koko 5 tuntia. Tulee ikävä niitä aikoja, kun halvimmalla tilauksella sai tykittää lähes aamusta iltaan.

Loppuun vielä heitin perinteisen ison työn, kun käyttörajaa oli muutama prosentti jäljellä, pääsin ilmeisesti tutustumaan peloteltuun idioottimoodiin, kun 5.5 xhigh toteutti tavoitteesta muutaman asian heikosti ja silti merkkasi kaiken toteutetuksi.

user_timo · tänään klo 09:47

finWeazel sanoi:
OpenAI näyttää ainakin kommentoivan palvelun huonontumista. Saapa nähdä mitä seuraa

Redditissä porukka vielä lämpimänä anthropicin suuntaan

Sam meinaa, että ihmiset vaan tottunu liian hyvään

Linkki: https://x.com/sama/status/2055356452286640630?s=20

Karhu III · tänään klo 11:02

Väittävät että reset olisi tulossa. Kauhea FOMO jos ei nyt ehdi polttamaan jäljellä olevaa tokenipinkkaa pois alta

Karhu III · tänään klo 11:21

Makis sanoi:
Tässä videossa hyvää perustelua miksi hinnat tulevat nousemaan rajusti jatkossa:

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

En osaa oikein TL;DR:ää tuosta tehdä, mutta jos joku ei ole vielä merkkejä nähnyt ilmassa niin tuosta löytyy. Ihan lopussa vielä Clauden asiakkaille tärkein pointti, eli kunhan IPO tapahtuu, niin mallien hinnoittelu tulee perustumaan neljännesvuosittaisiin tuottoihin.

Ei kyllä jaksa katsoa 10 minuutin lätinöitä. Ei sulla olisi mitään AI:n tekemää yhteenvetoa?

Mutta joo, mulla on nyt Codex Pro joka on 100 €/kk. Vaikka se maksaisi 1000 €/kk, niin minusta se olisi kannattava sijoitus. 10000 €/kk, niin pitää ehkä miettiä kenelle tiimissä annetaan lopputili.

Tähän on valitettavasti tultu.

finWeazel · tänään klo 12:10

user_timo sanoi:
Sam meinaa, että ihmiset vaan tottunu liian hyvään

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://x.com/sama/status/2055356452286640630?s=20

Luenkohan mä jotenkin tyhmästi kun eka ajatus mikä mieleen tuli tuosta altmanin postauksesta

"jengi tottunut hyvään" - [Malli halvennettu] - lol naurattaa aina kun porukka haluaa sen hyvän takaisin mihin on totuttu. Nyt kun "korjattu" niin liekö siellä yritetty halventaa, todettu että meni överiksi ja peruttu jotain muutoksia.

Ettei menis pelkäksi narinaksi niin codex app:in peukku alas/ylös systeemi on ollut tovin aikaa tosi hyvä. Helppo antaa palaute ja luulis syntyvän nopea signaali jos jossain on mätää ja palaute osuu oikeisiin sektoreihin.

user_timo · tänään klo 12:43

macOS:ssa saa tuon Codexin paritettua puhelimen ChatGPT:hen. Testasin tuota eilen ja hyvin näytti toimivan, kotona oli Mac Mini hereillä ja se siellä hommia sit painoi.

finWeazel · tänään klo 13:05

Tokenien hinta on vähän sama kuin pohtisi pätevien työntekijöiden hintaa. Kyllä kooderien pitäisi saada vain 2500e/kk, hulluutta maksaa enemmän, pöh. Noh, joku noinkin ajattelee ja siellä firmassa ei varmasti ole parhaat menot, tekijät tai menestykset. Voittoon on hankala säästää itseänsä.

Kannattaisi miettiä, että jos/kun saadaan enemmän aikaiseksi niin voisiko yritykselle generoida voitollista kasvua nopeammalla tuotesyklillä, uusilla tuotteilla/palveluilla jne. Nopeet syö hitaat.

user_timo · tänään klo 18:27

Mulla käytännössä koko päivän pyöriny Codexissa ja Hermeseissä Codex(100€)tilauksen agentit Kanban joukkioina puuhastelemassa.
On,
1. rakennettu Codex:ssa Java Gradle projekti
2. Päivittänyt oman golang projektin
3. Ajanut Hermesissä Kanban hommalla kahta erillistä egenttijoukkoa, jotka parannelleen palvelimella olevien pelien scriptejä.

Kaikki olleet high/xhigh ajoja 5.5:lla.
Codexin viikko- tai tuntirajat eivät missään vaiheessa ollut mitään muuta kuin 100%.
En pian kahteen viikkoon ole nähnyt kuin 100% lukemia.

Alan olemaan sitä mieltä, että mulla on joku todella posiviinen bugi mun tilillä.

Edit: otan nyt oikein asiakseni availla isoja projekteja ja pyydän niistä xhigh:lla reviewejä, että muuttuuko nuo mihkään
Edit2: tuo 5h aikaikkuna on minulla koko ajan liukuva, eli missään vaiheessa se ei ilmeisesti ala.
Edit3: täytin reilu 2vk sitten OpenAi:lle OpenSource tukihakemuksen, mutta siitä ei mitään ole kuulunut ja minun ymmärtääkseni se olisi hyvitystä API tilille, missä sitten voisi sitä tuhlata, joten ei pitäisi tähän tilaukseen vaikuttaa.

finWeazel · tänään klo 18:31

user_timo sanoi:
Alan olemaan sitä mieltä, että mulla on joku todella posiviinen bugi mun tilillä.

Niin kauan hauskaa, että bugi olikin laskutuspuolella ja tulee joku biljoona tokenia lasku perästä. Siinä sitten tappelemaan, että en ole API hinnalla mitään suostunut ostamaan enkä maksa laskua.

user_timo · tänään klo 18:34

finWeazel sanoi:
Niin kauan hauskaa, että bugi olikin laskutuspuolella ja tulee joku biljoona tokenia lasku perästä. Siinä sitten tappelemaan, että en ole API hinnalla mitään suostunut ostamaan enkä maksa laskua.

Totta. Mutta API-tokeneita en ole tässä käyttänyt lainkaan, kaikki tuon 100€ tilauksen juttuja. Ei ole edes generoituna OpenAi API avainta.
Edit: minulla ollut myös useita päiviä ettei käyttöä ole ollut lainkaan tai se on ollut todella vähäistä, voiko olla että tuollaisista nykyään lasketaan jotain puskuria että saa sitten vastineeksi vähän enemmän?

Edit2: eipä nuo tuosta liiku. Empä kiusaa enemmäpää tuota..

Makis · 45 minuuttia sitten

finWeazel sanoi:
Tokenien hinta on vähän sama kuin pohtisi pätevien työntekijöiden hintaa. Kyllä kooderien pitäisi saada vain 2500e/kk, hulluutta maksaa enemmän, pöh. Noh, joku noinkin ajattelee ja siellä firmassa ei varmasti ole parhaat menot, tekijät tai menestykset. Voittoon on hankala säästää itseänsä.

Vähän yksipuolinen näkemys. Mitenkäs harrastelijat? Harvalla on vara laittaa tekoälyavustimeen tonneja kuussa.

namlepo · 39 minuuttia sitten

Ite koitin 5.4 ja keskitasoa ja hitaampaa. Riittää omiin hommiin ja ei mene käyttörajat heti nollille. Miettikääpä jos ois rajattomasti tokeneita. Varmaan netti palas. Ja kaikki muutkin paikat.

kahlekuningas · 31 minuuttia sitten

Makis sanoi:
Vähän yksipuolinen näkemys. Mitenkäs harrastelijat? Harvalla on vara laittaa tekoälyavustimeen tonneja kuussa.

Mun näkemys on että harrastelijoilla on tosi hyvä tilanne tällä hetkellä, kun yritysasiakkaat maksaa lystin API-hinnoilla. Itsellä menee helposti 100-200 dollaria työpäivän aikana, enkä ole meidän firmassa edes kovimpia käyttäjiä. Eli sanoisin että nyt kannattaa halvalla kuukausimaksulla harrastella niin paljon kuin mahdollista, en usko että näin halvat hinnat voi jatkua loputtomiin.

finWeazel · 26 minuuttia sitten

kahlekuningas sanoi:
Mun näkemys on että harrastelijoilla on tosi hyvä tilanne tällä hetkellä, kun yritysasiakkaat maksaa lystin API-hinnoilla. Itsellä menee helposti 100-200 dollaria työpäivän aikana, enkä ole meidän firmassa edes kovimpia käyttäjiä. Eli sanoisin että nyt kannattaa halvalla kuukausimaksulla harrastella niin paljon kuin mahdollista, en usko että näin halvat hinnat voi jatkua loputtomiin.

Jos pidetään laatu samana tokenien hinta putoaa 1/10 osaan vuosittain. Jos ei tarvi parempaa niin hyvin voi jatkua nykymeno, ennenpitkää myös kuluttajakoneissa eikä tarvi pilveä. Se missä toki hinta kasvaa on isot projektit missä parhaankin nykyisentasoisen ai-avustimen rajat tulevat vastaan, parempaa kaipaisi. Tokenien hinnan putoaminen laadun pysyessä samana tarkoittaa mun mielestä myös sitä, että lokaalit avustimet mitä voi ajaa kuluttajaraudassa jatkavat parantumista vuosi vuodelta.

namlepo sanoi:
Ite koitin 5.4 ja keskitasoa ja hitaampaa. Riittää omiin hommiin ja ei mene käyttörajat heti nollille. Miettikääpä jos ois rajattomasti tokeneita. Varmaan netti palas. Ja kaikki muutkin paikat.

Heitän tähän villin veikkauksen, että open source hyötyy valtavasti koodiavustimista. Kaikenlaiset kokonaiset softat ja palikat löytyvät yhä isommissa määrin open sourcesta. Raha otettava muusta kuin "salainen lähdekoodi" kun koodia voi generoida vuosi vuodelta helpommin. Open source puoleltahan tähän löytyy esimerkkiä miten voidaan tehdä bisnestä vaikka koodi on avointa.

AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

finWeazel

Makis

mlackke

finWeazel

user_timo

finWeazel

finWeazel

edup

finWeazel

edup

finWeazel

El Toro

user_timo

Karhu III

Karhu III

finWeazel

user_timo

finWeazel

user_timo

finWeazel

user_timo

Makis

namlepo

kahlekuningas

finWeazel

Uutiset

Uutisia lyhyesti

Uusimmat viestit

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi