AI-koodausavustimet, keskustelua AI-avustetusta koodaamisesta/skriptaamisesta/dokumentoinnista/...

Toi Codex on kyllä paras hinta/laatusuhteeltaan imo. Claude on hyvä mutta ajaa itsensä vielä nopeammin limittiin. Gemini taas on näihin kahteen verrattuna liian tyhmä, runoilee liikaa omiaan. Itse olen aika hyvin pärjännyt codexin 5.5 medium mallilla peruskoodailussa, sitten jos pitää ratkaista joku oikeasti vaikea niin sitten xhigh. Ei siis tule limitti ihan niin nopeasti vastaan jos malttaa ajella mediumilla.
 
Mun mielestä 20-25 €/kk on paras vaihtoehto harrastuskäyttöön. 100 €/kk tai enemmän alkaa olla jo vähän kallis. Tosin saa sitten paljon enemmän aikaan.

Kannattaa myös huimioida jos koodausavustimen käyttö liittyy työhön niin sen voi laittaa verovähennyksiin.
 
Minun mielestä sitä käyttöä sai enempi ku vaihto 5.4seen sen mallin. Kun vertas 5.5. Ja chat gtpllä sitten teettää ne promptit sille codexille. Codex yksinään ei kyllä oikein hanskaa aina.
 
Google IO menossa. gemini 3.5 flash:ia pukkaa. Hyvältä näyttää kuvissa, mutta niinhän ne kaikki. Antigravity 2.0:aa esittelevät nyt striimissä.
1779211663947.png

1779211694245.png


Googlen konesaleissakin kuorma kasvaa, samasta esityksestä
1779211571938.png


edit. Alkaa houkutteleen testata toi googlen antigravity2.0 ja flash3.5. Hyvältä näyttää googlen presiksessä. Toisaalta oli tarkoitus pitää se kesäloma koodaushommista ja tehdä muuta kuin kököttää koneella.

edit. 3.5 pro ensi kuussa

uuh... google kerkes ensimmäisenä vm-kisaan?
1779212285777.png
 
Viimeksi muokattu:
Paras asia antigravityssä oli että se antoi käyttää Opusta "ilmaiseksi" silloin kun sitä testailin viimeksi tosin laittoivat aika tiukat rajat sille kun olin muutaman viikon käyttänyt niin poistin sen.
 
Mun mielestä 20-25 €/kk on paras vaihtoehto harrastuskäyttöön. 100 €/kk tai enemmän alkaa olla jo vähän kallis. Tosin saa sitten paljon enemmän aikaan.

Kannattaa myös huimioida jos koodausavustimen käyttö liittyy työhön niin sen voi laittaa verovähennyksiin.
Minusta menee jo aika vakavaksi harrastamiseksi jos tarttee tuollaista 100-200€ mallia. Joo, sillä parinkympin Claudella joutuu välillä odottelemaan, mutta voi vaikka käydä vaimoa silittelemässä tai tehdä jotain muuta siinä välissä.
 
Miten toi codexin viikkoraja menee? Sunnuntaina nollautuu? Jos näin, niin sain plus tilauksen viikkorajan käytettyä ilmeisesti 2 päivän aikana ja siitäkin iso osa 5h cooldownia? Siis mitä tolla sitten pitäisi voida tehdä oikeasti? Fart-äänimulaattori kasuaalisti kerran vuodessa? Joo rahalla tietty saa, mutta tänäänkin 2 samanlaista virhettä mikä kaataa koko projektin. Kun projekti kasvaa vähänkin, niin ei toi plus tilauksen codex ihan liian hyvin suoriudu ja samoja asioita saa pyydellä moneen kertaan ja pyytää korjauksia uudestaan asioihin mitkä oli jo kunnossa. Ihan hauska kokemus silti, mutta vähän mietityttää saako tosta sitten kuinka paljon irti kun koodipohja alkaa olla enemmän kuin 10 tiedostoa. Ehkä enemmän maksamalla codexin "muisti" on parempi?
 
Minusta menee jo aika vakavaksi harrastamiseksi jos tarttee tuollaista 100-200€ mallia. Joo, sillä parinkympin Claudella joutuu välillä odottelemaan, mutta voi vaikka käydä vaimoa silittelemässä tai tehdä jotain muuta siinä välissä.
En osaisi mihinkään vähempään tyytyä. Kun on kerran ajanut formuloita, niin karting tuntuu tylsältä.
 
Miten toi codexin viikkoraja menee? Sunnuntaina nollautuu? Jos näin, niin sain plus tilauksen viikkorajan käytettyä ilmeisesti 2 päivän aikana ja siitäkin iso osa 5h cooldownia? Siis mitä tolla sitten pitäisi voida tehdä oikeasti? Fart-äänimulaattori kasuaalisti kerran vuodessa? Joo rahalla tietty saa, mutta tänäänkin 2 samanlaista virhettä mikä kaataa koko projektin. Kun projekti kasvaa vähänkin, niin ei toi plus tilauksen codex ihan liian hyvin suoriudu ja samoja asioita saa pyydellä moneen kertaan ja pyytää korjauksia uudestaan asioihin mitkä oli jo kunnossa. Ihan hauska kokemus silti, mutta vähän mietityttää saako tosta sitten kuinka paljon irti kun koodipohja alkaa olla enemmän kuin 10 tiedostoa. Ehkä enemmän maksamalla codexin "muisti" on parempi?

Viikkorajan resetoitumisen näkee /status -näytössä ja muistaakseni webissä myös /codex/settings/usage URL:issa.

Kannattaa kiinnittää huomiota kontekstin kokoon, jotta ei tule tuhlattua limittejä niin nopeasti. Eli uudet jutut aloitetaan tyhjällä kontekstilla, paitsi jos homma on selvästi jatkoa edelliseen (silloinkin /compact voi kannattaa tilanteesta riippuen, jossain tilanteessa /fork voi myös olla hyödyllinen jos haluaa tehdä useampaa haaraa samasta lähtötilanteesta). Koodi kannattaa palastella järkevän kokoisiksi moduleiksi, joita voi käsitellä toisistaan riippumatta (ihan samalla tavoin kuin ihmisen kirjoittaessa softaa). Ei mitään massiivista AGENTS.md:tä tai muita kiinteitä kontekstinsyöjiä. Sopivilla skilleillä voi vähentää tarvetta keksiä pyörä aina uudestaan. Helpot asiat kannattaa hoitaa halvemmalla mallilla. Asetuksia on turha pitää tapissa jos vähemmälläkin tulee toimivaa. Mahdollisimman spesifinen suunnitelma tai prompti tuo halutun tuotoksen tehokkaammin kuin "pohdintaa" vaativa. Sen sellaista perusjuttua tulee ainakin mieleen. pätevät yhtä lailla Claude Codeen kuin Codexiin. Näihin oppii kun muutaman viikon hinkkaa. :)
 
Viimeksi muokattu:
200e/kk harrastukseen on aika vähän rahaa. Moni laittaa tuota enempi baariin tai polttaa uisteluvene/mootorikelkassa bensassa taivaantuuliin tai mitä nyt milloinkin. Mulla menee tuota enempi parhaimpaan karppiaikaan karpinsyötteihin kuukaudessa. Toki vois vähemmänkin, mutta kun harrastetaan niin mennään syvänpään kautta.

Googlen 3.5 flash vaikuttaa tosi mielenkiintoiselta kun pienempi malli joka nimenomaan optimoitu nopeaksi ja halvaksi. Paperilla melkoisen hyvä. Ensi kuussa isompi 3.5 pro.
 
Miten toi codexin viikkoraja menee? Sunnuntaina nollautuu? Jos näin, niin sain plus tilauksen viikkorajan käytettyä ilmeisesti 2 päivän aikana ja siitäkin iso osa 5h cooldownia?
Nollautuu viikon välein. Laskuri alkaa siitä hetkestä kun ottaa tilauksen.

Poikkeuksena jos OpenAI tekee ylimääräisen resetin. Esimerkiksi viimeksi tänään OpenAI resetoi limiitit ja nyt kaikilla OpenAI käyttäjillä uusi resetointopäivä on tiistai.
 
Jotain horinoita luin, että plussalaiset saaneet myöhemmin joskus aikaisemmin, pitää toivoa, että tulee vielä.
Oma plus nyt nollautunut.

E: Pistin 7 agenttia tykittämään, olisin laittanut enemmänkin, mutta kerkesivät imaista koko 5 tunnin käytön. Yhden laitoin huvikseen tekemään renderöijän, tavoitteena Interstellarin musta aukko, mutta kevyempänä ja reaaliaikaisena. Se projekti valmistui ensimmäisenä ja siitä tuli todellakin melkoinen musta aukko, aika hieno kuva tuli näytölle ja kerneli panikoi välittömästi, aukko siis imaisi 6 agenttiani mukanaan, joiden olisi pitänyt vääntää vielä pitkään koodia..
 
Viimeksi muokattu:
Google paskoi antigravitynsä totaalisesti. Tuli päivitys mikä poisti koko hemmetin IDEn mitä oli tuunannut pari kuukautta kuntoon. Joo lataa erikseen IDE mikä ei ollut IDE lainkaan. Redditissä kevyttä avautumista poppakonstien kera millä voi yrittää vanhaa takaisin.

EDIT: Eli, jos poistaa kokonaan AG2.0:n ja AG IDE:n (jos sellaisen meni asentamaan kun huomasi että AG2.0 ei ollutkaan se mitä oli tottunut käyttämään) ja asentaa pelkän AG IDEn uusiksi, käynnistyy IDE oikein vscode-editorilla kuten ennenkin. Sitten vaan extensionit kuntoon ja kaikki MCP-tuunaukset paikalleen ja workfowt kohdalleen. Taas mennään. Marketplace piti vaihtaa vscoden originaaliin, kun avoin versio puski erroria toisensa jälkeen syystä tai toisesta. Kaiken kaikkiaan semmoinen episodi, että kovin pahasti on polteltu Googlella sieniä tämmöisen jäniksen hatusta vetämiseksi. Hieman meni luotto koko konseptiin kerralla roskiin.
 
Viimeksi muokattu:
Google paskoi antigravitynsä totaalisesti. Tuli päivitys mikä poisti koko hemmetin IDEn mitä oli tuunannut pari kuukautta kuntoon. Joo lataa erikseen IDE mikä ei ollut IDE lainkaan. Redditissä kevyttä avautumista poppakonstien kera millä voi yrittää vanhaa takaisin.

EDIT: Eli, jos poistaa kokonaan AG2.0:n ja AG IDE:n (jos sellaisen meni asentamaan kun huomasi että AG2.0 ei ollutkaan se mitä oli tottunut käyttämään) ja asentaa pelkän AG IDEn uusiksi, käynnistyy IDE oikein vscode-editorilla kuten ennenkin. Sitten vaan extensionit kuntoon ja kaikki MCP-tuunaukset paikalleen ja workfowt kohdalleen. Taas mennään. Marketplace piti vaihtaa vscoden originaaliin, kun avoin versio puski erroria toisensa jälkeen syystä tai toisesta. Kaiken kaikkiaan semmoinen episodi, että kovin pahasti on polteltu Googlella sieniä tämmöisen jäniksen hatusta vetämiseksi. Hieman meni luotto koko konseptiin kerralla roskiin.
Google IO:ssa sanoivat, että antigravity2.0 tehty agentit edellä. Ajatuksena se, että ihmiset ei juurikaan enää koodia kirjoita vaan AI kirjoittaa ja ihminen katselmoi. Tähän se menee, manuaalinen koodaus on suurilta osin ohi. Manuaalinen naputtelu jäänyt/jää vähän samanlaiseksi kuin jos menis hevosella eikä autolla. Onhan se kiva harrastus, mutta harvoin järkevää, paitsi jos pitää päästä sinne missä ei vielä ole tietä.

--

asensin antigravity2:en. Näyttää ihan codex app:lta. Tuntuu tosi tutulta. Niin halpa tuo ai pro tilauskin, että vois huvin vuoksi laittaa vaikkei tarkoitus ole mitään puuhata ennen ensi talvea.
1779271689019.png


edit. 10min antigravityä ja ilmaisversion viikkotokenit käytetty. Jos nyt oikeen laskin niin ai pro 5TB ois 16x tokenit versus ilmainen. 3h/viikko agentti jauhais tuolla jos syö tokeneita samalla vauhdilla kuin tän aamun testissä. Ei tolla taida kuuhun mennä. Yritin ajaa vaan ihan perus koodikatselmointia yhteen projektiin, että näkisi mitä tuo saa irti koodista versus claudecode ja codex
 
Viimeksi muokattu:
Okei, millä planeetalla nyt ollaan jos sillä IDE:llä ei tee mitään? Ihan yhtä lailla siinä toimii agenteilla rakentaminen ja pääsee käsiksi kaikkeen mihin tarvitseekin päästä että saa asiat tehdyksi. Nyt ollaan ihan täysin todellisuudesta irti eikä kaikki ole vaan harrastamista huvikseen. Sen takia siellä on erikseen ladattavissa se AG2.0 IDE mikä siis toimii kun sen asentaa uudestaan poistamalla ensin lelut laatikosta. Googlella nyt meni vaan aivan täysin puihin riliisi kun hupsista kirjoitettiin käyttäjän IDE tolla uudella konsolilla sen oikean IDE:n sijaan. Vahinko tai ei.

AI Pro 5TB tilauksella naputeltu menemään 3.5 Flashilla. Hyvin sujuu kun korjasi ton junakolarin ja tokenit pysyy kurissa medium-asetuksella.
 
Okei, millä planeetalla nyt ollaan jos sillä IDE:llä ei tee mitään?
Sillä planeetalla missä viime joulukuusta lähtien esim. piilaaksossa iso määrä porukkaa jotka ei enää kirjoita riviäkään koodia. AI koodaa, ihminen katselmoi. Parhaiden mallien kyvykkyys agenttiseen ja autonomiseen koodinkirjoitukseen on kova. Jotain nichejä löytyy vielä missä tarvii ihmisen räpsytellä, mutta ei enää pitkään.

Kyllä googlekin tuon tietää miten heidän kooderit nykyään koodinsa ja projektit tekevät.

Tämä ei tarkoita "implement X", tuotantoon. Vaan, että sinne ympärille rakennetaan ja speksataan testit, automaatiot yms. niin että voidaan luottaa koodin toimivan. Kone on tunnoton kirjotteleen ja ajamaan testejä kunhan ihminen katsoo että rajapinnat ovat hyvät ja määrittelee asiat hyvin.
 
Sillä planeetalla missä viime joulukuusta lähtien esim. piilaaksossa iso määrä porukkaa jotka ei enää kirjoita riviäkään koodia. AI koodaa, ihminen katselmoi. Parhaiden mallien kyvykkyys agenttiseen ja autonomiseen koodinkirjoitukseen on kova. Jotain nichejä löytyy vielä missä tarvii ihmisen räpsytellä, mutta ei enää pitkään.

Kyllä googlekin tuon tietää miten heidän kooderit nykyään koodinsa ja projektit tekevät.

Tämä ei tarkoita "implement X", tuotantoon. Vaan, että sinne ympärille rakennetaan ja speksataan testit, automaatiot yms. niin että voidaan luottaa koodin toimivan. Kone on tunnoton kirjotteleen ja ajamaan testejä kunhan ihminen katsoo että rajapinnat ovat hyvät ja määrittelee asiat hyvin.

Missä se ihminen katselmoi jos ei IDE:ssä? Tai onko ajatuksena että se AI esitelmöi jollain piirrustuksilla?

Mites sitten tehdään kiireelliset korjaukset tms kun AI ei ole saatavilla / ei toimi?
 
Onkin tuollainen Antigravity mennyt ihan ohi, Google AI pro tilaus on (perhemallina), niin pistämpä kokeiluun tuonkin. Alkaa noita agenttisoftia olemaan koneella aika monta...
 
Missä se ihminen katselmoi jos ei IDE:ssä? Tai onko ajatuksena että se AI esitelmöi jollain piirrustuksilla?

Mites sitten tehdään kiireelliset korjaukset tms kun AI ei ole saatavilla / ei toimi?
Github/gitlab/gerrit/..., beyondcompare? Ei IDE ole ainoa vaihtoehto. Työkaluissa näkee paremmin diffit + muiden katselmoijien mukaanlukien ai-katselmoijien kommentit, ci-putken tulokset mukaanlukien lintterit, testit jne. Ja toki ne omat kommentit lisätään sen saman github tms. työkalun ei vscode-fork-IDEn kautta.

edit. AI-agentti on tietenkin mcp-serverin kautta kiinni github/... + jira/linear/... Katsoo tiketit ja ihmisten kommentit työkalusta ja toimii autonomisesti. Assign to ai-artturi tiketille ja vroom vroom.
 
Viimeksi muokattu:
Gerrit on noista kolmesta omannut parhaan katselmointityökalun, nuo kaksi Git-alkuista taas on tuskallisia käyttää. Minulla ainakin leviäisi pää ja hihat palaisi jos noita pitäisi koko ajan käyttää. Beyond Compare on maksullinen tuote, jota olen kyllä aktiivisesti käyttänyt jo 25 vuotta joten tykkään, mutta on sanottava että VS Coden komparaattori on nykyään varsin hyvä.
 
Gerrit on noista kolmesta omannut parhaan katselmointityökalun, nuo kaksi Git-alkuista taas on tuskallisia käyttää. Minulla ainakin leviäisi pää ja hihat palaisi jos noita pitäisi koko ajan käyttää. Beyond Compare on maksullinen tuote, jota olen kyllä aktiivisesti käyttänyt jo 25 vuotta joten tykkään, mutta on sanottava että VS Coden komparaattori on nykyään varsin hyvä.
Vähän vaikea vscodesta antaa kommentteja ja nähdä mitä muut on kommentoineet :) Joka tapauksessa joutuu jonnekin toiseen työkaluun menemään.

--

Siitä mikä on paras tapa AI:n aikana katselmoida koodia on ollut aika paljon juttua. Uskon, että kun pääpaino siirtyy naputtelusta speksailuun ja katselmointiin niin työkalut kehittyvät noiden osalta nopeasti. Kun seniori käyttää ison osan ajasta speksatessa ja katselmoidessa eikä naputellessa niin iso motivaatio tehdä paremmat työkalut. Jos pitäisi jiraan vielä koskea niin vetäisin ranteet auki.

Toki aina joku VIM ja Emacs jengi jää poteroihin huuteleen, mutta ne on vähemmistössä.

AI integroituu työkaluihin ja hakee sieltä taskit sen sijaan, että pelkästään promptissa käskytettäisiin. assign to ai, PR:ssa monelta ihmiseltä kommentteja jotka AI huomioi sen sijaan että vain jaska promptaa.
 
No minä käytän Claudea VS Coden kautta. Olen funtsinut kyllä jos kokeilisin Neovimin kautta mutta en ole vielä saanut aikaiseksi. Sillä muuten on aivan ylivoimaisesti kätevintä hyppiä koodissa (Telescope ftw). Mikään mitä olen n. 40 vuoden aikana käyttänyt ei pääse lähellekään samaa tehokkuutta.

Ja tuotahan se kunnollinen katselmointi vaatii. Et sinä voi katsella vain just sitä muuttunutta koodia, vaan pitää tsekkailla miten ne funktiot toimii mitä se kutsuu, miten ne vaikuttaa arkkitehtuuriin, onko tuplakoodia ym.
 
Viimeksi muokattu:
Siis AG IDEllä voi koodata ihan kaiken agenttien toimesta alusta asti ja kätevästi samalla katsoa mitä on tehty hyppimättä toiseen appiin katsomaan mitä on tehty mutta paremmalla ja kattavammalla UI:lla mikä toi uusi AG2.0 on. Ja Googlekin ajattelee kyllä just näin, ei ne muutenkin olisi julkaissut sitä AG2.0 IDE pakettia. Se kämmi oli se että käyttäjän AG 1.x (mikä siis on IDE) pävitettiin AG2.0 appiin mikä ei ollut IDE-versio lainkaan ja sitten mentiin pöpelikköön. Ja toinen kämmi se, et jos menee asentamaan perään AG2.0 IDEn, niin se ei koskaan edes käynnisty vaan kaikki pitää poistaa ja asentaa 2.0 IDE uudestaan.

Tuskiin kukaan tykkäisi jos veisi auton huoltoon ja hakiessa sitä tilalle annetaan toisen merkin hinnat alkaen -malli kysymättä mitään.
 
Et ole aallonharjalla missä ai ottaa taskit työkalusta ja koodaa itsenäisesti. Vertaa vaikka: otsikoitu harhaanjohtavasti, 3 hengen tiimi sisältäen kaikki tokenit mukaanlukien ci putken sisällä olevat ai katselmoinnit OpenClaw creator burned through $1.3 million in OpenAI API tokens in a single month — bill covered 603 billion tokens across 7.6 million requests and 100 coding agents
Olisihan se kiva jos olisi harrastukseen vara heittää tuollainen leppoisa miljoona. Oletkos sinä tehnyt niin?
 
Minä tästä "loputtomat rajat" -ongelmasta olen X:ssä kirjoitellut - ei vastakaikua mistään.
Menin nyt sitten openai sivuille support AI-agentin juttusille ja se minulle väittää:
1779283297023.png

1779283539265.png


Eli, eikö muka nyt muillakaan 100€ tilauksilla vähene prosentit lainkaan?
Minä en ole saanut noita prosenttejea mihinkään vaikka ajellut Hermesissä 5 agentin joukkoa4 tuntia aktiivisesti missä kaikki ovat GPT-5.5 xhigh ja 100% vaan edelleen.
 
Minä tästä "loputtomat rajat" -ongelmasta olen X:ssä kirjoitellut - ei vastakaikua mistään.
Menin nyt sitten openai sivuille support AI-agentin juttusille ja se minulle väittää:
1779283297023.png


Eli, eikö muka nyt muillakaan 100€ tilauksilla vähene prosentit lainkaan?
Minä en ole saanut noita prosenttejea mihinkään vaikka ajellut Hermesissä 5 agentin joukkoa4 tuntia aktiivisesti missä kaikki ovat GPT-5.5 xhigh ja 100% vaan edelleen.
Väheni mulla normaalisti 100$/kk tilauksella. Joutui rajoittamaan 5.5:lla käyttöä että riitti koko viikoksi. Voi tietty olla jotain alueellisia tai a/b testaus eroja.

Tästähän on kampanjakin menossa, että tuplakäyttöraja tuolla tilauksella toukokuun loppuun asti.
 
Kampanja tosiaan on ja yli 3vk sitten tuo hyvin maltillisesti kuluikin, sitten se vaan loppu ja sen jälkeen aina 100%, aivan sama mitä ja miten paljon olen tuon kanssa touhunnut.
 
Kampanja tosiaan on ja yli 3vk sitten tuo hyvin maltillisesti kuluikin, sitten se vaan loppu ja sen jälkeen aina 100%, aivan sama mitä ja miten paljon olen tuon kanssa touhunnut.
Veikkaan että openai:n servereillä bitti poikittain sun tilin kohdalla. Mulla kävi tolleen autovakuutuksen kanssa. Sitä ei saamut peruttua eikä vakuutusyhtiön toimistollakaan virkailija onnistunut sitä poistamaan. Piti eskaloida siitä ylöspäin.
 
Minä en oikein tiedä mihin tuota eskaloisin, X:ssä ei noiden tagaaminen mitään tuo. OpenAI sivuilta ei onnistu saamaan oikeaa henkilöä.
Jos jotain pitäisi tehdä, niin nauhoitella monen tunnin video nopeutettuna missä ajan kaikkea ja paljon, se sitten johonkin X:ään ja jos se siellä jakoon lähtee, niin sitten jos vaikka joku OpenAi:lla kiinnostuisi.
 
Minä en oikein tiedä mihin tuota eskaloisin, X:ssä ei noiden tagaaminen mitään tuo. OpenAI sivuilta ei onnistu saamaan oikeaa henkilöä.
Jos jotain pitäisi tehdä, niin nauhoitella monen tunnin video nopeutettuna missä ajan kaikkea ja paljon, se sitten johonkin X:ään ja jos se siellä jakoon lähtee, niin sitten jos vaikka joku OpenAi:lla kiinnostuisi.
Voi se kyllä olla tarkoituksellinen a/b testauskin. Kokeilevat mitä tapahtuu jos ei ole käyttörajaa.
 
Kuinkas sopivasti muuten, olin kirjautunut kun kävin haastamassa sitä OpenAI chattibottia, ettei nyt joku olisi taustalla lukenut logit:
1779287557161.png


Jee ne kuluu taas!
 
Heh onpas Google kiristänyt ruuvia nyt tuon flashinkin osalta, aikaisemmin sillä sai tykitellä aika kauan, nyt 1000 kredittiäkin suli vauhdilla.
 
Heh onpas Google kiristänyt ruuvia nyt tuon flashinkin osalta, aikaisemmin sillä sai tykitellä aika kauan, nyt 1000 kredittiäkin suli vauhdilla.
Huvittavaa näissä kun jos vaikka nopeuttaa uutta mallia 4x ja pitää hinnan samana niin asiakas kerkeää polttaa viikossa 4x enempi rahaa(ja tokeneita)
 
Kyllä tuo uusi flash 3.5 hörppää. Sanoisin että edellinen oli AG:ssa aivan riittävä ja riittävän nopea kaikkeen ja todella vähäruokainen. Olisi täysin kelvannut sen nopeus.

Tämä koko touhu kompastuu omaan mahdottomuuteensa hyvin pian. Joko on varaa maksaa tonneja kuussa ja pelata agenttiarmeijalla, tai sit tehdä vain välttämättömät pahat kohtuuhintaan agentin avustuksella ja loput käsin. Ei tässä mitään muuta lopputulemaa voi olla. Ilmaiset eväät on syöty.
 
Minä tuota 3.5 flash high:ta koitin Antigravity:ssä ja ilmoitus limitin saavuttamisesta tuli todella nopeaan.
Tämä kokemus sillä 5TB AI Pro tilauksella.
 
Aloin tuossa miettiä luettuani juttua AI:lla kirjoitetuista kirjoista, että pitäisiköhän sellaiselle henkilölle, joka tekee AI:lla ohjelmia keksiä joku ohjelmoijaa parempi nimitys? Kun eihän se ole ohjelmointia sen enempää kuin jos softa-arkkitehti laatii suunnitelman ja antaa sen ohjelmoijan toteutettavaksi, ei kukaan tuota arkkitehtia ohjelmoijaksi kutsu. Tuo siis tuli mieleen kun mietin, että ei noita AI:lla kirjoja tuottavia oikein voi kirjailijoiksi kutsua.
 
Minä tuota 3.5 flash high:ta koitin Antigravity:ssä ja ilmoitus limitin saavuttamisesta tuli todella nopeaan.
Tämä kokemus sillä 5TB AI Pro tilauksella.
5 tuntia nollautui, IDE väitti käytön jo loppuneen, mutta sain vielä 4 simppeliä promptia ja nyt pääsen tekstin mukaan seuraavan kerran käyttämään 27.5. Melko koominen tilaus, kun pääsee jonkun ~10 promptia laittamaan per viikko.
 
Jaahas, joku oli kuulemma vaihtanut tittelinsä Senior Claude Revieweriksi. Tuossahan olisi yksi vaihtoehto, vaihdetaan tuo vaikk Senior AI Reviewiriksi.
 
Googlelta tuli 100$-versio AI Ultra -tilauksesta Clauden ja Codexin vanavedessä. 5x enempi tokenia tarjolla per 5h mitä AI Pro 20€ tuhnulla saa. Tragikoomisesti tolla voi rallatella 3.5 Flashia about saman verran kuin 20€ tilauksella pystyi käyttämään G3 Flashia. Päivän käytössä vaikeaa huomata mitään käytännön kykyeroja 3 vs. 3.5, vastinaika ehkä hivenen parempi, mutta ei kyllä vakuuta tokenien ahmimisen suhteen. AI Pro kerryttää pilviquotaa olikoha joku 10$ / kk extrana ja Ultra-tilaus 40$ / kk. No eipä tietenkään saa BYOK-ratkaisua suoraan paketista AG:hen jotta voisi senkin imuroida hyötykäyttöön muun lisäksi.
 
Kallista lystiä.
Paljonkohan laskennallisesti tuolla palvelinmäärällä palvelee asiakkaita ja millä käyttörajoilla.
Yhdenlaisen estimaatin vois yrittää laskea deepseekin mallien ja gb300:en pohjalta. Tosin spacex kai vuokraa niitä vanhempia rautojansa joita ei voi käyttää grok:in opettamisessa(h100 ja/tai h200). Ehkä myöhemmin tulee myös gb200. Kuvasta näkee myös softan vaikutuksen,... Aika paljon taas nvidia optimoinut. MLPerf mistä mittaukset hyvä benchmarkki kun mittaa oikeaa ei keinotekoista suorituskykyä.

Per gpu gb300 deepseek r1, eli räkissä *72 tulos. GB300 räkki maksaa jotain 3-4M$ + sähköt päälle.

1779358479341.png



Deep seek V4 1.6biljoona parametria mallista tokeneita per gpu, räkki *72 + sähköt. Tässä kuvassa näkee hyvin miten pienempi latenssi johtaa pienempään tuotettuun tokenimäärään. Aika on oikeasti rahaa. Tämä malli varmaan samoissa kokoluokissa kuin anthropic/openai/google pienemmät mallit. Frontierit on 10biljoonan parametrin pinnassa.
1779358729308.png


Noista vois yrittää laskea jotain random utilisaatio, tokeneita luotu vuodessa, hinta per miljoona tokenia arviota. Konesaliraudan teoreettinen elinikä 7v, todellinen voi olla lyhyempi. Tällä hetkellä näyttäs pitkältä elinikä kun vanhat h100 raudatkin edelleen käytössä.
 
Huhuavat, että anthropic olisi tekemässä ensimmäisen voitollisen kvartaalinsa. Jos pitää paikkansa niin voidaan puheet ale-tokeneista ja huonosta bisneksestä lopettaa hyvin pian. Huhun lähde uusin rahoituskierros missä on sijoittajille kerrottu anthropicin talouspuolesta.
Anthropic is on track to post a revenue of $10.9 billion for the quarter ending in June, double the revenue it made for the first quarter, according to The Wall Street Journal. Out of that total, the company expects to post $559 million in operating profit, making it the company's first profitable quarter since it was founded in 2021 if it hits that target. The company reportedly revealed those figures to a group of investors for its current funding round, which could boost its valuation past OpenAI's.
 

Statistiikka

Viestiketjuista
308 920
Viestejä
5 237 352
Jäsenet
83 397
Uusin jäsen
JeZZYH

Hinta.fi

Back
Ylös Bottom