Google julkaisi "ajattelevan" Gemini 2.5 -kielimallin

Kaotik · 28.03.2025

Googlen tekoälymallit ovat kehittyneet LaMDA:sta ja PaLM 2:sta nykyiseen Gemini-kielimalliperheeseen. Nyt yhtiö on julkaissut uuden Gemini 2.5 -mallin, jonka kehutaan olevan merkittävä edistysaskel ns. ajattelevien kielimallien saralla.

Googlen mukaan Gemini 2.5 on ajattelevana kielimallina luotu ratkomaan entistä monimutkaisempia ongelmia. Sen ensimmäisen Gemini 2.5 Pro Experimental -version kerrotaan ottavan johtoaseman yleisemmissä kielimallitesteissä merkityksellisellä erolla aiempiin malleihin. LMArena.ai:n tulostaulukossa sen Arena Score -pistemäärä on 1443, kun toisena oleva GPT-4o yltää 1408 pisteeseen.

Ajattelevat kielimallit ovat malleja, jotka kykenevät kehittäjiensä mukaan järkeilemään läpi omat ajatuksensa ennen vastauksen muodostamista, mikä parantaa niiden tarkkuutta ja siten käytännön suorituskykyä. Googlen mukaan ”järkeily” tarkoittaa tekoälymaailmassa kykyä analysoida informaatiota ja tehdä siitä loogisia päätelmiä, sisällyttää vastaus kontekstiin ja tehdä valistuneita päätöksiä. Googlen mukaan sen kaikki tulevat kielimallit tulevat olemaan nimenomaan ajattelevia kielimalleja.

Gemini 2.5:n järkeilyn kerrotaan mahdollistaneen sen ottaneen kärkisijan esimerkiksi GPQA- ja AIME 2025 -testien matematiikka- ja tiedetehtävissä. Sen pistemääräksi Humanity’s Last Exam -testissä ilman erillisten työkalujen käyttöä kerrotaan 18,8 %. Humanity’s Last Exam on satojen eksperttien luoma datapaketti, joka on tarkoitettu vastaamaan ihmisten tietoja ja järkeilyä. Malli parantaa Googlen mukaan myös koodaustaitojaan selvästi ja kykenee esimerkiksi luomaan järkeilyä hyödyntäen pelin vain yhdellä komennolla.

Gemini 2.5 Pro on heti saatavilla Google AI Studiossa kehittäjille ja yrityksille ja Gemini Advanced -tilaajat voivat valita sen käyttöön laitteensa kielimallivalikoimasta. Se lisätään mukaan myös Vertex AI:n keilimalleihin lähiaikoina.

Lähde: Google

Xiyng · 29.03.2025

Tämä on varmaan ihan käytännöllinen tapa parantaa kielimallien päättelykykyä nopeasti, mutta ainakaan omaan korvaani tämäkään ei silti kuulosta oikeasti luotettavalta, koska kielimallit eivät rajallisen ymmärrykseni perusteella yksinkertaisesti osaa päätellä vaan parhaimmillaankin tuottavat mahdollisimman uskottavan näköistä päättelyä. Tiettyyn pisteeseen asti se varmasti auttaa, mutta ei se luotettavalta kuulosta. Kaikissa sovelluksissa ei toki tarvitakaan luotettavuutta, mutta en välttämättä lähtisi esim. kriittistä järjestelmää lähtisi koodamaan tekoälyn avulla. Varmaan esim. peleihin vähemmänkin luotettava tekoäly toki soveltuu hyvin, jos tulos vain on riittävän usein riittävän hyvä.

Team_Slow · 29.03.2025

Mitä enemmän tekoälyä käyttää sitä enemmän sen "älyttömyys" tulee ilmi. Mutta ainakin harrastus koodaamisessa yms. tuo on hyvä jos tekoäly käy saman koodin monesti läpi se huomaa siitä yleensä virheitä ja parannettavia asioita joita ennen joutui hakemaan syöttämällä monesti saman koodin uudelleen ja uudelleen.

Google julkaisi "ajattelevan" Gemini 2.5 -kielimallin

Kaotik

Banhammer

Xiyng

Team_Slow

Uutiset

Uutisia lyhyesti

Uusimmat viestit

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi