Metan uusi Llama 4 -tekoälymalli käsittelee jopa 10 miljoonan tokenin tietomääriä

NeliYgönen

Ylläpidon jäsen
Liittynyt
02.07.2020
Viestejä
365
Llama 4:n versiot ovat aluksi Scout ja Maverick, mutta kehitteillä on myös nimensäkin mukaan massiivinen Behemoth -versio.

1744065158980.png


Yhdysvaltalaisen Metan satsaus tekoälybuumiin on sen Llama-malli, joka on edennyt neljänteen versioonsa. Llama 4:stä on Euroopan ulkopuolella saatavilla mallit Scout ja Maverick, joiden lisäksi kehitteillä on myös pienempien mallien ”opettajamalli” Behemoth.

Llama 4 Scout on suunniteltu toimimaan FP4-tarkkuudella (4-bit Floating Point) NVIDIAn datakeskuksiin suunnatuissa H100-näytönohjaimissa. Verrattain matalaa tarkkuutta kompensoi mallissa hyödynnettävä MoE-arkkitehtuuri (Mixture of Experts), eli mallin jakaminen alamalleihin tai ”ekspertteihin”, jotka aktivoidaan tarpeen mukaan käyttäjän syötteestä riippuen. Arkkitehtuuri säästää laskentatehoa ja parantaa mallin tehokkuutta. Scout pystyykin käsittelemään jopa 10 miljoonan tokenin syötteitä. Tokenit ovat käytännössä esimerkiksi sanoja, tavuja tai merkkejä, joita tekoälymalli käsittelee.

1744065186908.png

MoE-arkkitehtuuri

Llama 4 Maverick käyttää FP4:n sijasta FP8-tarkkuuttta FP8-tarkkuuteen. Siinä on myös 128 alamallia eli ”eksperttiä”, kun taas Scoutissa niitä on 16. Suurempi määrä mahdollistaa syötteen tarkemman käsittelyn hyvin aikaisessa vaiheessa. Molemmat uutuusmallit ovat multimodaalisia, eli ne pystyvät tiedonkäsittelyssään hyödyntämään dataa sekä tekstistä että kuvista samanaikaisesti.

Lisäksi Metalla on koulutusvaiheessa massiivinen Behemoth-malli, jota käytetään mm. Maverickin ja Laman opettamiseen. Behemoth pystyy hyödyntämään yhteensä jopa kahta biljoonaa parametria tiedonkäsittelyssään, kun taas Maverickilla niitä on kokonaisuudessaan käytössä 400 miljardia ja Scoutilla 109 miljardia.

Toistaiseksi Metan tekoälypalvelut eivät ole kuitenkaan käytettävissä Euroopassa EU:n säädösten vuoksi.

Lähde: TechPowerUp
 
Viimeksi muokannut ylläpidon jäsen:
Eli kuinkas monen taiteilijan/piirtäjän/artistin työn tämä osaa kopioida sekunnissa ja kuinka paljon enemmän tuhlaa energiaa kuin edeltäjänsä?
 
Eli kuinkas monen taiteilijan/piirtäjän/artistin työn tämä osaa kopioida sekunnissa ja kuinka paljon enemmän tuhlaa energiaa kuin edeltäjänsä?
Pitäisi olla paljon virtatehokkaampi kuin aikaisempi llama. Arkkitehtuuri fiksumpi. Kopiointijuttuihin yms. en ota kantaa kun niistä on jo väännetty keinoälyketjuissa enemmän kuin yhden ihmisiän tarpeiksi.
 

Statistiikka

Viestiketjuista
274 682
Viestejä
4 729 729
Jäsenet
77 233
Uusin jäsen
1234arttu

Hinta.fi

Back
Ylös Bottom