Generatiivinen tekoäly saapuu peliin ensimmäistä kertaa NVIDIA ACE:n ja OpenAI Whisperin voimin

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 477
nvidia-ace-mecha-break-20240822.jpg


Kaotik kirjoitti uutisen/artikkelin:
NVIDIA on esitellyt ACE- ja digitaali-ihmisteknologioitaan jo useammissakin eri yhteyksissä, joista io-techin lukijoita kiinnostanee eniten pelit. Nyt odotus alkaa lähenemään loppuaan, sillä yhtiö kertoi teknologioiden löytyvän näillä näkymin ensi vuonna julkaistavasta Mecha Break -pelistä.



NVIDIAn ACE ja muut digitaali-ihmisteknologiat mahdollistavat aiempaa realistisen oloisten ihmisten luonnin peleihin, eikä vähiten niiden tekoälypohjaisten keskustelutaitojen vuoksi. Juuri nämä ovat pääosassa myös Amazing Seasun Gamen tulevassa Mecha Breakissa, jossa pelaajat voivat keskustella NPC-hahmojen kanssa puhumalla. Tekoälyä voi myös ohjastaa tekemään joitain asioita pelaajan puolesta asioita pelissä.

Pelin tekoälystä on vastuussa paikallisesti pyörivä, roolipeleille optimoitu Nemotron-4 4B SLM-kielimalli (Small Language Model). SLM-kielimallin pyörittäessä itse tekoälyä NVIDIAn Audio2Face-3D NIM -teknologia hoitaa huulien ja puheen synkronoinnin ja OpenAI:n Whisper-puheentunnistus hoitaa pelaajan käskyjen tulkinnan Nemotronille. Ainut pilvessä tapahtuva osuus on NPC-hahmojen puheen syntetisointi, josta on vastuussa Elevenlabs.

Lähde: NVIDIA

Linkki alkuperäiseen juttuun
 
Viimeksi muokattu:
Roolipeleissä todellisia keskusteluja hahmojen kanssa. Jännä nähdä miten toimii.
 
Näkisi vaan sen päivän kun tuo toimii suomalaisella rallienglannilla
 
Ei välttämättä ole kaukana. Chatgpt ja Siri ymmärtää hämmästyttävän hyvin jo nyt, eikä tarvitse edes rallienglantia, voi höpöttää vaikka savoksi…
Joo, mutta tässä puhutaan paikallisesta pienestä kielimallista eli se tukenee vain muutamaa yleisintä kieltä
 
Joo, mutta tässä puhutaan paikallisesta pienestä kielimallista eli se tukenee vain muutamaa yleisintä kieltä
Tää kiinnostaa itteäni aika paljon kun aikaisemmin oli ainakin jotain tutkimusta uutisoitu, jossa heidän LLM pärjäsi yksikielisissä testeissä sitä paremmin mitä useampaa kieltä oli käytetty koulutuksessa. Tämähän on kait melkein sama ihmisten kanssa, että mitä useampaa kieltä osaa sitä helpommin oppii uutta tietoa edes yksikielisestä tekstistä? Eli onko varsinaisesti kuinka suuri tilansäästöhyöty lopullisessa mallissa jos osaa vain ihan paria kieltä?
 
Tämä paikallinen kielimalli vaatii onneksi vain 2 Gt VRAM-muistia ja pitäisi pyöriä kaikilla RTX-näytönohjaimilla alkaen aina RTX 2060:stä.
 
Generatiivinen tekoäly tulee kohta npc-hahmoille, mutta milloin tulee tekoälyllä toimiva pelimoottori mikä muokkaa peliä sen edetessä. Elämme jännittäviä aikoja!
 
Tämä paikallinen kielimalli vaatii onneksi vain 2 Gt VRAM-muistia ja pitäisi pyöriä kaikilla RTX-näytönohjaimilla alkaen aina RTX 2060:stä.
Ja tässähän ei ole kuin kaksi ongelmaa: useinmissa nVidian korteissa sitä muistia on vain 8 gigaa ja sekään ei riitä edes grafiikoille ja toisekseen jos se vaatii rtx:n niin myynti radeon käyttäjille voi olla varsin vähäista
 
Joo, mutta tässä puhutaan paikallisesta pienestä kielimallista eli se tukenee vain muutamaa yleisintä kieltä
a) Suomalainen rallienglanti on englantia. Kielimalli osaa englantia, suomea toki ei. b) Kielimalli ei hoida puheen litterointia tekstiksi vaan OpenAI:n Whisper. Käsittääkseni melko kevyt malli.
 
a) Suomalainen rallienglanti on englantia. Kielimalli osaa englantia. b) Kielimalli ei hoida puheen litterointia tekstiksi vaan OpenAI:n Whisper. Käsittääkseni melko kevyt malli.
No sitten toivotaan, että se whisper osaa hommansa koska perinteiset puheentunnistukset ovat olleet varsin tarkkoja siitä miten ääntäminen menee
 
SLM-kielimallin pyörittäessä itse tekoälyä NVIDIAn Audio2Face-3D NIM -teknologia hoitaa huulien ja puheen synkronoinnin OpenAI:n Whisper-puheentunnistus hoitavat pelaajan käskyjen tulkinnan Nemotronille.

Onko tuossa virkkeessä joku virhe?
 
Ja tässähän ei ole kuin kaksi ongelmaa: useinmissa nVidian korteissa sitä muistia on vain 8 gigaa ja sekään ei riitä edes grafiikoille ja toisekseen jos se vaatii rtx:n niin myynti radeon käyttäjille voi olla varsin vähäista
Juu tuo muistin vähyys monessa RTX kortissa on ongelma, mutta tuo toinen nostamasi aihe ei ole. Kesäkuussa raportoitiin, että Nvidia nauttii 88 % markkinaosuudesta erillisnäytönohjaimissa ja mm. Steamin tilastot heijastelevat tätä hyvin.

 
Näkisi vaan sen päivän kun tuo toimii suomalaisella rallienglannilla
Evevenlabs syntetisoi jo täydellistä suomenkieltä. Itse jo jonkin aikaa sitten korvasin Google Assistentin omalla scriptilläni joka käyttää ainoastaan Googlen puheentunnistusta, lähettää datan ChatGPT:lle ja vastaa Elevenlabsin kautta. Aivan sujuvia keskusteluja voi käydä suomeksi
 
Sitä AI'n I-kirjainta edelleen odotellessa ei nousse hiki pintaan nytkään :coffee:
 
Aikas höpöltä vaikuttaa, sillee negatiivisessa mielessä.

Jos tuollainen tulee kokeiltavaksi niin toki kokeilen.
 
Hyvä että vihdoin otetaan ensiaskeleita. Mielummin otan peleihin välttävästi keskustelevat kuin nykyiset muutamia kovakoodattuja lauseita arpovat NPC:t.
 
Tossa videolla korvaan säärähti tuo kohta, missä se ai:llä terästetty NPC puhuu pelaajasta. Vähän immersio särkyy tommosessa.
 

Uusimmat viestit

Statistiikka

Viestiketjuista
258 250
Viestejä
4 491 023
Jäsenet
74 171
Uusin jäsen
äänihaitta

Hinta.fi

Back
Ylös Bottom