Tekoälyn luomaa taidetta.

Liittynyt
30.04.2024
Viestejä
272
Tuonne optinen illuusia ketjuun postaillaan noita AI:llä tehtyjä piilokuvia. Osaatteko sanoa mikä ohjelma kyseessä? Sormet ja muut menee ihan minne sattuu.

 
Liittynyt
14.01.2017
Viestejä
376
Tuonne optinen illuusia ketjuun postaillaan noita AI:llä tehtyjä piilokuvia. Osaatteko sanoa mikä ohjelma kyseessä? Sormet ja muut menee ihan minne sattuu.

Veikkaisin stable diffusionia controlnetillä käytettynä (tai vastaavaa). Controlnetillä voi antaa "ohjeistuskuvan" jota se noudattaa annettujen parametrien myötä.
 
Liittynyt
28.03.2017
Viestejä
1 591
Liittynyt
24.12.2016
Viestejä
396
Udio | AI Music Generator - Official Website
Udio päivittynyt versioon v1.5
  • Improved Audio Quality
  • Key control
  • Improved global language results
  • Dedicated creation page
  • Stem downloads
  • Audio to audio (remixing audio uploads)
  • Shareable lyric videos
Räpellystä ja testausta v1.5 versiolla:
Udio-130 2min10s yhdellä vedolla


Audio to audio



 
Viimeksi muokattu:

latee77

Team Ryzen
Team NVIDIA
RTX ON
Liittynyt
18.02.2017
Viestejä
5 151
Mikäs olisi nyt hyvä ohjelma jos haluaa kokeilla tehdä ”taidetta” tai toisin sanoin testailla / pelleillä mitä AI luo?

Maksullisia lienevät toki. Löytyykö esimerkiksi siihen osaavaa ohjelmaa jos haluaa oman naamansa ja teettää siihen taustat, maisemat tai liittää kaksi kuvaa yhteen?
 
Liittynyt
23.10.2016
Viestejä
134
Ihan ilmaiseksi kuvia pääsee omalla raudalla piirtelemään.
Nopeiten vauhtiin pääsee Stability Matrixin avulla GitHub - LykosAI/StabilityMatrix: Multi-Platform Package Manager for Stable Diffusion
Tämä on asennushallinta jolla saa kätevästi kokeiltua useita eri front end paketteja stable diffusionille (ja muille avoimille malleille). Tuo Matrix siis hoitaa yhdellä klikkauksella dependencyt ja eri paketteja on helppo kokeilla ja vertailla.
Helpoin olisi fooocus
Eniten käytetty Automatic1111 <- tälle paljon ohjeita ja tukea, myös tuohon oman naaman käyttöön
Jos node graph -käyttöliittymä ei pelota ja kiinnostaa opetella miten homma toimii taustalla niin comfyUI <- tämä kaikista järein työkalu

itse käytän GitHub - Panchovix/stable-diffusion-webui-reForge joka on käytännössä A1111 paremmalla performancella (ja joskus ylimääräisillä bugeilla...) mutta tämä ei valitettavasti vielä löydy matrixista
 

emviiex

Team Ford
Tukijäsen
Liittynyt
07.11.2016
Viestejä
435
Tässä viimeinen oma testailu Udion 1.5:lla. Jollain olisi kiva pysyä tekeen pidempää videota kun tuo noisee tuntuu aika rupuiselta.

 

latee77

Team Ryzen
Team NVIDIA
RTX ON
Liittynyt
18.02.2017
Viestejä
5 151
Ihan ilmaiseksi kuvia pääsee omalla raudalla piirtelemään.
Nopeiten vauhtiin pääsee Stability Matrixin avulla GitHub - LykosAI/StabilityMatrix: Multi-Platform Package Manager for Stable Diffusion
Tämä on asennushallinta jolla saa kätevästi kokeiltua useita eri front end paketteja stable diffusionille (ja muille avoimille malleille). Tuo Matrix siis hoitaa yhdellä klikkauksella dependencyt ja eri paketteja on helppo kokeilla ja vertailla.
Helpoin olisi fooocus
Eniten käytetty Automatic1111 <- tälle paljon ohjeita ja tukea, myös tuohon oman naaman käyttöön
Jos node graph -käyttöliittymä ei pelota ja kiinnostaa opetella miten homma toimii taustalla niin comfyUI <- tämä kaikista järein työkalu

itse käytän GitHub - Panchovix/stable-diffusion-webui-reForge joka on käytännössä A1111 paremmalla performancella (ja joskus ylimääräisillä bugeilla...) mutta tämä ei valitettavasti vielä löydy matrixista
Nopeesti testasin tuota Fooocusta, että ylipäätään toimii, ja toimiihan se.

Mihin tarviin tuota Stability Matrixia vai onko siis käyttöliittymä jolla voi käyttää esim. Foocusta ja Automatic1111 helpommin kuin noita erikseen?

Kiitti vinkeistä :thumbsup:
 
Liittynyt
23.10.2016
Viestejä
134
Mihin tarviin tuota Stability Matrixia vai onko siis käyttöliittymä jolla voi käyttää esim. Foocusta ja Automatic1111 helpommin kuin noita erikseen?
Matrixi on käytännössä kuin "launcher" näille kilkkeille. Sillä on helppo hallita käyttöliittymäpaketteja ja ladata malleja meta-datan kera. Lisäksi se linkittää kansiorakenteet automaagisesti niin että samaa malli-checkpointtia voi käyttää kaikissa käyttöliittymissä. Kaiken mitä Matrix tekee voi tehdä manuaalisesti itse, se vain helpottaa asioita.
 
Liittynyt
21.02.2017
Viestejä
5 140
Stability AI:sta aiemmin tänä vuonna lähteneet SD 1.5:n, SDXL:n ja SD3:n pääkehittäjät perustivat uuden firman ja julkaisivat eilen Flux -nimisen kuvageneraattorin. Midjourney v6 tasoa ja varmaan ylikin.

Kuulemma toimii 12 Gt näyttikselläkin, mutta itellä on ahdasta on 32 gigalla keskusmuistia ja 24 gigalla vrammia. Kone menee välillä juntturaan kun keskusmuisti täyttyy ja swappaa page filen puolelta, etenkin promptia prosessoidessa, mutta kuvia pukkaa kyllä ulos:

ComfyUI_00651_.png


r/StableDiffusion subreddit täytenään nättejä esimerkkikuvia.

Blogissa hieman enemmän tietoja:
 
Liittynyt
28.03.2017
Viestejä
1 591
Flux FP16 näyttää vievän 28GB VRAM... harmi kun noin lähellä, mutta niin kaukana 24GB korteille. FP8 menisi tietty hyvin.

Laatu kyllä hyvää tasoa, vielä jos saisivat lokaalin txt2vid ja img2vid samalle tasolle, niin oltaisiin hyvissä asetelmissa.
 
Liittynyt
21.02.2017
Viestejä
5 140
Flux FP16 näyttää vievän 28GB VRAM... harmi kun noin lähellä, mutta niin kaukana 24GB korteille. FP8 menisi tietty hyvin.
Meinaatko tuota T5xxl enkooderia? Itse Flux näyttäisi mahtuvan kyllä pienempäänkin.

Testailen tässä SwarmUI:ta just ja kuvan rendaaminen 4090:llä 20 steppiä kestää n. 15 sekkaa ja käyttää maksimissaan vähän alle 20Gt VRAMia. Tiedä sitten puskeeko tämä jotenkin tuon Fluxin mallin 8-bittiseksi, mutta tällä hetkellä toimii paljon nopeemmin kuin ComfyUI. Comfyssakin itse Fluxin sampling stepit menee ihan kivaa vauhtia, selvästi yli 1it/s, mutta muut vaiheet ympärillä (tekstin enkoodaus ja VAE) hitaita. VRAM myös katossa Comfyssä.

(Vähän mietin että sainko vahingossa T5:n disabloitua tästä Swarmista, kun se rupesi downlodaamaan sitä uusiksi, niin otin vain vanhan T5-fp8 filun ja uudelleennimesin sen siksi minkänimistä Swarm kaipasi. Hyvää jälkeä tulee kyllä näinkin.)

edit: eiköhän tuo T5 toimi kun promptia seuraa hyvin tarkasti.

obese fisherman fly fishing while sitting on an eccentric avocado sofa on a red wooden raft floating on a lake in the finnish countryside, summer at noon

1250-obese fisherman fly fishing while sittin-flux1-dev-613775163-1.jpg


tosiaan 15sekkaa kestää tämä 20-steppinen ja kun vaihtaa promptia niin ei vie enempää aikaa. Ai että!

edit2: Swarmin doceista selviää että tosiaan pakkaa defaulttina mallin FP8 muotoon laatua heikentäen.

By default swarm will use fp8_e4m3fn for Flux, if you have a very very big GPU and want to use fp16/bf16, under Advanced Sampling edit Preferred DType
 
Viimeksi muokattu:
Toggle Sidebar

Statistiikka

Viestiketjut
248 645
Viestejä
4 334 482
Jäsenet
72 262
Uusin jäsen
TrixIDK

Hinta.fi

Ylös Bottom