Tekoälyn luomaa taidetta.

  • Keskustelun aloittaja Keskustelun aloittaja Lager7
  • Aloitettu Aloitettu
Ei kannata ekalla yrityksellä kuuhun kurkottaa, kunhan asentaa joko A1111 (helppo) tai ComfyUI (vaikea) ja alkaa ihmettelemään miten systeemit toimii.
Tää kyllä totta. Auto1111:ssä on tosiaan helpompi käyttöliittymä. Ei ole tullut käyteltyä vähään aikaan, niin en ollut kärryillä millainen tuki siinä on recolorille.

Varmaan kandee ihan vaan txt -> image jutuista lähteä liikkeelle ja lisätä controlnetiä ja muuta monipuolisuutta mukaan kun on saanut tuntumaa käyttöliittymään. Paljon vau-elämyksiä tarjolla kun näihin uppoutuu.
 


Vaikka muutaman kuukauden vanha, tuo tutoriaali on yhä mielestäni paras, jos ekaa kertaa pappia kyydissä. Seurailee askel askeleelta, niin varmasti pääsee tuottamaan laadukkaita kuvia.

Videon loppupuolella myös ControlNetin käyttöä, jolla saa siis väritettyä mustavalkokuvia ja kaikkea muuta hauskaa.
 
Näköjään tuolla TensorRT lisärillä saa hiresfix kyllä toimimaan, kunhan ensin generoi dynaamisen default enginen ja sen päälle staattiset loppuresoluutiot käytettävälle checkpointille.

Toisin sanoen homma menee näin:
  1. Generoi TensorRT default engine (mahdollistaa kuvat 512x512 - 768x768 välillä)
  2. Generoi TensorRT "static shapes" enginet esimerkiksi 1920x1280 sekä 1280x1920
  3. Luo txt2img kuva 768x512 resoluutiolla, hiresfix päälle 2.5 skaalauksella -> output 1920x1280
Jos haluaa nostaa reson vielä isommaksi (esim 3840x2560) voi kuvan viedä img2img välilehdelle ja ajaa ControlNet tile / SD upscale scriptin. Alla pari tensor-ytimillä luotua kuvaa, nopeus oli 3080 Ti kanssa reilut 20it/s.

00004-2851671967.jpg 00250-2936382266-gigapixel.jpg
 
ControlNet tukea ei (vielä?) ole, mutta A1111 dev branchissa pitäisi TensorRT + SDXL toimia. Itse en ole tuota yhdistelmää testannut, kun tullut käytettyä erikseen Comfyä pelkästään SDXL seikkailuissa. LoRA tuki on ja sitä testasinkin, mutta nekin pitää ensin muuttaa TensorRT yhteensopiviksi checkpointtien tavoin.
 
Fooocus ja Adoben Generative Fillit ovat tulleet jo melko luontevasti osaksi workflowta. Onhan tuosta Stable diffusionista saanut jo paljon iloa irti sisällöntuotantyössä, joskus sieltä saa uutta inspiraatiota tehdä ja joskus käyttistä kamaa, joskus puuttuvan palasen isompaan photoshop komposiittiin. Enää ei tarvi juuri aikaa tuhrata jos joku lähdekuva on väärässä kuvasuhteessa. Leikkiminen toinen toistaan happoisemmilla prompteilla on myös todella koukuttavaa.

Seuraava suurempi loikka mitä itse haluaisin, olisi sellainen, että saisi tarjota yhä paremmin oman image promptin ja tekoäly osaisi todella napata siitä sen oleellisen pointin, esim tunnistettavan ihmishahmon/kasvot ja rakentaa hänestä tunnistettavia lisäkuvia tekstipromptin tukemana. Tai vaikka tuotekuvausta napata juuri sen tietyn viinipullon etiketteineen ja renderöidä sitä kokonaisuutta mielivaltaisilla taustoilla / taidetyyleillä. Se olis aivan mahtavaa. Kai tuo jo jotenkin on mahdollistakin, mutta vähän turhan vaikeiden pluggareiden juttuja vielä. Kai.
 
Alkaa SDXL pohjaiset checkpointit vihdoin olemaan hyvällä mallilla. Juggernaut XL v6 + RunDiffusion kokeilua A1111:llä, ei mitään LoRA tai Controlnettiä käytössä. Monenlaista kuvatyyliä yhdellä ja samalla checkpointilla.

00338-105848344.jpg 00323-1747405329.jpg 00793-1856361695.jpg 00228-4170253845.jpg 00580-556850263.jpg
00313-481547330.jpg 00714-2826010174.jpg 00284-1022280181.jpg 00480-61228970.jpg 00496-2310627489.jpg
 
Googlailun perusteella ControlNetiä tarvitaan ilmeisesti vanhojen mustavalkokuvien käsittelyyn SD:n kanssa. Saako sen ladattua ilmaiseksi? Nähtävästi se vaatii ainakin kirjautumisen.
 
Googlailun perusteella ControlNetiä tarvitaan ilmeisesti vanhojen mustavalkokuvien käsittelyyn SD:n kanssa. Saako sen ladattua ilmaiseksi? Nähtävästi se vaatii ainakin kirjautumisen.
Ei siihen mitään kirjautumista tarvita, lataat sen A1111 extensions -> available välilehdeltä. Sivun yllä linkkaamassani videossa tuo käydään läpi.

Jos jonkun pilvipalvelun kautta SD käytät, siinä tapauksessa ei tietoa.
 
Nevermind, ajattelin että läppä olisi hyvä. Ei näköjään ollut.
 
Harvemmin kanssakeskustelijoiden pedareiksi maalaaminen kovin paljoa naurattaa ihmisiä, tai sitten on sen tasoista huumoria, ettei ole näille leveysasteille levinnyt.

Ontopic: Uudet Nvidia ajurit julkaistu tänään, uutena ominaisuutena System Memory Fallback for Stable Diffusion. Eli 6-8GB VRAM korttien kanssa ei pitäisi enää generointi hidastua, kun ajurit ei siirrä ylimenevää VRAM osuutta RAM puolelle 6GB paikkeilla. Itse en ole tuosta joutunut kärsimään, mutta kuulemma auttanut jos ei ole vähintään 10-12GB näytönohjainta.
 
ihmettelen vähän näiden ai firmojen toimintaa. ensin pöllitään kaikki kuvat ilmaiseksi netistä ja sitten myydään isolla rahalla ja heitetään härän pyllyä tekijänoikeuksille. Joo ei voi tehdä kuvaa Arnold Schwarzeneggeristä mutta voi tehdä kuvan juuri hänen näköisestään toisesta henkilöstä. Eli tässä kuvassa on tässä kuvassa on vaan etäisesti jotain tiettyjä juttuja muistuttavia olentoja henkilöitä. ja sitten tietysti kun pistää stable diffusionin omalle koneelle voi tehdä kaiken maailman kauheuksista kuvia niin paljon kuin sielu sietää. Mulla ei vaan pyörinyt se kun herjaa, että loppuu muisti kesken tuolla amd:n kortilla.

DALL·E 2023-10-31 20.02.41 - Photo-realistic scene set in a dense jungle. A humanoid hunter, r...png
DALL·E 2023-10-31 16.04.58 - 4K photorealistic image of a female terminator with metallic skin...png
 
Onko mitään niksi kolmosia kenelläkään heittää miten saisi nopeammaksi kuvien generoinnin latasin stable diffuusorin ja näyttis on gtx 1660ti 6gb vram cpu ryzen 5 3400g muistaakseni 16gb ram. Vai onko tällä setillä mitään tehtävissä edes asialle?
 
Commandline argumenteiksi webui-user.battiin: --xformers --opt-channelslast --medvram

Tuo 6 gigan VRAM on suurin rajoittava tekijä.
 
Sinänsä paljon mielekäämpää ettei ihmisen tarvitse vaivautua tekemään toritaidetta. ;-)
Autojenmuotoilussa tekoäly ollut voimissaan, muotoilusta päätellen, jo 15 vuotta.
 
Mihinka hintaan saa nayttiksia joidenkan tuon kanssa voisi leikkia? Jos saa johonkin inhimilliseen hintaan niin voisi firman poytakoneeseen hommata.
 
Suno.ai verkkosivustoversiossa vissiin v2 musiikkigeneraattorista.
Suno
Pikaisella kokeilulla kuulostaa paremmalta kuin discord versio suno.ai generaattorista:

 
Viimeksi muokattu:
Stability AI julkaisi Stable Video Diffusionin ja ComfyUI lisäsi tuen. Pikaisella kokeilulla ihan hauska tekele, img2vid:

Comfy-UI-08498.webp


Augmentation level tuossa 0.1 sai heebon puheliaaksi mutta silmät vähän häröt. Augmentation level 0:lla stabiilimpi, vähemmän häröt silmät, mutta tylsempi, tyyppi vain vähän huojuu. RTX 4090 putkautti näitä 25 framen pätkiä 44-48 sekunnissa kellotuksista riippuen.

ComfyUI:n valmiit workflowt ja selityksiä asetuksille:

lanh0U.jpg
 
Viimeksi muokattu:
Mä tein deepfaken colab.research.google.com kanssa, tubesta löytyi hyvä tutorial. Hyvin toimii.

Onko mitään ton tapaista AI juttujen tekoon, missä vaan muokataan parametrit valmiiseen koodiin? Tuo kuvasta liikkuvaksi kuvaksi muutos näyttää hyvältä, mutta nopealla vilkaisulla monimutkainen prosessi. Haen siis yläkoulun tvt kurssille matskua. Bing creator kuvia ja deep fake videoita tehty. Jotain muuta vielä kaipailisi.
 
Jtn testailuja stable diffusion, vähän on hakusessa vielä miten tätä käytetään optimaalisesti.
 

Liitteet

  • image (43).png
    image (43).png
    3,5 MB · Luettu: 240
  • image (46).png
    image (46).png
    3 MB · Luettu: 346
  • image (16).png
    image (16).png
    2,4 MB · Luettu: 351
  • image (6).png
    image (6).png
    2,4 MB · Luettu: 331
Testasin miten DALL E suoriutuu laittamalla Mona Lisan erilaisiin tilanteisiin.
Halloween -juhlissa
_87e5090a-c904-4ff5-8239-8291436fa71d.jpg


Tiskijukkana

_317e651b-0764-4506-8510-330eddfe27ab.jpg


Kahvilla Pariisissa


_528c7faf-8ef7-4e0a-b423-a05306e4acc1.jpg


Kung Fu munkkina

_0be75ad5-a6fb-4595-a877-48f370376508.jpg


Salaisena agenttina punaisella torilla (vienyt näköjään patsaan Putinilta).


_b361a6ea-7195-4604-b0f1-583fb19aad3f.jpg
 
Stability AI julkaisi juuri SDXL Turbon, jonka väittävät tarjoavan parempaa laatua neljässä stepissä kuin originaali SDXL 50:ssä stepissä. Yhdellä stepilläkin ilmeisesti saisi kelvollista kamaa.


edit: miinuksena 512x512 natiivireso SDXL:n 1024x1024:n sijaan.
 
Viimeksi muokattu:
Testasin miten DALL E suoriutuu laittamalla Mona Lisan erilaisiin tilanteisiin.
Tiskijukkana

_317e651b-0764-4506-8510-330eddfe27ab.jpg

Menisi itselle ihan täydestä Kiasmassa mikäli olisi maalattuna tai miksi ei tuollaisenakin. Melkein pelottavan nerokas tulkinta tuosta alkuperäisen horisonttikikkailusta (kaksi eriväristä valoa, jonka voi ajatella olevan kuvallinen sanaleikki kanssa miten Mona Lisan voi nähdä eri valoissa, oletettavasti et sitä erikseen määrittänyt vaan tuli suoraan dj:n tyypillisestä ympäristöstä?).
 
Krea.Ai testailua. Tässä on se image prompti. Eli kopioi toisen kuvan kokonaan tai sitten voi asteittain valita että tekee enemmän teksti promptin mukaisen. Nopeakin on.
downloadedImage (50).png
downloadedImage (63).png
 
Tuli itsekin hypättyä RTX 4090 kelkkaan, 24 gigan VRAM on mannaa. Pystyy luomaan XL checkpointeilla 1920x1080 kuva -> 3840x2160 hiresfix pysyen latent spacessa ilman img2img vaihetta.

00160-3069790399.jpg

00151-1733187843.jpg
 
Laittaakaapas joku niillä paremmilla vehkeillä lähi kuva naisen kasvoista, että miten realistiseen ihoon pääsee?
 
Kaveri kaski kysymaan etta onko jo tarjolla sellaisia joilla saisi alastomia ihmisia aikaan?
 
Riippuu täysin checkpointista. Suurin osa kaipaa vielä lisätreenausta käsille ja sormille.

y382vre2rn5c1.jpg
 
On tuossa alastonkuvassa muutakin vikaa. Nainen taustalla näyttää tulevan pöydän läpi. Taitaa vaatia vielä käyttäjältä paljon, mutta nuo kehittyvät nopeasti.
 
Laittaakaapas joku niillä paremmilla vehkeillä lähi kuva naisen kasvoista, että miten realistiseen ihoon pääsee?
Olen varmaan skaalannut tätä kertaalleen ylöspäin mutta mielestäni parhailla malleilla ihokin rupeaa olemaan jo melko realistista. Taustalla vähän ylimääräisiä klooneja ja kädet perinteisen mutatoituneet :cautious:

Tietysti paikka paikoin rupeaa tulemaan jo vähän liiankin puhdasta jälkeä joten jonkinlaista ihon epätäydellisyyttä täytyisi saada mukaan jos realismia haluaa lisää...

_00084-4223723580.png
 
Viimeksi muokannut ylläpidon jäsen:
Nämä tähän ketjuun pariinkin otteeseen postatut alastonkuvat eivät sitten kuulu foorumille siinä missä muutkaan alastonkuvat, siitäkään huolimatta että ovat tekoälyn tekemiä.
 

Statistiikka

Viestiketjuista
262 348
Viestejä
4 553 454
Jäsenet
74 959
Uusin jäsen
sorjonen

Hinta.fi

Back
Ylös Bottom