Tekoälyn luomaa taidetta.

Sallys · 17.07.2024

Tuonne optinen illuusia ketjuun postaillaan noita AI:llä tehtyjä piilokuvia. Osaatteko sanoa mikä ohjelma kyseessä? Sormet ja muut menee ihan minne sattuu.

Optiset illuusiot

Muistelisin että jossain kuvaketjussa ehdotettiin optisille illuusioille omaa ketjuaan ja kun tämä tuli vastaan päätin tehdä sellaisen. Eli kun kohtaat jonkin hienon tai hauskan optisen illuusion niin postaa se tähän ketjuun. Jos löydät jonkin sivun niin älä postaa koko sen sisältöä vaan yksi...

bbs.io-tech.fi

zamerok · 18.07.2024

Sallys sanoi:
Tuonne optinen illuusia ketjuun postaillaan noita AI:llä tehtyjä piilokuvia. Osaatteko sanoa mikä ohjelma kyseessä? Sormet ja muut menee ihan minne sattuu.

Optiset illuusiot

Muistelisin että jossain kuvaketjussa ehdotettiin optisille illuusioille omaa ketjuaan ja kun tämä tuli vastaan päätin tehdä sellaisen. Eli kun kohtaat jonkin hienon tai hauskan optisen illuusion niin postaa se tähän ketjuun. Jos löydät jonkin sivun niin älä postaa koko sen sisältöä vaan yksi...

bbs.io-tech.fi

Veikkaisin stable diffusionia controlnetillä käytettynä (tai vastaavaa). Controlnetillä voi antaa "ohjeistuskuvan" jota se noudattaa annettujen parametrien myötä.

Infinity · 18.07.2024

Infinity sanoi:
QR monster controlnet kokeilua, muutama piilotettu teksti. Pikkukuvasta näkee selkeästi, täysikokoisena täytyy hiukan siristää silmiä tai katsoa kauempaa.

Sama QR monster controlnet todennäköisesti.

monster-labs/control_v1p_sd15_qrcode_monster · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

David ":DA" Imodium · 18.07.2024

Ei ehkä tekoälyn luomaa, mutta komposoimaa:

aneane · 26.07.2024

Udio | AI Music Generator - Official Website
Udio päivittynyt versioon v1.5

Improved Audio Quality
Key control
Improved global language results
Dedicated creation page
Stem downloads
Audio to audio (remixing audio uploads)
Shareable lyric videos

Räpellystä ja testausta v1.5 versiolla:
Udio-130 2min10s yhdellä vedolla

Audio to audio

latee77 · keskiviikkona klo 00:20

Mikäs olisi nyt hyvä ohjelma jos haluaa kokeilla tehdä ”taidetta” tai toisin sanoin testailla / pelleillä mitä AI luo?

Maksullisia lienevät toki. Löytyykö esimerkiksi siihen osaavaa ohjelmaa jos haluaa oman naamansa ja teettää siihen taustat, maisemat tai liittää kaksi kuvaa yhteen?

Newari · keskiviikkona klo 13:33

Ihan ilmaiseksi kuvia pääsee omalla raudalla piirtelemään.
Nopeiten vauhtiin pääsee Stability Matrixin avulla GitHub - LykosAI/StabilityMatrix: Multi-Platform Package Manager for Stable Diffusion
Tämä on asennushallinta jolla saa kätevästi kokeiltua useita eri front end paketteja stable diffusionille (ja muille avoimille malleille). Tuo Matrix siis hoitaa yhdellä klikkauksella dependencyt ja eri paketteja on helppo kokeilla ja vertailla.
Helpoin olisi fooocus
Eniten käytetty Automatic1111 <- tälle paljon ohjeita ja tukea, myös tuohon oman naaman käyttöön
Jos node graph -käyttöliittymä ei pelota ja kiinnostaa opetella miten homma toimii taustalla niin comfyUI <- tämä kaikista järein työkalu

itse käytän GitHub - Panchovix/stable-diffusion-webui-reForge joka on käytännössä A1111 paremmalla performancella (ja joskus ylimääräisillä bugeilla...) mutta tämä ei valitettavasti vielä löydy matrixista

emviiex · keskiviikkona klo 13:49

Tässä viimeinen oma testailu Udion 1.5:lla. Jollain olisi kiva pysyä tekeen pidempää videota kun tuo noisee tuntuu aika rupuiselta.

latee77 · keskiviikkona klo 19:25

Newari sanoi:
Ihan ilmaiseksi kuvia pääsee omalla raudalla piirtelemään.
Nopeiten vauhtiin pääsee Stability Matrixin avulla GitHub - LykosAI/StabilityMatrix: Multi-Platform Package Manager for Stable Diffusion
Tämä on asennushallinta jolla saa kätevästi kokeiltua useita eri front end paketteja stable diffusionille (ja muille avoimille malleille). Tuo Matrix siis hoitaa yhdellä klikkauksella dependencyt ja eri paketteja on helppo kokeilla ja vertailla.
Helpoin olisi fooocus
Eniten käytetty Automatic1111 <- tälle paljon ohjeita ja tukea, myös tuohon oman naaman käyttöön
Jos node graph -käyttöliittymä ei pelota ja kiinnostaa opetella miten homma toimii taustalla niin comfyUI <- tämä kaikista järein työkalu

itse käytän GitHub - Panchovix/stable-diffusion-webui-reForge joka on käytännössä A1111 paremmalla performancella (ja joskus ylimääräisillä bugeilla...) mutta tämä ei valitettavasti vielä löydy matrixista

Nopeesti testasin tuota Fooocusta, että ylipäätään toimii, ja toimiihan se.

Mihin tarviin tuota Stability Matrixia vai onko siis käyttöliittymä jolla voi käyttää esim. Foocusta ja Automatic1111 helpommin kuin noita erikseen?

Kiitti vinkeistä :thumbsup:

Newari · eilen klo 12:56

latee77 sanoi:
Mihin tarviin tuota Stability Matrixia vai onko siis käyttöliittymä jolla voi käyttää esim. Foocusta ja Automatic1111 helpommin kuin noita erikseen?

Matrixi on käytännössä kuin "launcher" näille kilkkeille. Sillä on helppo hallita käyttöliittymäpaketteja ja ladata malleja meta-datan kera. Lisäksi se linkittää kansiorakenteet automaagisesti niin että samaa malli-checkpointtia voi käyttää kaikissa käyttöliittymissä. Kaiken mitä Matrix tekee voi tehdä manuaalisesti itse, se vain helpottaa asioita.

Halpuuttaja · tänään klo 11:20

Stability AI:sta aiemmin tänä vuonna lähteneet SD 1.5:n, SDXL:n ja SD3:n pääkehittäjät perustivat uuden firman ja julkaisivat eilen Flux -nimisen kuvageneraattorin. Midjourney v6 tasoa ja varmaan ylikin.

Kuulemma toimii 12 Gt näyttikselläkin, mutta itellä on ahdasta on 32 gigalla keskusmuistia ja 24 gigalla vrammia. Kone menee välillä juntturaan kun keskusmuisti täyttyy ja swappaa page filen puolelta, etenkin promptia prosessoidessa, mutta kuvia pukkaa kyllä ulos:

r/StableDiffusion subreddit täytenään nättejä esimerkkikuvia.

Blogissa hieman enemmän tietoja:

Announcing Flux by Black Forest Labs: The Next Leap in Text-to-Image Models

Flux, the largest SOTA open source text-to-image model to date, developed by Black Forest Labs—the original team behind Stable Diffusion is now available on fal. Flux pushes the boundaries of creativity and performance with an impressive 12B parameters, delivering aesthetics reminiscent of...

blog.fal.ai

Infinity · tänään klo 11:33

Flux FP16 näyttää vievän 28GB VRAM... harmi kun noin lähellä, mutta niin kaukana 24GB korteille. FP8 menisi tietty hyvin.

Laatu kyllä hyvää tasoa, vielä jos saisivat lokaalin txt2vid ja img2vid samalle tasolle, niin oltaisiin hyvissä asetelmissa.

Halpuuttaja · 32 minuuttia sitten

Infinity sanoi:
Flux FP16 näyttää vievän 28GB VRAM... harmi kun noin lähellä, mutta niin kaukana 24GB korteille. FP8 menisi tietty hyvin.

Meinaatko tuota T5xxl enkooderia? Itse Flux näyttäisi mahtuvan kyllä pienempäänkin.

Testailen tässä SwarmUI:ta just ja kuvan rendaaminen 4090:llä 20 steppiä kestää n. 15 sekkaa ja käyttää maksimissaan vähän alle 20Gt VRAMia. Tiedä sitten puskeeko tämä jotenkin tuon Fluxin mallin 8-bittiseksi, mutta tällä hetkellä toimii paljon nopeemmin kuin ComfyUI. Comfyssakin itse Fluxin sampling stepit menee ihan kivaa vauhtia, selvästi yli 1it/s, mutta muut vaiheet ympärillä (tekstin enkoodaus ja VAE) hitaita. VRAM myös katossa Comfyssä.

(Vähän mietin että sainko vahingossa T5:n disabloitua tästä Swarmista, kun se rupesi downlodaamaan sitä uusiksi, niin otin vain vanhan T5-fp8 filun ja uudelleennimesin sen siksi minkänimistä Swarm kaipasi. Hyvää jälkeä tulee kyllä näinkin.)

edit: eiköhän tuo T5 toimi kun promptia seuraa hyvin tarkasti.

obese fisherman fly fishing while sitting on an eccentric avocado sofa on a red wooden raft floating on a lake in the finnish countryside, summer at noon

1250-obese fisherman fly fishing while sittin-flux1-dev-613775163-1.jpg

tosiaan 15sekkaa kestää tämä 20-steppinen ja kun vaihtaa promptia niin ei vie enempää aikaa. Ai että!

edit2: Swarmin doceista selviää että tosiaan pakkaa defaulttina mallin FP8 muotoon laatua heikentäen.

By default swarm will use fp8_e4m3fn for Flux, if you have a very very big GPU and want to use fp16/bf16, under Advanced Sampling edit Preferred DType

Tekoälyn luomaa taidetta.

Sallys

Optiset illuusiot

zamerok

Optiset illuusiot

Infinity

monster-labs/control_v1p_sd15_qrcode_monster · Hugging Face

David ":DA" Imodium

aneane

latee77

Newari

emviiex

Team Ford

latee77

Newari

Halpuuttaja

Announcing Flux by Black Forest Labs: The Next Leap in Text-to-Image Models

Infinity

Halpuuttaja

Uutiset

Uutisia lyhyesti

Uusimmat viestit

Statistiikka

Hinta.fi

Statistiikka