Tekoälyn luomaa taidetta.

  • Keskustelun aloittaja Keskustelun aloittaja Lager7
  • Aloitettu Aloitettu
Tässäpä Suno-tekoälyn tekemä biisi. Pikaisesti rustatut omat sanat biisissä. Tekoäly kertoo itsestään ja ehkäpä toiveistaan! ;)

BTW, aika hassu "flickki" tuossa biisin alussa, se yrittää laulaa puhemuotoon tarkoitun intron alkua! =D
Muutenhan tuo biisi on melkein laadultaan valmis radiosoittoon. Tarkalla korvalla kun kuuntelee, huomaa määräntynlaista "kihinää" soitinäänissä, joka tekoälyn artifaktia.

Joissakin kohti muuten pätkii tuosta Mikkosoftan mediasoittimesta johtuen, ei pätki sama video koneella yhtään!

Tässäpä OneDrive linkki (ei voinut laittaa suoraa toistinta näkymään tähän TechBBS:n foorumin puutteesta johtuen?):

 
Viimeksi muokattu:
Milläs ohjelmalla saa kuvista videoita?

Vai ihan Stable Diffusionille Mov2Mov ja ReActor?
 
Viimeksi muokattu:
Hunyuan T2V testailua, kerrassaan upea paikallisesti ajettava 13 miljardin parametrin videomalli.

Testasin ekaa kertaa myös äänen syntetisointia kokonaan MMAudiolla, tuo siis luo äänet klippiin riippuen, mitä siinä tapahtuu.



SDPA kanssa meno hyytyi 848x480 73 freimiin, nyt sain asennettua SageAttention2 lähdekoodista ja 4090 menohalut piisaa nippa nappa 960x544 97 freimin kohdalle. VRAM käyttö about 23GB virallisella fp8 Hunyuanilla näillä parametreillä. Tammikuussa pitäisi tulla Hunyuanin I2V malli, sitä kieli pitkällä odottaen.
 
Viisarikellossa minimiaika on 0:00:00 ja maksimi 11:59:59. Pyydä tekoälyä piirtämään kello, jossa viisarit osoittavat aikaa 0:03:00.
1737111582582.png
 
Tekoälyllä ei varmaan kauheasti piirretä muita kelloja kuin 10 yli 10, jos vaikka tekee googlella kuvahaun kellosta. (ja joo, ei absoluuttisesti noin, mutta suurinpiirtein samalta näyttää suuri osa generoinneista).
 
Mulla ei oo esim. Dallea mutta chatgpt ehdotti että:

A realistic analog clock face displaying the time 12:03, where the hour hand is slightly past the 12 o'clock mark and the minute hand points at the 3-minute mark. The clock face is circular with clear black numerals and tick marks, a white background, and simple black hands. The design is clean and minimalistic, resembling a classic wall clock. The setting is neutral, showing only the clock on a plain background, with no additional objects or distractions.

Tuleeko tuolla edes lähelle?
 
Mulla ei oo esim. Dallea mutta chatgpt ehdotti että:

A realistic analog clock face displaying the time 12:03, where the hour hand is slightly past the 12 o'clock mark and the minute hand points at the 3-minute mark. The clock face is circular with clear black numerals and tick marks, a white background, and simple black hands. The design is clean and minimalistic, resembling a classic wall clock. The setting is neutral, showing only the clock on a plain background, with no additional objects or distractions.

Tuleeko tuolla edes lähelle?

Ei (todennäköisesti), kokeilin jotain samansuuntaista, ei ymmärrä kellotaulun suunnista (juuri) mitään.
 
Mulla ei oo esim. Dallea mutta chatgpt ehdotti että:

A realistic analog clock face displaying the time 12:03, where the hour hand is slightly past the 12 o'clock mark and the minute hand points at the 3-minute mark. The clock face is circular with clear black numerals and tick marks, a white background, and simple black hands. The design is clean and minimalistic, resembling a classic wall clock. The setting is neutral, showing only the clock on a plain background, with no additional objects or distractions.

Tuleeko tuolla edes lähelle?
Tuolla pääsi niin neutraaliin tilanteeseen kuin mahdollista (eli viisarit 10 yli 10):
1737116776756.png


E: Nyt taisin kaivaa liian syvältä:

1737118021564.png
 
Viimeksi muokattu:
Ei se A.I edes tunnu ymmärtävän mikä on viisari, tai esim. hour hand. Yritin saada tehtyä kelloa missä ei ole tuntiviisaria mutta ei onnistu.
 
Kuitenkaan AI:lle ei tuottanut mitään ongelmia ilmaista tämän hetkistä aikaa. Tämä tuli ensimmäisellä promptilla:
1737130744338.png


Tietenkään tänään ei ole thuunantai, mutta ihan hyvä suoritus.
 
Jos epäilet olevasi itse tekoäly, koita piirtää kello ohjeiden mukaan. ;)

Moniko kokee elämänsä järkytyksen?

"That looks like nothing to me"
 
Tehkää vaikka joku geneerinen kuvahaku googleen niin vähintään puolet tuloksista on AI-generoituja. Menkää kivijalkakauppaan niin suurin osa halpistekstiileiden kuoseista on AI:n suunnittelemaa. Sama koskee verkkokaupoissa myytävää tavaraa kuten kännyköiden kuoria, ulkoasuissa esiintyy luonnottoman näköisiä mielikuvituseläimiä ja kasveja joita ei ole olemassa. Älypuhelinten taustakuvissa joita voi ladata sovelluskaupoista, esiintyy sama ilmiö. Tällä hetkellä pahin ongelma keskittyy kiinanrihkamaan, mutta AI:n helppous takaa että sen luomat tuotokset tulevat yleistymään ellei sitä mitenkään estetä. Ihminen on laiska ja mukavuudenhaluinen.

Tekoälyn luomalta "taiteelta" ei pääse pakoon mitenkään ja tulevaisuus ei enää ole pelkästään muovinen, vaan totaalisen keinotekoinen. Aitouden ja todellisuuden sekä epäaidon ja hallusinaatioiden välisestä erosta tulee häilyvä, ja tästähän Philip K. Dick kirjoitti huumehöyryissään paljonkin. AI-"taiteessa" on paljon samaa surrealistisuutta josta ei pääse eroon vaikka sormien lukumäärä osuisikin oikeaan.
 
Viimeksi muokattu:
Tehkää vaikka joku geneerinen kuvahaku googleen niin vähintään puolet tuloksista on AI-generoituja. Menkää kivijalkakauppaan niin suurin osa halpistekstiileiden kuoseista on AI:n suunnittelemaa. Sama koskee verkkokaupoissa myytävää tavaraa kuten kännyköiden kuoria, ulkoasuissa esiintyy luonnottoman näköisiä mielikuvituseläimiä ja kasveja joita ei ole olemassa. Älypuhelinten taustakuvissa joita voi ladata sovelluskaupoista, esiintyy sama ilmiö. Tällä hetkellä pahin ongelma keskittyy kiinanrihkamaan, mutta AI:n helppous takaa että sen luomat tuotokset tulevat yleistymään ellei sitä mitenkään estetä. Ihminen on laiska ja mukavuudenhaluinen.

Tekoälyn luomalta "taiteelta" ei pääse pakoon mitenkään ja tulevaisuus ei enää ole pelkästään muovinen, vaan totaalisen keinotekoinen. Aitouden ja todellisuuden sekä epäaidon ja hallusinaatioiden välisestä erosta tulee häilyvä, ja tästähän Philip K. Dick kirjoitti huumehöyryissään paljonkin. AI-"taiteessa" on paljon samaa surrealistisuutta josta ei pääse eroon vaikka sormien lukumäärä osuisikin oikeaan.
Levynkansissa nykyään helvetin yleistä myös tekoälyn käyttö. No joku buumi tässä tulee, arvaamaton sellainen. Jossain vaiheessa taas käsityö nostaa arvostusta.
 
Sunolla leikitty , pikkuhiljaa tajuaa miten tuota käsketään... omat lyriikat ja promptit hienosäätöineen...

 
Viimeksi muokattu:
Toihan on samanlainen kuin koittaa piirtää täysi lasi:

1739278985371.png
Wau, hyvä havainto! Näitä voisi olla hyvä kerätä jonnekkin keskitetysti (paperille lyijykynällä dokumentoiden) vielä kun on joitakin keinoja tunnistaa robotti.

Unohdin aiemmin kertoa, että vaikken onnistunut saamaan tekoälyä piirtämään kelloa kolmea yli 12, niin kolmea vaille onnistui ensimmäisellä promptilla:
1739281207850.png


Tämä jos mikä on osoitus siitä, että vaikkei tekoäly kaikkeen pystykään, niin vittuilla se ainakin osaa.
 
Mitä laitoit image promptiksi?

En muista enää, ehkä vain kellon ajan mutta tein niin että tallensin viisarin kuvan google kuvahausta, "masking" kellotaulun minuuttiviisarin, ja siihen päälle "inpaint" niin että on Image promptissa tarjolla kuvahaun minuuttiviisari. Ja Foocucsen advance asetuksista "mixin image prompt + inpaint".

Eli tuolla tavalla saa kuvan osaan täydennettyä / vaihdettua sisältöä, yhdistää promptia, kuva promptia maskatulle alueelle. Hieno ominaisuus jota ei (ilmeisesti) ole kuin muutamissa tekoälyohjelmissa noin helposti toteutettavissa.

Pitää olla myös "advanced image prompt" päällä, mutta kaikki tarvittavat asetukset saa tulille muutamalla valinnalla. Jos haluat tarkemmat ohjeet niin voin katella kotona kavakaappauksin.
 
Näitä varmaan yhdistää, että kevyesti 99.999999..% netissä olevista vesilasikuvista ei ole piripintaan täynnä. Sama ajatus muihin vaikeisiin.

Luulisi että piripintaisia shottilaseja ainakin löytyis koulutusmateriaalista :hmm:

Mutta nää on näitä neuroverkkojen hassutuksia, ei voi tietää miten se on sen tensorihimmelinsä kutonut...
 
Puolisen vuotta tuli luvatusti oltua erossa comfysta ja muista ja aika paljon testailtua tämän päivän juttuja ja olisikohan aika kypsä että omiin tarpeisiin olisi jotain jo valmiina. Kehitystä oli kyllä kiitettävästi, mutta jätin nyt vielä notebookit ja colabit hankkimatta, kun tuntuu että img2img puolella on vähän ollut tyhjäkäyntiä ja upscale toimii Topazin kanssa ilmankin ihan siedettävästi. Game changereita näköjään pulpahtelee ja katoaa edelleen kovalla tahdilla. This is HUGE! :D

Se aivoresurssien määrä mitä "parempiin animepilluihin" on investoitu, hämmentää kyllä edelleen tällaista tylsää ikäloppua :D... Hyvähän se vaan että on terveitä kiinnostuksen kohteita. Mielenkiinnolla jäädään seuraamaan mitä tulevaisuus tuo tullessaan.

Adobe on onneksi alkanut vähin äänin keskittyä tekoälyn yhdistämisen käytetyimpiin työkaluihinsa, mikä on hyvä. Se rämpiminen jonain kuvageneraatorina pelkästään omien ja vain omilta käyttäjiltä varastettujen kuvien kanssa herätti lähinnä myötähäpeää.

Luulisi että piripintaisia shottilaseja ainakin löytyis koulutusmateriaalista :hmm:

Mutta nää on näitä neuroverkkojen hassutuksia, ei voi tietää miten se on sen tensorihimmelinsä kutonut...

Heitin hassuttelun innoittamana haasteen photarille, mutta annoin pohjaksi oman kuvan että simuloisi vähän paremmin softan oikeaa käyttötarkoitusta. Piirsin rajat, että lisää sen tuohon mun tietokoneen päälle. Ensin suomeksi. Ei täysiä laseja, eikä tullut täyttä myöskään englanniksi (100% full, water surface level at the top jne.).
Screenshot 2025-03-16 022534.png
rajasin seuraavaksi yhdestä sen luomista tyhjistä laseista, ääriviivoja myötäillen alueen ja "full of water". Rajaukseen (vaaleanpunaisella) mahdutin mukaan vähän vettä vinkiksi, vaikka sen pitäisi luonnostaan analysoida kuvaa kokonaisuutena ja vain rajattua aluetta muuttaen (toimii käytännössä näin: maalaat esim rantahiekalle ympyrän ja pyydät rantapalloa. Ai funtsii pitkään ja progress bar etenee... aina virheilmoitukseen, että kuvassa on pornograafista materiaalia. Tapahtuu lähes aina jos kuvassa on vaikka bikinit tai muuta yhtä kovaksi pornoksi luokiteltavaa :cool:)
Screenshot 2025-03-16 025110.png
Ja tulos:
Screenshot 2025-03-16 024537.png
:facepalm: ei helvetti :D

Selvästi tiesi rajauksesta ja muodosta että mitä pyydetään ja pakko totella... ei vaan ilmeisesti ole ikinä nähnyt täpötäyttä vesilasia adobe stockissa. Ratkaisu on sitten epätoivoisesti ottaa pala tuollaisesta pisarakuvasta, joita varmasti jokainen on nähnyt taustakuvina yms. Ja sitten lätkäistä se sellaisenaan, käsi pystyyn ja "valmis!". Ei vaivautunut matchaamaan edes väriä tms.

Antamalla referenssiksi googlen kuvauhaulla tms kaivetun kuvan 100% täydestä lasista, niin olisi varmaan onnistunut. Käytännössä kuitenkin pääsee nopeammin tekemällä kokonaan ite ja ilman epävarmuutta siitä että onnistuukohan se siltikään.
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
271 368
Viestejä
4 691 224
Jäsenet
76 750
Uusin jäsen
misa404

Hinta.fi

Back
Ylös Bottom