Tekoälyn luomaa taidetta.

  • Keskustelun aloittaja Keskustelun aloittaja Lager7
  • Aloitettu Aloitettu
Tuonne optinen illuusia ketjuun postaillaan noita AI:llä tehtyjä piilokuvia. Osaatteko sanoa mikä ohjelma kyseessä? Sormet ja muut menee ihan minne sattuu.

 
Tuonne optinen illuusia ketjuun postaillaan noita AI:llä tehtyjä piilokuvia. Osaatteko sanoa mikä ohjelma kyseessä? Sormet ja muut menee ihan minne sattuu.

Veikkaisin stable diffusionia controlnetillä käytettynä (tai vastaavaa). Controlnetillä voi antaa "ohjeistuskuvan" jota se noudattaa annettujen parametrien myötä.
 
QR monster controlnet kokeilua, muutama piilotettu teksti. Pikkukuvasta näkee selkeästi, täysikokoisena täytyy hiukan siristää silmiä tai katsoa kauempaa. :)

00023-2298960164.jpg

00042-3009562135.jpg
Sama QR monster controlnet todennäköisesti.

 
Udio | AI Music Generator - Official Website
Udio päivittynyt versioon v1.5
  • Improved Audio Quality
  • Key control
  • Improved global language results
  • Dedicated creation page
  • Stem downloads
  • Audio to audio (remixing audio uploads)
  • Shareable lyric videos
Räpellystä ja testausta v1.5 versiolla:
Udio-130 2min10s yhdellä vedolla


Audio to audio



 
Viimeksi muokattu:
Mikäs olisi nyt hyvä ohjelma jos haluaa kokeilla tehdä ”taidetta” tai toisin sanoin testailla / pelleillä mitä AI luo?

Maksullisia lienevät toki. Löytyykö esimerkiksi siihen osaavaa ohjelmaa jos haluaa oman naamansa ja teettää siihen taustat, maisemat tai liittää kaksi kuvaa yhteen?
 
Ihan ilmaiseksi kuvia pääsee omalla raudalla piirtelemään.
Nopeiten vauhtiin pääsee Stability Matrixin avulla GitHub - LykosAI/StabilityMatrix: Multi-Platform Package Manager for Stable Diffusion
Tämä on asennushallinta jolla saa kätevästi kokeiltua useita eri front end paketteja stable diffusionille (ja muille avoimille malleille). Tuo Matrix siis hoitaa yhdellä klikkauksella dependencyt ja eri paketteja on helppo kokeilla ja vertailla.
Helpoin olisi fooocus
Eniten käytetty Automatic1111 <- tälle paljon ohjeita ja tukea, myös tuohon oman naaman käyttöön
Jos node graph -käyttöliittymä ei pelota ja kiinnostaa opetella miten homma toimii taustalla niin comfyUI <- tämä kaikista järein työkalu

itse käytän GitHub - Panchovix/stable-diffusion-webui-reForge joka on käytännössä A1111 paremmalla performancella (ja joskus ylimääräisillä bugeilla...) mutta tämä ei valitettavasti vielä löydy matrixista
 
Tässä viimeinen oma testailu Udion 1.5:lla. Jollain olisi kiva pysyä tekeen pidempää videota kun tuo noisee tuntuu aika rupuiselta.

 
Ihan ilmaiseksi kuvia pääsee omalla raudalla piirtelemään.
Nopeiten vauhtiin pääsee Stability Matrixin avulla GitHub - LykosAI/StabilityMatrix: Multi-Platform Package Manager for Stable Diffusion
Tämä on asennushallinta jolla saa kätevästi kokeiltua useita eri front end paketteja stable diffusionille (ja muille avoimille malleille). Tuo Matrix siis hoitaa yhdellä klikkauksella dependencyt ja eri paketteja on helppo kokeilla ja vertailla.
Helpoin olisi fooocus
Eniten käytetty Automatic1111 <- tälle paljon ohjeita ja tukea, myös tuohon oman naaman käyttöön
Jos node graph -käyttöliittymä ei pelota ja kiinnostaa opetella miten homma toimii taustalla niin comfyUI <- tämä kaikista järein työkalu

itse käytän GitHub - Panchovix/stable-diffusion-webui-reForge joka on käytännössä A1111 paremmalla performancella (ja joskus ylimääräisillä bugeilla...) mutta tämä ei valitettavasti vielä löydy matrixista

Nopeesti testasin tuota Fooocusta, että ylipäätään toimii, ja toimiihan se.

Mihin tarviin tuota Stability Matrixia vai onko siis käyttöliittymä jolla voi käyttää esim. Foocusta ja Automatic1111 helpommin kuin noita erikseen?

Kiitti vinkeistä :thumbsup:
 
Mihin tarviin tuota Stability Matrixia vai onko siis käyttöliittymä jolla voi käyttää esim. Foocusta ja Automatic1111 helpommin kuin noita erikseen?
Matrixi on käytännössä kuin "launcher" näille kilkkeille. Sillä on helppo hallita käyttöliittymäpaketteja ja ladata malleja meta-datan kera. Lisäksi se linkittää kansiorakenteet automaagisesti niin että samaa malli-checkpointtia voi käyttää kaikissa käyttöliittymissä. Kaiken mitä Matrix tekee voi tehdä manuaalisesti itse, se vain helpottaa asioita.
 
Stability AI:sta aiemmin tänä vuonna lähteneet SD 1.5:n, SDXL:n ja SD3:n pääkehittäjät perustivat uuden firman ja julkaisivat eilen Flux -nimisen kuvageneraattorin. Midjourney v6 tasoa ja varmaan ylikin.

Kuulemma toimii 12 Gt näyttikselläkin, mutta itellä on ahdasta on 32 gigalla keskusmuistia ja 24 gigalla vrammia. Kone menee välillä juntturaan kun keskusmuisti täyttyy ja swappaa page filen puolelta, etenkin promptia prosessoidessa, mutta kuvia pukkaa kyllä ulos:

ComfyUI_00651_.png


r/StableDiffusion subreddit täytenään nättejä esimerkkikuvia.

Blogissa hieman enemmän tietoja:
 
Flux FP16 näyttää vievän 28GB VRAM... harmi kun noin lähellä, mutta niin kaukana 24GB korteille. FP8 menisi tietty hyvin.

Laatu kyllä hyvää tasoa, vielä jos saisivat lokaalin txt2vid ja img2vid samalle tasolle, niin oltaisiin hyvissä asetelmissa.
 
Flux FP16 näyttää vievän 28GB VRAM... harmi kun noin lähellä, mutta niin kaukana 24GB korteille. FP8 menisi tietty hyvin.
Meinaatko tuota T5xxl enkooderia? Itse Flux näyttäisi mahtuvan kyllä pienempäänkin.

Testailen tässä SwarmUI:ta just ja kuvan rendaaminen 4090:llä 20 steppiä kestää n. 15 sekkaa ja käyttää maksimissaan vähän alle 20Gt VRAMia. Tiedä sitten puskeeko tämä jotenkin tuon Fluxin mallin 8-bittiseksi, mutta tällä hetkellä toimii paljon nopeemmin kuin ComfyUI. Comfyssakin itse Fluxin sampling stepit menee ihan kivaa vauhtia, selvästi yli 1it/s, mutta muut vaiheet ympärillä (tekstin enkoodaus ja VAE) hitaita. VRAM myös katossa Comfyssä.

(Vähän mietin että sainko vahingossa T5:n disabloitua tästä Swarmista, kun se rupesi downlodaamaan sitä uusiksi, niin otin vain vanhan T5-fp8 filun ja uudelleennimesin sen siksi minkänimistä Swarm kaipasi. Hyvää jälkeä tulee kyllä näinkin.)

edit: eiköhän tuo T5 toimi kun promptia seuraa hyvin tarkasti.

obese fisherman fly fishing while sitting on an eccentric avocado sofa on a red wooden raft floating on a lake in the finnish countryside, summer at noon

1250-obese fisherman fly fishing while sittin-flux1-dev-613775163-1.jpg


tosiaan 15sekkaa kestää tämä 20-steppinen ja kun vaihtaa promptia niin ei vie enempää aikaa. Ai että!

edit2: Swarmin doceista selviää että tosiaan pakkaa defaulttina mallin FP8 muotoon laatua heikentäen.

By default swarm will use fp8_e4m3fn for Flux, if you have a very very big GPU and want to use fp16/bf16, under Advanced Sampling edit Preferred DType
 
Viimeksi muokattu:
Eikö tämäkin nyt ole jo melkein sellainen, jonka pystyisi hyvä myyntimies myymään suoraan pelistudiolle?


What kind of computer game Stephen King would create?


If Stephen King were to create a computer game, it would likely be a narrative-driven, atmospheric horror experience with deep psychological elements, unexpected twists, and a focus on character development. Here’s a more detailed vision of what such a game might look like:
1. Story-Driven with Complex Characters
  • Narrative Focus: The game would have a rich, multi-layered story, similar to King’s novels. The plot would likely involve ordinary people encountering something terrifyingly supernatural or deeply unsettling in their small, seemingly peaceful town.
  • Character Depth: Characters would be well-developed with detailed backstories, making players invested in their fates. The game might explore themes of trauma, guilt, and the human psyche, with characters that are relatable but flawed.
2. Atmospheric Horror
  • Eerie Setting: The game would feature a setting that feels alive and menacing—perhaps a dilapidated mansion, a haunted small town, or a secluded location with a dark history. The environment itself would play a crucial role in creating tension, with every shadow, creak, and whisper adding to the unease.
  • Psychological Tension: Rather than relying solely on jump scares, the game would build suspense through atmosphere, foreshadowing, and slow-burn horror. It would tap into the fear of the unknown, the unseen, and the uncontrollable.
3. Choice and Consequence
  • Moral Dilemmas: The game could involve choices that impact the story’s outcome, forcing players to make difficult decisions. These choices might reflect classic King themes like the battle between good and evil, or the corrupting influence of power and fear.
  • Multiple Endings: Given King’s penchant for complex narratives, the game might have multiple endings, each depending on the player's actions throughout the game. Some endings could be tragic, some redemptive, and others deeply unsettling, leaving players questioning their choices.
4. Supernatural Elements
  • Unexplained Phenomena: The game would likely include supernatural elements that defy logic, much like in King’s stories. These could be malevolent spirits, cursed objects, or otherworldly entities that lurk in the dark.
  • Psychic Abilities or Curses: The protagonist might possess (or be cursed with) a supernatural ability, such as telepathy, precognition, or the ability to see the dead, which would play a key role in solving the game’s central mystery.
5. Creepy, Ambiguous Villain
  • Human and Supernatural Villains: The game might feature a mix of human antagonists and supernatural threats. The human villains could be deeply disturbed individuals with dark secrets, while the supernatural elements could represent ancient, malevolent forces.
  • Ambiguous Morality: King’s villains often have ambiguous motivations, sometimes acting out of a twisted sense of justice or survival. This complexity would translate well into a game, where players might question who the true antagonist is.
6. Immersive and Reactive Environment
  • Dynamic World: The environment might change based on the player’s actions or the progression of the story. For example, a once-familiar setting could become increasingly distorted as the player delves deeper into the mystery.
  • Interactive Elements: Players could interact with various objects, read documents, or listen to tapes that reveal pieces of the story, similar to how King often weaves multiple narratives together in his books.
7. Creeping Sense of Dread
  • Slow-Burn Horror: The game would likely build horror gradually, drawing players into a false sense of security before unraveling the terror. This pacing would keep players constantly on edge, unsure of when the next scare or twist might occur.
  • Themes of Isolation and Madness: The game might explore themes of isolation, paranoia, and the breakdown of reality—classic King motifs that would translate effectively into a video game format.
Overall, a Stephen King computer game would be a deeply immersive, unsettling experience that blends psychological horror, supernatural elements, and a gripping, character-driven narrative. It would leave players haunted long after they’ve put down the controller, much like King’s novels do.



What would be story of such a game?


Game Title: "Whispering Pines"
Story Overview:

In the isolated town of Whispering Pines, Maine, a dark presence stirs beneath the surface of everyday life. Once a thriving logging community, the town has withered into obscurity, its population dwindling as people slowly drift away—or disappear altogether. You play as Evelyn Bennett, a once-prominent investigative journalist who, after a personal tragedy, retreats to Whispering Pines to reconnect with her roots and find solace. However, what she discovers is far from peace: the town is haunted by an ancient, malevolent force that feeds on the fears and secrets of its residents.
Act 1: The Return
  • Prologue: Evelyn arrives in Whispering Pines after the mysterious death of her sister, Margaret, who was the town’s librarian. Margaret’s death was ruled a suicide, but Evelyn, unconvinced, begins to investigate. She stays in her family’s old, creaky house, where Margaret had lived alone for the past decade.
  • Exploration: Evelyn starts exploring the town, reconnecting with old acquaintances who have become strange and reclusive. The town itself feels off—streets seem to change, shadows move where they shouldn’t, and there’s a pervasive sense of being watched. Through her investigation, Evelyn discovers that Margaret had been researching the town’s history, particularly a series of unexplained disappearances dating back over a century.
Act 2: Uncovering the Past
  • The Haunting: As Evelyn delves deeper, she begins to experience vivid, terrifying visions and dreams that blur the line between reality and nightmare. She starts finding eerie messages and symbols that suggest someone—or something—is guiding her. The town’s residents become increasingly hostile, and Evelyn encounters ghostly apparitions tied to the town’s dark history.
  • The Legend: Evelyn learns of an ancient legend surrounding the town’s founding: a malevolent entity known as “The Whisperer” was said to have been sealed away by the town’s founders, who made a pact to keep the entity’s existence a secret. The entity feeds on fear and can manipulate reality, drawing power from the town’s collective anxiety and hidden sins.
  • Unseen Forces: Evelyn begins to piece together that the entity is trying to break free, using the townsfolk as pawns. The closer she gets to the truth, the more the entity tries to manipulate her—distorting her perception, warping the environment, and turning even familiar faces against her. Evelyn finds a journal left by Margaret that hints at a ritual to re-bind the entity, but it requires knowledge and relics scattered across the town.
Act 3: Descent into Madness
  • The Fractured Mind: As the entity tightens its grip, Evelyn’s sanity is pushed to the brink. The game shifts to a more psychological horror focus, with the line between reality and hallucination becoming increasingly blurred. Evelyn faces nightmarish versions of the townspeople and confronts her own guilt over her sister’s death.
  • The Gathering Storm: Evelyn discovers that the entity has been manipulating events in Whispering Pines for decades, pushing the town towards its current state of despair. It turns out that some townspeople are aware of the entity and have formed a secretive cult dedicated to appeasing it, believing that only through sacrifice can they keep it at bay.
  • The Sacrifice: Evelyn learns the shocking truth that her sister was killed by the cult, who believed that Margaret’s research threatened to expose them and unleash the entity. The final part of the ritual to bind the entity requires a personal sacrifice, forcing Evelyn to confront her deepest fears and make a harrowing choice.
Act 4: The Final Confrontation
  • The Ritual: Evelyn gathers the necessary relics and information to perform the ritual, but the entity, now at full strength, plunges the town into a nightmarish reality. The game’s final chapters are a desperate race against time as Evelyn navigates a twisted version of Whispering Pines, facing manifestations of the entity and its cult.
  • The Choice: In the climax, Evelyn reaches the heart of the town—a forgotten, cursed site in the woods where the entity was originally bound. Here, she must make a choice: sacrifice herself to seal the entity permanently, or attempt to destroy it, risking unleashing its full wrath upon the world.
  • Multiple Endings:
    • Sacrifice Ending: Evelyn sacrifices herself, successfully binding the entity but at the cost of her life. The town slowly returns to normal, but the few remaining residents are left with a deep, unsettling sense of something lost.
    • Destruction Ending: Evelyn attempts to destroy the entity, leading to a cataclysmic battle. If successful, the entity is obliterated, but Whispering Pines is left in ruins, and Evelyn is forever changed, haunted by what she has unleashed.
    • Corruption Ending: Evelyn is unable to complete the ritual, succumbing to the entity’s influence. The entity is freed, and the game ends with a chilling scene of Whispering Pines being swallowed by darkness, with Evelyn’s final fate left ambiguous.
Themes and Atmosphere:
  • Themes: The game would explore themes of guilt, grief, the impact of past sins, and the nature of fear. The player would constantly question what is real and what is illusion, mirroring Evelyn’s descent into uncertainty.
  • Atmosphere: The game would be thick with a sense of dread, using the environment, sound design, and subtle visual cues to create an immersive experience. The town of Whispering Pines itself would be a character, its changing, labyrinthine streets reflecting the entity’s growing power.
Conclusion:
"Whispering Pines" would be a chilling, narrative-driven horror game that captures the essence of Stephen King’s storytelling. It would blend psychological horror, supernatural elements, and a deeply personal story, leaving players both terrified and emotionally moved by the time the credits roll.
 
Stability Matrixiin latasin Foocucsen jolla hiukan pelleillyt, mutta Stable Diffusion Web UI ei ota käynnistyäkseen, onkohan jostain Nvidian ajureista kiinni tms?

Näyttökuva 2024-08-03 104116.png


Stable Diffusionille löytyisi laajennuksista ladattavaaksi, esim tuo Automatic1111, Reactor ja Mov2mov joita vois kokeilla. Mutta koko roska ei aukea. Vai olenko hakoteillä?

Foocucsella faceswap ei oikein toimi, muokkaa kasvoja liikaa. Tai Inpaintin kautta jos laamaa kaiken muun kuin kasvot niin jättää ne muokkaamatta mutta taustaa arpoo miten sattuu.
 
En tiedä mitä masinointia, mutta Saksan single chart top 100 listalla sijalla 48 tekoälygeneroitu rallatus:
Butterbro - Verknallt in einen Talahon (feat. udio .com
AI-generated song charts in Germany, amid controversy

Last week's fair was wild in a different way
I chilled with the Chayas on the bumper car
Then I recognized a Talahon from the distance
With pages at zero and vape in hand
He has a thick shell and seems really hard
But he asks every guy if he has any problems

I think I have a crush on a Talahon
With Louis belt, Gucci cap and Air Max shoes
He does shadow boxing and is the coolest of his bros
And the knife in your pocket is definitely not just for bread and butter

Between letters from court he picks up banknotes
And treats all his bros to thirst quenchers
This is the man for life, yes
Because the first date, bro, was a hookah bar
He says he'll buy me the whole world
And you don’t even need citizen’s money for it
He definitely earns his para normally
By normal I mean illegal by default

He lives dangerously, what do you know?
Not everyone with the style is a Talahon

I think I have a crush on a Talahon
With Louis belt, Gucci cap and Air Max shoes
He does shadow boxing and is the coolest of his bros
And the knife in your pocket is definitely not just for bread and butter

I'll be honest, I've never had such a crush before
It smells like a complete perfumery
Of all the perfumes, you smell his the most
Because he treats himself to half a bottle of Dior Sauvage on the one
This is the man for life, that's crystal clear
When he gets angry, he's sweet as baklava

I think I have a crush on a Talahon
With Louis belt, Gucci cap and Air Max shoes
He does shadow boxing and is the coolest of his bros
And the knife in your pocket is definitely not just for bread and butter

The Kuzengs are about to go outside, shortly after sunset
But first I'll butter him up with a knife
 
Viimeksi muokattu:
Jaaha, taas amatöörimäinen ongelma. Olisin C-Asema / käyttäjät / minä /appdata jne jne poistellut Foocucsella luodut kuvat kun halutut ovat tallessa, mutta tuota appdata kansiota ei löydy "minä" kohdan alta. Täppäsin ominaisuuksista "piilotettu" päälle ja hävitti myös koko Stability Matrixin työpöydältä. Kun laitoin sen pois päältä niin SM tuli takaisin työpöydälle mutta nyt ei aukea Foocus enää vaan herjaa "access to the path /plaaplaa/ is denied". Myös C aseman "minä" kansio hävisi, vain "julkinen" näkyy.

Poistiko tuo piilota -täppä nyt kansion...

En uskaltanut asentaa uudelleen Foocusta vielä kun varoittaa että hävittää kaikki tekeleet jne. Tosin osan olen tallettanut toiselle asemalle joten eikai niitä pääse tuhoamaan?

Saattaisi olla Windows ketju kyllä parempi tälle probleemalle.
 
Kuulemma toimii 12 Gt näyttikselläkin, mutta itellä on ahdasta on 32 gigalla keskusmuistia ja 24 gigalla vrammia. Kone menee välillä juntturaan kun keskusmuisti täyttyy ja swappaa page filen puolelta, etenkin promptia prosessoidessa

Mulla oli myös tuota 100 % RAM -> 100 % SSD swappailua vielä hetki sitten samoilla 32GB+24GB specseillä, mutta korjaantui kun kävin lataamassa kokonaan uuden ComfyUI (portable).
 
Jaaha, taas amatöörimäinen ongelma. Olisin C-Asema / käyttäjät / minä /appdata jne jne poistellut Foocucsella luodut kuvat kun halutut ovat tallessa, mutta tuota appdata kansiota ei löydy "minä" kohdan alta. Täppäsin ominaisuuksista "piilotettu" päälle ja hävitti myös koko Stability Matrixin työpöydältä. Kun laitoin sen pois päältä niin SM tuli takaisin työpöydälle mutta nyt ei aukea Foocus enää vaan herjaa "access to the path /plaaplaa/ is denied". Myös C aseman "minä" kansio hävisi, vain "julkinen" näkyy.

Poistiko tuo piilota -täppä nyt kansion...

En uskaltanut asentaa uudelleen Foocusta vielä kun varoittaa että hävittää kaikki tekeleet jne. Tosin osan olen tallettanut toiselle asemalle joten eikai niitä pääse tuhoamaan?

Saattaisi olla Windows ketju kyllä parempi tälle probleemalle.

Jaahas, syy löytyi, piti vaan eri paikasta kansiota laittaa "näytä piilotetut" ja sitten harmaana olevasta näkyvästä "piilota" täppä pois niin toimii taas. Tuo siis ei pelkästään piilottanut kasniota näkyvistä vaan myös esti käytön.

Nyt näkyy itseasiassa myös Appdata kansiot jonka alla Stability Matrix ja fooocus. Jos deletoin sieltä turhat kuvat niin varmaan jättää erikseen tallennetut toiseen kansioon.

Mutta osaako Fooocus yms. hyödyntää noita aikaisempia kuvia?

Eikai se mitään omia tuotoksia pidä muiden luomille kuville lähteenä tms?
 
Vähänkö on erijälkeä noissa kun mun Foocus testailuissa :D Taitaa Flux olla kova juttu nyt.

Saitteko nuo aikaan ihan promptaamalla ohjeita ja testailemalla tyylejä jne. vai pitikö yhtä kuvaa useammin muokata / jalostaa?
 
Vähänkö on erijälkeä noissa kun mun Foocus testailuissa :D Taitaa Flux olla kova juttu nyt.

Saitteko nuo aikaan ihan promptaamalla ohjeita ja testailemalla tyylejä jne. vai pitikö yhtä kuvaa useammin muokata / jalostaa?

Kaikki yhden tai kahden lauseen promptilla, En kovin syvällisesti testaillut vielä.
 
Vähänkö on erijälkeä noissa kun mun Foocus testailuissa :D Taitaa Flux olla kova juttu nyt.

Saitteko nuo aikaan ihan promptaamalla ohjeita ja testailemalla tyylejä jne. vai pitikö yhtä kuvaa useammin muokata / jalostaa?
Leijonakuvat tuli kolmen kuvan ryppäästä josta valitsin kaksi parempaa, ei noita hirveesti tarvi tuunailla jälkikäteen kunhan kirjoittaa promptin kunnolla niin tulee iha hyvää jälkeä. Eikä edes välttis tarvi kirjottaa promptia kunnolla nii osaa tuottaa hyvää jälkeä mutta ympäristö ja muut yksityiskohdat jää sitten noppien varaan.
 
Aikalailla laadukkaampaa jälkeä tekee kuin Foocus.

Fluxissa varmaan kans inpaint vastaavia ominaisuuksia, jos osaisi tuolla laadulla yhdistellä tai muokata kuvaa.
 
Fluxissa varmaan kans inpaint vastaavia ominaisuuksia, jos osaisi tuolla laadulla yhdistellä tai muokata kuvaa.
Flux on perusmalli eikä itsessään tarjoa noita inpaint hommia ym. Noi saadaan kunnolla toimimaan lisämalleilla, jollaisia SDXL:ään on ehtinyt tulla jo paljon ja niitä myös Fooocus hyödyntää inpaintissaan ja muissa advanced tabin hommissa joissa käytetään input-kuvaa hyödyksi.

Tyyliä muokkaavia ja henkilöitä lisääviä LoRA malleja Fluxiin on jo, mutta nämä monimutkaisemmat Contolnet (syvyyskartta ym. input kuvasta), IP-adapter (tyyli input kuvasta) ja inpaint projektit on vasta alkutaipaleella.

Eli toistaiseksi perusjutut vain, teksti promptit ja image-to-image (lisätään kohinaa input kuvan päälle, jolloin sen värimaailmaa jää enemmän tai vähemmän jäljelle).
 
Flux on perusmalli eikä itsessään tarjoa noita inpaint hommia ym. Noi saadaan kunnolla toimimaan lisämalleilla, jollaisia SDXL:ään on ehtinyt tulla jo paljon ja niitä myös Fooocus hyödyntää inpaintissaan ja muissa advanced tabin hommissa joissa käytetään input-kuvaa hyödyksi.

Tyyliä muokkaavia ja henkilöitä lisääviä LoRA malleja Fluxiin on jo, mutta nämä monimutkaisemmat Contolnet (syvyyskartta ym. input kuvasta), IP-adapter (tyyli input kuvasta) ja inpaint projektit on vasta alkutaipaleella.

Eli toistaiseksi perusjutut vain, teksti promptit ja image-to-image (lisätään kohinaa input kuvan päälle, jolloin sen värimaailmaa jää enemmän tai vähemmän jäljelle).

Okei, kiitti valaistuksesta :thumbsup: Nyt en pääse koneelle, mutta oliko tuo Flux oma juttunsa vai saiko startattua Stability Matrixin kautta :hmm:Ei taida sieltä saada, niin olisko jollain linkittää luotettavaa latauslinkkiä Fluxille?
 
Okei, kiitti valaistuksesta :thumbsup: Nyt en pääse koneelle, mutta oliko tuo Flux oma juttunsa vai saiko startattua Stability Matrixin kautta :hmm:Ei taida sieltä saada, niin olisko jollain linkittää luotettavaa latauslinkkiä Fluxille?

Stability matrixin päivittämisen (Settings -> updates -> v2.11.8) jälkeen onnistuu Fluxin lataaminen sillä. (Myös Comfy kannattanee päivittää)
 
Oliko muuten olemassa / suositella jotain "promptaus" sivustoja jossa valmiita esimerkkejä mitä vois sitten muokata itelleen sopiviksi? Ei välttämättä tule mieleen mitä kaikkea voi kuvanmuokkaukseen pyytää mausteeksi, esim. Bokeh efektiä jne.
 
Oliko muuten olemassa / suositella jotain "promptaus" sivustoja jossa valmiita esimerkkejä mitä vois sitten muokata itelleen sopiviksi? Ei välttämättä tule mieleen mitä kaikkea voi kuvanmuokkaukseen pyytää mausteeksi, esim. Bokeh efektiä jne.

Sinänsä hupaisa vastaus, mutta kysäise ChatGPT:ltä xD


Bokeh Effects:
“with a creamy bokeh background”
“featuring a soft, circular bokeh”
“with a dreamy bokeh effect in the background”
“highlighting a sharp subject with a blurred bokeh backdrop”

Aperture Settings:
“shot at f/1.8 for a shallow depth of field”
“captured with an aperture of f/2.8 for moderate background blur”
“using a narrow aperture of f/16 for a deep depth of field”
“with an aperture of f/4 for balanced sharpness and blur”

Lighting Conditions:
“in golden hour lighting”
“under soft, diffused light”
“with dramatic, high-contrast lighting”
“in low light with a warm glow”

Composition and Framing:
“with a rule of thirds composition”
“featuring leading lines towards the subject”
“with a centered composition”
“using a wide-angle perspective”

Color and Tone:
“in vibrant, saturated colors”
“with a muted, pastel color palette”
“in black and white with high contrast”
“with a vintage, sepia tone”

Subject and Scene:
“a portrait of a person with a blurred cityscape background”
“a landscape with a sharp foreground and blurred mountains”
“a close-up of a flower with a soft-focus background”
“an action shot with motion blur”
 
Sinänsä hupaisa vastaus, mutta kysäise ChatGPT:ltä xD


Bokeh Effects:
“with a creamy bokeh background”
“featuring a soft, circular bokeh”
“with a dreamy bokeh effect in the background”
“highlighting a sharp subject with a blurred bokeh backdrop”

Aperture Settings:
“shot at f/1.8 for a shallow depth of field”
“captured with an aperture of f/2.8 for moderate background blur”
“using a narrow aperture of f/16 for a deep depth of field”
“with an aperture of f/4 for balanced sharpness and blur”

Lighting Conditions:
“in golden hour lighting”
“under soft, diffused light”
“with dramatic, high-contrast lighting”
“in low light with a warm glow”

Composition and Framing:
“with a rule of thirds composition”
“featuring leading lines towards the subject”
“with a centered composition”
“using a wide-angle perspective”

Color and Tone:
“in vibrant, saturated colors”
“with a muted, pastel color palette”
“in black and white with high contrast”
“with a vintage, sepia tone”

Subject and Scene:
“a portrait of a person with a blurred cityscape background”
“a landscape with a sharp foreground and blurred mountains”
“a close-up of a flower with a soft-focus background”
“an action shot with motion blur”

Joo no siinähän niitä toimivia käskyjä onkin, tietää vähän mitä voi pyytää :thumbsup:
 
Oliko muuten olemassa / suositella jotain "promptaus" sivustoja jossa valmiita esimerkkejä mitä vois sitten muokata itelleen sopiviksi? Ei välttämättä tule mieleen mitä kaikkea voi kuvanmuokkaukseen pyytää mausteeksi, esim. Bokeh efektiä jne.

Tuolta ainakin löytyy kaikenlaisia kuvia (kaikenlaista mitä ei ois tarvinnut nähdäkään ku otin nudity filtterit pois päältä :smoke: )
 
Ihan ilmaiseksi kuvia pääsee omalla raudalla piirtelemään.
Nopeiten vauhtiin pääsee Stability Matrixin avulla GitHub - LykosAI/StabilityMatrix: Multi-Platform Package Manager for Stable Diffusion
Tämä on asennushallinta jolla saa kätevästi kokeiltua useita eri front end paketteja stable diffusionille (ja muille avoimille malleille). Tuo Matrix siis hoitaa yhdellä klikkauksella dependencyt ja eri paketteja on helppo kokeilla ja vertailla.
Helpoin olisi fooocus
Eniten käytetty Automatic1111 <- tälle paljon ohjeita ja tukea, myös tuohon oman naaman käyttöön
Jos node graph -käyttöliittymä ei pelota ja kiinnostaa opetella miten homma toimii taustalla niin comfyUI <- tämä kaikista järein työkalu

itse käytän GitHub - Panchovix/stable-diffusion-webui-reForge joka on käytännössä A1111 paremmalla performancella (ja joskus ylimääräisillä bugeilla...) mutta tämä ei valitettavasti vielä löydy matrixista
Olipa iso pettymys kun pitkän taistelun jälkeen oli pakko todeta ettei AMD pohjainsella raudalla saa toimimaan ainakaan windowsin kanssa. Onko jotain muita vaihtoehtoja, vai onko pakko alkaa tekemään dual boottia?
 
Olipa iso pettymys kun pitkän taistelun jälkeen oli pakko todeta ettei AMD pohjainsella raudalla saa toimimaan ainakaan windowsin kanssa. Onko jotain muita vaihtoehtoja, vai onko pakko alkaa tekemään dual boottia?
Nähtävästi toi AMD:n oma (vai onko sponssaama, en tiedä) softa on juuri lisännyt FLUX tuen. 24 gigaa VRAMia vaatii eli vain 7900XTX tai joku pro-kortti.

 
Olipa iso pettymys kun pitkän taistelun jälkeen oli pakko todeta ettei AMD pohjainsella raudalla saa toimimaan ainakaan windowsin kanssa. Onko jotain muita vaihtoehtoja, vai onko pakko alkaa tekemään dual boottia?

Kyllä ainakin stable diffusionin sai toimimaan amd:llakin, kun aikanaan sitä säädin. Tosin ehkä jäi auki, että oliko tarkoitus saada jotain vai juuri tuo Stability Matrix toimimaan.

Listataan tämäkin, mutta tuohon ylle äsken pamahtanut linkki näyttää lupaavalta.

Saattoi olla tämä: GitHub - lshqqytiger/stable-diffusion-webui-amdgpu: Stable Diffusion web UI
 
Tässä AI musiikivideo jonka sain tehtyä! Tähän käytin Stable diffusionia, Comfya, Luma dream machinea ja Klingiä. Vielä tarvitaan pientä opiskelua & kokeilua että saan tehtyä kaikki paremmin. Etenkin perhonen oli tosi haastava animoida.

 
Junia
 

Liitteet

  • Old Steamtrain Desinged Devil Himself, Red And Bla (1).png
    Old Steamtrain Desinged Devil Himself, Red And Bla (1).png
    2,6 MB · Luettu: 85
  • Ols Steamtrain Desinged Devil Himself, Red And Bla.png
    Ols Steamtrain Desinged Devil Himself, Red And Bla.png
    1,5 MB · Luettu: 83
Taas tuli Udiolla räpelleltyä biisi joka ainakin omasta mielestä on ihan kuunneltava. Video noiseella joka on ainoa järkevä jonka olen löytänyt mikä toimii online, mutta videot tympii kun ovat tuollaisia lyhyitä erillisiä pätkiä aina.

 
Käyköhän tämä Flux nyt ihan kaikilla pytyillä, asensin sen näiden ohjeiden mukaan ( Install Flux in Under 10 Minutes )
ja käyttö Stable Diffusion WebUI Forgen kautta. Ainakin näyttää tuossa valikoissa että Fluxia on tarjolla kuten pitää:

Näyttökuva 2024-09-06 171615.png


Ettei tullu mitään lama-versiota laiteltua tuon ohjeen kautta :hmm: Tosin SD Forge ei ole tuttu joten pitää vielä sen säätöihin katsoa joku tutoriaali tms.
 

Statistiikka

Viestiketjuista
258 777
Viestejä
4 496 129
Jäsenet
74 291
Uusin jäsen
MinikuiOni

Hinta.fi

Back
Ylös Bottom