NVIDIA oikeuteen tekoälymalli NeMosta

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 601
Liittynyt
12.12.2016
Viestejä
4 262
Onkohan tämä AI buumi lopulta se tekijänoikeusmafian viimeinen suuri parkaisu? Toivottavasti
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 601
Onkohan tämä AI buumi lopulta se tekijänoikeusmafian viimeinen suuri parkaisu? Toivottavasti
Ei sillä etteikö tekijänoikeusfirmojen toimintatavoissa olisi paljonkin korjattavaa, mutta ihanko tosissasi toivot ettei tekijänoikeuksia olisi olemassa? Mietipä nyt hetki uudelleen sillä aikaa kun virittelen painokonetta tulille.
 
Liittynyt
16.10.2016
Viestejä
12 147
Onkohan tämä AI buumi lopulta se tekijänoikeusmafian viimeinen suuri parkaisu? Toivottavasti
Kyllähän tämä muuttaa asiaa huomattavasti. Kirjallisuuutta, kuvia ym, joka on saatavissa helposti internetistä, eikä ole minkään salasanalla suojatun muurin takana tullaan käyttämään noiden opetuksessa pilvinpimien ja jossain vaiheessa NE itse hakevat tietoa netistä ja opettelevat noista.

Ainut ratkaisu asiaan on se, että KAIKKI tekijänoikeudellinen materiaali on vedettävä TODELLA paksujen maksumuurien taakse ja ERIKSEEN merkattava, että tekoälysovellutukset EIVÄT SAA lukea / katsoa kyseistä materiaalia ja kaikki sovellutukset ON OLTAVA tehty siten, että ne noudattavat tuota sääntöä..

Toki tässäkin on valtaviua aukkoja ja ongelmia, mm kuka on vastuussa, kun materiaalista on juku poistanut merkinnät (on mahdotonta tehdä merkintöjä, joita ei voida poistaa) ja jonkun koneella pyörivä AI on käynyt netistä hakemassa tietoa ja oppinut kyseisestä materiaalista..

Toki tämä kaatuu todennäköisesti maihin, kuten Kiina, jonka sovellutukset saavat sitten huiman edun länsimaisiin verrattuna ja porukka alkaa käyttää niitä. Tästä taas on suurta hyötyä Kiinalle ja se ajaa tässäkin asiassa länsimaiden ohi, jotka kompastuvat tälläkertaa tekijänoikeuksiinsa..
-------------
Epäilisin, etttä opettamisessa joudutaan luopumaan tekijänoikuksista.
-------------
Siitä se vasta ulina ja konflikti alkaakin, kun typerimmät käyvät kutsumaan jotain teköälyä "häneksi", "SE"n asemsta. Epäilisin, että tapahtuu 10 vuoden kuluessa, jos kehitystahti jatkuu nykyisellään ja kipiulu sekä ongelmat ovat huomattavanpaljon suuremmat, kuin joku tekijänoikeus..
-------------
Edit n:th edition:
Pitipä ihan katsoa,mitä kaikkea on AI pistetty tekemään.. ja ilmeisesti kaikkea on kokeitu, mm porno.
Google ai drawn porn tuottaa näköjään lukuisia tuloksia. On näköjään melko uskomaton määrä hakutuloksia, n 312 miljoonaa kpl (Enemmän, kuin "disney porn", vähemmän, kuin Netflix porn. Toki haku oli epäreilu, kun siinä oli 3 sanaa, AI porn tuottaa miljardi 380 miljoonaa tulosta):, etupäässä laillisia, mutta myös esim uutisia vähemmän laillisista:

Google AI porn law tuottaa n 68 miljoonaa tulosta, jotka pikaisesti näyttäisivät olevan erilaisten ongelmien pohtimista, mm:
‘Society needs to be alert’: Most people are unaware AI is being used to create child abuse content | Euronews
Kuka on sitten missäkin tapauksessa vastuussa: Sekö, joka pyytää AI:ltä explisiittisesti kielletyn lapo kuvan? AI:ta hostaava paikka, joka antaa laskentakapasiteetin? AI:n suunnittelija? Onko se teksti, jolla kuva luodaan = kuva vai ei? Ja missä on raja, mikä on luokittelu peruste eri kuville, mikä on fiktiota, missäkohti fiktio muuttuu laittomaksi?

Noihin kyllä liittyy sellaisia loputtoman syviä matopurkkeja, jotta mm. lainsäätelijät on vielä hyvinkin monella taholla täysin totaalisessa kusessa noiden kanssa. AI:den soveltaminen on lähtenyt liikkeelle, kun raketti ja säännösten teko, kuin etanoiden vaellus siihen verrattuna. Homma on karannut käsistä ja aiheuttaa suuria ristiriitoja lukuisin tavoin...Ehkä tekijänoikeudet ovat melko merkityksetön asia lopultakin, kun katsotaan lakiongelmien koko kirjoa..

Miten saman kuvan muuten saa aikaan eri AI:llä, jos on tarkemmin kuvailtu asia? Onko siitä mitä testejä tehty? Tai miten saman tekstituotoksen?

Jos tätä AI iden luomaa säännösongelma-aukkoa yritetään pistää läjään, niin tulemme näkemään todella paljon ja todennäköisesti todella tulkinnanvaraisia säännöksiä erittäin suuria määriä.

Saa nähdä, yritetäänkö yksityisomisteiset AI:t kieltää jossain vaiheessa kokonaan tai ainankin osittain tai määritelläänkö esim AI disto X laittomaksi ohjelmistoksi... Tämän jälkeen AI serverien pyörittäjille raskas moderointi ja valvontapakko.. Toki ei toimi varmasti tämäkään, mutta saa nähdä..

Entä jos joku luo AI rungon, joka on opetettu laillisesta aineistosta, mutta voi oppia lisää? Kuka silloin on vastuussa mistäkin rikoksesta, jonka joko AI tekee, tietoja hakiessaan tai AI:n käyttäjä, esim vahingossa? Tai jos AI instanssin omistaa henkilö X ja hänellä käy esim vieras, joka tekee laittomuuksia tai lainaa ta kopioi opetetun ohjelmiston ja tekee sillä laittomuuksia..?
 
Viimeksi muokattu:
Liittynyt
22.10.2018
Viestejä
9 685
Ainut ratkaisu asiaan on se, että KAIKKI tekijänoikeudellinen materiaali on vedettävä TODELLA paksujen maksumuurien taakse ja ERIKSEEN merkattava, että tekoälysovellutukset EIVÄT SAA lukea / katsoa kyseistä materiaalia ja kaikki sovellutukset ON OLTAVA tehty siten, että ne noudattavat tuota sääntöä..
Jotenkin sitä kuvittelisi että mitä tahansa netistä löytyvää ei saisi kaupalliseen käyttöön kuka tahansa käyttää ilman lupaa. Jos lupa on, niin kovaa ajoa vaan.

Ajatus siitä että lupa oletuksena moiselle kaupalliselle käytölle olisi olemassa ei kestä päivänvaloa.

En vastusta kommunismia, mutta siitä olisi hyvä tehdä rationaalisesti perusteltu demokraattinen päätös.
 
Liittynyt
21.02.2017
Viestejä
5 034
Jotenkin sitä kuvittelisi että mitä tahansa netistä löytyvää ei saisi kaupalliseen käyttöön kuka tahansa käyttää ilman lupaa. Jos lupa on, niin kovaa ajoa vaan.

Ajatus siitä että lupa oletuksena moiselle kaupalliselle käytölle olisi olemassa ei kestä päivänvaloa.
Ostamastani kirjasta saan kirjoittaa kaupallisessa tarkoituksessa vaikkapa kirja-arvostelun blogiini. Saan myös inspiroitua kirjasta ja mukailla sen tyyliä tai käyttää siitä kohtuullisen pituisia suoria lainauksiakin omassa kaupallisessa tarkoituksessa kirjoittamassani kirjassa.

Onko tämä liian vapaata lainsäädäntöä? Tai pitäisikö tämä sääntö olla erilainen tekoälyn kohdalla?
 

Ronald McDonald

BANNATTU
BANNED
Liittynyt
19.02.2024
Viestejä
308
Ostamastani kirjasta saan kirjoittaa kaupallisessa tarkoituksessa vaikkapa kirja-arvostelun blogiini. Saan myös inspiroitua kirjasta ja mukailla sen tyyliä tai käyttää siitä kohtuullisen pituisia suoria lainauksiakin omassa kaupallisessa tarkoituksessa kirjoittamassani kirjassa.

Onko tämä liian vapaata lainsäädäntöä? Tai pitäisikö tämä sääntö olla erilainen tekoälyn kohdalla?
Ei sinun tarvitse sitä kirjaa edes ostaa tai omistaa, jotta voit nuo tehdä. Sen kirjan ostaminen ei anna sinulle mitään lisäoikeuksia, ainostaan antaa sinulle omistusoikeuden siihen kirjaan.
 
Liittynyt
21.02.2017
Viestejä
5 034
Ei sinun tarvitse sitä kirjaa edes ostaa tai omistaa, jotta voit nuo tehdä. Sen kirjan ostaminen ei anna sinulle mitään lisäoikeuksia, ainostaan antaa sinulle omistusoikeuden siihen kirjaan.
Juu tiedän. Pointtina lähinnä etten ole hankkinut sitä dataa rikollisin keinoin.
 
Liittynyt
21.02.2017
Viestejä
5 034
Mikä se rikollinen keino sitten olisi?
Vaikkapa warettaminen tai CIA:n palvelimille tunkeutuminen? Tää on ihan sivuseikka, johon ei sen suurempaa syytä takertua.

Pointti oli luoda skenaario, jossa ihmisenä en tee mitään laitonta oppiessani materiaalista ja käyttäessäni sitä oppia kaupallisessa tarkoituksessa lain puitteissa. Eli jos tämä ihmisälylle ok eikä vääryyttä tapahtunut missään vaiheessa, miksi keinoälyn kohdalla tapahtui?
 

finWeazel

Chief Karpfen
Liittynyt
15.12.2019
Viestejä
8 026
Nvidia väittää ettei ole rikkomusta. Mielenkiintoista nähdä mitä oikeus päättää jos sinne asti päädytään
“We respect the rights of all content creators and believe we created NeMo in full compliance with copyright law,” the spokesperson told PCMag by email.
 
Liittynyt
22.10.2018
Viestejä
9 685
Ostamastani kirjasta saan kirjoittaa kaupallisessa tarkoituksessa vaikkapa kirja-arvostelun blogiini. Saan myös inspiroitua kirjasta ja mukailla sen tyyliä tai käyttää siitä kohtuullisen pituisia suoria lainauksiakin omassa kaupallisessa tarkoituksessa kirjoittamassani kirjassa.

Onko tämä liian vapaata lainsäädäntöä? Tai pitäisikö tämä sääntö olla erilainen tekoälyn kohdalla?
Saatko ”opettaa” sen tekstisisällön vaikka sql tietokantaan josta sen voi ”promptilla” hakea ja sitten myydä tämän ”ai mallin” isolla rahalla?

Esittämäsi ihmisen tekemät asiat on tekijänoikeuslailla suojattu. Tää tietokantaan lukeminen ja sen myyminen ei ole.
 

Ronald McDonald

BANNATTU
BANNED
Liittynyt
19.02.2024
Viestejä
308
...

Pointti oli luoda skenaario, jossa ihmisenä en tee mitään laitonta oppiessani materiaalista ja käyttäessäni sitä oppia kaupallisessa tarkoituksessa lain puitteissa. Eli jos tämä ihmisälylle ok eikä vääryyttä tapahtunut missään vaiheessa, miksi keinoälyn kohdalla tapahtui?
Olen samaa mieltä. Ihan yhtäläisesti taiteilija voi ammentaa inspiraatiota katselemalla muiden töitä.
 
Liittynyt
21.02.2017
Viestejä
5 034
Saatko ”opettaa” sen tekstisisällön vaikka sql tietokantaan josta sen voi ”promptilla” hakea ja sitten myydä tämän ”ai mallin” isolla rahalla?
Mun tekninen osaaminen ei ole kovin skarppia näiltä osin, mutta eikös Google haku tee jotain hyvin vastaavaa? Linkkaa toki aina lähteeseen, mutta tekee tietokantoja muiden aineistoista ja myy palvelua niiden pohjalta. Kai toi ihan laillista on?
 
Liittynyt
22.10.2018
Viestejä
9 685
Linkkaa toki aina lähteeseen, mutta tekee tietokantoja muiden aineistoista ja myy palvelua niiden pohjalta.
Lähteiden linkkaus on todella oleellinen juttu, samoin kuin esitetyn sisällön laajuus. Jos google näyttäisi esikatselussa merkittävän osan sisällöstä ja jättäisi linkit pois, niin aivan taatusti rikkoisi lakia. Lisäksi google noudattaa tekijänoikeuksien omistajien pyyntöjä mm. siitä että saako heidän sisältöjä käyttää millään tapaa.
Googlen toimintaa on (muistaakseni) myös muutamaan otteeseen säännelty niukemmaksi näiden asioiden osalta.
Edit: ainakin google news ajoi karille kun ajattelivat että toisten tahojen tuottaman uutissisällön toistaminen omassa palvelussa on ihan kosher. Nykyisin makselevat rojalteja tms.
 
Viimeksi muokattu:

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 601
Vaikkapa warettaminen tai CIA:n palvelimille tunkeutuminen? Tää on ihan sivuseikka, johon ei sen suurempaa syytä takertua.

Pointti oli luoda skenaario, jossa ihmisenä en tee mitään laitonta oppiessani materiaalista ja käyttäessäni sitä oppia kaupallisessa tarkoituksessa lain puitteissa. Eli jos tämä ihmisälylle ok eikä vääryyttä tapahtunut missään vaiheessa, miksi keinoälyn kohdalla tapahtui?
Olen samaa mieltä. Ihan yhtäläisesti taiteilija voi ammentaa inspiraatiota katselemalla muiden töitä.
Siinä on eroa oppiiko ihminen vai AI. AI voi kopioida oppimansa sellaisenaan, sellaisenaan ihmisen näkökulmasta muttei toisen AIn ja siitä sitten eteenpäin. Ihminen ei (eideettinen muisti on ääriharvinainen poikkeus joka saattaa kyetä ekaan mutta ei tuokaan)
Ottaen huomioon että ilman aika- tai laskentatehorajoitteita botti voisi oppia kirjaimellisesti ihan kaiken mitä ikinä on tehty, pitää sen opettamisesta tietenkin maksaa opetusmateriaalin omistajille.
 
Liittynyt
21.02.2017
Viestejä
5 034
Siinä on eroa oppiiko ihminen vai AI. AI voi kopioida oppimansa sellaisenaan, sellaisenaan ihmisen näkökulmasta muttei toisen AIn ja siitä sitten eteenpäin. Ihminen ei (eideettinen muisti on ääriharvinainen poikkeus joka saattaa kyetä ekaan mutta ei tuokaan)
Itseasiassa ihminen voi kirjoittaessaan siteerata ja plagioida paljon tekoälyä törkeämminkin, esim copy-pastea käyttämällä. Ulkomuistikyky tässä aika triviaali tekijä.

Kuten ihmisenkin kohdalla, tarkastelisin ennemminkin sen tekoälymallin outputteja. Jos se mukailee mun kirjani tyyliä tai lainaa sitä samoissa tai vähemmissä kuin ihmisellekin olisi sallittavaa, niin en ihan tiedä miksi vääryys on tapahtunut. Jos se ilman tarvittavia lupia pyydettäessä siteeraa kirjani sanasta sanaan, kannesta kanteen on raja ylitetty jo hyvän matkaa sitten.
 
Liittynyt
05.03.2024
Viestejä
360
Ei sillä etteikö tekijänoikeusfirmojen toimintatavoissa olisi paljonkin korjattavaa, mutta ihanko tosissasi toivot ettei tekijänoikeuksia olisi olemassa? Mietipä nyt hetki uudelleen sillä aikaa kun virittelen painokonetta tulille.
Mielenkiintoinen ajatus.

Jos tekijänoikeuksia ei olisi niin... Kyllä ihmiset edelleen tuottaisivat musiikkia, kuvia, pelejä jne.

Rajoitettua sisältöä varmasti tulisi myös, että vaikka tekijänoikeuksia ei olisi niin kyllä siihen keinot löytyisi rajata yleisöä ja pyytää rahaa. Tyyliin elokuvateatteri. Tai aidataan alue ja joku esittää musiikkia siellä. Jotenkin se vaan tuntuu tyhmältä jos mitään tekijänoikeutta ei olisi.

Lähinnä tuo Internet teki sen, että se on tehty kopiointia varten ja teoksen monistamisessa ei enää ole mitään kulua se on muuttanut ihan kaikkea. Softat menneet palvelumalliin ja kaikkea viihdesisältöä on mielin määrin. Teknologia tehnyt kaiken tuottamisesta myös todella halpaa.

Lainsäädäntö nyt vaan ei seuraa aikaansa. Saisi olla jotenkin harmonisoitu patenttilainsäädännössä tuon keston mukaan ja jos joku keksii rajoitella teoksiaan sen jälkeen niin siitä vaan. Kyllä se pidemmällä aikavälillä se raha kuuluu kuitenkin sille kuka tekee duunin eikä sille kuka omistaa jonkun kusimerkin hiirenkorvien muodossa.
 

Ronald McDonald

BANNATTU
BANNED
Liittynyt
19.02.2024
Viestejä
308
Siinä on eroa oppiiko ihminen vai AI. AI voi kopioida oppimansa sellaisenaan, sellaisenaan ihmisen näkökulmasta muttei toisen AIn ja siitä sitten eteenpäin. Ihminen ei (eideettinen muisti on ääriharvinainen poikkeus joka saattaa kyetä ekaan mutta ei tuokaan)
Ottaen huomioon että ilman aika- tai laskentatehorajoitteita botti voisi oppia kirjaimellisesti ihan kaiken mitä ikinä on tehty, pitää sen opettamisesta tietenkin maksaa opetusmateriaalin omistajille.
Ei ihmisenkään tarvitse maksaa opetusmateriaalista, halutessaan voi tietenkin. Ja mikään ei estä katselemasta sitä taulua ja maalata siitä 1:1 kopio, tässä ei ole mitään laitonta. Laitonta on kopioida jotain ilman lupaa ja myydä sitä kaupallisessa tarkoituksessa. Jos alat myymään AI:n tekemiä 1:1 kopioita Rolling stonesin levyistä, voi tämä vaatia luvat Rollareilta.
 
Liittynyt
22.10.2018
Viestejä
9 685
Jos se ilman tarvittavia lupia pyydettäessä siteeraa kirjani sanasta sanaan, kannesta kanteen on raja ylitetty jo hyvän matkaa sitten.
Mielellään sitä rajan laittaisi tosiaan paljon matalemmalle kuin täysi 1:1 kopio. Nykyiset Llm mallit saa tulostamaan varsin suurella tarkkuudella lähes kaiken mitä sinne on tallennettu, tai siis ”opetettu”. Prompt filtereillä sun muilla saadaan välillä luotua illuusio siitä että näin ei olisi, mutta tarkasteltavana pitäisi IMO aina olla se filtteröimätön versio.

Hakukoneissa raja näyttäisi olevan noin 20 sanaa mitä saa suoraan lainata toisen sisältöä ilman että tekijänoikeuksia rikotaan. Ja toki 0 sanaa jos oikeuksien omistaja niin haluaa.

Jos nää llm mallit oikeasti oppis kopioimisen sijaan, siten että opetusdataa ei itsessään enää saisi mallista ulos millään jipoilla, niin tilanne olis varsin toinen.
 
Liittynyt
16.10.2016
Viestejä
12 147
Mielellään sitä rajan laittaisi tosiaan paljon matalemmalle kuin täysi 1:1 kopio. Nykyiset Llm mallit saa tulostamaan varsin suurella tarkkuudella lähes kaiken mitä sinne on tallennettu, tai siis ”opetettu”. Prompt filtereillä sun muilla saadaan välillä luotua illuusio siitä että näin ei olisi, mutta tarkasteltavana pitäisi IMO aina olla se filtteröimätön versio.

Hakukoneissa raja näyttäisi olevan noin 20 sanaa mitä saa suoraan lainata toisen sisältöä ilman että tekijänoikeuksia rikotaan. Ja toki 0 sanaa jos oikeuksien omistaja niin haluaa.

Jos nää llm mallit oikeasti oppis kopioimisen sijaan, siten että opetusdataa ei itsessään enää saisi mallista ulos millään jipoilla, niin tilanne olis varsin toinen.
Mistäs mallista saa ulos ja miten pitkiä pätkiä?

Tuossa Nvidia ja muita koskevassa reutersin uutisessa ei ole mainittu, saiko noista teoksista minkälaisia pätkiä ulos eri tekoälyiltä, joiden tekijöitä vastaan syytteitä on nostettu..

Se oli sensijaan mielenkiintoisempi linkki (tuossa uutisessa), jotta joku höperö jo ilmeisesti haluaa tekoälyjen tekemät tuotokset tekijänoikeusvalvonnan alle.. Oikeus on toistaiseksi todennut vaatijoille ja tekoälyn tuotoksille sujaa vaatineille: EI! Ja toivottavasti tajuaa pitää linjauksensa.
 
Liittynyt
22.10.2018
Viestejä
9 685
Tuossa Nvidia ja muita koskevassa reutersin uutisessa ei ole mainittu, saiko noista teoksista minkälaisia pätkiä ulos eri tekoälyiltä, joiden tekijöitä vastaan syytteitä on nostettu..
Jos ei saa minkäänlaisia pätkiä ulos, niin mitenköhän ovat päätelleet että heidän tekijänoikeuksia olisi rikottu?

edit: uutisen tapauksessa siis löytyi tieto siitä että niitä oltiin mallille syötetty. Jos ei ole lisenssiä moiseen toimintaan ostettu niin väärin meni. Nvidia sittemmin ton mallinsa poisti tekijänoikeussyistä.

Mistäs mallista saa ulos ja miten pitkiä pätkiä?
Isoja pätkiä saa ja käytännössä kaikista.
Lue vaikka ny timesin oikeusjuttu aiheesta, jos kiinnostaa.
 
Viimeksi muokattu:
Liittynyt
16.10.2016
Viestejä
12 147
Jos ei saa minkäänlaisia pätkiä ulos, niin mitenköhän ovat päätelleet että heidän tekijänoikeuksia olisi rikottu?

edit: uutisen tapauksessa siis löytyi tieto siitä että niitä oltiin mallille syötetty. Jos ei ole lisenssiä moiseen toimintaan ostettu niin väärin meni. Nvidia sittemmin ton mallinsa poisti tekijänoikeussyistä.


Isoja pätkiä saa ja käytännössä kaikista.
Lue vaikka ny timesin oikeusjuttu aiheesta, jos kiinnostaa.
Mikäli siitä ei saa pitkiä pätkiä 1:1 ulos, niin eipä siinä ongelmaa ole.
Onko linkki timesin juttuun?
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 601
Mikäli siitä ei saa pitkiä pätkiä 1:1 ulos, niin eipä siinä ongelmaa ole.
Onko linkki timesin juttuun?
 
Liittynyt
16.10.2016
Viestejä
12 147
-jaa olivat sitten käyneet MS:llä opettamassa ilmeisesti myös makumuurin takana..

Eikös sivuilla ole "lippuja*", joiden pitäisi pysäyttöö bottien sivujen indeksointi? Tarvitaan siis lippu, joka kertoo, että sivulta ei saa opiskiella AI mitään.. Toki tämä ei auta mitään, jos joku siteeraa artikkelia jonnekin muualle lyhyemmän tai pidemmän pätkän ja AI lukaisee sitten sen..

Ehkä lehtien ja muiden pitää vain unohtaa koko internet ja julkaista lehdet vaikka paperille painettuina. Siitä on AI:hin syöttö ja muukin tekijänoikeus ongelmat sitten poistettu..
-------
Siis tosiasiassa:
Kun on siirrytty nettiin niin on täysin selvää että tekijänoikeus säännöksiä pitää muuttaa.. Esim siten, että jos haluaa jonkun olevat " ei vapaata riistaa", niin se on sitten laitettava maksumuurin taakse ja suojattava tehokkaasti kopiointia vastaan...
 
Viimeksi muokattu:

Timo 2

Premium-jäsen
Liittynyt
11.02.2018
Viestejä
12 176
Esim siten, että jos haluaa jonkun olevat " ei vapaata riistaa", niin se on sitten laitettava maksumuurin taakse ja suojattava tehokkaasti kopiointia vastaan
Copypasteeminen ja kuvakaappauksen ottaminen voidaan ehkä estää, mutta milläsestätä jos joku kirjoittaa sanasta sanaan ja alkaa myymään edullisemmin? Vaikka tekiäoikeuksissa on paljon parannettavaa, ei me voida todeta kopioinnin estämisen olevan 100 % sen tekiän vastuulla.
 
Liittynyt
22.10.2018
Viestejä
9 685
Mikäli siitä ei saa pitkiä pätkiä 1:1 ulos, niin eipä siinä ongelmaa ole.
Jos korvaan jostain kirjasta satunnaisesti jonkun sanan synonyymilla, niin saisinko julkaista sen omana työnäni? Tuskin.

1:1 vaatimus on täysin järjetön ja ei todellakaan ole vaatimus edes ihmisen tekemän plagioinnin kohdalla.

Ja aika pitkiä pätkiä saa ulos. Paljon pidempiä kuin mitä esim. google saa hakutuloksissaan näyttää.
Eikös sivuilla ole "lippuja*", joiden pitäisi pysäyttöö bottien sivujen indeksointi?
Tai mielummin siten että botti ei saa indeksoida ellei sitä ole sallittu.

Lippua ei hakukoneille haluta, sillä hakujen tarkkuus heikkenisi.



Siis tosiasiassa:
Kun on siirrytty nettiin niin on täysin selvää että tekijänoikeus säännöksiä pitää muuttaa.. Esim siten, että jos haluaa jonkun olevat " ei vapaata riistaa", niin se on sitten laitettava maksumuurin taakse ja suojattava tehokkaasti kopiointia vastaan...
Lisäksi, eikö vaikka ekirjat (tämän uutisen aihe) ole käytännössä aina maksumuurin takana ja tehokkaasti drm suojattu? Silti käytetty opetusmateriaalina.
 
Liittynyt
17.10.2016
Viestejä
1 201
Pitää muistaa että LLM:t ovat käytännössä todennäköisyyskoneita, eli kun annetaan tekstisyöte se täydentää lausetta sanalla joka koulutusdatan perusteella todennäköisin. Tällä perusteella LLM ei "muista" koulutusdataansa eikä 1-1 artikkelin ulostaminen ole edes teknillisesti mahdollista.
Minun mielestäni tässä pitäisi vetää raja kaupallisen käytön suhteen: Jos firma käyttää koulutusdataa kaupallisten mallien kouluttamiseen (kuten OpenAI) niin sen pitäisi maksaa jonkinlainen korvaus datan käytöstä. Sen sijaan vapaan lähdekoodin projektit jotka julkaisevat mallin ja koodin olisi vapautettu maksuista. Tämä myös ohjaisi alaa terveempään suuntaan pois isojen firmojen hyppysistä.
 
Liittynyt
11.02.2019
Viestejä
1 783
Ainut ratkaisu asiaan on se, että KAIKKI tekijänoikeudellinen materiaali on vedettävä TODELLA paksujen maksumuurien taakse ja ERIKSEEN merkattava, että tekoälysovellutukset EIVÄT SAA lukea / katsoa kyseistä materiaalia ja kaikki sovellutukset ON OLTAVA tehty siten, että ne noudattavat tuota sääntöä..
Tai sitten luodaan laki joka sanoo että malleja saa opettaa VAIN materiaaleilla johon on lupa.

Kuulostaa vähän AI-uskovaisten horinalta käsienheiluttelu että "ei tälle nyt mithään maha, pakko kopsata kun ei muuta voi". Jospa vaikka ei kopsattaisi, ei se kuitenkaan vahingossa tapahdu. Se tietenkin vaikeuttaa tai tekee mahdottomaksi näiden geneeristen megamallien luonnin, mutta eipä ne pakollisia ole olla olemassa muuten kuin luojiensa mielestä.

Kuten ihmisenkin kohdalla, tarkastelisin ennemminkin sen tekoälymallin outputteja.
Nykyisen lainsäädännön puitteissa (joka ei kovin hyvin suoraan näihin sovellu) on kolme paikkaa jossa AI-malli voi rikkoa tekijänoikeuksia:

1. Ulostamalla (liikaa) luvatta opetukseen käytettyä alkuperäistä materiaalia. Suora kopiointi ei tietenkään mene minkään fair use säännön alle eli tämä lienee kohtuullisen selvä kuvio.

2. Levittämällä mallia joka sisältää luvatta opetukseen käytettyä materiaalia. Tämä on hähmäisempi tapaus koska voi väittää että malli ei sisällä alkuperäistä materiaalia sellaisenaan, mutta toisaalta jos se pätee niin miksei sitten pakattu jpeg mona lisakin olisi vapaasti levitettävissä. Eihän sekään enää ole häviöllisen pakkauksen jälkeeen ole biteiltään "alkuperäinen". Näkisin itse että tämä puolustus ei päde, mutta ei liene testattu ainakaan suoraan vastaavassa tapauksessa. Tämä ei myöskään koske pilvessä ajettuja malleja suoraan.

3. Käyttämällä materiaalia joka on hankittu kiertämällä erityisiä suojauksia tai ehtoja. Tapaus NYT ja maksumuurit.

Tapaus 2 ei rinnastu mitenkään ihmisten toimintaan, aivojaan kun ei voi jaella muille hyödyllisellä tavalla.
 
Liittynyt
21.02.2017
Viestejä
5 034
Toi kohta 2. on kyllä mielenkiintoinen.

En lainkaan ylläty jos sallivalla lisenssillä vapaassa jakelussa olevasta Mixtral 8x7B:stäkin saadaan ulos liian suora sitaatti Harry Potterista ulos kun tarpeeksi promptataan. Eli tuon luoneelle startupille MistralAI:lle ja sitä ja muita malleja hostaavalle Huggingfacelle saattaa tulla isot laskut maksettavaksi jos menee Ranskassa oikeuteen ja häviävät.

Ja olenkohan minäkin nyt velkaa J K Rowlingille, kun kotikoneellani Mixtralia säilön ja pyörittelen vaikken ensinkään ole kiinnostunut Harry Potterista.
 

bsh

Liittynyt
28.02.2017
Viestejä
111
Open Source määritelmän kehittäjä (Bruce Perens) miettii tällä hetkellä uutta lisenssiä tulevaisuuden "open sourcelle". Siinä yritetään ottaa huomioon myös miten esim. lähdekoodia saa käyttää AI:n kouluttamiseen (tai saako sitä ollenkaan).

En löytänyt tästä mitään auki kirjoitettua analyysiä, kun on julkaistu niin hiljattain, joten en ainakaan itse osaa lisenssitekstin perusteella nopeasti sanoa, mikä tuon logiikka käytännössä olisi.

 
Liittynyt
16.10.2016
Viestejä
12 147
Tai sitten luodaan laki joka sanoo että malleja saa opettaa VAIN materiaaleilla johon on lupa.

Kuulostaa vähän AI-uskovaisten horinalta käsienheiluttelu että "ei tälle nyt mithään maha, pakko kopsata kun ei muuta voi". Jospa vaikka ei kopsattaisi, ei se kuitenkaan vahingossa tapahdu. Se tietenkin vaikeuttaa tai tekee mahdottomaksi näiden geneeristen megamallien luonnin, mutta eipä ne pakollisia ole olla olemassa muuten kuin luojiensa mielestä.
Kaikissa maissa ei noita pyyntöjä noudateta ja mallit ovat vain dataa, joten geneerisiä megamalleja tullaan luomaan jokatapauksessa, tekijänoikeuksista riippumatta.
Lisäksi mallit tulevat muuttumaan jatkuvasti oppiviksi, joten ne voivat jokatapauksessa käydä lukemassa helposti suojaamattoman materiaalin ja sillekään ei mahdeta yhtäänmitään.

Kannattaa nyt hahmottaa, että enää ei olla paperi tai kasetti aikakaudella vaan aikakaudella, jolloin kaikki suojaamaton on äärettömän helppo kopioida, laadun säilyessä 100%

Ei siis kannata hirttäytyä joihinkin kivikautisiin tekijänoikeusmalleihin. Dataa tulee syntymään kokoajan vauhdikkaammin, sekoittuen toiseen dataan, kaiken valvominenkaan ei ole käytännössä mahdollista myöhemmässä vaiheessa. Nyt vielä melkein onnistuu, kun malleja tekevät muutamat isot firmat jossain länsimaissa, mutta AI mallit kehittyvät ja tämä tilanne on vain väliaikainen ja ratkaisu, joka toimii nyt ei tule toimimaan kymmentäkään vuotta, jos kehitys jatkuu nykytahtia..
 
Liittynyt
22.10.2018
Viestejä
9 685
Tällä perusteella LLM ei "muista" koulutusdataansa eikä 1-1 artikkelin ulostaminen ole edes teknillisesti mahdollista.
.. paitsi jos todennäköisyydet on sun puolellasi.

Esim. eka lause jostain kirjasta luultavasti korreloi todella vahvasti koko loppukirjan kanssa.

Ainakin chat gpt:stä sai kappalekaupalla uutisartikkelien sisältöä käytännössä 1:1 ulos vain pyytämällä täydentämään googella löydetyn artikkelin alun pohjalta.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
1 201
.. paitsi jos todennäköisyydet on sun puolellasi.

Esim. eka lause jostain kirjasta luultavasti korreloi todella vahvasti koko loppukirjan kanssa.
Toki, mutta se lause korreloi myös muun koulutusdatassa olevan materiaalin kanssa. Yksittäinen kirja on kuitenkin vain häviävän pieni määrä dataa, joten paljon riippuu siitä kuinka tavanomainen lause on kyseessä.
 
Liittynyt
22.10.2018
Viestejä
9 685
Toki, mutta se lause korreloi myös muun koulutusdatassa olevan materiaalin kanssa. Yksittäinen kirja on kuitenkin vain häviävän pieni määrä dataa, joten paljon riippuu siitä kuinka tavanomainen lause on kyseessä.
Riittävän monta sanaa ja ei ole kuin yksi vaihtoehto jäljellä.
 
Liittynyt
11.02.2019
Viestejä
1 783
Kannattaa nyt hahmottaa, että enää ei olla paperi tai kasetti aikakaudella vaan aikakaudella, jolloin kaikki suojaamaton on äärettömän helppo kopioida, laadun säilyessä 100%
Ihan totta turiset. Puukolla on erittäin helppo tökätä toinen hengiltä, joten miksipä lakia murhasta säätää ja siitä ketään rankaista. Kivikautisia lakeja moiset.

/s
 
Toggle Sidebar

Uusimmat viestit

Statistiikka

Viestiketjut
240 948
Viestejä
4 215 030
Jäsenet
70 982
Uusin jäsen
Lahtaaja

Hinta.fi

Ylös Bottom