Tekoälymallien kouluttamiseen ostetaan nyt myös yritysten sisäistä viestintää

NeliYgönen

Ylläpidon jäsen
Liittynyt
02.07.2020
Viestejä
695
SimpleClosure auttaa esimerkiksi lopettavia startup-yhtiöitä ostamalla näiden Slack-keskusteluita.

1776717566106.png


Tekoälymallien kouluttamiseen käytettäväksi dataksi ei riitä pelkästään julkinen internet, jota mallit ovat kolunneet jo vuosia. Yksi uusista alan suuntauksista on eri yritysten sisäiset viestintäkanavat – kuten Slack-keskustelut ja sähköpostiketjut – ja niiden haaliminen mallien koulutusdataksi.

Esimerkkinä toimii SimpleClosure-yhtiö, joka tarjoaa apualopettaville startup-yrityksille mm. maksamalla suuria rahasummia näiden sisäisestä viestintädatasta, mikä helpottaa yritysten kuoppaamista. Tieto on arvokasta, sillä datalla kerrotaan koulutettavan entistä hienostuneempia ja yksityiskohtaisempaan päättelyyn pystyviä tekoälymalleja verrattuna julkisesti saatavilla olevaan dataan. Datan arvoon vaikuttaa myös ala, jolta se tulee – esimerkiksi terveys- ja finanssialan yritysten data on erityisen haluttua tekoälykoulutustarkoituksiin.

Ilmiö on luonnollisesti herättänyt myös kritiikkiä asiantuntijoiden suunnalta, sillä yritysten työntekijöiden käymien keskustelujen myymistä kolmansille osapuolille pidetään paitsi eettisesti arveluttavana myös tietosuojanäkökulmasta ongelmallisena. Ihmisiä voidaan tunnistaa käydyistä keskusteluista, ja vaikka dataa ostavat yritykset vakuuttelevat perkaavansa sitä anonyymiksi ennen koulutustarkoituksia, ovat asiantuntijat huolissaan arkaluontoisten tietojen vuotamisesta koulutettaviin tekoälymalleihin.

Lähde: Forbes
 
Hyvä idea. Itsekin sijoitan entistä enemmän sellaisiin firmoihin joilla on iso data moat ja hallinnon kanssa hommat sujuu.
 
META alkaa nauhoittamaan usa:ssa työntekijöiden koneista hiirenliikkeet, näppikse,... keinoälymallien opettamista varten. Sisäisessä kommunikaatiossa teroittaneet, että jo aikaisemmin yritys on voinut seurata työntekijöiden koneiden käyttöä. Melkoinen dystopia


 
META alkaa nauhoittamaan usa:ssa työntekijöiden koneista hiirenliikkeet, näppikse,... keinoälymallien opettamista varten. Sisäisessä kommunikaatiossa teroittaneet, että jo aikaisemmin yritys on voinut seurata työntekijöiden koneiden käyttöä. Melkoinen dystopia


Jostakin se opetusdata vaan pitää kerätä jotta voidaan kokonainen toimisto korvata agenteilla, ja myöhemmin myös ne agenttien virittelijät korvata agenteilla jne. Näin se nyt vaan menee ja meno luultavasti senkun kiihtyy.

AI ja dystopia kulkee käsi kädessä kohti jotain, ja ovat kulkeneet jo tovin.
 
Kuulostaa vähän ikävänsuuntaiselle vinoumalle opetusdatassa, että se on kerätty yrityksiltä jotka ajautui konkurssiin (tai muuten vaan lopettamaan). :hmm:
 
Jostakin se opetusdata vaan pitää kerätä jotta voidaan kokonainen toimisto korvata agenteilla, ja myöhemmin myös ne agenttien virittelijät korvata agenteilla jne. Näin se nyt vaan menee ja meno luultavasti senkun kiihtyy.

AI ja dystopia kulkee käsi kädessä kohti jotain, ja ovat kulkeneet jo tovin.
Jos olisi tilannetajua niin pyytäisi työntekijöitä annotoimaan ja nauhoittamaan spesifisiä työsekvenssejä sen sijaan että taustalla kaapataan 24/7. En tiedä miten hyvää random hiirenliikkeet ja napinpainallukset ja ehkä screenshotit ovat versus että tarkoituksella kaapattaisiin ensin tavoite ja annotoitaisiin miksi mitän tehtiin mitä tehtiin. "nyt päivitän tiketin X koska ..." ja sitten tekee. Annotoinnin vois ihan hyvin vetää puheena samalla kun tekee työtä. Opetusdatan laadulla on merkitystä.
 
Jos olisi tilannetajua niin pyytäisi työntekijöitä annotoimaan ja nauhoittamaan spesifisiä työsekvenssejä sen sijaan että taustalla kaapataan 24/7. En tiedä miten hyvää random hiirenliikkeet ja napinpainallukset ja ehkä screenshotit ovat versus että tarkoituksella kaapattaisiin ensin tavoite ja annotoitaisiin miksi mitän tehtiin mitä tehtiin. "nyt päivitän tiketin X koska ..." ja sitten tekee. Annotoinnin vois ihan hyvin vetää puheena samalla kun tekee työtä. Opetusdatan laadulla on merkitystä.
Ihan turhaa, vaikka toki insinöörimieltä tämä häiritseekin. Raakana vaan kaikki ja sit käskytetään claudea komennolla /simplify ja se siitä. Seuraavassa vaiheessa tuotetaan tämäkin data sitten synteettisenä.
 

Statistiikka

Viestiketjuista
305 776
Viestejä
5 178 390
Jäsenet
82 754
Uusin jäsen
vässykkä

Hinta.fi

Back
Ylös Bottom