Hei kaikki, minulla on hieman villinlainen idea, josta haluaisin keskustella kanssanne. Mitä jos käyttäisimme suuria kielimalleja (LLM) datan pakkaamiseen ja siirtämiseen?
Perusajatus on seuraava: kuvittele, että sekä lähettäjällä että vastaanottajalla on pääsy samaan tehokkaaseen LLM-malliin. Lähettäjä syöttää LLM:lle dataa tietyn kehotteen ja siemenen kera. LLM, joka on koulutettu massiivisella määrällä tekstiä, voisi sitten pakata tämän datan paljon lyhyemmäksi kehotteeksi ja siemeneksi vastaanottajan LLM:lle.
Vastaanottajan LLM, joka ymmärtää kieltä ja käyttää kehotteen ja siemenen tarjoamaa kontekstia, pystyisi sitten rekonstruoimaan alkuperäisen datan!
Joitain mahdollisia etuja:
Ultra-pakkaus: LLM:t voisivat saavuttaa huomattavasti korkeamman pakkaussuhteen kuin perinteiset menetelmät.
Tietoturva: Kehoteiden ja siementen monimutkaisuus voi vaikeuttaa datan murtamista ilman samaa LLM:ää.
Käyttökelpoisuus: Ei tarvita erillistä salausohjelmistoa, jos kaikilla on sama LLM.
Mutta on myös joitain rajoituksia, jotka on otettava huomioon:
Mallin haavoittuvuus: Jos itse LLM:ssä on heikkouksia, hyökkääjät voivat hyödyntää niitä datan varastamiseen.
Tietovuodot: LLM on ehkä koulutettu salaamattomalla datalla, mikä voi johtaa tietovuotamiin rekonstruoinnin aikana.
Skaalautuvuus: Suurten tietomäärien käsittely LLM:ien avulla voi olla laskennallisesti kallista.
Mitä mieltä olette? Onko tämä hullu idea vai vilaus tulevaisuuteen datansiirron alalla? Haluaisin kuulla ajatuksianne ja kaikkia samankaltaisia ideoita, joita olette keksineet!
Tässä jutussa Creating a QR code AI image with Stable Diffusion (automatic1111) upotetaan qr-koodi kuvaan jonka muutkin pääsevät näkemään, jos vain tietävät saman promptin ja seed arvon. Samalla tavalla mikä tahansa data voidaan pakata naurettavan pieneen tullaan ja siirrettävä datan määrä vähenisi radikaalisti, eikö?
P.S. Tiedän, että koneoppimisen ja datanpakkaamisen parissa tehdään paljon tutkimusta. Tutkiiko joku muu vastaavia konsepteja LLM:ien avulla?
Ideaa saa vapaasti hyödyntää kunhan tunnustuksen saan idean keksijänä Joku vastaa kuitenkin, että keksitty jo pari vuotta sitten
Mistä haen mun Nobel palkinnon?
P.S Bard väänsi yllä olevan tekstin koska olen laiska kirjoittamaan kännykällä ku olen jo vanha ukko pahalla ikänäöllä varustetuna
P. P. S Reddit poisti kaikki mun idean postaukset, joka CIA on kohta ovella?
Perusajatus on seuraava: kuvittele, että sekä lähettäjällä että vastaanottajalla on pääsy samaan tehokkaaseen LLM-malliin. Lähettäjä syöttää LLM:lle dataa tietyn kehotteen ja siemenen kera. LLM, joka on koulutettu massiivisella määrällä tekstiä, voisi sitten pakata tämän datan paljon lyhyemmäksi kehotteeksi ja siemeneksi vastaanottajan LLM:lle.
Vastaanottajan LLM, joka ymmärtää kieltä ja käyttää kehotteen ja siemenen tarjoamaa kontekstia, pystyisi sitten rekonstruoimaan alkuperäisen datan!
Joitain mahdollisia etuja:
Ultra-pakkaus: LLM:t voisivat saavuttaa huomattavasti korkeamman pakkaussuhteen kuin perinteiset menetelmät.
Tietoturva: Kehoteiden ja siementen monimutkaisuus voi vaikeuttaa datan murtamista ilman samaa LLM:ää.
Käyttökelpoisuus: Ei tarvita erillistä salausohjelmistoa, jos kaikilla on sama LLM.
Mutta on myös joitain rajoituksia, jotka on otettava huomioon:
Mallin haavoittuvuus: Jos itse LLM:ssä on heikkouksia, hyökkääjät voivat hyödyntää niitä datan varastamiseen.
Tietovuodot: LLM on ehkä koulutettu salaamattomalla datalla, mikä voi johtaa tietovuotamiin rekonstruoinnin aikana.
Skaalautuvuus: Suurten tietomäärien käsittely LLM:ien avulla voi olla laskennallisesti kallista.
Mitä mieltä olette? Onko tämä hullu idea vai vilaus tulevaisuuteen datansiirron alalla? Haluaisin kuulla ajatuksianne ja kaikkia samankaltaisia ideoita, joita olette keksineet!
Tässä jutussa Creating a QR code AI image with Stable Diffusion (automatic1111) upotetaan qr-koodi kuvaan jonka muutkin pääsevät näkemään, jos vain tietävät saman promptin ja seed arvon. Samalla tavalla mikä tahansa data voidaan pakata naurettavan pieneen tullaan ja siirrettävä datan määrä vähenisi radikaalisti, eikö?
P.S. Tiedän, että koneoppimisen ja datanpakkaamisen parissa tehdään paljon tutkimusta. Tutkiiko joku muu vastaavia konsepteja LLM:ien avulla?
Ideaa saa vapaasti hyödyntää kunhan tunnustuksen saan idean keksijänä Joku vastaa kuitenkin, että keksitty jo pari vuotta sitten
Mistä haen mun Nobel palkinnon?
P.S Bard väänsi yllä olevan tekstin koska olen laiska kirjoittamaan kännykällä ku olen jo vanha ukko pahalla ikänäöllä varustetuna
P. P. S Reddit poisti kaikki mun idean postaukset, joka CIA on kohta ovella?
Viimeksi muokattu: