Ongelma on se että tuohon pitää käyttää helvetisti aikaa ja vaivaa.
Jos haluan softasta X puolankielisen käännöksen niin otan sen listauksen kaikista teksteistä mitä siinä ohjelmassa käytetään ja lähetän sen henkilölle joka osaa puolaa ja englantia ja hän pystyy suht nopeasti kääntämään ne tekstit.
Jos haluan kouluttaa tekoälyn tunnistamaan niitä Puolan liikennemerkkejä niin ensinnä tarvitsen tuhansia kuvia eri kulmista, eri valaistuksessa, eri säässä ja muissa olosuhteissa kaikista niistä eri Puolan liikennemerkeistä siinä ympäristössä missä ne autot näkevät niitä merkkejä. Sitten mun pitää ottaa kasa ihmisiä jotka käyvät läpi kaikki nuo tuhannet kuvat ja sitten merkkaavat niihin että tässä kuvassa on liikennemerkki Z alueella x1y1 - x2y2.
Tuon jälkeen otetaan kaikki nuo tuhannet annotoidut kuvat ja ne syötetään sille neuroverkolle koulutusmateriaaliksi. Sitten kun se neuroverkko on valmis niin sille syötetään tuhansia uusia, ei annotoituja kuvia noista liikennemerkeistä ja katsotaan mikä on tulos. Eli käydään läpi ihmissilmällä kaikki nuo tuhannet kuvat ja mitä se neuroverkko on nähnyt niissä. Jos sieltä löytyy vääriä positiivisia ja missattuja tunnistuksia niin sitten otetaan nuo kuvat, annotoidaan ne ja lisätään ne koulutusmateriaaliin, mahdollisesti twiikataan neuroverkon parametreja, luodaan uusi neuroverkkoja ja taas ajetaan sen läpi sitä ei-annotoitua dataa ja taas käydään läpi ne tuhansien eri kuvien tulokset.
Ja tuota prosessia toistetaan kunnes päästään siihen pisteeseen asti että neuroverkko on tarpeeksi tarkka.
Ja tuo vielä oikeasti aivan helvetisti enemmän aikaa kuin muutaman tekstinpätkän kääntäminen toiselle kielelle. Tuo vie niin helvetisti aikaa ja dataa että siinä on syynsä miksi Googlen kaltaiset firmat ovat helvetin hyviä kaikessa neuroverkkopohjaisessa tunnistuksessa ja se on koska niillä on tietokannoissaan jo valmiiksi tsiljoonittain kuvia, videota ja muuta materiaalia. Joko valmiiksi annotoituna tai raakadatana annotointia varten.
Mutta siinä lyhyt intro siihen miten modernit neuroverkot toimivat