Digitalisaatio - hyvät ja huonot puolet

  • Keskustelun aloittaja Keskustelun aloittaja Sompi
  • Aloitettu Aloitettu
Puhut nyt ilmeisesti jostain yksinkertaisesta tiedostolistauksen sisältävästä tietokannasta, joka on ihan eri asia, kuin kokonainen sivusto, jossa haku kohdistetaan esim. vapaamuotoiseen tekstisisältöön, ja hakutuloksille pitäisi muodostaa relevanssit. Se, ettei sellaisen toteuttaminen onnistu niin yksinkertaisesti kuin väität, ei ole mitään "pöhinää", vaan vaatii oikeasti paljon asioita jotka ottaa huomioon, jotta hakutuloksista saadaan jollakin tapaa järkeviä.
Ei mitään relevansseja tarvita, jos käyttäjällä on aivot päässä ja hakutuloksia on vähemmän kuin satoja. Ei tarvitse tehdä asioista hankalampia kuin ne ovat.

Esimerkiksi joku verkkokaupan tuotehaku vastaa täysin tuota tiedostolistauksesta hakua. Esimerkiksi hakusanalla "vaijeri" pitäisi löytyä mm. tuote nimeltään "vaijerin kuori", mutta valitettavasti esimerkiksi IKH:n verkkokaupan haku ei toimi noin.

Tärkeintä olisi, että se haku ylipäätään vittu toimisi. Kaikenlainen hifistely on sitten toissijaista ja ne hifistelyominaisuudet pitäisi myös saada käyttäjänä tarvittaessa jotenkin pois päältä, jotta niistä ei olisi haittaa.
 
Taitaa mennä merkistökeskusteluksi. Jatkoin merkistö ketjuun

Usein ihmettelen, miten hankalaa työkseen ohjelmakoodia vääntäville voi olla toteuttaa toimiva hakutoiminto. Eihän siinä tarvitse muuta kuin vain toteuttaa yksinkertainen merkkijonohaku, johon on useimmissa ohjelmointikielissä valmiit funktiot olemassa. Ehkä sitä ennen eliminoi vertailtavista merkkijonoista isot kirjaimet ja diakriittiset merkit. Siihenkin on yleensä olemassa valmiit funktiot ilman, että tarvitsee edes mitään frameworkkia. Nykyaikana hyvin harvoin esimerkiksi missään verkkokaupassa kohtaa oikeasti toimivaa hakutoimintoa. Jopa Google on nykyään aivan uskomattoman huono ja palauttaa yleensä täysin epärelevantteja hakutuloksia, jotka eivät edes liity hakusanoihin mitenkään.

Jos ja kun ei haeta joka tarkkaa merkkijonoa, vaan jotain muuta, asioita, niin ei se ihan helppoakaan ole. ja oleellinen asia myös esittää se hakutulos.

Tyypillinen vaikea paikka on ns verkkokaupat, ja mitä enemmän nimikkeitä niin sitä vaikeampaa. Tilannetat ei helpota se että jos kaupalla paljon tavarantoimittajia, päämiehiä , niin niiltä ei saa hakemiseen liittyen hyvää dataa, tai edes kohtuullista. Tilannetta ei helpota että monissa tuoteryhmissä nimikkeiden elinkaari on lyhyt, termit kirjavia jne.

Vielä vaikeampaa on jossain avoimessa verkkokauppa paikassa/alustassa missä markkinoi useat toimijat, tai jopa yksityiset. jolloin vielä epämääräisemät tiedot tuotteesta.

Digitalisaatio, AI kehittyminen vienyt toki hakua "alaa" hurjasti eteenpäin, kehittyneet ja osaavat tekijät eivät tarkoita että hakutulosten esittäminen olis pelkästään asiakaslähtöistä, vaan ihan muut motiivit.

Merkistöön siirsin sen takia että lähdit toteutustapohtiin merkkien haulla, merkkijonojen haulla.

Haluttujen hakutulosten löytämiseksi ja niiden esittämiseksi on merkitystä isoilla kirjaimilla, mitä merkkijonon ympärillä, ja varsinkin jos ei ole unicodemerkistöä niin myös miettiä ne vaihtoehdot miten jokin tietty merkki on haettavaan tietokantaan/tidostoon tallenettu, ja noin yleisemmin millä eri tavoin sitä eri sisällön luojat ovat kirjoittaneet.

Lisäksi ne merkkijonon ympärillä olevat merkit. Tämä siis johdattelu siihen että jos käytettävässä ympäristössä ei ole kehittyneitä hakuominaisuuksia niin siinä jää kovasti tehtävää koodarille. pelkästään löytää ne halutut esiintymät, jonka jälkeen sitten pitäisi valita mitä esittää ja miten.


Toimii. Merkistö ei vaikuta tavujonojen vertailuihin sinänsä mitään, vaan ongelmana on vain lähinnä se, että UTF-8:ssa merkkijonon muunnos tietokoneen ymmärtämästä muodosta ihmisen ymmärtämään muotoon on häviöllinen prosessi. Jos kuitenkin diakriittiset merkit on joka tapauksessa tarkoitus eliminoida, niin asialla ei suomen kielen aakkoston kanssa ole merkitystä.

Diakriittisten merkkien eliminointi nimenomaan UTF-8:ssa on varsin simppeliä. Diakriittiset merkit tulevat kokonaan omana kirjainmerkkinä varsinaisen perusmerkin jälkeen ja ne voi vain yksinkertaisesti jättää kokonaan huomiotta. On olemassa erikoistapauksia, joissa diakriittinen merkki on kiinteänä osana itse peruskirjainta, mutta niistä on kyllä varmasti olemassa valmiita muunnostaulukoita, joilla sen saa muunnettua perusmerkkiä vastaavaksi ASCII-merkiksi.

Varsinkaan suomalaisen aakkoston kanssa ei pitäisi oikeasti tulla mitään ylitsepääsemättömiä ongelmia jotain merkkijonohakua tehdessä. :D
Jos mennään UTFllä niin ääkköset varmaan löytyy, ASCIIlla ei edes ole.

Jos haetaan ihmisen tuottamasta vapaasta sisällöstä, niin lähtökohta on että siellä on erilaisia tapoja ilmaista sama asia, ja sitten kirjoitus ja termivirheitä.
 
Esimerkiksi joku verkkokaupan tuotehaku vastaa täysin tuota tiedostolistauksesta hakua.
No ei vastaa. Tuotteilla voi olla nimi, leipäteksti, kuvaus, brändi, kategoria ja tuloksilla tuntematon määrä tuoteattribuutteja.

Jossain isossa verkkokaupassa olisi aika historiallisen paska toteutus jos on vaan hakuboksi josta saat tuloksena kasan lajittelemattomia tuotteita ilman mitään mekanismia jälkisuodattaa sitä tulosjoukkoa esim. brändin, kategorian, hintahaarukan ja mahdollisten tuoteattribuuttien perusteella.
 
Puhut nyt ilmeisesti jostain yksinkertaisesta tiedostolistauksen sisältävästä tietokannasta, joka on ihan eri asia, kuin kokonainen sivusto

Ja myös terminaaliin on saatavilla nykyään sumeita hakumoottoreita jotka löytävät relevantin kohteen vaikka et muista tarkkaa nimeä. Tai voit hypätä usein käyttämääsi hakemistoon muualta kunhan muistat nimestä hiukkasen. Tuolla säästää paljon aikaa suurimmassa osassa tapauksia. Ja miksi? Koska haku ei ole vain typerä alimerkkijonon etsijä ja koska se palvelun kehittäjätaho ei mennytkään sieltä missä aita on matalin vaan oikeasti pyrkii näyttämään relevantteja hakutuloksia käyttäjälle. Triviaalin haun tekeminen on triviaalia, ja se ei ole se mitä suurin osa käyttäjistä nykyään haluaa.

Jatkot laitan toiseen ketjuun koska tää on ihan puhdasta off-topicia.
 
Ei ole kyse hakukoneoptimoinnista. Hakukoneoptimoinnilla on tietysti tarkoitus nostaa sitä omaa sivustoa hakutuloksissa ylemmäs, mutta ei sen sivuston pitäisi ylipäätään sisältyä niihin hakutuloksiin, jos hakukoneen käyttäjä hakee jotain ihan muuta.
Onko sulla nyt esimerkki siitä erityisestä DOS liittyvästä hausta, joka tuottaa vain hakutuloksia liittyen powershelliin ?

Hakukoneoptimointia käytetään väärin ihan tarkoituksella, eli jotkin tahot yrittää saada tietoisesti sivustonsa nousemaa sellaisissa hakutuloksissa mihin sivuston ei edes tarkoitus tarjota vastasuta/tietoa/hyötyä.

Kaiken "huonon" takana ei ole aina tuommoinen, vaan sivusto voi olla laajalle joukolla ihan hyvä tulos kyseisellä haku rimpsulla, joten on ihan tarkoituksen mukaista nostaa sen näkyvyyttä ylös.

Pitkänlinja Google haun käyttäjälle tuottaa ärtymystä se että omat hakutavat on jostain yli 10v takaa, jolloin oli voi pieni promillen murto-osa (en tarkistanut faktoja) niitä lähteitä, ehkä hyviäkin omaan tarpeeseen, ja tapa hakea sopeutu siihen mailmaan. Nyt ne voi olla jopa kuolleita, ja tilalle on sitten miljardit sivut mistä hakukoneet pitäisi arpoa mitä joku historiaton käyttäjä etsii. (ja sitä siis sotkee massiivinen hakukone optimointi)
 
Eikös unicode-merkkien UTF-8-esityksessä kuitenkin jokaisen tavun numeroarvo ole aina yli 127, siis etumerkkibitti on 1? Eihän tuollaista ongelmaa pitäisi silloin pystyä tulemaan vastaan.

Merkistökeskustelu kiellettiin aiemmin ja sille perustettiin oma lanka toisaalle. Mutta kyllä, kaikki useampitavuiset enkoodaukset ovat yli 127'n eli sinne ei tule vahingossa osumia.
 
Ei mitään relevansseja tarvita, jos käyttäjällä on aivot päässä ja hakutuloksia on vähemmän kuin satoja. Ei tarvitse tehdä asioista hankalampia kuin ne ovat.
Kaikki mitä tähän liittyen sanot, kielii siitä ettet tiedä asiasta yhtään mitään, kunhan jauhat jauhamisen ilosta :D

Esimerkiksi joku verkkokaupan tuotehaku vastaa täysin tuota tiedostolistauksesta hakua.
No ei todellakaan vastaa. Kyse on paljon monimutkaisemmasta asiasta, enkä edes jaksa alkaa sitä tässä nyt sen tarkemmin avaamaan. Useimmat tämän asian kyllä ymmärtävät, varsinkin heistä jotka näiden verkkokauppojen tekniikan kanssa ovat tekemisissä.

Esimerkiksi hakusanalla "vaijeri" pitäisi löytyä mm. tuote nimeltään "vaijerin kuori", mutta valitettavasti esimerkiksi IKH:n verkkokaupan haku ei toimi noin.
Se, että nostat yhden huonosti toimivan esimerkin ei liity mitenkään siihen, mistä tässä oikeastaan ollaan keskusteltu. Pelkkä "yksinkertainen hakusanahaku" ei riitä hyvän hakutoiminnon toteuttamiseen verkkokaupassa.
Tärkeintä olisi, että se haku ylipäätään vittu toimisi. Kaikenlainen hifistely on sitten toissijaista ja ne hifistelyominaisuudet pitäisi myös saada käyttäjänä tarvittaessa jotenkin pois päältä, jotta niistä ei olisi haittaa.
Juuri tämänhän siinä on tavoitteena. Mutta ei käyttäjän tarvitse tietää mitä "hifistelyä" siellä haun konepellin alla tapahtuu. Toisin kuin väität, hakutulosten järjestäminen relevanssiuden mukaan on käyttökokemuksen ja halutun tuotteen (nyt jos vaikka siitä verkkokaupasta puhutaan) kannalta ensisijaisen tärkeää.

Verkkokaupassa saattaa olla satoja, tuhansia, tai kymmeniä tuhansia tuotteita, ja tuommoinen "merkkijonohaku" (hitto että tämä jo terminä jotenkin huvittavan alkeellisen kuuloinen nykypäivänä) palauttaisi lähinnä helvetin pitkän listan tuotteista, joiden tuotenimistä, tuotekuvauksista ym. kentistä on löytynyt osittainen merkkijonohaku (jos se oli oikein kirjoitettu), ja lista olisi korkeintaan jossain aakkosjärjestyksessä. Ei palvele ketään.

Oikeasti hyvin toteutettu haku osaa hakusanan perusteella päätellä, mitä käyttäjä tarkoittaa. Ja tässä on nykyään kovaa vauhtia yleistynyt ja tulee yleistymään AI:n käyttö, joka tulee parantamaan eri hakutoimintoja tarkkuudellaan nykyisestä huimasti. Siinä tämmöiset "merkkijonohaulla" toteutetut palvelut jäävät äkkiä syrjään, kun käyttävät turhautuvat 90/2000 -luvun tyyliin toteutetun oldskool-haun paskuuteen.
 
Tuotteiden hakuun voisin sanoa yhden sivun joku oli huonosti toteutettu LVI tukkuri dahlin sivuilla jos yritit hakea sanoilla 'pönttö", "wc pönttö", "wc-istuin" jne ei tullut hatulokseksi sitä porsliinista valta-istuinta vaan kaikkea muuta. koska tuote oli nimellä "wc-laite".

ja s-kaupan sivuilla oli aluksi. "Coka cola" hakusanalla sai vain perus kokiksen. zeroa tai jotain muuta varianttia hakiessa olisi pitänyt tietää tarkka tuotenimen kirjoitusasu katalogissa. Onneksi nyttemmin ovat korjanneet systeemit paremmin toimiviksi.

Google haku kyllä välillä ärsyttää kun haen tarkalla tuotetkoodilla jotain osaa niin saan suurimmaksi osaksi sponsoroituna jotain muuta ihan eri valmistajan osaa. Eli tuloksia millä en tee yhtään mitään. Vaikka kuinka olisi sponsoroitu niin valmistajan x tuote ei sovi valmistajan y laitteeseen.
 
No ei vastaa. Tuotteilla voi olla nimi, leipäteksti, kuvaus, brändi, kategoria ja tuloksilla tuntematon määrä tuoteattribuutteja.
Niin? Sitten vain haetaan noista kaikista, tai annetaan vaikka käyttäjän päättää checkboxeilla, mistä haetaan. Se itse hakufunktion toteutus ei kuitenkaan eroa mitenkään tiedostonimihausta.

Jossain isossa verkkokaupassa olisi aika historiallisen paska toteutus jos on vaan hakuboksi josta saat tuloksena kasan lajittelemattomia tuotteita ilman mitään mekanismia jälkisuodattaa sitä tulosjoukkoa esim. brändin, kategorian, hintahaarukan ja mahdollisten tuoteattribuuttien perusteella.
Se tulosjoukko on kuitenkin parempi suodattaa etukäteen kuin jälkikäteen. Tehostaa itse hakuakin paljon, kun haetaan pienemmästä joukosta.
 
Se tulosjoukko on kuitenkin parempi suodattaa etukäteen kuin jälkikäteen. Tehostaa itse hakuakin paljon, kun haetaan pienemmästä joukosta.
Mitähän tälläkin tarkoitat?
Hakualgoritmin tehtävä on nimenomaan "suodattaa" ja järjestää tulokset siihen muotoon, jonka uskotaan olevan käyttäjälle huödyllisin.

Eiköhän @kaarlos tarkoittanut juuri sitä samanlaista tulosmöhköä, jota aiemmassa viestistissäni kuvasin, ja joka olisi juuri tällaisen antiikkisen merkkijonohaun seuraus.
 
Niin? Sitten vain haetaan noista kaikista, tai annetaan vaikka käyttäjän päättää checkboxeilla, mistä haetaan. Se itse hakufunktion toteutus ei kuitenkaan eroa mitenkään tiedostonimihausta.

Ainiin, eli haku siis näyttää ihan hakukentän yhteydessä checkboxit Amazonissa mitä niistä ~tuhansista kategorioista ja varmaan sadoista tuhansista eri tuoteattribuuteista löytyy? Kuulostaa kieltämättä nopealta käyttää.

Tässä nyt ihan käytettävyyden nimissä tavataan mennä siihen suuntaan, että sen ensimmäisen haun tekeminen on mahdollisimman kitkatonta (== pelkkä hakukenttä) ja sen tehdyn haun myötä saat sivutetun tulosjoukon mukana metadataa joka kuvaa hakuun sisältyvät tuoteattribuutit, kategoriat sekä hinta-rangen jolla voit tarkentaa hakua ja nämä päivittyvät sitä mukaa kun tiukennat niitä kriteereitä.

Nojoo, ei kyllä millään tavalla kuulu tänne kuten Paapaa ylempänä mainitsi. Nämä haut on analogiaikana tehty Elloksen kuvastoista joissa toki nuorna poikana hakualgoritmit tapaavat vielä jämähtää sinne naisten alusvaatekuvastoon.
 
muistan kuinka kirjastossa oli joskus 90 luvulla tietokoneita (päätteitä?) joilla pystyi hakemaan teoksia. Yksivärinen pieni näyttö, käyttöliittymä tekstipohjainen ja pelkällä näppäimistöllä. PIti muistaa merkkirajoitukset ja tähdet** kun haki sanan osalla ja kaikkea muuta. Mutta sillä löysi oikeasti asioita kunhan sitä osasi käyttää. :comp2:

Sitten jossain vaiheessa tilalle tuli web-pohjainen haku jolla löytyi huonommin ja esimerkiksi teoksen hyllypaikan löytääkseen joutui klikkailemaan sieltä ja täältä ja hyvä jos löysi. :dead:
 
muistan kuinka kirjastossa oli joskus 90 luvulla tietokoneita (päätteitä?) joilla pystyi hakemaan teoksia. Yksivärinen pieni näyttö, käyttöliittymä tekstipohjainen ja pelkällä näppäimistöllä. PIti muistaa merkkirajoitukset ja tähdet** kun haki sanan osalla ja kaikkea muuta. Mutta sillä löysi oikeasti asioita kunhan sitä osasi käyttää. :comp2:

Sitten jossain vaiheessa tilalle tuli web-pohjainen haku jolla löytyi huonommin ja esimerkiksi teoksen hyllypaikan löytääkseen joutui klikkailemaan sieltä ja täältä ja hyvä jos löysi. :dead:
Jotain tämän kaltaisia kapistuksia? T: juniori, joka ei ole koskaan päässyt tuollaisiin edes kajoamaan

 
Jotain tämän kaltaisia kapistuksia? T: juniori, joka ei ole koskaan päässyt tuollaisiin edes kajoamaan
Ainakin Turun suunnalla Suomessa nuo ekat digitalisaation tuomat itsepalvelupäätteet olivat DOS-pohjaisia perus-PC-koneita ja niissä oli sellainen sinipohjainen Turbo Vision -tyylinen käyttöliittymä. Samoja oli myös kirjaston henkilökunnalla käytössä. Joskus 2000-luvun puolella sitten Vaski-kirjastoissa ja vastaavissa siirryttiin Windows-pohjaisiin.
 
Ennen digitalisaatiota oli kyllä paljon paremmin kun ei tarvinnut murehtia hakumoottereiden puutteista ja syntaksista.

Sai vaan rauhassa kävellä pitkin kaupan käytäviä etsien tuotetta, ehkäpä jopa kysyä myyjältä, ja jos tuotetta ei löytynyt niin voi aina kävellä seuraavaan kauppaan ihmettelemään jospa sieltä löytyisi. Sadepäivänä ehkä arvoin kauppojen nimiä Keltaisista Sivuista, ja lankapuhelimella soittaen koitin kuvailla osaa jonka oikeaa nimeä en tiennyt.

Näin ne hommat hoitui varsin tehokkaasti, ennen kun digitaalisaatio ja hakukoneet pilasivat tämänkin.
 
Ennen digitalisaatiota oli kyllä paljon paremmin kun ei tarvinnut murehtia hakumoottereiden puutteista ja syntaksista.

Sai vaan rauhassa kävellä pitkin kaupan käytäviä etsien tuotetta, ehkäpä jopa kysyä myyjältä, ja jos tuotetta ei löytynyt niin voi aina kävellä seuraavaan kauppaan ihmettelemään jospa sieltä löytyisi. Sadepäivänä ehkä arvoin kauppojen nimiä Keltaisista Sivuista, ja lankapuhelimella soittaen koitin kuvailla osaa jonka oikeaa nimeä en tiennyt.

Näin ne hommat hoitui varsin tehokkaasti, ennen kun digitaalisaatio ja hakukoneet pilasivat tämänkin.
Onpa kyllä aika typerä olkiukko, ja tajuat varmasti itsekin, mikä kaikki viestissäsi on pielessä.

Välissä kuitenkin oli sellainen aikakausi, kun tuotehaut olivat jo digitalisoituneet ja niiden saattoi vielä olettaa toimivankin. Nyt uusi normaali on, että se haku ei löydä tuotetta, vaikka tuotenimen kirjoittaisi siihen sellaisenaan hakusanaksi.

Eikä sillä digitaalisella haulla (toimivallakaan) nyt varsinkaan löydä jotain tuotetta, jonka nimeä ei tiedä, vaan jota osaa korkeintaan kuvailla. Silloin tarvitaan sitä myyjää tai muuta asiantuntevaa asiakaspalvelijaa.
 
Esimerkiksi hakusanalla "vaijeri" pitäisi löytyä mm. tuote nimeltään "vaijerin kuori", mutta valitettavasti esimerkiksi IKH:n verkkokaupan haku ei toimi noin.
IKH haku näyttää olevan juurikin sellainen että se hakee haettua merkkijonoa tuote tiedoista, ja esittää ne sitten jossain järjestyksessä.

Vaijeri siis tuntuu löytävän ison määrä tuotteita joissa on peräkanaan merkit vaijeri jossa kentässä. ja esittää ne sitten käyttäjällä jossain järjestyksessä, oletuksena ilmeisesti "osuvuus" vaikuttaa sen verran sekalaiselta että on varmaan se järjestys missä ne tulostuu ilman järjestely, saati jotain älykkäämpää.

Älykkäämmät algortimit, vai AI , niin voisi löytää myös tuotteita joiden löytämiseen käyttäjä ei ole osannut tarkkaa haku fraasia kirjoittaa.

Tosin jos uniikki ensikertalainen käyttäjä tuolee suoraan kotisivun URLilla, niin "vaijeri" hakusanasta ei voi kovin personoitua kehittää, jos kirjoittaa lainausmerkeillä "vaijeri" niin vanhempi koodari opimoija tarjoaa ensimmäisen perus vaijeria metritavarana.

Googlen hakukone löytää sieltä vaijerin suojuksia, eli Google osas löytää.
 

Statistiikka

Viestiketjut
253 988
Viestejä
4 417 948
Jäsenet
73 258
Uusin jäsen
lu1kero

Hinta.fi

Back
Ylös Bottom