25.08.2020

Tekoäly ja tietovarastot

Hei,

Kirjoitin aiemmin blogin siitä, kuinka monet ymmärtävät tekoälyn hieman väärin.

Yksi asia tuntuu jakavan ihmisten mielipiteitä. 

Onko tekoälyn hyödyntäminen jollain tapaa yhteydessä tietovarastoihin ja BI-ratkaisuihin (Data Warehousing & Business Intelligence, eli DW/BI)?

DW/BI-ratkaisuja kutsutaan myös ”raportoinniksi” tai ”analytiikaksi” eli tuodaan erilaista dataa yhteen analyysiä varten.

Osan mielestä tekoäly on ikää kuin jatkumo tälle kehitykselle, eli ensin on DW/BI sitten edistynyt analytiikka ja viimeisenä pysäkkinä tekoäly. 

He sanovat, että turha mennä asioiden edelle; tee ensin tietovarastoa ja sitten voit vasta siirtyä tekoälyyn.

Vastakkaisen näkemyksen mukaan näillä on vain vähän yhteyttä toisiinsa. 

Tekoälyä voi ja tulee kehittää ilman mitään kummempia jaettua tietoalustaa. Tarvitaan vaan datasettejä, algoritmeja ja pilveä.

Kumpi on oikeassa vai ovatko kummatkin? Pohditaan asiaa tarkemmin.

 

Tekoälyn hyödyntämisen vaiheet

Kerron esimerkin oikeasta elämästä, nimittäin eräästä verkkokaupasta.

Kaikki varmaan joskus ovat tilanneet jotain verkkokaupasta, eli se on suhteellisen tuttu alue monille ja soveltuu siten meille esimerkiksi.

DW/BI:llä voidaan selvittää, kuinka monta tuotetta verkkokauppa myy, kuka tuotteita ostaa ja missä päin maailmaan mitäkin tuotetta tilataan. Verkkokauppa voi laskea eri tuotekategorioiden katteita sekä investointien vaikutuksia myyntiin.

DW/BI ratkaisulla verkkokauppa voi siis yhdistellä erilaista tietoa, esim tutkia varaston kiertoa yhdessä myyntilukujen kanssa, ja tehdä siten paljon erilaista optimointia.  

Puhutaan klassisesta tietojohtamisesta; tehdään päätökset kuinka paljon vaikkapa tuotteita tilataan eri maiden varastoihin tietoon nojaten.

Edistyneellä analytiikalla verkkokauppa voi taas ennustaa, että ketkä ovat potentiaalisimmat asiakkaat ja mitä he todennäköisimmin ostavat.

Heillä on nimittäin paljon dataa siitä, mitä esimerkiksi 20-25 vuotiaat opiskelijat Helsingissä ostavat.

Muuttujia on paljon (demografia, ostohistoria, sijaintitiedot) ja voimme rakentaa sellaisen koneoppimismallin, jonka perusteella voimme hyvin tarkkaa ennustaa tulevia ostoksia. 

Näin verkkokauppa voi ottaa hieman etukenoa ja asioiden optimointi tehostuu.

Se voi optimoida varaston kiertokulkua erittäin tehokkaasti, koska tilaukset perustuvat automaattisesti kysyntään ja hävikkiä tulee vähän.

Edistyneen analytiikan myötä menemme siis askeleen pidemmälle, kun klassisessa tietojohtamisessa.

Tekoälyä hyödyntämällä otamme jälleen harppauksen edistyneestä analytiikasta kohti kehittyneempää automatiikkaa.  

Tekoälyä ja algoritmeja hyödyntäen verkkokauppa voi lähettää tuotteen valmiiksi potentiaaliselle ostajalle, ennen kun hän on painanut tilausnappia. 

Näin hän saa tuotteen jopa yhdessä päivässä kotiovelleen. 

Miten se on mahdollista?

Verkkokauppaa tietää koneoppimisen mallien perusteella, kun sen kanta-asiakas käy yli kolme kertaa tietyn tuotteen tilaussivulla, hän tilaa tuotteen yli 80 % todennäköisyydellä. 

Heillä on toki käytössä mallissaa muitakin muuttujia ja siksi ennuste onkin hyvin tarkka.

Tämä triggeröi tilauksen lähtemisen matkaan varastosta automaattisesti. 

Moni voi hieraista silmiään tässä kohtaa, eli kuinka tällainen riski voidaan ottaa? Kaikki perustuu kuitenkin matematiikkaan.

Jos jokin on ennustettavaa, niin ihmisten ostokäyttäytyminen. Mieti vaikka omaa kauppakassia, onko siellä paljon samoja tuotteita kun viime viikolla? 

Kun verkkokaupalla on tästä paljon dataa ja, he voivat kehittää yllä kuvattua ”älykästä” varastonhallintaa.

 

Kaikki lähtee datasta

Kyseinen esimerkki ei ole utopiaa, vaan Amazonin kuuluisia päivän tilaus. Se on jo siis nyt toiminnassa.  

Amazon on Amazon, eikä kaikki voi olla amazoneja, se on selvää. Mutta periaate on kuitenkin sama kaikilla.

Jos palataan alkuperäiseen kysymykseen, että tarvitaanko DW/BI-ratkaisua tekoälyn kehittämisessä, niin tietyllä tavalla kyllä tarvitaan.

Voisiko Amazon tuottaa kyseisen ennakoivan ratkaisun ilman, että se voisi tuottaa edes yksinkertaista DW/BI-raporttia alueesta? 

Ajatellaan, että Amazon ei tietäisi kuinka monta tuotetta tilataan vuodessa, kuka niitä tilaa tai mikä on varaston koko. 

Nämä olivat siis niitä DW/BI-puolen asioita, eli tekoälyn kehityskaaren ikään kuin ensimmäisiä vaiheita.

Vastaus on ei. Ilman näitä tietoja ei voi toteuttaa Amazonin kuuluisaa päivän tilaus -mallia. Itse BI- ja raportointikäytännöt eroavat, mutta tiedot tarvitaan.

Jos mietitään isoja suomalaisia yrityksiä, niin hyvin usein ollaan tilanteessa jossa kehitetään tietovarastoa, eli ei voida vielä kunnolla tuottaa edes BI-raportteja. 

Tässä ei ole toki suomalaisilla yrityksillä mitään hävettävää, he eivät ole mitenkään jäljessä vaan päinvastoin.

Yksi maailman suurimmista lääkeyrityksistä ei tiedä paljonko se myy lääkkeitä kuukausittain. He rakentavat nyt tietovarastoa, jotta saisivat tämän selville.

Amazonilla, Supercellillä ja Netflixillä on siinä mielessä helpompaa, kun operoidaan yhdellä alustalla. Isolla teollisuusyrityksellä on satoja IT-järjestelmiä.

Näin ollen voi sanoa, että kannattaa ensin miettiä miten saa rakennettua DW/BI-raportteja kunnolla, ennen kun lähtee automatisoimaan varaston kiertokulkua tekoälyllä. 

Entä sitten chatbotit ja itseohjautuvat autot, mihin niiden rakentamisessa tarvitaan tietovarastoa?

 

Pisteratkaisut

Tänä päivänä useat tekoälyratkaisut liittyvät tekstin, kuvan, videon tai äänen hyödyntämiseen. 

Teknologian kehittyminen tarjoaa valtavia mahdollisuuksia näillä alueilla ja voi tehdä monta ammattikuntaa täysin turhaksi.

Miettikää kuinka moneen ammattiin liittyy jonkin asian katsominen tai tekstin tutkiminen ja siitä johtopäätöksen tekeminen?

Lääkärit katsovat röntgenkuvia ja outouksia ihossa, tullimiehet rajanylittäjiä ja lukemattomat eri ammattiryhmät erilaisia kirjallisia dokumentteja. 

Entä kuinka paljon puheohjaus säästäisi ihmisten aikaa, kun voisimme ohjata kaikkea ympärillämme vain parilla sanalla?

Pelkästää itseohjautuva auto olisi todella mullistava keksintö (toki niitä on, mutta sitten kun tulevat käyttöön), joka muuttaisi yhteiskuntia hyvin radikaalisti.

Mihin näissä tarvitaan DW/BI-raportteja? 

Pointti on, että ei mihinkään. Miksi siis yritys ei voisi ruveta kehittämään tuotantolinjalle konenäköön perustuvaa lajittelijaa ilman sen kummenpia DW/BI-virityksiä?

 

Kokonaisvaltainen tekoäly

Edellä mainitut tekoälyn hyödyntämisen esimerkit ovat ns pisteratkaisuja, eli sidottu tiettyyn alueeseen. 

Jos tekoäly tunnistaa röntgenkuvasta syövän, niin mitä sitten tapahtuu? Tämä tieto pitää yleensä integroida potilaan muuhun tietoon. 

Esimerkiksi potilastietoihin, kuten ikään, sukupuoleen ja vaikkapa hoitohistoriaan. 

Nämä tiedot eivät pyöri datasetteinä tekoälykehittäjien Python-kirjastoissa, vaan ovat järeissä IT-järjestelmissä ja DW/BI-systeemeissä. 

Jos haluamme selvittää syövän syyn, ehkä haluamme yhdistää tietoa potilaasta hyvin laajalti. Näin voimme saada oikeaa vaikuttavuutta aikaiseksi.

DW/BI-osaaja ei osaa kehittää tekoäly-algoritmeja, mutta hän osaa integroida dataa eri lähteistä ja tarjoilla sen valmiiksi käsiteltynä datan kulutusta varten.

Tekoälykehittäjä taas osaa tehdä ennustemallit ja algoritmit, mutta ei osaa integroida sitä data-alustaan tai ”tuotteistaa” sitä peruskäyttöä varten.

Kumpikaan edellä mainituista ei ole myöskään liikkeenjohdon ammattilainen, joka osaisi suunnitella verkkokaupan koko varastologistiikan.

Mikäli halutaan kehittää tekoälyä kokonaisvaltaisesti, näiden osaajaryhmien pitää tehdä yhteistyötä.

 

Yhteinen virtuaalinen data-alusta

Toki ymmärrän, että tekoälykehittäjän maailmassa DW/BI-ratkaisut tuntuvat vieraalta.

Vähän niin kuin Michelin-tason huippukokki ei välitä miettiä miten orkestroidaan globaalin ravintolaketjun ruoka-annosten toimitus tasa-laatuisesti.

Samaan tapaan huippu tekoälykehittäjä harvemmin tietää ison volyymin datatuonnosta juuri mitään.

Amazon-esimerkissä edistyneen analytiikan mallit on yhdistettävä varaston hallintaan liittyvään järjestelmään sekä muihin toimitusketjun osiin. 

Siinä ei ”huippukokin” temput enää auta. Tarvitaan hyvin pitkälle vietyä eri ammattiryhmien yhteistyötä.

Miten olisikaan houkutteleva ajatus rakentaa yhteinen data platform, tietovarasto tai data lakehouse (kyllä, kuulit oikein, jälleen uusi termi), johon kaikki data tuotaisiin. 

Jos mietimme isoa organisaatiota, se ole kuitenkaan realistista. Dataa on liian paljon ja monikansalliset yritykset eivät säädösten vuoksi niin vain liikuttelee dataa yli rajojen.

 

Uusi näkökulma

Ari Hovilla konsultit suunnittelevat tähän kuitenkin ratkaisua erään ison innovatiivisen pörssiyrityksen kanssa. 

Ellie-mallinnustyökalu on tässä keskiössä 

Ellie nimittäin mahdollistaa ison ”datakartaston” laatimisen virtuaalisesti. 

Toisin sanoen sillä voi laatia virtuaalisen replikan koko konsernin kattavasta platformista. 

Ajatus on vielä se, että Ellie integroidaan data catalog-tuotteen kanssa.

Ollaan erittäin jännän äärellä, nimittäin voimme tällä ratkaisulla oikeasti ottaa datavarannon kunnolla haltuun 

Jos organisaatio ymmärtää ratkaisun avulla datavarantonsa ja yhteistyö on arkkitehtuurin ytimessä, voimme tehdä ”amazonit”.

Näin kyseinen organisaatio saa valtavan kilpailuedun, koska se pystyy toteuttamaan sekä pistemäisiä tekoälyratkaisuja, että varmistamaan niiden integroimiseen muihin järjestelmiin.

Homma on alussa ja katsotaan miten käy. Nyt tehdään jotain täysin uutta ja ollaan ikään kuin tutkimusmatkalla.

Pidän teidät kuitenkin ajantasalla että miten homma edistyy. 

Jos kiinnostaa kuulla lisää, niin voin kertoa privaatisti lisää. 

 

Ystävällisin terveisin,

Johannes Hovi

Ps. Järjestämme jälleen Data Vault 2.0 Sertifiointikoulutuksen 28.9.2020 etätoteutuksena.

Data Vault 2.0 Bootcamp + Certification

Kolme päivää tiukkaa asiaa ja mahdollisuus suorittaa arvostettu, menetelmän kehittäjän Dan Linstedtin auktorisoima sertifointikoe. Varmista, että tietovarasto-osaaminen on kunnossa ja hanki sertit koko tiimille!

Erään kurssilaisen palaute edellisestä bootcampistä, joka järjestettiin myös etätoteutuksena:

“This was one of the best trainings I have ever taken! Cindi showed she fully masters the content and material inside out, and she is really good in doing the actual trainging. Thank You! nothing you could have done better.”

Lisätiedot ja ilmoittautuminen tästä.

Saattaisit olla kiinnostunut myös näistä

Data Lakehouse -arkkitehtuuri

Lue lisää

Tiedon elinkaari ja tiedonhallinta

Lue lisää

Tietovaraston paras arkkitehtuuri

Lue lisää