17.11.2020

Datanlukutaitoa voi kehittää

Hei,

Data- ja analytiikkajohtajien kaksi suurinta haastetta ovat Gartnerin mukaan kulttuuri ja datanlukutaidon puute.

MItä nämä kaksi oikeastaan tarkoittavat?

Datavetoisesta kulttuurista on puhuttu jo jonkun aikaa, joten monilla on siitä jonkinlainen käsitys. Ainakin se tarkoittaa toimintatapaa, jossa päätökset perustuvat dataan. 

Kokonaisuudessaan se on kuitenkin hyvin laaja käsite, jonka voi ymmärtää kukin omalla tavallaan. Datanlukutaito on mahdollisesti vieläkin täsmentymättömämpi käsite.

 

Miten Gartner kuvaa datanlukutaidon?

”Gartner defines data literacy as the ability to read, write and communicate data in context, including an understanding of data sources and constructs, analytical methods and techniques applied — and the ability to describe the use case, application and resulting value.”

Vaikka määritelmä on selkeää englantia, ei tämä vielä konkretisoi asiaa kovinkaan tarkasti. Ainakin tämän voi ymmärtää hyvin monella tapaa. Palaan myöhemmin siihen, miten itse ymmärrän datanlukutaidon. Tarkastellaan ensin vähän datanlukutaidon taloudellista merkitystä yrityksille ja organisaatioille.

 

Yritykset hyödyntää dataa ovat vaarassa epäonnistua

David Dadoun pelifirmasta nimeltä Ubisoft piti Tukholmassa Data Innovation Summit 2020 -konferenssissa ansiokkaan esityksen datanlukutaidosta. 

Hän eritteli muutamien faktojen avulla sitä, mitä datanlukutaidon puute maksaa yrityksille. Hän aloitti panostuksista, joita yritykset satsaavat data- ja analytiikka-aloitteisiin.

Pelkästään vuoituiset tekoälypanostukset kasvavat lähes 100 miljardiin dollariin globaalisti jo vuonna 2023. Data Science -aloitteista kuitenkin yleisesti vain 13% päätyy tuotantoon asti. 

Toisaalta tarkasteltuna niistä aloitteista, jotka ovat analyyttisesti tarkasteltuna menestyksekkäitä – eli tuottavat analyyttisiä oivalluksia – ainoastaan 20% kääntyy liiketoiminnallisiksi tuloksiksi. Vaikka näistä lähtötiedoista ei pysty laskemaan tarkkaa lukuarvoa, selvää on, että valtaosa 100 miljardin panostuksista valuu hukkaan.

Dadounin mukaan keskeisin syy surkeisiin tuloksiin on organisaatioiden datanlukutaidon puute.

 

Mitä datanlukutaidon puute maksaa yrityksille?

PItäisikö panostukset data-, analytiikka- ja tekoälyhankkeisiin sitten lopettaa? Ovatko ne hukkaan heitettyä rahaa?

Eivät keskimäärin. Kolikon toinen puolihan on se, että niilllä jotka onnistuvat, voivat tuotot olla satumaisia. Tarkastelemalla listaa maailman arvokkaimmista yrityksistä nähdään, että panostukset tuottavat.

Vaikka unohdettaisiin nämä piilaakson gorillat, tavallisiakin yrityksiä tarkastelemalla huomataan, että panostukset dataan, analytiikkaan ja tekoälyyn tuovat laaja-alaista kilpailutetua. Forbes-lehdessä tiivistettiin asia seuraavasti:

”McKinsey Global Institute indicate that data driven organizations are 23 times more likely to acquire customers, six times as likely to retain those customers, and 19 times as likely to be profitable as a result.”

Datavetoiset yritykset lyövät siis kilapailijansa keskimäärin kaikilla toiminnan osa-alueilla. Yrityksillä ei ole varaa olla panostamatta dataan.

Jos David Dadounin ohjeita seuraa, yritysten tulee edelleenkin panostaa dataan, mutta pitää huolehtia datanlukutaidon kehityksestä organisaatiossa.

Pitäisikö hänen arvionsa hyväksyä sellaisenaan? Ainakin hänen arvionsa on linjassa monien omien omien havaintojemme kanssa. 

Meitä pyydetään usein auditoimaan asiakkaidemme data- ja analytiikkahankkeita ja niissä toteutettuja ratkaisuja.

Usein johtopäätös on seuraavan suuntainen:

Tekijät ovat olleet ammattilaisia, ja he ovat tehneet oikeansuuntaisia teknologia- ja arkkitehtuuriratkaisuja. He ovat siis tehneet asiat keskimäärin oikein. Kuitenkaan hankkeet eivät ole välttämättä toteuttaneet liiketoiminnan tavoitteita. Tai itse asiassa tavoitteet itsessään ovat olleet usein epäselviä. Toisin sanoen ei ole osattu tehdä oikeita asioita. 

Asiakkaamme ovat saattaneet käyttää miljoonia tekemällä asioita oikein, mutta tulokset eivät ole tyydyttäviä, koska on tehty vääriä asioita. Tällä on suora yhteys omaan määritelmääni datanlukutaidosta, johon palaan seuraavaksi.

Meidän kokemuksemme mukaan siis datanlukutaidon puute maksaa paljon myös suomalaisille organisaatioille.

 

Mitä datanlukutaito konkreettisesti tarkoittaa?

Datanlukutaito tarkoittaa kykyä lukea, mitä data meille kertoo. 

Datasta voi muodostaa kuvaajia, joista voidaan tarkastella trendejä. Onko myynnissämme vuodenaikojen mukaista syklisyyttä. Voidaanko syklisyyden läpi nähdä myynnissä trendinomaista nousua tai laskua.

Toisenlaisella kuvaajalla voidaan tarkastella asioiden välistä korrelaatiota ja pohtia mahdollisia syyseuraussuhteita. Sopivalla kuvaajan akselien valinnalla voidaan havaita myös muutoksia, jotka muuten jäisivät huomaamatta. Muhimasssa oleva epidemia voidaan havaita, kun ymmärretään, että meidän pitää seurata asioiden kehittymistä logaritmisella asteikolla.

Perusymmärrys tilastollisista lainalaisuuksista auttaa kriittisessä tarkastelussa siitä, onko havaittu muutos trendiomainen vai onko kyseessä kenties vielä satunnaisuuteen liittyvä ”kohina”.

Nämä kaikki taidot auttavat hahmottamaan sitä, mitä data meille kertoo. 

Osaamme analysoimme asioita oikein, mutta analysoimmeko oikeita asioita?

Datanlukutaitoon kuuluu keskeisesti myös kyky lukea, mitä data itse asiassa kuvaa.

Kuvaako data koko kuluttajamarkkinaa? Kuvaako data kaikkia kuluttaja-asiakkaita Suomessa? 

Vai kuvaako data sitä osajoukkoa kuluttaja-asiakkaista, jotka on satuttu kyselytutkimuksessa tavoittamaan,? Esimerkiksi niitä asiakkaita,  jotka viettävät aikaansa kauppakeskuksissa silloin,  kun kyselytutkimuksen tekijät ovat toimistotyöajan puitteissa niihin jalkautuneet. Tällöin aineistossa lienee aliedustettuina työssä käyvät.

Tämä tieto voi olla keskeinen – tai sitten ei ole – riippuen käyttötarkoituksesta. Keskeistä on, että tiedon käyttäjä tietää mitä data itse asiassa kuvaa.

Tällaisissa yksinkertaisissa tapauksissa riittää, että tiedon hyödyntäjä vaivautuu tarkastelemaan datan sisältöä tarkemmin ja osaa kriittisesti arvioida, mitä se tarkoittaa. 

Monimutkaisemmissa tapauksissa asia ei välttämättä ratkea dataa tarkastelemalla. 

Teollisen tuotantolaitoksen ongelmien juurisyistä ei välttämättä löydy vihjeitä pelkästään logitietoja tarkastelemalla. Datasta ei välttämättä hyppää esille, että virhetilanteet syntyvät tietyllä komponentttinimikkeen ja komponentin toimittajan yhdistelmällä.

Tässä auttaa tiedon mallintaminen. Tietomalli, joka kertoo että tuotannossa käytetään samoja komponenttinimikkeitä eri toimittajilta, antaa suoran vihjeen siitä, mitä varitaatioita tulisi analysoida.

Asiayhteys – se mihin kaikkeen muuhun dataan tarkasteltava data liittyy – auttaa ymmärtämään, mitä data itse asiassa kuvaa. Gartner kuvasi tätä sanoilla ”data in context”.

Miten tämä liittyy audioimiimme hankkeisiin, joissa on tehty miljoonilla asioita oikein, mutta mahdollisesti vääriä asioita?

Jos hyvät tietomallit auttavat datan tulkinnassa, auttavat ne mitä suurimmassa määrin silloin, kun määritellään mitä dataa meillä pitäisi tulevaisuudessa olla saatavilla.

Tietoalustahankkeissa on tärkeämpää tehdä oikeita asioita kuin tehdä asioita oikein. 

Hyvällä tietomallinnuksella varmistetaan että tuleva tietoalusta kuvaa sitä, mitä sen haluamme kuvaavan.

Tällöin tulevilla tiedon käyttäjillä on varmuus siitä, mitä tutkittava data itse asiassa kuvaa.

 

Kumpi tulee ensin, datavetoinen kulttuuri vai datanlukutaito?

Alussa todettiin, että data- ja analytiikkajohtajien kaksi suurinta haastetta ovat kulttuuri ja datanlukutaidon puute.

Tässä kirjoituksessa on kuitenkin keskitytty vain jälkimmäiseen.

Datavetoisen kulttuurin kehittäminen on laaja kokonaisuus ja kokonaan erillisen blogikirjoituksen aihe, tai useamman.

Kuitenkin näiden kahden suhdetta voidaan tarkastella miettimällä, kumpi oli ensin kulttuuri vai lukutaito. Puhun tässä nyt kulttuurista yleisesti ja tavallisesta lukutaidosta.

En osaa vastata kumpi oli ensin. Sen kuitenkin muistan historiantunneilta, että lukutaidon kehitys on ollut keskeinen ellei keskeisin mootori kukoistavien kulttuurien kehitykselle.

Uskon että datanlukutaidon kehitys on samoin keskeisin moottori orgnisaation datavetoisen kulttuurin kehitykselle.

Ystävällisin terveisin,

Hannu Järvi
hannu.jarvi (@) arihovi.com

Ps. Pidän aiheesta myös räätälöityjä yrityskohtaisia koulutuksia, kysy lisää minulta.

Ps. Kannattaa myös tutustua tulevaan tiedon mallinnuksen koulutukseemme, mikäli haluat kasvattaa datanlukutaitoasi.

Tietojen mallintaminen – Data Modeling

Kurssi kattaa käsitteiden mallintamisen liiketoimintaihmisten kanssa, arkkitehtuurityyppisen mallinnuksen sekä laajat, yritystasoiset tietomallinnukset.

Listätiedot ja ilmoittautuminen tästä.

Saattaisit olla kiinnostunut myös näistä

Datan hallinta

Tietojen mallintaminen – Data Modeling

Lue lisää
Datan hallinta

Advanced Data Modelling

Lue lisää