03.09.2018

Kompleksi dataprojekti

Hei,

Data-ala on kaikkien huulilla, koska sen hyödyntäminen nykyisin yritysten elinehto.

Yritystämme lähestytään jatkuvasti asiakkaiden toimesta ja pyydetään apua monenmoisiin datahaasteisiin. Nyt puhutaan paljon Master Data Managementistä, Data Governancesta, Data Qualitystä, Data Platformeista sekä koneoppimisesta.

Olemme auttaneet näissä kaikissa datan hyödyntämisen osa-alueissa asiakkaitamme jo pitkään. Vasta viime vuosina on näiden termien käyttö yleistynyt ja näillä nimikkeillä kulkevia projekteja tehdään nyt entistä enemmän. Yritykset haluavat nyt tosissaan kehittää data-analytiikkaa sekä sen hyödyntämistä liiketoiminnan kehittämisessä.

Yllä mainitut termit ovat hyödyllisiä, niitä tarvitaan kommunikoinnin tueksi, vaikkakin niiden sisältö hieman vaihtelee eri organisaatioissa. Kirjoitin aikaisemmin bloginkin, jossa avasin näiden termien merkityksiä.

Kerron tässä kirjoituksessa hieman siitä, miksi dataprojektit ovat luonteeltaan komplekseja ja miksi juurisyyn selvittämisestä kannattaa lähteä liikkeelle.

Datan hyödyntäminen on kompleksista

Yhdestä asiasta lähes kaikki data-asiantuntijat on samaa mieltä: datan hyödyntäminen on erittäin kompleksista, kun kyseessä on vähänkään PK-yritystä isompi organisaatio. Kirjoitin aikaisemmin näistä realiteeteista ja tavoista, jolla suomalainen tiedonhallinta on järjestetty.

Data hyödyntämisen kompleksisuutta ei ole syytä aliarvioida. Jos se olisi helppoa, niin Google ja Amazon olisivat helisemässä, koska kaikki voisivat kilpailla heidän kanssaan. Monimutkaisia ongelmia on paljon muitakin, kuten Sote tai monet EU-asiat, vaikkapa EU-tasoinen yhteinen talousjärjestelmä.

Mittakaava on Sotessa ja EU:ssa ehkä eri, mutta datan hyödyntäminen muistuttaa usein Sote-tyyppistä vääntöä: sitä tehdään monien ihmisten toimesta, eikä kukaan oikeasti tiedä tarkalleen että miten se lopulta toimii.

Yhtälailla datahankkeita saattaa vaivata sekavuus ja se, että niitä yrittävät aina yhä uudet ihmiset pistään kuntoon, koskaan siinä onnistumatta. Tunnen pörssiyrityksen,  joka ovat 20 vuotta rakentanut organisaatiotason data-alustaa, mutta kaikki yritykset ovat kariutuneet yksi toisensa jälkeen.

Kompleksisuus tulee usein myös näkyviin siinä, että on asiaan on hyvin monta näkökulmaa, joita jokaista edustaa ryhmä ihmisiä. Soten kanssa mietitään ainakin taloudellisia, sosiaalisia, aluepoliittisia sekä kansanterveydellisiä näkökulmia. Kukaan yksittäinen ihminen ei hallitse kaikkia alueita, vaan eri näkökulmilla on omat asiantuntijansa. Osaaminen on siis siiloutunutta. Tämä tekee Sotesta niin kimurantin toteuttaa.

Samat haasteet ovat myös dataprojekteissa. Niissä on otettava huomioon taloudellinen näkökulma, IT-infrastruktuuri, henkilönäkökulma (roolitukset ja vastuuasiat), data (esim missä datat ovat ja missä muodossa) sekä käyttäjänäkökulma (datan hyödyntäjät).

Kompleksiset hankkeet aiheuttavat asianosallisille ns kognitiivista kuormaa. Sillä tarkoitetaan henkistä ponnistelua, kuten monimutkaisten syy-seuraussuhteiden hahmottamista, uuden oppimista ja abstraktioiden hahmottamista.

Kognitiivinen kuorma

Miettikäämme hetkeksi substanssiosaamista ja asintuntijuutta. Tietotyössä Ihminen hankkii tyypillisesti jonkin koulutuksen ja jatkaa siitä työelämään. Erikoistuminen tapahtuu tyypillisesti opintojen lopulla ja ensimmäisissä työpaikoissa. Toki on olemassa moniosaajia, mutta usein osaaminen alkaa kehittyä tiettyyn suuntaan ja saavuttaa jossain vaiheessa erikoistumisen asteen. Olemme lopulta liiketoiminan, talouden, HR:n, markkinoinnin tai esimerkiksi IT-alan substanssiosaajia.

Substanssiosaamisessa ei ole kyse vain tietotaidosta. Kehitämme itsellemme tietyn kulttuurin, sanaston ja uskomusjärjestelmän liittyen alueeseemme. Tähän vaikuttaa toki sekin, että jokaista aluetta palkitaan tietyn tyyppisestä toiminnasta ja ajattelusta.

IT-puoli on jakautunut lukuisiin heimoihin ja alaheimoihin. On koodaajia, ERP-, CRM-, DW/BI-konsultteja sekä lukematon määrä erilaisia osa-alueita. Ja heillä on myös kaikilla samaan tapaan oma kulttuurinsa ja maailmankuvansa.

Ihmisellä on rajallinen tiedonkäsittelykapasiteetti ja saatamme kokea kognitiivista kuormaa, jos ollaan siellä äärirajoilla. Kognitiivista kuormaa syntyy silloin, kun ollaan epävarmoja miten suhtautua ulkomaailmaan, uuteen tietoon tai ihmisiin. Kun käsitteet ja termit ovat tuttuja tietyssä viiteryhmässä, kognitiivinen kuorma vähenee. Näin ollen meillä on luontainen taipumus kuulua johonkin tiettyyn viiteryhmään, se tuntuu meistä helpolta.

Toinen kognitiivista kuormaa aiheuttava asia on uuden oppiminen sekä asettuminen mukavuusalueen ulkopuolelle. Uuden oppiminen lisää aina kognitiivista kuormaa, koska se edellyttää keskittymistä, ponnistelua ja paneutumista.

Me haluamme luontaisesti pysyä omalla substanssialueellamme ja välttelemme uuden oppimista. Kuinka moni esimerkiksi opiskelee jatkuvasti uusia taitoja? Sitä tehdään, mutta se vaatii panostusta.

Tee oikea diagnoosi

Dataprojektit ovat siis kompleksisia ja hankalasti määriteltäviä kokonaisuuksia.

Olen huomannut, että joskus saatetaan lähteä liian kunnianhimoisesti liikkeelle, haukataan liian iso pala kerralla. Toki pitää olla kunnianhimoa, mutta kokonaisuus silti kannattaa jakaa pienempiin osiin.

Neuvon asiakasta  aloittamaan juurisyyn selvittämisestä.

Eräällä aasialaisella lentoyhtiöillä oli jokin aikaa sitten ongelmia lentoturvallisuuden kanssa. Mietitiin monia eri teknisiä ratkaisuja, kunnes lopulta löydettiin juurisyy: yhtiöllä oli tiukka hierarkia, jonka esti lennonvalvojia tai perämiehiä raportoimasta ongelmista kapteenille.

Heidän kulttuurissaan pomolle ei ole tapana kertoa huonoja uutisia. Huomattiin, että kommunikoinnin parantaminen sekä hierarkian purkaminen olivat ne toimenpiteet, joilla oli suurin vaikutus lentoturvallisuuden parantamiseen.

Mikä on se perimmäinen ongelma organisaationi datan hyödyntämisessä? Esimerkiksi jollain voi olla kuluttajadatan laadun kanssa ongelmia. Saatetaan tulla siihen lopputulokseen, että tämä peräänkuuluttaa Data Quality-projektia, eli kutsukaamme kaikki DQM (Data Quality Management) toimittajat meille ja parhaat jättäkööt tarjouksen.

Edellä mainitussa esimerkissä juurisyy voi olla se, että esim yrityksen myyjät ovat viimeisen viiden vuoden aikana syöttäneet tietoja järjestelmään puutteellisesti, ohjeistus on ollut väärä. Ongelma ei ole siis aina teknistä laatua.

Juurisyy kannattaa selvittää samaan tapaan, kun lääkäri diagnosoi potilaan terveyshaasteen. Eli mikäli sinulla on dataan hyödytämiseen liittyvä ongelma, mieti hyvin tarkkaan että mistä haasteet pohjimmiltaan johtuvat.

Kun olemme löytäneet juurisyyn tai epäilyn sille, pitää miettiä mikä on pienin toteutettavissa oleva toimenpide joka vaikuttaa juurisyyhyn.

Esimerkiksi ylätason datakartoitus on melko pieni operaatio ja auttaa juurisyyn analysoinnissa. Pelkästään sen tekeminen ratkaisee niin monta asiaa, että lopulta oikea suunta löytyy helposti. Lyhyesti sanottuna siinä kartoitetaan liiketoimintadatat graafisen esityksen avulla ja selvitetään ihan perusasiat.

Kun olemme selvittäneet juurisyyn, mieti mikä on helpoin tapa vaikuttaa implementointiin.  Dataprojekteissa tarvitaan havainnollistamista eli kokeiluja, PoC:ja, demoja ja testejä.

Dokumentoi kokeilut ja projektit, näin eivät vain yksittäiset ihmiset opi, vaan myös muut ihmiset ja yksiköt oppivat. Näin tapahtuu organisatorista oppimista. Tässä kokeilujen ja datajalosteiden uudelleen hyödyntämisestä kirjoitan vielä uuden blogin.

Tämä auttaa myös siinä, että miten onnistunut projekti voi johtaa jatkuvaan prosessiin.

Osaamisen kehittäminen ja yhteistyö

Kävin erään johtajan kanssa läpi data-asioita ja siitä huolimatta että hän vaikutti ymmärtävän, en ollut siitä ihan vakuuttunut.

Hän ei nimittäin ymmärtänyt miksi datan mallinnuksessa datojen integrointi on niin tärkeää. Olin aluksi miettinyt, että kannattaako minun mennä tietokanta tasolle. Onko se liian teknistä, minun periaatteena on yleensä, ettei johdon kanssa kannata puhua liiallista IT/Data-jargonia.

Päätin lopulta koittaa, eli kerroin hänelle saman esimerkin jonka kerron tiedonmallinnuskoulutuksessa IT-ihmisille, jotka suunnittelevat tietokantoja. Johtaja ymmärsi relaatiokantojen rakenteen perusperiaatteen ja oli ihmeissään, että näinkö se homma menee, että onko kaikki datat tuolla tavalla tauluissa IT-järjestelmien sisällä? Että voinko käsitemallinnuksella tosiaan määrittää kaikki datat ja niiden yhteydet noin helposti? Kyllä voit, sanoin hänelle.

Tarinan opetus oli siis se, että vaikka asian omaksuminen lisäsi johtajan kognitiivista kuormaa, hän oli erittäin tyytyväinen että avasin asiaa tuolla tarkkuudella. Toinen opetus tarinassa on se, että älä yliarvioi toisen kykyä ymmärtää jotain, joka on sinulla ihan peruskauraa.

Samoin kuin juurisyyn diagnosoinnissa, lähde yhteistyön kehittämisessä pienin askelin liikkeelle. Lyödä pienin mahdollinen yhteinen tekijä, jolla yhteistyötä voi parantaa. Esim se, kaikki avaavat toisille keskeiset käsitteet. Liiketoiminta kerto IT:lle mikä on asiakas ja miten se määritellään ja IT kertoo, mikä on relaatiotietokanta ja mikä ns. data-allas.

Jos jonkun käsitemääritystyön päätteenä on esimerkiksi se, että liiketoiminta ymmärtää perusasiat datasta ja IT/Data-osaajat ymmärtävät tietyt liiketoiminnan peruskäsitteet, ollaan jo todella paljon viisaampia.

Näin voimme lähteä toteuttamaan esimerkiksi Data Governance -projektia täysin uudella vaihteella: osaamme tunnistaa juurisyyn sekä puhumme samaa kieltä.

Olen itse teknologia-fani ja  mukana isoissa ja komplekseissa datahankkeissa. Silti suosittelen asiakkaita aina alkuun panostamaan perusasioihin, juurisyyn diagnosointiin, oppimiseen sekä yhteistyöhön.

Yhteenveto

Väitän tässä kirjoituksessa, että ihmiset välttelevät oppimista ja eivät halua tehdä yhteistyötä erilaisten ihmisten kanssa.

Intuitiivisesti tulee heti mieleen vastaväite, että kyllähän ihmiset opiskelevat uusia asioita ja tekevät yhteistyötä. Todistamme tätä ympärillämme jatkuvasti. Onko väitteeni sittenkin väärä?

Kysyin asiaa meidän Johannekselta, joka on psykologi. Hän oli sitä mieltä, että ihmisellä on toki taipumus välttää kognitiivista kuormaa (oppimisen välttely ja ryhmään kuuluminen), mutta itseohjautuvuus on näitä vieläkin vahvempi tarve.

Tämä tarkoittaa Johanneksen mukaan sitä, että meillä on hyvin vahva tarve itse ohjata käyttäytymistä, jos se vie meitä johonkin päämäärään tai siitä palkitaan.

Opiskelemme vuosia korkeakoulussa, koska tiedämme sen lopulta palkitsevan. Teemme yhteistyötä, kompromisseja pyrimme niin ikään ymmärtämään muiden näkökantoja, jos se hyödyttää meitä. Muutosvastarinta voi olla meillä geeneissä, mutta niin on myös uteliaisuus, halu oppia ja oivaltaa.

Mutta vaikkapa italian kielen opiskelu tai uusiin ihmisiin tutustuminen ilman selkeää päämäärää on usein aikuiselle hankalaaa. Ei ole riittävää motivaatiota tai sitä tukevaa ympäristöä.

Organisaation on siksi hyvä luoda puitteet, työkalut ja mekanismit näille prosesseille.

Esimerkiksi seuraavilla toimenpiteillä:

  • Selvitä ongelman juurisyy

  • Lähde pienestä liikkeelle, testaa ja demoa

  • Dokumentoi tulokset myöhempää käyttöä varten

  • Järjestä n 1-2 pv koulutus/infopaketti/workshop kaikille dataprojektiin osallistuvalle

  • Määritä ja mallinna koulutuksessa keskeiset liiketoimintakäsitteet

  • Käy asiantuntijan johdolla keskeiset data-alan periaattet ja käytännöt läpi

  • Anna jokaisen substanssiosaajan kertoa omat tavoitteensa projektin suhteen, siten että eri ryhmät voisivat ymmärtää toisiaan paremmin

Nämä ohjeet on hyvä muistaa, olet sitten toimittajan edustaja tai työskentelet asiakasyrityksessä. Olen nähnyt ja todistan koko ajan, että tilataan toimittajilta dataprojekteja (DW/BI, Data Governance, MDM, DQM, tekoäly yms) ilman, että edes keskeiset termistöt ovat selviä. Ei tiedetä juurisyytä tai pienintä mahdollista tapaa puuttua siihen.

Ystävällisin terveisin,

Ari Hovi

Ps. Hollantilainen Rick van der Lans tulee jälleen Suomeen vetämään todella ajankohtaisen päivän koulutuksen Datan virtualisoinnista ja siihen liittyvistä teknologioista.

The Logical Data Warehouse: Design, Architecture and Technology 16.10.2018

Datan virtualisointi mahdollistaa eri datalähteiden yhdistämisen lennossa, ikään kuin näkymien kautta. Aihe liittyy teknologioihin, joista Gartner käyttää nimitystä Logical Data Warehouse.

Lue lisää tästä

Saattaisit olla kiinnostunut myös näistä

Microsoft Fabric: Shortcuts

Lue lisää

Data Lakehouse -projektit käytännössä: Kokemuksia asiantuntijoilta

Lue lisää

Eettinen tiedonkäyttö: Vastuullisuuden peruspilarit

Lue lisää