Hei,
Information at your figertips oli Microsoftin slogan jo kymmenisen vuotta sitten. Onko data edelleenkään omissa näpeissä, helposti saatavilla kun tarve on?
Monikäyttöisten BI-,- data-analytiikka -alustojen rakentaminen on monesti haastavaa, erityisesti isojen organisaatioiden kohdalla. Liikkuvia osia on paljon, kuten myös tarjolla olevia teknologioita sekä kumppaneita.
Jotta ollaan aidosti dataohjautuvia, tietojen pitää olla aktiivisesti tarvitsijoiden käytössä. Kun tieto alkaa olla saatavilla, saatu tieto luo lisää tiedon tarvetta. Päätökset alkavat perustua dataan, ei mutuun.
Miten päästä mahdollisimman nopeasti ja tehokkaasti dataan käsiksi mahdollistaa tietojohtaminen käytännössä?
Kerron tähän seuraavassa konkreettisia vinkkejä.
Missä ongelma
Tietoalusta- ja tietovarastoratkaisuissa kyllä tehdään paljon työtä tietojen saamiseksi ulos perusjärjestelmistä. Integrointityötä tehdään ja tietoja yritetään jalostaa.
Liiketoimintaihmiset pyytävät raportteja, analyysejä tai aineistopoimintoja teknisiltä asiantuntijoilta, kuten data engineereiltä. Nämä sitten – aikataulunsa puitteissa – toimittavat pyydettyjä asioita.
Hyvin usein käy kuitenkin niin, että pieleen meni. Väärinkäsitys. Ehkä epäselvä toimeksianto. Kenties toteuttajalle vieras toimiala.
Sitten tehdään toinen yritys ja toivotaan että nyt tärppää. Aikaa kuluu. Tarve ehkä ehti mennäkin jo ohi.
Näin sen ei pitäisi mennä. Liiketoimintaihmisten pitäisi voida itse, omatoimisesti hakea tarvitsemansa data. Silloin he saavat tulokset välittömästi. Koska saatu tieto lue yleensä tarpeen lisätiedoille, he usein pian tekevät tarkentavan kyselyn ja sitten lisää.
Huomaatko mikä valtava ero näissä kahdessa menettelyssä on?
Ensinnä infokantakerros
Mikäli haluamme lisätä liiketoiminnan omatoimisuutta datan hyödyntämisessä, tarvitaan muutamia tärkeitä osa-alueita.
Ensinnäkin tarvitaan riittävän pitkälle jalostettu ns. infokantakerros. Se koostuu hyvin suunnitellusta ja mallinnetusta tietovarastosta sekä tietovaraston esityskerroksesta.
Esityskerros on joko tähtimallimuotoinen tai koostuu ns. leveistä tauluista. Lisäksi tueksi voidaan rakentaa kyselyjä helpottavia näkymiä. Kaikissa tässä pyritään helppoon raportointiin ja kyselyihin.
Paras alusta infokerrokselle on SQL-pohjainen relaatiokanta, kuten SQL Server, Synapse, Snowflake tai PostgreSQL. Pilvipohjaiset relaatiokannat tarjoavat nopeimman etenemisen.
Nyt alunperin hajallaan olleet, epäyhtenäiset ja vaikeasti saatavat tiedot on valmiiksi yhdistetty ja osittain jo jalostettu mm. laskemalla keskeisimpiä tunnuslukuja valmiiksi.
Toiseksi työkalut ja koulutus niihin
Toiseksi tarvitaan työkaluja. Relaatiokantojen natiivikieli on SQL. Ne eivät itse asiassa muuta kieltä ymmärräkään. SQL-kieltä pidetään turhaankin vaikeana ja vain nörttien kielenä.
Olemme kouluttaneet tuhansia SQL-kursseillamme, suuri osa ei-IT-henkilöitä. Kuka tahansa tietoja pyörittävä ja exceltaitoinen oppii SQL-kykyiseksi parissa päivässä.
Tuo investointi kannattaa ehdottomasti tehdä, sillä sen jälkeen avautuu aivan uusi maailma, kun pääsee itse heti dataan kiinni ja voi siirtää haluamiaan tietojoukkoja vaikka Exceliin jatkokäsittelyyn.
Mieleeni on jäänyt usean SQL-kurssilaisen toteamus, että tämä kurssipäivä oli paras työpäivä ikinä, kun vihdoin pääsi itse puikkoihin!
Esimerkiksi suuressa eurooppalaisessa kauppaketjussa Picnicissä on koulutettu 150 Business analyst -henkilöä liiketoiminnan puolella SQL-taitoiseksi ja he tekevät omatoimisesti kymmeniä kyselyjä päivässä (Tabelau on kytössä lähinnä graafisiin raportteihin).
He eivät siis pääsääntöisesti tilaa IT-osastolta raportteja tai aineistoja, vaan tekevät ne itse. Tämä on sitä dataohjautuva!
Toki käytetään myös BI-työkaluja, kuten Tableau, PowerBI ja Cognos ja niillä tehdään tietysti laajasti käytettyjä vakioraportteja.
Mutta jos halutaan päivittäin vaihtuviin tarpeisiin datat kunnolla omiin käsiin, omiin sormenpäihin, SQL on tehokkain ratkaisu.
Sitten organisointi ja tuki
Kolmanneksi tarvitaan organisointia, data governancea. Ilman sitä muut asiat eivät tule jalkautumaan organisaatioon.
Konsulttimme Jari Ylinen on kehittänyt tähän todella toimivan systeemin. Siihen kuuluvat mm. tiedohuoltotriot, joissa on liiketoiminnan substanssiosaajana tietovastaava, IT-puolen asiantuntija sekä data scientisti analytiikkaa varten.
Haasteena data governancen implementoinnissa on usein se, että on vaikea lopulta määrittää, kenelle kuuluu esim tuote- ja asiakasdata.
Käsitemallinnus on tähän määrittelyyn muuten erinomainen menetelmä, koska usein määrittelyongelmien juurisyy on se, että lopulta ei olla kunnolla selvitetty, että mitä asiakkaalla tai tai tuotteella lopulta tarkoitetaan.
Tähän data governanceen kuuluu jo mainittu koulutus ja lisäksi tuki.
Koulutukseen satsaaminen on todella tuottava investointi. Liiketoimintapuolen ihmiset koulutetetaan ymmärtämään relaatiokantoja, mallinnusta, oman infokannan rakennetta sekä SQL-kieltä.
Lisäksi tarpeen mukaan BI-välinettä. Heille tarjotaan tukipalveluja, jotta alkuajan ongelmiin saadaan heti nopeita ratkaisuja.
Neljänneksi metadata
Neljänneksi tarvitaan infokerroksen kuvaus eli metadataa. Käyttäjien on ymmärrettävä riittävästi jalostetun esityskerroksen rakennetta.
Lisäksi tarvitaan metadataväline, josta voidaan katsoa käsitteiden ja attribuuttien yhteisesti hyväksytyt määritelmät sekä rakenteet.
Jos mietitään haastetta, jonka kanssa kaikki organisaatiot painiskelevat, puhutaan data-arkkitehtuurista. Ja nyt en tarkoita vain jonkun yksittäisen alustan teknistä arkkitehtuuria, vaan laajempaa informaatiotason kerrosta.
Organisaatiot ovat liikkeenjohdollisesti jakautuneet yksiköihin, vaikkapa liiketoimintayksiköt 1-5, ja sitten tukifunktiot talous-, HR,- IT-, hankinta-, jne.
Yksikköjen IT-järjestelmät, sovellukset ja niiden väliset integraatiot muodostavat kaaoottisen ja ”spagettimaisen” arkkitehtuurin, joka on rakentunut pala palalta, järjestelmä järjestelmältä historian saatossa.
Metatyökalut auttavat tämän kompleksisuuden selkeyttämisessä. Ellie-mallinnustyökalu on saavuttanut lyhyessä ajassa valtavan suosion, koska se auttaa organisaatioita hallitsemaan data-aluetta entistä tehokkaammin.
Lopuksi
Koko hommasta ei tule mitään, jos ei ole sitä kuuluisaa johdon tukea.
Tarvitaan datastrategia, jossa on päälinjaukset tehtynä, resursseja ja rahaa. Ja muistetaan vielä, että johto joutuu tekemään isoja kannanottoja ja päätöksiä usein vähäisillä lähtötiedoilla, joten johtokin tarvitsee selkokielistä koulutusta ja tukea data-asioihin.
Yllä olevat neljä kohtaa sekä johdon osuus implementointuna ovat hyvä tukijalka informaation saamiseksi – vanhan sloganin mukaan – omiin sormenpäihin.
Ystävällisin terveisin,
Ari Hovi
Data Vault 2.0 Bootcamp + Certification 16.08.2021 – 18.08.2021
Koulutus järjestetään yhteistyössä Data Vaultin kehittäjän Dan Linstedtin kanssa. Kouluttajana toimii Cindi Mayersohn, joka on yksi Danin auktorisoimistista virallisista Data Vault 2.0 kouluttajista.
Sertifioinnilla varmistat, että Data Vault-pohjainen tietoalusta tehdään oikeiden periaatteiden mukaisesti.
Lue lisää ja osallistu tästä.