Hei,
Moni asiakas kysyy meiltä, että onko heillä tehty oikeita asioita datan hyödyntämisen sekä tietojohtamisen suhteen.
Halutaan benchmarkata, verrata omia ratkaisuja muihin. Se on hyvä tapa, koska pyörää ei kannata keksiä uudestaan, muiden kokemuksista kannattaa oppia.
Olemme auttaneet useita organisaatioita arvioimaan omaa datan hyödyntämisen maturiteettia. Käytämme siinä luomaani Hovi Data Frameworkia, eli HDF:ää. Moni tunteekin sen, mutta jaetaan se tässä kaikille.
Kutsun sitä välillä ns pöydänjalkamalliksi (Table Model), koska vertaan sitä pöytään.
Kuvitellaan pöytää, jossa on neljä jalkaa. Pöydän päällä on lamppu, joka valaisee pöytää. Pöytä seisoo tukevan lattian päällä. Jokainen pöydänjalka kuvastaa data-hallinnan osa-aluetta.
Näitä ovat datastrategia, arkkitehtuuri & metodit, työkalut & teknologia, organisaatio & ihmiset.
Lamppu, joka valaisee pöytää ylhäältä, kuvastaa osaamista ja lattia edustaa resursseja.
Pöytä pysyy tukevasti pystyssä, jos se seisoo neljällä jalalla ja lattia on tasainen. Jos yksi jalka puuttuu tai on liian lyhyt, siitä tulee hutera. Jos kaksi jalkaa puuttuu, se kaatuu.
Sama pätee myös datan hallintaan, eli sen kehittämistä tulee aina katsoa kokonaisuutena.
Käyn seuraavaksi läpi jokaisen osa-alueen.
1. Datastrategia
Strategia sisältää orgnisaatiokohtaiset suunnitelmat, joiden avulla maksimoimme datasta saatavan arvon. Datastrategia tulee olla linjassa liiketoimintatavoitteiden kanssa, se on kiinteä osa sitä.
Datastrategian minimitavoite on oman datavarannon ymmärtäminen, kuvaaminen ja pääsy ylipäätänsä omiin tietoihin. Ota huomioon myös datan (Data Quality) sekä hallintamalli (Data Governance).
Kehittyneempi strategia ottaa huomioon tulevaisuuden kehityksen, kuten koneoppimisen sekä uusien datalähteiden hyödyntämisen.
Jos olet oikein pitkällä, voidaan strategiaan lisätä myös omien data,- ja tekoälytuotteiden rakennus ja kaupallistaminen.
Jos ja usein kun tietovarastoratkaisut ovat osa datastrategiaa, kannattaa määritellä ainakin:
– tietoturvanäkökulma
– tiedon jalostuksen periaatteet
– operatiivisten järjestelmien tietojen siirtolaajuuden periaatteet
– operatiiviset järjestelmät vs. tietovarastointi: raportointiperiaatteet.
Datastrategiasta ei kuitenkaan kannata tehdä liian suurta numeroa, koska helposti sen tekeminen venyy ja ympäristö ehtii muuttua siinä välillä. Strategiaksi riittää selkeät tavoitteet sekä tiekartta, miten niihin ajatellaan päästävän.
2. Organisaatio ja ihmiset
Menestynyt tiedonhallinta edellyttää ihmisten työn välistä koordinointia. Myös organisointi ja roolitukset ovat tärkeitä, esim onko CDO (Chief Data Officer) rooli tarpeellinen vai hoitaako CIO tätä tehtävää. Myös eri roolien vastuualueet tulee olla määritelty.
On myös satsattava siihen, että on riittävästi henkilöitä tiedonhallinnan eri rooleihin. Ehkä tarvitaan uusia henkilöitä; joka tapauksessa investointi nykyhenkilökunnan koulutukseen tiedonhallinnan alueella maksaa itsensä aina takaisin.
Organisaatioiden pitää myös tarkasti määrittää mitkä toiminnot on ulkoistettu toimittajille ja ulkopuolisille kumppaneille. Tarvitaan riittävästi omaa osaamista. Esim datan omistajuutta ja ymmärrystä ei kannata ulkoistaa – datahan on organisaation keskeinen resurssi.
Tiedonhallinta on monen organisaation ydinprosesseja – viimeistään lähitulevaisuudessa – ja sen avaimet on välttämätöntä pitää omissa käsissä.
Data on yleensä siiloutunut eri yksikköihin, samoin kunkin alueen dataosaaminen. Erityistä huomiota tulee kiinnittää yksikköjen välisen yhteistyön suunnitteluun sekä ns omistajuuteen; kuka vastaa eri datoista, miten datoja hyödynnetään ja jaetaan yli yksikkörajojen.
Lopulta tiedonhallinnan maturiteetin kehittämisessä on kyse organisaation muutosprosessista ja muutosjohtamisesta – mitään ei tapahdu ihmistä nopeammin!
Täten päätösten ja suunnitelmien myötä tarvitaan vahvaa ihmisten motivointia, kompetenssien kehittämistä ja innostamista, jotta strategiat jalkautuvat.
3. Arkkitehtuuri ja metodit
Arkkitehtuuri määrittää periaatteet koskien datanluontipaikkoja ja tietovirtoja.
Data-arkkitehtuuri on osa kokonaisarkkitehtuuria, mutta tässä kohtaa rajaan arvioinnin juuri datan rakenteisiin sekä niiden kuvauksiin.
Toki tarvitsemme prosessi-, ja sovellusarkkitehtuuria, mutta datakeskeinen ajattelu (Data Driven) edellyttää datavarannon kuvaamista tietojärjestelmistä riippumattomasti.
Arkkitehtuuriin tulee olla kuvattuna myös tekoäly-, koneoppimisen soveltaminen, sekä käytössä olevien teknologien väliset suhteet sekä integraatiot.
Eri menetelmien valinta tulee olla perusteltua. Esim vaikka Data Vaultia suosittelenkin hyvin moneen eri tilanteeseen, se voi olla liian järeä paikallisiin toteutuksiin. Metodit ja menetelmät tulee siis valita tapauskohtaisesti.
Yhteisen kielen luominen on hyvin tärkeää, eli käsitteiden määritys tulee olla lähtötila monessa hankkeessa. Käsitteiden mallinnus on yksi tärkeimmistä menetelmistä. Tämän vaiheen ohittaminen johtaa lähes aina ongelmiin myöhemmin.
Pyri myös yksinkertaisuuteen: mikäli kuvaukset, tietomallit sekä arkkitehtuurit eivät avaudu muille kun tekijälle itselleen, ne on tehty liian monimutkaisesti.
Viime kädessä ratkaisevinta ei olekaan kuinka täydellisen oikeita kuvaukset ja tietomallit ovat vaan se, että niiden laatimiseen osallistuu mahdollisimman moni ihminen – vain osallistumalla itse prosessiin asia sisäistyy ja johtaa toimintaan.
Tämä viimeinen seikka onkin tärkein osa toimivaa arkkitehtuuria.
4. Työkalut ja teknologiat
Teknologiatoimittajien hallinta on tärkeää, koska organisaatiot ovat riippuvaisia tästä yhteistyöstä.
Toisaalta ei haluta olla liian riippuvaisia tietystä toimittajasta ja teknologioista, eli asian kanssa joutuu taspainottelemaan jatkuvasti.
Joskus työkaluista innostutaan liikaakin: hankkimalla jokin työkalu tai ohjelmisto kaikki ongelmat ratkeavat. Muita pöydänjalkoja – arkkitehtuuria, strategiaa ja organisointia – tarvitaan.
Uusia työkaluja ja teknologioita tulee myös markkinoille kiihtyvällä tahdilla. Näin ollen organisaatioiden pitää pystyä hallitsemaan kokonaisuutta siten, että uusien teknologioiden käyttöönotto on mahdollisimman nopeaa.
Eräs CIO totesi hyvinkin fiksusti, että heidän periaatteen mukaan datat pitää aina olla omissa käsissä, mutta muuten voidaan ulkoistaa hyvin laajasti. Tämä on hyvä periaate, koska ulkoistamiselta ei voi välttyä.
Myös ns future-proof -analyysi on tärkeää; onko teknologia pitkäikäinen, miten sitä tuetaan ja onko organisaatiolla riittävää osaamista.
Esimerkiksi moni otti Big Data-teknologia Hadoopin käyttöön tietovaraston kylkeen ja vasta myöhemmin todettiin, että konsernitason käyttö vaatii sellaista osaamista ja tukea, jota on hyvin vaikea järjestää.
Nyt Hadoop-tyyppinen Big Data-teknologia on integroitu esim Azureen ja AWS:ään.
Organisaation tulee siis kytkeä HR-osasto mukaan päätöksentekoon, heillä on (tai pitäisi olla) kuva oman henkilöstön ja rekrymarkkinan vastaavuudesta teknologiavalintoihin.
Kehitys on data-alalla ollut nopeaa. Meillä on nyt käytössämme paljon uusia työkaluja ja teknologioita, joilla oikeasti saavutetaan kustannussäästöjä. Esim nyt voimme rakentaa toimivan data-alustan ennen kuulumattoman nopeasti.
5. Osaaminen ja resurssit
Kuvitteellista tiedonhallinnan pöytää valaisee lamppu. Tämä kuvastaa osaamista, koska se liittyy kaikkiin ”pöydänjalkoihin”.
Mitkään teknologiat, arkkitehtuurit eivät auta, jos organisaatioilla ei ole tarvittavaa osaamista niiden käyttöön. Meidän tulee myös miettiä, miten ja mistä sitä hankimme ja ylläpidämme.
On hyvä miettiä myös tulevaisuutta, mitä osaamista tulemme tarvitsemaan huomenna. Tietystä osaamisesta on markkinoilla kova pula, joten se saattaa estää tietyn teknologian käytön kokonaan (kuten juuri Hadoopin tai muiden open source-teknologioiden kohdalla).
Organisaatioiden tulee panostaa myös muiden kuin data-alan ja IT-osaajien kehittämiseen. Tämä on todella tärkeä, joskin välillä laiminlyöty osa-alue.
Monen dataprojektin onnistumisen todennäköisyys nousisi huomasti, mikäli esimiehet ja muut substanssiosaajat tuntisivat datan hydyntämisen perusteet.
Tätä tapahtuu onneksi nyt enenevässä määrin, koska data-asiat ja tekoäly on nyt pinnalla.
Pöytämme seisoo lattian päällä, joka kuvastaa resursseja, eli rahoitusta. Mikäli ylin johto ei anna riittävää budjettia datakyvykkyyksien kehittämiseen, emme voi hankkia parhaita ohjelmistoja tai rekrytoida riittävää määrää osaamista.
Tässä kohtaa ylimmän johdon ymmärryksen kasvattaminen data-asioihin sekä tekoälyyn on ratkaisevassa roolissa. Budjetit korreloivat lähes suoraan sen kanssa.
Ylimmälle johdolle kompleksiset ja vahvaa IT-panostusta ja -osaamista vaativat asiat pitää pystyä viestimään liiketoiminnan kielellä ja perustelemaan liiketoiminnalle luontevin tavoin.
Kyse ei monestikaan ole yksinomaan johdon kompetenssien kasvattamisesta data-asioista vaan myös meidän IT-ihmisten kompetenssien kasvattamisesta liiketoiminta-asioista – yhteistyö ja kyky IT:n ja liiketoiminnan yhteenlinjaamisen ratkaisee aina lopulta!
Yhteenveto
Kuten alussa mainitsin, pöytä ei pysy pystyssä kunnolla, mikäli se ei seiso neljällä jalalla.
Ei siis kannata panostaa vain yhteen ”pöydän jalkaan” koska ne kaikki ovat sidoksissa toisiinsa.
Auditoidessamme asiakkaiden dataratkaisuja, teemme mielenkiintoisia huomioita.
Arvaatteko mikä osa-alue on yleensä kaikista puutteellisin? Melkein aina asiakas on alkuun sitä mieltä että huono teknologia on syypää ongelmiin. Mutta näin ei läheskään aina ole.
Usein tekniset ratkaisut ovat ihan oikein tehty olemassa olevat työkalut ovat ihan toimivia. Haaste on vain se, että vastuut on epäselvät tai toimittajalle on ulkoistettu ymmärrys datan hyödyntämisestä.
Monesti myös strategia on hyvin tehty, mutta organisoinnin puutteen vuoksi sitä ei olla jalkautettu suunnitelmien mukaisesti. Ja jos muutosprosessin johtamisen tärkeyttä ei mielletä, tulokset voivat jäädä hyvin laihoiksi.
Jos sinulla on mikä tahansa dataprojekti, sitä kannattaa arvioida pöydänjalkamallin kautta.
Näin varmistetaan, että toiminta on järkevää ja tavoitteellista eikä kehitysinvestoinnin mene hukkaan.
Moni hyödyntää tähän DAMA Frameworkkia, joka sekin on hyvä. Tämä minun mallini on ehkä käytännönläheisempi, yksinkertaisempi ja sisältää enemmän konkretiaa.
Olemme myös yhteensovittaneet DAMA Fameworkin HDF:n kanssa.
Mikäli tämä asia kiinnostaa, meidän datahallinnan kulttuurimuutoksen läpivientiin ja Data Governance-asioihin erikoistunut konsulttimme Jari Ylinen voi kertoa, miten eri osa-alueiden arviointi ja mittaaminen kannattaa toteuttaa ja miten sen tulokset saadaan siirrettyä uudeksi toiminnaksi.
Ystävällisin terveisin,
Ari Hovi
Ps. Järjestämme uutena DataOps-koulutuksen, joka liittyy myös yllä olevaan blogiin. Suosittelen tätä erittäin lämpimästi!
Enterprise DataOps – Curating Trusted Data as a Service from Data Lake to Data Marketplace 25.03.2019 – 26.03.2019
Kaikki yritykset ja organisaatiot kamppailevat sen tosiasian kanssa, että liiketoimintadataa säilytetään hyvin monessa eri paikassa.
Käytössä on pilvi-, sekä on-premise ratkaisuja, monia tietovarastoja sekä erillisiä datamartteja. Näiden lisäksi käytössä on MDM-, ECM sekä Big Data -alustoja.
Miten hallitsen kokonaisuutta? Onko tähän olemassa lääkettä?
Meillä on ilo tarjota ensimmäisenä Suomessa DataOps-valmennus, joka tuo sinulle uuden tavan hallita eri tiedon talletus-, hallinta-, sekä analysointiratkaisuja.
Lue lisää koulutuksesta tästä