16.08.2017

Datat omaan käyttöön – Tietoalustan hyödyt

Hei,

 

Edelliseen blogiini laadin kyselyn, ikään kuin testin jonka perusteella voimme analysoida tietoalustan (Data Platform) tarvetta. Vielä muistutan, että tarkoitan tietoalustalla tietovaraston (Data Warehouse) laajennuttua käyttöä. Tämä pitää sisällään Hadoop -tyyppisen ratkaisun Big Dataa varten sekä tietovaraston datan käytön laajemminkin kuin pelkästään raportointiin ja analysointiin.

Hyviä lukuhetkiä!

 

Analysoi datatarpeesi

 

Kyselyä voi toki käyttää olemassa olevan tietovarastoratkaisun toimivuuden evaluaatioon, monella nimittäin saattaa olla vanhentunut ratkaisu edelleen käytössä. Joku saattaa miettiä, että tietovarastot ovat menneen talven lumia ja nyt niitä enää tehdä. Käytännössä jokainen oikeasti datavetoinen organisaatio tarvitsee tietovaraston ja paremminkin juuri data platformin eli tietoalustan. Esimerkiksi Facebook on rakentanut ison Hadoop-pohjaisen Big Data-alustan, mutta osa datasta heillä on relaatiotietokantapohjaisessa tietovarastossa, koska monet kyselyt ja analyysit sujuvat siellä paremmin.

 

Mitkä ovat tietoalustan hyödyt?

 

Mikäli tulit todenneeksi, että tietoalustalle on tarvetta tai nykyinen ratkaisu tulisi modernisoida, ehkä sen hyödyt on vielä hyvä käydä läpi. Se pitää usein kuitenkin ”myydä” investoinnista vastaavalle johtajalle. Perusidea on pitää organisaation tietoja keskeisenä pääomana, joka pitää saada omaan hallintaan.

 

Seuraavassa on lueteltu tietoalustan avulla saavutettavia etuja.

  • Operatiivisissa järjestelmissä ja muissa lähteissä olevat tiedot yhdistetään eli integroidaan tietoalustan keskitettyyn ja yhteiskäyttöiseen tietokantaan. Näin tiedot ovat ikään kuin puolivalmisteina, joita on helppo käyttää moniin eri tarkoituksiin. Esim. asiakastiedot saadaan kaikki kokoon.
  • Tietoalusta säilyttää historiaa, joten voi tehdä trendianalyysejä ja katsoa vaikkapa miltä asiakkaat näyttivät viime vuoden tammikuussa. Tietoalustasta muodostuu ”organisaation muisti”.
  • Raportteja ja analyysejä on helpompi tehdä omasta selkeästi mallinnetusta ja kuvatusta tietoalustasta. Tiedot ovat siis heti saatavilla – eivät enää vain valmisohjelmiston ”umpipurkissa” tai muussa erillisessä sovelluksessa. Tietoalusta on riippumaton perusjärjestelmien toimittajista.
  • Tietoalustasta on helppo tehdä monenlaisia valmiita summauksia, valmiiksi yhdisteltyjä tietoja ja laskettuja mittareita. Hyvillä BI -työkaluilla näitä on helppo kysellä ja tutkia. Raporttien ohjelmointitarve vähenee.
  • Raportointia, analyysejä, uusia sovelluksia, datapoimintoja ja muuta datan hyödyntämistä voi kilpailuttaa, koska datarakenteet ja itse data eivät ole kenenkään toimittajan monopolina (kuten operatiivisten järjestelmien kohdalla). Myös itse tietovaraston ylläpidon tai laajentamisen voi kilpailuttaa.
  • Tietoalusta toteutetaan avoimilla ratkaisuilla, kuten relaatiokannoilla ja Hadoopilla; ei ole teknistä suljetun ratkaisun umpikujaa tai toimittajalukkoa.  Vaihtoehtoisia BI-työkaluja ja analyysiohjelmistoja on runsaasti saatavilla.
  • Hyvin suunniteltu tietoalusta on laajennettavissa pala palalta, kuin lisäisi legopalikoita rakennelmaan.

 

Tietoalustan uudentyyppisiä etuja:

  • Tietovarastosta voi muodostaa konekielisiä aineistoja viranomaisille, yhteistyökumppaneille, toimittajille ym. tahoille. Näin sama data, jota raportoidaan ja sitä kautta myös laatutarkastetaan, hyödynnetään aineistokäyttöön. Dataa ei tarvitse enää erikseen ja uudelleen tilata tai poimia perusjärjestelmistä. Poimi ja tallenna kerran – käytä moneen kertaan. Arkkitehtuuri yksinkertaistuu, laatu paranee ja kuluja säästyy.
  • Tietoalustan päälle voi rakentaa myös uusia, kevyitä appeja ja kevytsovelluksia; datahan on valmiina hyvissä rakenteissa ja integroituna.
  • Uudet sensoridatat sekä ulkoisten tietolähteiden tiedot saadaan nopeasti yhdistettyä olemassa olevaan dataan.
  • Data Scientisti pääsee nopeammin analysoimaan dataa ja laatimaan algoritmeja ja johtopäätöksiä, kun perusdatat on valmiiksi mallinnettu, yhdistetty ja kuvattu.

 

Hyvin suunniteltu on puoliksi tehty

 

On huomattava, että kaikki nykyiset tietovarastot eivät anna kaikkia mainittuja etuja. Edut saavutetaan, kun tietoalustassa on ko tilanteeseen sopiva arkkitehtuuri ja ennen kaikkea, että se on suunniteltu eli mallinnettu hyvin. Tällöin se sisältää tietojen luonnolliset riippuvuudet. Se tukee tasapuolisesti eri tietotarpeita samalla maksimoiden tuen tulevaisuudenkin tietotarpeille.

Osa eduista edellyttää sitä, että tietoalustassa on tietovaraston lisäksi Hadoop-tyyppinen Big Data -ratkaisu. Jotkut lukijat saattavat miettiä, ettei meillä ole vielä niin paljon dataa, että tarvittaisiin Big Dataa. Jos edustat isoa organisaatiota, ennemmin tai myöhemmin tulet todennäköisesti keräämään myös Big Data -tyyppistä dataa, eli kannattaa varautua siihen uutta ratkaisua suunniteltaessa.

Tiivistettynä: tiedot ovat omissa käsissä, hallinnassa ja kuvattuna. Dataa ja datatietämystä ei ole ulkoistettu (kuten järjestelmät). Me uskomme, että edessä on valtava murros joka liittyy koneälyyn, IoT:hen ja aivan uusien palvelujen tarjoamiseen. Nyt on aika valmistautua. Ne, joilla  on datat hallinnassa (mallinnettuna ja tietoalustassa) ehtivät murrokseen mukaan ja ovat voittajia.

 

Terv. Ari Hovi & tiimi

 

Tässä on jotain aiheeseen liittyviä ajankohtaisia koulutuksia, joihin kannattaa tutustua:

 

Data Sciencen perusteet, 01.09.2017

QlikView Designer: Miten analysoida tehokkaasti tietoja QlikView:n avulla, 04.09.2017 – 05.09.2017

Azure Machine Learning -koulutus, 07.09.2017- 08.09.2017

Internet of Things (Iot) -perusteet, 12.09.2017       

R-ohjelman perusteet ja mallintaminen, 13.09.2017 – 15.09.2017                  

Saattaisit olla kiinnostunut myös näistä

Microsoft Fabric: Shortcuts

Lue lisää

Data Lakehouse -projektit käytännössä: Kokemuksia asiantuntijoilta

Lue lisää

Eettinen tiedonkäyttö: Vastuullisuuden peruspilarit

Lue lisää