Tietovarasto- ja BI- ratkaisuissa on tehty paljon työtä omissa järjestelmissä olevien, siiloutuneiden tietojen integroimisessa, varastoimisessa ja analysoimisessa – ja työ on monasti vielä kesken. Nykyisenä Digi- ja Big Data –aikana syntyy tämän lisäksi yhä enenevässä määrin uudenlaista dataa, josta osa on yrityksen ulkopuolella. Tässä voi erottaa kaksi pääaluetta. Ensinnäkin digitaaliset palvelut. Myyntiä ja markkinointia kiinnostaa suuresti, miten myynti- ja markkinointikampanjat onnistuvat. Uutiskirjeiden lähetysten avaukset, Google Analyticsin klikkaustiedot ja Facebook-mainosten käyttötilastot ovat esimerkkejä tällaisista datoista. Lisäksi halutaan asiakkaiden haastattelututkimusten tuloksia analyysiin.
Toinen suuri uudenlaisen datan alue muodostuu sensori- ja mittausdatasta. Teollisuuden koneet ja erilaiset hyötyajoneuvot kuten rekat, trukit tai nosturit ovat jo pitkään keränneet monenlaista mittaus- ja sensoridataa omasta toiminnastaan. Tiedot on yleensä kuitenkin talletettu vain paikallisesti. Tarve olisi saada nämäkin tiedot tietovarastoon, osaksi yrityksen data-analyysejä.
Terveydenhuollon alueella sairaaloiden laitteet keräävät potilaista monenlaista mittausdataa, jota hyödynnetään paikallisesti. Teho-osastolla laite hälyttää, jos potilaan mittausdata huononee. Nämä datat halutaan keskitettyyn tietovarastoon analyysejä varten. Voi vain kuvitella, mitä tietoa tulevaisuuden aktiivisuusrannekkeet meistä keräävätkään. Osa tästä tullaan säilömään keskitettyihin tietovarastoihin – jos annamme luvan. Tämä mullistaa terveydenhuoltoa. Emme mene rintakivun vuoksi jonottamaan. Epäilyttävä mittausdata laukaisee kutsun tarkastukseen jo ennen kuin kipu alkaa. Sekä koneiden että ihmisten kohdalla siirrytään ennakoivaan huoltoon.
Kolmas ryhmä uudesta datasta on ostettavat, ulkoiset datat. Tästä kirjoitinkin jo aiemmin.
Edellä mainitut datat ohjaavat operatiivista toimintaa. Sen lisäksi ne halutaan analyysejä varten omiin käsiin. Hyvä ratkaisu tähän on Data Lake. Tiedot talletetaan Hadoopiin, joka tarjoaa kustannustehokkaan alustan ottaa vastaan isoja massoja kaiken rakenteista tietoa. Data Scientistit pääsevät nyt kiinni näihin datoihin kaivamaan aivan uudenlaisia näkemyksiä. On lisäksi tarvetta yhdistää nämä uudet tiedot perinteisiin tietoihin. Potilaiden mittausdata halutaan yhdistää potilaiden perustietoihin, jotka ovat perinteisessä tietovarastossa relaatiokannassa. Tässä tarvitaan käsitemallinnusta. Uudet tiedot ajautuvat näin osaksi tuotannollista BI-ympäristöä hyödyntämään liiketoimintaa.
Yritysten lukuisten tietojärjestelmien myötä tiedoilla on taipumus siiloutua. On huolehdittava, että uudet tietolähteet eivät muodosta lisää siiloja vaan tulevat osaksi yrityksen integroitua data platformia.