15.10.2013

Kimball vai Inmon?

Suunniteltaessa tietovarastoratkaisun arkkitehtuuria on valittavissa ollut jo pitkään kaksi koulukuntaa: Kimballilainen ja Inmonilainen. Kumpi näistä on parempi?

Bill Inmonia luonnehditaan joskus arvonimellä ”Father of Data Warehouse”. Tämä ei täysin pidä paikaansa, sillä termin Data Warehouse keksi jo aiemmin IBM:lla työskennellyt Barry Devlin. Inmon tosin kirjoitti runsaasti kirjoja ja oli muutenkin aktiivinen 90-luvun alussa. Hän esitteli käsitteen Corporation Information Factory  lähtien siitä, että tietovarasto on koko organisaation yhteinen asia. Tällaista keskitettyä ratkaisua kutsutaan myös termillä Enterprise Data Warehouse (EDW). Tietovaraston tehtävä on kerätä ja integroida tietoa keskitetysti organisaation eri osista. Näin saadaan siiloutuneet tiedot yhteen. Tietovarasto suunnitellaan normalisoiduksi.

Ralf Kimball julkaisin ensimmäisen kirjansa The Data Warehouse Toolkit vuonna 1995, jossa hän esittää ns. dimensionaalien mallinnusmenetelmänsä, joka ei ole normalisoitu. Kimball lähtee paikallisista liiketoiminnan tarpeista: minkälainen tähtimallinen mukainen datamartti rakennetaan, että saadaan ratkaisut tiettyyn liiketoiminnan ongelmaan. Tähtimallirakenne tukee hyvin raportointia ja siitä on helppo tehdä kyselyjä. Inmon pitää Kimballin menetelmää hyvänä, mutta ainoastaan silloin kun takana on hänen koulukuntansa mukainen keskitetty tietovarasto, josta siis johdetaan datamartteja raportointia varten, tarpeen mukaan. Kimballin mielestä isoonkin yritykseen riittää joukko tähtimallin mukaisia datamartteja, joilla on yhteisiä osia (dimensioita).  Keskitettyä, normalisoitua tietovarastoa ei hänen mukaansa tarvita.

Kimballin ratkaisumalli lienee maailmalla yleisempi, sillä sen avulla on helpompi lähteä rakentamaan paikallista, osastokohtaista tietovarastoa. Monasti ratkaisusta on tullut toimiva ja tarpeita vastaava.  Isommat yritykset taas päätyvät usein Inmonilaiseen toteutukseen, sillä tietojen integrointitarve on suurempi. Nämä yritykset ovat yleensä jo käyneet sen vaiheen läpi, jossa on rakennettu paikallisia, osastokohtaisia datamartteja ja huomattu, että tietojen yhdisteleminen johdon tarpeisiin on vaikeaa. Paikalliset tietovarastot ovat usein myös toteutettu eri välineillä ja tekniikoilla sekä eri toteuttajien toimesta – mikä on kallista.

Inmonin lähestymistapa on periaatteessa vaativampi, ainakin aluksi. On oltava enemmän omaa osaamista ja on osattava tehdä osastojen välistä yhteistyötä. Liiketoiminnan strategia ja tietojohtaminen kuitenkin edellyttävät, että yrityksen siiloutuneet tiedot ovat nopeasti saatavilla ja myös yhdisteltävissä. Oikein suunniteltuna ja organisoituna myös Inmonilainen EDW on tehtävissä riittävän nopeasti. Pitkällä tähtäimellä EDW-ratkaisut tulevat yleensä kokonaiskuluiltaan edullisemmaksi kuin vaikeasti ylläpidettävät, usein hajanaiset datamart-ratkaisut. Kimballilaista menetelmää käyteään usein keskitetyn EDW:n lisäksi. Monenlaisten raportointiratkaisujen tukena se onkin erinomainen

Tällä kiistalla ei ole ”voittajaa”. Molempia menetelmiä tarvitaan. Kummassakin panostetaan tietovaraston tietojen mallinnukseen, mutta eri tavalla. Kumpi koulukunta sopii omaan tilanteeseen ja tukee parhaiten liiketoimintaa selviää parhaiten ottamalla asioista selvää,  kysymällä muiden kokemuksista ja hankkimalla koulutusta.

 

Saattaisit olla kiinnostunut myös näistä

Datanhallinnan strategiset vaihtoehdot

Lue lisää

Ari Hovi vahvistaa ja laajentaa palveluaan Data Lakehouse -ratkaisujen toimittajana

Lue lisää

Lähestymistapoja dataosaamisen kehittämiseen

Lue lisää