Tietovarastoja on kaikenlaisia.
On Inmoneja, Kimballeja ja Linstedtejä, ja loputtomasti näiden variaatioita ja kombinaatioita. On ketteriä ja staattisia, ajantasaisia ja vanhentuneita, onnistuneita ja epäonnistuneita. Onnistuminen arvioidaan suhteessa tarpeisiin ja tarpeet määräävät toteutustavan. Alkuperäinen Data Vault syntyi nimenomaan vastaamaan laajennettavuuden ja ketteryyden tarpeisiin, ja se onkin varsin kätevä, mutta uusi versio on vielä astetta terävämpi.
Tietovarastojen tarpeellisuudesta ollaan vielä edelleenkin montaa mieltä. Raportointivälineet yhdistelevät tätä nykyä näppärästi eri lähteistä poimittua tietoa, alati lisääntyvä prosessointiteho vähentää tarpeita tiedon fyysiselle siirtämiselle ja virtualisointityökalut kärkkyvätkin tähän saumaan. Mutta niin kauan kuin historian pitää säilyä jossakin, tai yksittäinen raportointityökalu ei veny kaikkiin organisaation tiedon käyttötapoihin, on tietovarastoilla paikkansa. Ja jos kerran tietovarastoja tarvitaan, ne voivat aivan hyvin olla ajantasaisia, ketteriä ja onnistuneita. Linstedtejä.
Tai kuten Bill Inmon itse sanoo:
”The Data Vault is the optimal choice for modeling the EDW in the DW 2.0 framework.”
Pikaisella vilkaisulla Data Vault 2.0:an muutokset edeltäjäänsä nähden ovat pieniä. Asia joka heti pistää silmään on perinteisten surrogaattiavaimien vaihtuminen hash-tiivisteisiin, jotka on laskettu liiketoiminta-avaimien pohjalta. Ladattavan tiedon tiivisteet lasketaan Staging Areassa, jonka jälkeen kutakuinkin koko tietovarasto voidaan ladata rinnakkaislatauksina.
DV 2.0 on kuitenkin paljon enemmän kuin tekninen päivitys. Siinä missä alkuperäinen DV oli lähinnä mallinnusohje, DV 2.0 on kokonaisvaltainen BI-järjestelmä, kattaen metodit (ketterät kehitysmenetelmät), arkkitehtuurin sekä mallinnuksen. DV 2.0 tähtää organisaation kaikkia tietotarpeita nopeasti ja ikuisesti palvelevaan ketterään toimintatapaan ja sitä tukevaan tekniseen ratkaisuun. DV 2.0 -ratkaisussa pyritään aktiivisesti pois erälatauksista kohti virtualisointia ja reaaliaikaisuutta, ja DV 2.0 tukeekin alusta asti niin Hadoop-integraatiota kuin reaaliaikaista IoT-datan käsittelyä.
Näillä alueilla tulee tapahtumaan…
Tiedon näkökulmasta DV 2.0 perustuu siihen tosiasiaan, että lähdejärjestelmiin tallennettu tieto on juuri sitä mitä se on, mutta sen tulkinta ja käyttötarkoitukset muuttuvat alati. Tiedot ladataan lähdejärjestelmistä muuttumattomina raakavaultiin, jonka päälle rakennetaan tätä (tai jotakin toista) hetkeä palveleva Business Vault, ja lopuksi tiedot julkaistaan Information Mart:in kautta. Lisäksi konseptiin sisältyy metadata- ja mittarirakenteita, joihin tallennetaan tietovaraston meta-, laatu- ja suorituskykytietoa, koska myös itse tietovarastoon pätee sama asia kuin liiketoimintaan: et voi optimoida asioita joita et ensin mittaa.
Data Vault 2.0 on siis pitkälle mietitty ja tarkasti määritelty johdonmukainen menetelmä ja tästä johdonmukaisuudesta seuraa korkea automatisoitavuusaste. Se on asia, josta voi olla innoissaan. Minä ainakin olen.
Sinua saattaisi kiinnostaa myös:
Tietovarasto ei ole koskaan valmis