Data Vault -johdanto
Keskitettyjä tietovarastoja on suunniteltu usein joko tähtimallimenetelmällä (Kimball-tyyli) tai normalisoiduilla rakenteilla (Inmon-tyyli). Molempia menetelmiä on jouduttu sovittamaan alkuperäisestä tarkoituksestaan.
Dan Linstedtin kehittämä Data Vault -menetelmä on suunniteltu nimenomaan laajojen keskitettyjen tietovarastojen (EDW) suunnitteluun. Malli on kasvattanut koko ajan suosiotaan maailmalla ja mm. Hollannissa suurin osa tietovarastoista toteutetaan Data Vault -menetelmällä.
Tietovarasto- ja Big Data -guru Rick van der Lans sanoo, että jokaisen tietovarastoa suunnittelevan täytyy ainakin tutkia Data Vault -menetelmä ja päättää sitten ottaako sen käyttöön.
Data Vault -menetelmän tukee hyvin tietovarastointia, joissa tarvitaan useiden tietolähteiden integrointia, muutosjoustavuutta ja helppoa laajennettavuutta. Menetelmässä on selkeä ja suoraviivainen tapa hoitaa tietojen historiointi. Erityisesti menetelmässä on panostettu tietojen jäljittämiseen ja auditointiin, mikä on osoittautunut tärkeäksi mm. viranomaisvaatimusten tiukentuessa (ns. compliance-vaatimukset). Vaikka menetelmä ei sellaisenaan soveltuisikaan, oppii kurssilla monenlaista hyödyllistä tietoa EDW -kannan mallintamismenetelmistä.
Paikka
Helsinki
Koulutusmuoto
Classroom
Remote
Kesto
1 päivä
Hinta
990 €
Data Vault -johdanto -koulutuksen sisältö
Data Warehouse – arkkitehtuurit ja mallinnus
- eri arkkitehtuureihin sopivat mallinnusmenetelmät
- tähtimallinnuksen ja perinteisen ER-tietovarastomallinnuksen ongelmat
- tavoitteet hyvälle mallinnusmenetelmälle
Data Vault menetelmän taustaa
- menetelmän kehityshistoriasta
- taustalla olevat ideat ja arkkitehtuuri
- perusrakenteet
Data Vault menetelmän rakennuspalikat
- hubit, satelliitit ja linkit
- esimerkkejä ja ohjeita
- etenemisvaiheet
- harjoituksia
Tietojen käsittely ja laatuasiat
- missä tietoja jalostetaan ja johdetaan
- uusia ajatuksia laadun hoitamiseksi
Jäljitettävyys ja historiointi
- miksi jäljitettävyys on tärkeää
- jälitettävyysmenetelmät
- historiointimenetelmät
Data Vault -mallin arviointia
- soveltuvuusalueet, ongelmia ja ratkaisuja
- DW automaatio ja Data Vaultia tukevat tuotteet
- Data Vaultin rooli laajemmassa mallinnuksessa
Data Vault 2.0 piirteitä
- hajautusavain
- Menetelmistö, arkkitehtuuri ja malli
- tiedon virtualisointi
- Hadoopin niveltäminen mukaan
Kouluttaja
Kouluttajana toimii Hannu Järvi, CEO and Machine Learning / Artificial Intelligence lead, Ari Hovi
Hannu on työskennellyt tekoälyn parissa ensimmäisen kerran 90-luvun puolivälissä. Hänellä on kirkas käsitys siitä, mikä on tekoälyssä tänä päivänä realismia, ja mikä mainospuhetta.
Hannu on auttanut organisaatioita AI-strategiatyössä pienistä organisaatioista suurimpiin vientiyrityksiin. Hän on kouluttanut hetorogeenisiä ryhmiä AI-vasta-alkajista koneoppimisen tohtoreihin tunnistamaan AI:n liiketoiminnallisten mahdollisuudet ja työskentelemään yhdessä niiden parissa.
Aikataulu