Mikä on Microsoft Fabric?
Microsoft Fabric kokoaa yhteen tarvittavat kehitysvälineet
Perinteisesti pilvipalveluissa data-alustan kehittäminen on edellyttänyt laajasti erilaisia osaamisia, aina infrapalveluista erillisten analytiikkapalveluiden osaamiseen saakka. Microsoft Fabric – palvelun idea on siinä, että tästä kokoelmasta IaaS / PaaS – palveluita päästään irti ja siirrytään enemmän kohden SaaS – tyyppistä analyyttista tarjoamaa. Suurin hyöty tulee yhtenäisemmästä käyttökokemuksesta kehittäjille sekä siitä että ei tarvitse hallinnoida yhtä laajaa kirjoa erilaisia pilvipalvelusta käyttöön valittavia palveluita.
Tyypillisesti data-alustaa kehitettäessä on valittu käyttöön erilaisia PaaS – palveluita, mutta niidenkin hyödyntäminen vaatii usein jonkin verran palvelukohtaista erikoisosaamista.
Lyhyenä yhteenvetona voidaan todeta, että Microsoft Fabric on kokonaisvaltainen uusi analytiikkapalvelu.
OneLake datan tallennusratkaisuna keskiössä
Microsoft Fabricissa datan tallennus ja datan käsittelyn erilaiset tarpeen mukaiset moottorit ovat aidosti erotettu toisistaan, keskiössä on OneLake – nimellä kulkeva tietoallas.
OneLake muodostaa keskitetyn loogisen tietoaltaan organisaation datoille ja eräälaisena standardina datan tallennuksen ratkaisuna on parquet-delta tiedostoformaatti, jota kaikki Fabricin analytiikkamoottorit tukevat.
OneLaken datoihin on tarjolla myös erillinen sovellus, jota voi käyttää Windows File Explorerin tapaan.
Datan käsittelyn moottorit
Eräs keskeisiä datan käsittelyn moottoreita on Spark, käyttäjän ei tarvitse itse hallinnoida laskentaklustereita, vaan ne ovat Microsoftin operoimia.
Lakehouse delta – tauluille on tarjolla oma SQL – endpoint jonka avulla voidaan suorittaa lukuoperaatioita dataan. Tietovarasto-osiolle on oma SQL endpoint, joka tarjoaa laajemman joukon operaatioita.
Tapahtumavirta / telemetriadatan analysointiin on tarjolla reaaliaikaisen analytiikan osio, joka tukee KQL – kyselykieltä.
Fabricin analytiikkapalvelut
Käytössä on seuraavia palveluita niin että kehittäjän käyttökokemus on aiempaan nähden paljon yhdenmukaisempi
- Data Factory
- Synapse Data Engineering
- Synapse Data Science
- Synapse Real-Time Analytics
- Synapse Datawarehouse
- Power BI
Esimerkiksi erilaisten Spark – notebookien suoritus data engineering – työssä on Fabricissa helppoa hyödyntäen Synapse Data Engineering osiota. Luonnollisesti juuri nyt Fabric on vielä Public Preview – vaiheessa, joten monet palvelut vielä kehittyvät ja muuttuvat.
Fabricin kustannusten muodostuminen
Microsoft Fabricissa kustannusten muodostumiseen vaikuttaa haluttu suorituskykytaso eli Capacity Unit – taso (CU). Tarkemmin asiasta löytyy tästä. Eri työtilat voivat jakaa kapasiteetteja, ja kapasiteetteja voidaan valita esimerkiksi henkilötietojen maantieteelliseen käsittelyyn liittyen tarkoituksenmukaisella tavalla.
Tämän lisäksi OneLake – tallennustila sekä joissain tapauksissa alueiden välinen tiedonsiirto tuottavat kustannuksia.
Miten lähteä liikkeelle Microsoft Fabricin kanssa?
- Microsoft Fabric – perusteet
- DP-600: Microsoft Fabric Analytics Engineer
- Microsoft Fabric Analytics Engineer
- Implementing a Data warehouse with Microsoft Fabric – Applied Skills Workshop
- Implementing Real Time Analytics with Microsoft Fabric – Applied Skills Workshop
- Implementing a Data Science and Machine Learning Solution for AI with Microsoft Fabric – Applied Skills Workshop
Asko Kauppinen
Principal Consultant, Ready Solutions