Mikä on Microsoft Fabric?
Lukuaika noin 3 minuuttia
Lukuaika noin 3 minuuttia
Perinteisesti pilvipalveluissa data-alustan kehittäminen on edellyttänyt laajasti erilaisia osaamisia, aina infrapalveluista erillisten analytiikkapalveluiden osaamiseen saakka. Microsoft Fabric -palvelun idea on siinä, että tästä kokoelmasta IaaS / PaaS -palveluita päästään irti ja siirrytään enemmän kohden SaaS-tyyppistä analyyttista tarjoamaa. Suurin hyöty tulee yhtenäisemmästä käyttökokemuksesta kehittäjille sekä siitä että ei tarvitse hallinnoida yhtä laajaa kirjoa erilaisia pilvipalvelusta käyttöön valittavia palveluita.
Tyypillisesti data-alustaa kehitettäessä on valittu käyttöön erilaisia PaaS-palveluita, mutta niidenkin hyödyntäminen vaatii usein jonkin verran palvelukohtaista erikoisosaamista.
Lyhyenä yhteenvetona voidaan todeta, että Microsoft Fabric on kokonaisvaltainen uusi analytiikkapalvelu.
Microsoft Fabricissa datan tallennus ja datan käsittelyn erilaiset tarpeen mukaiset moottorit ovat aidosti erotettu toisistaan, keskiössä on OneLake-nimellä kulkeva tietoallas.
OneLake muodostaa keskitetyn loogisen tietoaltaan organisaation datoille ja eräälaisena standardina datan tallennuksen ratkaisuna on parquet-delta tiedostoformaatti, jota kaikki Fabricin analytiikkamoottorit tukevat.
OneLaken datoihin on tarjolla myös erillinen sovellus, jota voi käyttää Windows File Explorerin tapaan.
Eräs keskeisiä datan käsittelyn moottoreita on Spark, käyttäjän ei tarvitse itse hallinnoida laskentaklustereita, vaan ne ovat Microsoftin operoimia.
Lakehouse delta -tauluille on tarjolla oma SQL endpoint, jonka avulla voidaan suorittaa lukuoperaatioita dataan. Tietovarasto-osiolle on oma SQL endpoint, joka tarjoaa laajemman joukon operaatioita.
Tapahtumavirta / telemetriadatan analysointiin on tarjolla reaaliaikaisen analytiikan osio, joka tukee KQL -kyselykieltä.
Käytössä on seuraavia palveluita niin että kehittäjän käyttökokemus on aiempaan nähden paljon yhdenmukaisempi:
Esimerkiksi erilaisten Spark – notebookien suoritus data engineering – työssä on Fabricissa helppoa hyödyntäen Synapse Data Engineering osiota. Luonnollisesti juuri nyt Fabric on vielä Public Preview – vaiheessa, joten monet palvelut vielä kehittyvät ja muuttuvat.
Microsoft Fabricissa kustannusten muodostumiseen vaikuttaa haluttu suorituskykytaso, eli Capacity Unit -taso (CU). Tarkemmin asiasta löytyy tästä. Eri työtilat voivat jakaa kapasiteetteja, ja kapasiteetteja voidaan valita esimerkiksi henkilötietojen maantieteelliseen käsittelyyn liittyen tarkoituksenmukaisella tavalla.
Tämän lisäksi OneLake -tallennustila sekä joissain tapauksissa alueiden välinen tiedonsiirto tuottavat kustannuksia.